这一次,国产光计算芯片走到了商业化的临界点|甲子光年

甲子光年
07-16

光计算芯片行业的水温,正在发生变化。

作者|八度‍‍

编辑|王博

“集成光路将是半导体领域60年一遇的‘换道超车’。”

去年底,在2023全球硬科技创新大会上发布的《光子时代:光子产业发展白皮书》前言的最后一段,有着这样一句话。

光计算芯片在算力、数据传输上的优势毋庸置疑,国内团队的研究成果也时常见诸报端,但一提到规模化商用,不少人仍心存疑虑。2023年,一位从事微纳光子器件科研的研究生在知乎上发帖讨论光计算芯片相关问题时就直白地说:“既然没有商用,肯定是还有很大问题的。”

那么,光计算芯片从论文里走出来了吗?

矩阵规模(算力密度)和单节点光辨识度(算力精度)是衡量光计算芯片性能的关键指标,业内公认的达到商用标准的矩阵规模是128×128,2021年全球范围内有两家企业完成了64×64的光计算芯片流片,此后三年内这个瓶颈一直没有被突破,有的企业甚至转战了其它赛道。

而在近期举行的2024世界人工智能大会(WAIC)期间,“甲子光年”了解到,国内光计算芯片公司光本位科技已完成首颗算力密度和算力精度均达到商用标准的光计算芯片流片,这颗芯片的矩阵规模为128×128,峰值算力超1700TOPS。

光本位科技研发的矩阵规模为128×128的光计算芯片,图片来源:光本位科技

“我们目前对标的就是英伟达A100,”光本位科技联合创始人程唐盛告诉“甲子光年”,“128×128芯片将被制作成板卡,其最终形成的算力将与英伟达的电子芯片产品具有可比性。同时,我们的初代产品功耗大约是它们的十分之一到十五分之一。此外,在延时方面,光计算芯片也会有数量级的降低。”

128×128的矩阵规模,意味着国产光计算芯片离产业化更近一步,而不仅仅是“停留在纸面上”“只生活在实验室里”。

光本位科技创始人熊胤江表示,公司正在进行128×128光计算板卡调试,预计将于2025年内推出商业化光计算板卡产品,用更高的能效比、更大的算力赋能大模型、AI算力硬件、智算中心、具身智能等产业,同时公司即将完成更大矩阵规模的光计算芯片研发。

“我认为目前可能正处于一个临界点上,”一位关注芯片行业投资人告诉“甲子光年”,“大家已经从最初认为光计算芯片完全无法实现的态度,转而认为它有可能实现。”

光计算芯片行业的水温,正在发生变化。

1.“你相信光吗?”

“你相信光吗?”

这一句网络流行语,也是光计算芯片行业的真实写照。

在过去的50多年里,芯片的算力一直遵循着摩尔定律持续增长。以往,行业更习惯采用的是电芯片算力,但当下电芯片的算力正面临增长瓶颈。

比如,量子隧穿效应限制了晶体管尺寸的进一步缩小;随着性能增长,能量消耗和热量积累对芯片的散热提出了更高要求;信号延迟,芯片内部传输速度和数据传输瓶颈限制了处理速度;可扩展性问题,现有技术框架下晶体管数量接近上限。

供给面临瓶颈,而需求仍在增加。摩尔线程创始人兼首席执行官张建中今年5月在“甲子光年”举办的“AI创生时代——2024甲子引力X科技产业新风向”大会上直言:“大多数AI创业公司即使融到了数十亿或数亿资金,也难以建立算力中心。再加上算力资源的稀缺,使得许多企业心有余而力不足。包括OpenAI在内的整个行业面临的问题是如何解决算力资源匮乏导致的迭代难题。”

如何破局?光计算芯片提供了一种新的思路。

光计算芯片是光子芯片的一种应用形式,专注于计算任务的光学实现,具有超高速度、超强并行性、超高带宽和超低损耗的特点。

其实几十年来,科学家们对光的探索,从未停止。在20世纪40年代,傅立叶变换被引入光学中,发展出傅立叶光学。1980年至2004年是光计算的黄金年代,在此期间,科研人员提出了大量光计算技术,包括光学模式识别、逻辑光计算、光学神经网络、光互连和光学全息存储等。

但是,由于对光计算的应用需求和应用场景不清晰,并且缺乏与之相匹配的光学硬件体系,此前光计算技术的发展比较缓慢。

近几年,随着人工智能产业的爆发,光计算芯片也进入了快速发展期。

2021年,全球光子产品总及相关服务的估值则高达7万亿美元以上,约占全球世界经济总量的11%。

而现在,光计算作为一个专业涉及面广、理论和技术要求极高的新兴产业,被视为中国与国际竞争对手站在同一起跑线上,甚至能够实现技术超越的潜在领域。

2.128×128:算力与功耗的双重突破

尽管光计算芯片被寄予厚望,但过去很长时间里,光计算是一项被困在实验室的技术。

2017年,光计算领域出现了第一篇Nature文章,之后一些公司陆续成立。然而,整个产业链还不够成熟,从封装到电芯片配合方面都没有太多可参考的范例。到了2022年,光本位科技成立的那一年,行业经过五年的发展,技术和产业链逐渐成熟,但光计算芯片还是没有像传统电芯片那样大规模商业化。

熊胤江认为这主要有两个维度的原因:一是过去光计算芯片本身设计的不成熟,无法与现阶段领先的电方案直接对比;二是将其落地成产品的产业链不成熟,光电融合归根到底还是非常有挑战的工程化工作。

“国内很多高校里的光计算芯片都是3×3或是4×4这种更小规模,一些初创公司,也最多只能做到64×64,这代表它并没有具备商业化能力,还在研发阶段。”峰瑞资本早期项目负责人李罡告诉“甲子光年”。

而这一次,光本位科技的这颗矩阵规模为128×128的光计算芯片成功流片,意味着国产光计算芯片走到了商业化的临界点。

要实现规模化商用,光计算芯片需解决非线性计算、存算一体等难题,无论是科研院所,还是产业界,都认为构建光电融合生态是一条必经之路。光本位科技基于PCM相变材料实现了存算一体的存内计算,存储单元与计算单元完全融合,目前已迭代出以光计算芯片为核心的电芯片设计能力,并与国内顶尖封装公司建立深度战略合作,共同开发先进光电合封能力。

“128×128矩阵规模可以与谷歌的TPU或是华为的升腾等采用的架构相媲美。对我们来说,光计算在算力密度和矩阵规模上已经等同于电子计算,这是以前光计算未能实现的,而我们首次做到了。”熊胤江说。

光本位科技的光子存算一体原型机,图片来源:光本位科技

光计算芯片的矩阵规模对应的就是算力。

例如,从64×64矩阵规模提升到128×128矩阵规模,算力至少增加了四倍,但功耗的增加是线性的。

具体来说,在64×64矩阵规模时,芯片配备了64个模数转换器(ADC)和64个数模转换器(DAC)。当矩阵规模到了128×128时,虽然算力提升了四倍,但所需的ADC和DAC数量仅增加到原来的两倍,这意味着算力效率至少提升了一倍。

同时,这款光计算芯片的精度也实现突破,达到了AI推理的标准精度。

更为重要的是,128×128矩阵中的每个单元都是可调的,这使得该芯片成为一个完全通用的平台,能够处理任何类型的AI计算任务,这一点与之前固定权重、只能处理单一应用的其它光计算芯片形成了鲜明对比。

这样的技术突破并非一蹴而就,而是十年技术积累的结晶。

2014年开始,牛津实验室就开创了相变材料与硅光结合的研发,2017年成功研发全球首个光子存算一体芯片。在牛津大学读博士期间,程唐盛师从全球“相变材料光计算”第一人——牛津大学材料系教授、英国皇家工程院院士Harish Bhaskaran,他还主导、参与了牛津大学的相变材料光计算芯片、新型超低功耗纳米相变材料的研发。

程唐盛告诉“甲子光年”,从在牛津读博士开始,他多年来一直着手解决光计算技术在实际应用中的问题,研究如何降低功耗和扩大规模,以期满足人工智能发展等应用对算力的需求。

光本位科技创始团队在光计算领域不断突破。2022年创业,更是“有备而来”。

“从公司成立之初,我们就已经意识到市场上现有的光计算芯片矩阵规模较小,这限制了它们的算力密度和算力规模。因此,从公司成立的第一天起,我们就明确了首先要将矩阵规模从64×64提升至128×128,然后进一步扩展至256×256,以及512×512。”程唐盛告诉“甲子光年”。

去年,光本位科技利用前代的光计算芯片,完成了板卡架构的完整运行,包括封装、与电芯片结合,并运行了通用AI网络如ResNet-50等。

今年,光本位科技进一步优化芯片,一方面是提升矩阵规模至128×128,以提高算力密度和算力规模;另一方面,针对每个独立的光器件进行优化、仿真,并进行针对性的流片,以实现整个系统的全面优化。

“我们基本上每三个月到半年会进行一次流片。我认为只有将产品迅速做出来,并且不断迭代,公司才是真正的稳健。”熊胤江说。

这一次128×128光计算芯片,正是由前3次的产品迭代而来。

那么,这样的光计算芯片产品的商用场景在哪里?

3.光计算芯片被谁需要?

对于应用层来说,光计算芯片将为它们提供更高算力和更低功耗的支撑。

更高算力,意味着光计算芯片可以处理更复杂的模型,更复杂的模型则可以催生更好的应用;更低功耗,意味着无论是在训练模型时的成本,还是用户在实际使用时的推理成本,都会在很大程度上降低。一旦光计算芯片被商用,将是后摩尔时代的一道曙光,形成一种良性循环。

技术应用的每次变革都源于算力的突破。正是算力的提升,人工智能的颠覆性时刻才得以出现。

所以光计算芯片的首要场景,就是人工智能。“当下人工智能快速发展,这一场景的应用和需求变得非常明确。光计算芯片能够针对当前的大型模型相关应用快速进行适配和优化。”李罡说。

在大模型领域,光计算将帮助下游客户降低成本、提高效率。它可以使得未来推理成本降至现在的千分之一或万分之一,使用户在访问大模型时几乎无成本,从而显著提高大模型公司的毛利率。

算力成本的降低对于大模型应用落地非常重要,否则企业将不得不每天都头疼开销,从而减小模型规模,降低训练质量。

一位人工智能初创企业的创始人告诉“甲子光年”,算力成本降低会有助于应用产品的发展,“我觉得现在大家应该逐渐更加清晰地想明白token是消耗越多越好,而不是想办法尽量做一个节省token的应用。”

同时,光计算芯片算力的大幅提升,也能够为当前人工智能、大数据分析、自动驾驶等热门技术场景提供强大的动力。

熊胤江介绍,在自动驾驶领域,目前L3级别的算力在200-500TOPS,而要达到L5级别,预计需要2000TOPS以上的算力。如果基于现有技术,功耗将在2kW以上,这对于新能源智能驾驶汽车的续航能力是一个挑战。

因此,必须寻找一种低功耗、高算力的解决方案,而光计算芯片,恰好能够满足这一需求。

而对于当下火热的具身智能来说,光计算芯片能够在端侧进行大量计算,并且不需要消耗过多能量,使机器人在保持“高智商”的同时,还能进行大量机械操作。

如果具身智能要达到通用人工智能(AGI)的能力和认知力,所需的算力将远超现有水平。光计算芯片的高算力潜力,将使具身智能能够独立思考,甚至可能具备超越人类的思维逻辑和判断能力,这将是光计算技术的终极潜力所在。

不可否认,光计算芯片以其超高速、高能效的特性,未来一定还会催生出全新的算法范式,从而推动整个计算科学领域的进步和创新。

4.“左手钉子、右手锤子”的产业化之路

随着128×128矩阵规模光计算芯片流片,未来两年,将是光计算芯片工程化的关键时期。也就是说,光计算芯片要真正开始接受“真实而复杂”的场景考验。

“2025年,将是光本位科技的突破年,届时光计算芯片将进入商业化元年,光本位科技将与下游大规模接触并适配,建立商业合作关系。2026年,光计算芯片有望实现大规模出货。”熊胤江预测。

他告诉“甲子光年”,光本位科技的发展遵循T字形战略,纵向上,深入产品周期,从芯片到板卡,再到下游适配和最终出货。今年下半年电子芯片也会完成流片,团队将进行封装测试,完成2.5D和3D的光电合封,最终将形成光子计算板卡,并交付给客户适配,同时构建软件生态系统。

横向上,光本位科技将拓宽光计算领域的研发壁垒,进行更大矩阵规模的研发,包括但不限于256×256、512×512矩阵规模的光计算芯片研发,并利用波分复用等先进技术。

“这T字形战略既有纵深,确保产品不是空中楼阁,能够深入到用户层面;同时,也确保我们能够一直保持研发的领先地位。”熊胤江告诉“甲子光年”。

光本位科技的光计算芯片运行原理图,图片来源:光本位科技

光本位科技将研发能力视为“锤子”,将市场需求视为“钉子”。既要技术的不断迭代,也要用户需求的持续反馈。

若要两者在中间相遇,左手市场、右手研发都需要投入。

在科研层面,光本位科技与复旦大学成立了未来计算硬件联合实验室,探索光计算在技术发散时期的所有可能性。

在工程化落地方面,团队集结了模拟、数字、硬件、系统架构和算法等领域资深的“行业老兵”,确保产品能够实现实际的工程化落地。

同时,公司已经与国内产业链中的合作伙伴建立了联系,包括与国内领先的硅光企业联合微电子进行战略合作,以及与国内顶尖的封装测试厂进行2.5D和3D光电封装的前沿研发。

技术突破只是一个敲门砖,接下来对光计算芯片和光本位科技来说,要面临的是产业生态的挑战。

目前,市场客户普遍使用的是英伟达或其他熟悉的GPU,要实现光计算板卡的广泛应用,需要与客户进行适配。“我们努力的方向是确保光计算板卡在硬件上完全兼容现有生态。”程唐盛说。

当然,光计算芯片和电芯片并不是替代关系,而是相互增强。

在初期发展阶段,光计算芯片可能会扮演张量计算核心的角色,辅助传统的电子芯片。鉴于目前电子芯片在市场上的主导地位,光计算芯片将首先承担起人工智能应用中的大量线性运算任务。

但随着客户需求的逐渐丰富,整个软件生态系统随之丰富,各个光计算公司的交付能力也将有所提升。

程唐盛把当下光计算芯片的发展类比于“AlphaGo问世前夕”。与人工智能或电子芯片平台相比,光计算还处于一个较前期的发展阶段。随着效率的提升和生态系统的完善,光计算将逐渐发挥更大的作用,为智能时代的计算、存储、传输和感知提供强有力的技术支撑。

中科创星创始合伙人米磊在2016年曾提出过一个“米70定律”,他认为,光学技术会是未来一项非常关键的基础技术,其成本会占到未来所有科技产品成本的70%。但不可否认的是,任何一种技术取得突破,都需要长期的积累和投入,以及更长时间的转化和落地。

人类自诞生以来就受惠于光,而光也将为人工智能创造更多可能。

*参考资料:

《27岁融资超亿元!95后海归创业者进军光计算芯片》,甲子苏州

(封面图来源:“甲子光年”使用AI工具生成)

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法