英国芯片初创公司 Fractile 表示,已完成由 Factorial Funds、Accel 和Peter Thiel 的Founders Fund 领投的 2.2 亿美元 B 轮融资。
Fractile由牛津大学毕业的工程师Walter Goodwin于 2022 年创立,专门生产用于推理的芯片,推理是人工智能模型响应用户查询的过程。
古德温表示,他的公司正致力于解决他所说的尖端人工智能模型面临的关键制约因素:即模型对查询做出有效响应所需的时间。他指出,随着模型规模和复杂性的不断增长,人工智能公司现在需要数千万个“token”(高级计算中的基本计量单位)才能执行复杂任务或解决难题。数据在处理器和内存芯片之间传输的速度决定了查询的延迟或响应时间。
Fractile 设计了一种逻辑芯片和一种将存储器连接到服务器机架内部的架构,该公司表示,这将帮助人工智能公司在不牺牲速度的情况下最大限度地提高带宽。
“我们希望做到快速且成本低廉,”古德温说。
该公司拒绝透露该产品的技术规格,但表示其内存需求既不依赖于传统的高带宽内存芯片,也不依赖于片上静态随机存取存储器(SRAM)——这两种内存形式是人工智能中最常用的。
随着智能人工智能引发计算需求激增,硬件初创公司Fractile也加入了这场竞相将产品推向市场并与主要客户达成交易的行列。生产餐盘大小的快速推理人工智能芯片的Cerebras公司将于周四进行IPO,目标是筹集高达48亿美元的资金。
Majestic Labs 近期宣布推出一款新型服务器产品,该产品已从风险投资机构筹集了 1 亿美元资金。该公司称,该产品可提供足够的内存来处理基于多达 10 万亿个参数训练的模型。与此同时,包括英伟达、亚马逊云服务和谷歌云在内的大多数大型芯片设计商都已推出了专用于推理的处理器。
打造下一代推理硬件
Fractile 公司宣布完成2.2亿美元融资,旨在加速其芯片和系统交付给客户的进程。本轮融资由Accel、Factorial Funds和Founders Fund领投,Conviction、Gigascale、O1A、Felicis、Buckley Ventures和8VC等机构跟投,现有投资者也参与了投资。
Fractile成立于2022年,其创立的初衷是:最终,世界上最强大的AI系统将因其产生有用输出所需的时间而限制其影响力。该公司押注于一个合乎逻辑的结论:真正释放这种潜在价值,使速度大规模可行,唯一的途径就是彻底革新运行前沿AI模型所使用的硬件。自此,Fractile便致力于研发旨在解决这一问题的芯片和系统。
原始人工智能能力已经发展到一定程度,从查询到输出的时间已成为制约其前沿能力的关键因素。随着模型的改进,它们处理越来越长的输出序列的能力也随之提升。最棘手的问题需要生成数千万个token,而生成更长的输出序列能够持续提升人工智能的能力。与此同时,推理的单位经济效益已成为一个严峻的制约因素。推理既是人工智能行业的收入引擎,也是制约其扩展速度的因素。
性能与推理时部署的计算量之间的正相关性一直是前沿人工智能系统的长期标志。DeepMind 的 AlphaGo 之所以能达到超人水平,并非仅仅运行一次神经网络来选择下一步棋,而是通过对众多可能的未来进行树搜索来实现,而每个未来都是通过神经网络的顺序重复推理来探索的。2024 年推理模型的出现表明,类似的原理也适用于逻辑逻辑模型 (LLM)。然而,如今我们看到,一些最有价值的人工智能应用消耗了数百万个token,这也反映了辛勤工作的一个基本属性。严肃的智力工作包含许多顺序步骤,每个步骤都依赖于前一个步骤。
对于极其艰巨的工作而言,这些循序渐进的步骤最终会产生数量惊人的中间产出,而当这些产出被综合起来时,却能带来极其宝贵的成果。安德鲁·怀尔斯在费马大定理研究多年后意识到,他当时所采用的方法看似走到了尽头,但却完美契合了他三年前探索过的一种方法。这种着眼于长远背景、按顺序探索不同方向的能力——以及怀尔斯积累的大量论文——正是前沿逻辑逻辑模型(LLM)在应用于日益复杂的问题时所努力的方向。
如今的逻辑逻辑模型(LLM)为了解决这些难题,已经能够生成高达 1 亿个token。在现有芯片上,这些模型通常以每秒约 40 个token的速度运行,因此生成如此长度的单个输出需要一个月的时间。推理速度的技术和经济限制,尤其是内存带宽在当前架构上无法扩展,是制约进展的关键所在。为了将一个月的工作压缩到一天,需要以每秒约 1200 个token的速度生成输出,同时还要应对在超长上下文中运行大型模型所带来的复杂性和容量挑战。这正是 Fractile 从零开始构建的目标。
然而,硬件登月计划最令人兴奋之处并非在于加速现有工作负载,而在于它能够催生全新的工作负载。将一个月的工作压缩到一天,将周末的实验室计算压缩到一次咖啡休息时间,不仅能大幅提升工作效率,还能使更具雄心的AI应用场景在经济上可行。智能体编码仅仅是故事的开端。21世纪的标志性工作将以推理引擎为标志,它将在药物研发、软件工程、材料发现以及任何人类能够从纯粹的智力劳动中受益以解决复杂问题的领域,产生庞大而广泛的智力探索链。正如任何技术革命一样,那些推动进步最快、将前沿推向最远的人,将获得最大的价值份额。那些已经达到当前前沿极限的工作负载已经具有变革性。而那些超越前沿、旨在开启下一阶段硬件发展的新领域,将拓展人们的想象力,并重塑整个经济格局。 Fractile 致力于通过逐个芯片地提升全球进步的时钟速度。
这一切的实现始于人才。自成立以来,公司一直致力于全栈开发,从基础人工智能研究到晶圆代工工艺创新,再到芯片微架构,积极寻求最有前景的解决方案,开发能够打破权衡曲线、突破成本与延迟之间帕累托最优解的系统,并开辟一条改变世界顶级人工智能模型应用方式的道路。
点这里👆加关注,锁定更多原创内容
*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。
推荐阅读

喜欢我们的内容就点“在看”分享给小伙伴哦~

夜雨聆风