据悉,AI推理平台Fireworks AI正在洽谈新一轮融资,估值达到150亿美元(约1000亿元人民币)。
什么是AI推理平台?
举个例子,一个模型(如DeepSeek或Llama 3)被训练出来后,它本身只是一个拥有巨大权重的静态文件。
要让它变成像ChatGPT那样能与你对话的服务,需要把它部署到服务器上。这个部署和运行的过程,就是推理。

AI推理赛道竞争格局:头部玩家估值对比
可能还是比较难理解。那再解释一下Fireworks AI是做什么的。
一、关于Fireworks AI
简单理解,Fireworks AI是一个“高性能AI云平台”。
在这个平台上,开发者可以非常方便地使用DeepSeek、Kimi等全球主流的开源大模型,无需自己花巨资搭建和运维。只需一行代码,用户就可以在几秒钟完成部署。
其支持的模型包括DeepSeek-V4-Pro、Kimi K2.6、MiniMax M2.7、GLM 5.1、Qwen3.6 Plus、Gemma 4 31B IT等,这些模型涵盖文本、图像、音频和多模态领域,支持模型微调、强化学习以及评估。
相比传统云服务商,Fireworks AI作为AI推理平台,能够提供更低成本、更高性能且支持定制化开源的大模型。
当AI应用愈发深入,其价值就愈发显现出来。“每个企业在商业模式、目标、运营等方面都各不相同,微调成为利用AI的关键环节,这正是Fireworks AI的用武之地。

Fireworks AI的创始团队
二、Fireworks AI的成长史
2022年,CEO乔琳(Lin Qiao,复旦本科、硕士,UCSB博士,前Meta工程高级总监)发现虽然AI底层框架已相当成熟,但众多企业和开发者却苦于缺乏将AI技术快速、高效、低成本投入实际生产的基础设施。
她敏锐地捕捉到,市场需要一种“AI云”,为用户提供便捷、可靠且可扩展的部署环境。
2022年10月,在ChatGPT发布前夕,Fireworks AI正式诞生。帮助企业运行开源AI模型,按Token收费。
2022年底,ChatGPT横空出世,引爆整个生成式AI市场,Fireworks AI迅速站上风口。
推理市场带来了Token消耗的指数级上升。用户在平台上消耗的大量Token,就是Fireworks AI的收入来源。

目前Fireworks AI每天处理约30万亿个Token。
AI编程工具Cursor,以及Uber、Samsung、Notion、Shopify等大型企业,都是其客户。
三、Fireworks AI的融资史
2022年,Fireworks AI获得Benchmark2500万美元种子轮融资;
2023年完成A轮融资,投资方包括Sequoia Capital、英伟达、AMD等。
2024年,Fireworks AI完成由Sequoia Capital领投的5200万美元B轮融资。公司估值达到5.52亿美元。
2025年,C轮融资由Lightspeed Venture Partners、Index Ventures和Evantic共同领投,Sequoia Capital继续跟投,估值达到40亿美元。

2026年2月,Fireworks AI年化收入已经达到3.15亿美元(约22亿元人民币),同比增长416%。
2026年3月,公司宣布收购游戏服务器托管公司Hathora。在游戏场景,Hathora的技术核心是低延迟、大规模的分布式计算编排,可以帮几百万人同时在线对战。这种规模化调度能力,对AI模型推理至关重要。
现在,Fireworks AI新一轮融资很快就要来了——据彭博社报道,该公司正在洽谈新一轮融资,估值150亿美元(约1000亿元人民币)。

Fireworks AI产品界面
四、AI正在盛产千亿公司
当年的“大模型六小虎”当中一半以上都已经获得了1000亿估值或市值,其中智谱市值一度逼近9000亿港元,超过了美团+京东的整体市值。
MiniMax港股市值超2500亿港元,同时开启A股上市辅导。
DeepSeek首轮融资投前估值喊到450亿美元(约合3000亿元人民币)。
Kimi最新估值超200亿美元。
阶跃星辰冲刺千亿IPO。
与此同时,我们需要心知肚明的是,AI目前尚未创造出传统意义上的“千亿元级产品”。
夜雨聆风