当河豚学会＂调度＂AI:聊聊日本的Sakana Fugu,以及＂中美之外＂的大模型江湖

前几天刷到一个名字特别有意思的产品——Sakana Fugu(河豚)。本来以为是做生鲜配送的,点进去一看,是日本AI公司Sakana AI推出的旗舰商用AI产品。今天这篇文章,就带大家看看这只"AI河豚"凭什么能在高手林立的全球大模型圈里游出自己的路线,顺便聊聊中国和美国之外,世界其他角落正在发生的大模型故事。

一、什么是Fugu?先从河豚这种鱼说起

河豚(学名fugu)是日本料理里出了名的一道菜,它的最大特点就是:会膨胀。平时小小的,一受刺激就把自己吹成一个带刺的球,以此吓退捕食者。但更出名的是它的毒性——河豚体内含有河豚毒素(TTX),处理不当就是死。所以日本有专门的"河豚师"执照,必须经过严格训练才能合法烹饪。

把这个意象套到AI产品上,你会发现Sakana AI的命名其实藏着两层意思:

1. "膨胀"的力量:Fugu的能力不是靠把一个模型无限做大,而是靠调度一群模型,让"集体智能"瞬间膨胀。
2. "去毒"的精修:原始数据是"有毒的",需要专业厨师精心处理;Fugu则是把一帮"有毒"的、可能各说各话的LLM,通过学习得到的协调策略,料理成可用的、靠谱的回答。

这个名字起得是真讲究。

二、Sakana Fugu到底是什么?一句话讲清楚

官方页面的slogan是:

One Model to Command Them All(一个模型,号令群雄)

它不是一个新的基础大模型,而是一个多智能体编排系统(Multi-Agent Orchestration System),由一个相对轻量的"指挥家"模型,去动态调度一个池子里不同的LLM(包括开源的、闭源的各种前沿模型),来完成复杂的多步任务。

用更通俗的话说:

• 传统的做法:你用GPT-5,就只能问GPT-5;你用Claude,就只能问Claude。每个模型都有自己的强项,你也得自己判断"这道题该交给谁"。
• Fugu的做法:你只调一个API,它内部会自动判断——这道题该让谁先想、谁后做、谁负责检查、谁负责重写,几个模型之间怎么传话、按什么顺序传,全都由Fugu这个"指挥家"实时设计。

它基于Sakana AI两篇被ICLR 2026接收的论文:

• TRINITY:让一个轻量的"进化型协调者"在多轮对话里给LLM分配"思考者/执行者/验证者"三种角色。
• Conductor:用强化学习训练"指挥家",让它自己摸索出用自然语言协调多模型的最佳策略。

产品分两个版本,都走OpenAI兼容的API:

版本	定位	典型用途
Fugu	性能与延迟平衡	日常Coding、Code Review、响应式聊天机器人
Fugu Ultra	极致性能,面向高难度问题	Kaggle竞赛、论文复现、网安分析、文献/专利调研

性能方面,Fugu在SWE Bench Pro、LiveCodeBench、GPQA-D(研究生级科学问答)、Humanity's Last Exam(人类终极考试)等硬核基准上,得分都和当前最强的闭源前沿模型处于同一档,部分指标还反超。Sakana还特别强调一点:Fugu的"集体智能"路线,天然规避了单一供应商依赖和出口管制风险——这点对日本、欧洲这种"主权AI"需求强烈的市场,格外有吸引力。

小提示:目前Fugu在欧盟/EEA地区还不能用,Sakana在等GDPR等合规落地。其它地区可以申请beta。

三、Sakana AI是何方神圣?三位大神+一个东京梦之队

如果说Fugu是产品,Sakana AI这家公司本身,放在全球AI圈里也相当独特。它2023年成立于东京,由三位大牛共同创办:

• David Ha(CEO):Google Brain前研究员,前Stability AI研究负责人,日本Mercari高管,2025年入选TIME100 AI榜单。是一位连接硅谷学术圈和日本工业界的关键人物。
• Llion Jones(CTO):这个名字对Transformer圈的人来说如雷贯耳——他是2017年那篇神文《Attention Is All You Need》的共同作者之一,正是这篇论文奠定了今天所有大语言模型的基础架构。Llion Jones是少数从硅谷"反流"亚洲、参与本土前沿AI研究的Transformer原作者。
• 伊藤廉 / Ren Ito(董事长):日本本地科技与政策圈的人脉核心,负责和政府、大企业打交道。

公司名"Sakana"是日语"さかな",意思是鱼。这来自他们的核心哲学——"受自然集体智慧启发"。鱼群没有中央指挥,却能形成复杂的群体行为;鸟群、蚁群、蜂群同理。Sakana AI认为,下一代AI的突破可能不是把单个模型越训越大,而是让一群小模型/异构模型学会协作——这正是Fugu这条产品线的思想根源。

这些年Sakana AI在学术圈的"出圈作"包括:

• The AI Scientist:一套能自主产生研究问题、跑实验、写论文、审稿的AI科研系统,论文登上了Nature。David Ha入选TIME100 AI就是凭这个。
• Darwin Gödel Machine:把"达尔文进化"和"哥德尔自我改进"结合的自我演化智能体。
• The AI Scientist-v2:能产出通过顶级AI会议同行评审的研究。
• ALE-Agent:在2025年5月,直接杀进人类程序员的AtCoder Heuristic Competition,在1000名人类选手中排到第21名。

商业方面,Sakana已经和日本最大金融机构之一的三菱UFJ银行(MUFG)签了多年战略合作,给防卫创新科学技术研究所做委托研究,还和Google达成了战略合作。日本政府和企业是真金白银在押注这只"鱼"。

四、当"中国+美国"成为默认叙事,世界其他地方在做什么?

聊完日本,我们把视角拉远一点。

过去两年,大模型的故事几乎被中国 vs 美国完全垄断:OpenAI、Anthropic、Google、xAI对DeepSeek、Qwen、智谱、Kimi、文心、豆包。这种"二元叙事"给人感觉AI就是这两家的事。

实际上,世界其他角落正在悄悄长出自己的玩家,而且各有各的打法。

🇫🇷 法国:Mistral AI —— 欧洲最硬核的开源旗手

Mistral AI 2023年成立于巴黎,主打"主权AI、开放权重"路线,估值在2025年底已经达到约140亿欧元,成为欧洲大模型的绝对门面。

• 创始人Arthur Mensch来自DeepMind,团队早期就抱定"欧洲不能没有自己的基础模型"的信念。
• 产品线在2025年扩张得很快:7月推出Codestral(代码补全专用)、9月推出Magistral(推理模型)、11月Mistral Large 3重磅登场——这是一个开源的MoE(混合专家)大模型,主打企业级推理、Agent能力、长上下文,被业内视为正面挑战OpenAI的"开源旗舰"。
• Mistral还和欧洲航天局、德国电信、Stellantis、ASML、HPE等大客户深度合作,主打"数据不出欧洲",这在GDPR时代是绝对的卖点。

一句话:Mistral让"用大模型"不必再被硅谷垄断,欧洲企业第一次有了"信得过、合规、用得起"的选择。

🇩🇪🇨🇦 德国+加拿大:Cohere × Aleph Alpha —— 主权AI的跨大西洋合体

这是一个2026年初最重磅的并购案例。

• Aleph Alpha(海德堡,2019年成立):欧洲"主权AI"的代表,主打可解释、可控、本地化部署,服务对象是德国政府、欧盟机构和大型工业企业。2024年他们推出了PhariaAI——一个面向企业的AI操作系统层。
• Cohere(多伦多,2019年成立):由Aidan Gomez联合创办(他正是《Attention Is All You Need》的第一作者),主打企业级LLM+RAG平台。

2026年初,Cohere宣布收购Aleph Alpha,合并后的实体估值约200亿美元,采用双总部(多伦多+海德堡)模式,直接喊出"主权AI的替代选项"的口号。两国政府都在背后支持。

这意味着什么?Transformer架构最重要的两个发明人(Gomez和Llion Jones)——一个在加拿大做Cohere,一个在日本做Sakana——都把"非美式AI"这条路当成了长期事业。

🇮🇱 以色列:AI 1.1战略

以色列的AI故事不是单一公司,而是"AI 1.1"国家战略——政府把AI列为国家优先级,军方Unit 8200培养出大量AI人才,本土诞生了一批专注网络安全、企业AI Agent、医疗AI的公司,很多被NVIDIA、Microsoft等收购,小而精,强在"AI落地能力"。

🇰🇷🇮🇳🇸🇬🇦🇪:亚洲其他玩家

• 韩国:Naver的HyperCLOVA X、LG的EXAONE、NC AI,以及政府主导的K-AI Alliance,主攻韩语优化和企业服务。
• 印度:Krutrim(印度首个本土大模型)、Sarvam AI(拿到印度政府巨额订单做"印度版AI基础设施"),主打"印度语系"(印地语、泰米尔语、孟加拉语等几十种语言)。
• 新加坡:Sea Group的Sea-Lion系列,主攻东南亚十多种语言。
• 阿联酋:阿布扎比背书的G42 + Falcon(由阿联酋技术创新研究所TII开发,曾长期登顶HuggingFace开源榜),以及和OpenAI的巨额算力合作。

🇧🇷 拉丁美洲:不缺席,但还在追赶

巴西的Maritaca AI、墨西哥的AICommunity、智利的Not Diamond等小公司正在起步,主攻西班牙语+葡萄牙语市场,体量和影响力都还小,但"主权AI"的意识也在觉醒。

五、回到Fugu:它给我们的启发是什么?

Fugu最让我触动的地方,不是某个具体跑分,而是它传递的一个判断:

AI的下一步,未必是更大的单体模型;可能是更聪明的"调度艺术"。

当一个日本公司用"鱼群协作"的东方哲学,去调度一帮美国公司训练的模型,做出跑分追平甚至部分超越最强闭源模型的产品——这件事本身就在说,AI的创新中心正在多极化。

中国有"模型即基础设施"的规模优势,美国有"基础研究+算力+生态"的护城河,而日本、法国、德国、加拿大、以色列、韩国、印度这些"中段玩家"在用另一条路线突围:不开比参数大战,转而做"集成、调度、本地化、合规"。这条路未必性感,但商业上更稳,政治上也更安全。

Fugu这个名字起得真好——有毒的食材,经过专业的处理,反而成为一道极致美味。 当下的大模型世界,可能就需要这样一群"AI河豚师":他们不一定要重新训练出最大的模型,而是知道怎么把这群五花八门的"有毒模型",搭配出最适合每一道具体问题的那道菜。

如果你也对多智能体、AI编排、或者全球AI地缘格局感兴趣,欢迎在评论区聊聊你最看好的"中美之外"玩家。

我们下期见。

参考资料:

• Sakana AI 官方 Fugu 页面:https://sakana.ai/fugu/
• Sakana AI 官方 Beta 公告:https://sakana.ai/fugu-beta
• Sakana AI 公司介绍:https://sakana.ai/company-info
• Time100 AI 2025 - David Ha
• TRINITY 论文:https://arxiv.org/abs/2512.04695
• Conductor 论文:https://arxiv.org/abs/2512.04388
• Mistral AI 官方文档:https://docs.mistral.ai/
• Cohere × Aleph Alpha 收购报道(Futurum / Silicon Republic)