乐于分享
好东西不私藏

AI工具三国志

AI工具三国志

上篇,我们讨论了OpenClaw、Dify、DeerFlow的差异和各自的优势领域。今天,我想记录一下我的思考:谁会是AI开启实际应用落地的版本答案。
这三个项目都是开源项目,但背景显而易见,初露锋芒但身世显贵的DeerFlow被列在里面简直有点屈尊了。翻看下字节的AI产品线。

大模型层

产品
说明
Doubao-Text(豆包)
主打对话生成、知识问答的中文 LLM
Doubao-Vision(豆包视觉)
多模态理解,图文理解能力
云雀大模型(VeLark)
字节自研基座模型,对标 GPT-4 级别
Seed-T2I(吐栗)
字节图生图模型,对标 Midjourney

应用层

产品
说明
豆包 APP
C 端对话助手,对标 Kimi/ChatGPT
猫箱(Duetab)
字节版 AI 搜索/浏览器伴侣
Cici
国际化 AI 助手(豆包海外版)
扣子(Coze)
AI 应用开发平台,对标 Dify,支持工作流编排
小红书 AI
小红书内置 AI 功能(搜索增强、内容生成)
抖音 AI
AI 特效、AI 脚本生成、直播 AI 助手
剪映/CapCut AI
AI 视频剪辑、AI 字幕、AI 配音
醒图 AI
AI 修图、AI 写真

平台层(B2B)

产品
说明
火山引擎(Volcano Engine)
字节云服务,提供模型 API(Doubao API、VeLark API)
智能创作云
企业级 AI 内容生产平台
推荐系统 AI
字节核心算法能力对外输出
Lark AI
飞书( Lark Suite)内置 AI 助手

Agent / 开发者工具

产品
说明
扣子(Coze)
可视化工作流 + Agent 平台,对标 Dify
DeerFlow
开源 SuperAgent 框架(字节内部孵化),已在服务器部署
Doubao Agent SDK
开发者构建 Agent 的 SDK
好家伙,总结一下:
  1. 全链路覆盖:从基座模型 → 平台工具 → 应用层,全部自研
  2. 应用驱动:AI 能力优先在抖音、头条、飞书等自家产品中落地,再对外输出
  3. C端+B端双轮驱动:豆包抢 C 端市场,火山引擎抢 B 端
  4. 开源 DeerFlow:补齐开发者生态,对标 OpenAI 的 Agent 框架
在这个赢者通吃的年代,在这个抓住入口的年代,在这个流量为王的年代。前两位选手显然最后都会面临一个一点也不艰难的抉择:被收购还是被杀死。
从上篇的对比我们可以看出,这仨项目其实是互补的。作为最后开源的DeerFlow,字节显然是有其考量的。收购估计已经记在了Todo list中,或为了打通开源路径抢占入口或为了避免各位伟大的友商后来者居上。
在字节及其友商这个神仙打架的层间,Agent三件套肯定不会形成技术壁垒,但在变革的时代下抢占一个身位已经是巨大的领先。阿里大模型团队集体搬家,既是一次补强也是一次偷家。
所以,回到我们的角色上。从技术人员的角度,和效果上看,现在的DeerFlow似乎是应用效果最差的,但你必须跟上字节的节奏。毕竟学习成本不高,万一字节起飞了,咱也能跟着喝口汤呢。