前几天我在一个开发者群里刷到一条消息:Agnes AI全模态API免费了,无限期。文本、图片、视频,全部免费。
全球模型榜单前十的AI Lab,Claw-Eval和Artificial Analysis双榜都上了,排第九。这种级别的玩家,把核心模型API全免费开放?不是试用,不是额度,是永久免费,所以赶紧去上手玩了玩。
来看看有多牛
Agnes官方甩出一份数据:单周Token消耗4.11万亿。文本模型吃掉2.67T,图片加视频干掉1.44T。567万张图,237万秒视频。OpenRouter上排全球第二,仅次于DeepSeek V4 Flash。

我按它以前的定价算了笔账,文本模型输入0.15/1M tokens,图片0.3/分钟。4.11T Token加567万张图加237万秒视频,一周烧掉的钱够在一线城市买套房。
现在全部免费,而且调用量三周连涨。第一波薅羊毛的人没走,反而越用越狠。这说明什么?说明有人真拿它干活了。

这帮人到底在做什么
Agnes AI 是全球第九的AI Lab,他们不走"全能但昂贵"的路线,搞了一套Agent-native的全模态矩阵。文本、图像、视频三大能力协同工作,逻辑简单粗暴:省钱,不省能力。

• Agnes-2.0-Flash 是文本核心。Transformer架构,数万亿Token语料训练,覆盖自然语言、代码、数学、学术和多语言材料。持续预训练、监督微调、RLHF对齐优化全走了一遍。它擅长复杂指令理解、长上下文建模、数学与逻辑推理、多任务统一建模、工具调用和Agent任务规划。Claw-Eval真实Agent任务评测里,Agnes-2.0-Flash部分任务超越了Gemini Flash和MiniMax M2.7。 • Agnes-Image-2.1-Flash 基于Diffusion Transformer,约16亿高质量数据训练。Artificial Analysis图像编辑盲评里进了榜单前列。身份一致性做得尤其好,人像编辑时脸部特征不会崩。 • Agnes-Video-2.0 支持原生音画同步,输出可选720P或1080P。首帧生视频、首尾帧生视频、多帧生视频、多镜头内容生成、人物内容生成、景别切换、第一视角运镜、光影氛围塑造都能干。Artificial Analysis图像生视频盲评里,音画同步表现杀入了前列。
三款模型免费之前,定价已经是同类主流商业模型的一半。Agnes-2.0-Flash输入0.03美元/1M tokens,输出0.15美元/1M tokens。Agnes-Image-2.1-Flash 3美元/1000张。Agnes-Video-2.0 0.3美元/分钟,现在全部免费开放了。
4.11T不是刷出来的
免费政策放开第三周,Agnes全模态模型的周调用量冲到4.11万亿Token。文本模型Agnes-2.0-Flash独自吃掉2.67T。图片和视频模型合计贡献1.44T。开发者生成了567万张图,视频模型跑了237万秒。
4.11T跑赢了小米MiMo-V2.5在OpenRouter上的周调用量,仅次于DeepSeek V4 Flash。Agent多轮对话、代码库全局分析、批量图片生成、自动化视频工作流,这些才是真正吃Token的怪兽。开发者以前不敢这么玩,因为账单会吃人。现在全模态API抹到零,大家直接把油门踩死。

567万张图不是设计师一张张点的,是脚本在批量跑。237万秒视频不是创作者熬夜剪的,是工作流在自动吐素材。1.44T的视觉Token占比说明,免费政策直接解放了视觉内容创作和批量创意测试的生产力,以前用不起,现在用不完。
Agnes把19个Issues晾在GitHub上
我顺着官网底部的链接摸到GitHub。AgnesAI-Labs仓库首页挂着19个Issues,全公开,没锁,没藏。TTFT偏慢、图片模型偶发503、Codex接入报400、Claude Code适配问题,Agnes团队把这些真实毛病全列在GitHub Issues里。

更狠的是,Agnes团队在主页直接挂了GitHub Projects看板链接。你打开 https://github.com/users/AgnesAI-Labs/projects/1 就能看见Bug追踪、功能排期、开发进度,全透明。

大多数公司巴不得把问题藏进私域客服池,让用户反复提交工单,然后收一封"我们已收到您的反馈"的自动回复。Agnes团队选择把底牌晾在GitHub上。开发者提Issue,团队公开回复,修复进度实时同步。
我翻了几个具体的Issue。有人反馈图片模型返回503,团队回复正在排查CDN节点。有人问Codex怎么接入,社区开发者直接贴了配置代码。敢免费,也敢把问题公开,敢让人盯着看。这种姿态比任何公关话术都硬。
1M上下文,切片那套可以扔了
Agnes-2.0-Flash本周正式上线1M上下文窗口,高峰时段Agnes会限制在512K,非高峰时段你能直接塞进去一本长篇小说。开发者不用改代码,messages数组总内容量控制在1M Token以内就行。
我跑了两个场景来测试这个1M窗口。
第一个场景比较实用的,我给了他一份面试资料,让他消化掉,秒变面试大师。

随后就可以疯狂提问了,比如:
问:如何用两个栈实现队列

你看,他连这是刚才喂给他的面试题的第几道也说出来了,响应时间十几秒。
我没有做任何RAG切片,没有建向量库,没有写检索逻辑,直接把TXT文件内容全贴进去。以前这种活需要搭一套LangChain流水线,现在一行代码不用改。
第二个场景是代码库全局审查,我把一个小型Java项目的全部源码、配置文件、依赖项一次性打包塞进去,让Agnes-2.0-Flash分析跨文件调用的潜在Bug。

它一口气找出14个Bug,位置精确到行号。这种全局视野是切片方案做不到的,你切十段代码,每段都"看起来没问题",合起来就崩。
来看看效果:

他还给你整了一份 Markdown 格式的分析报告:

1M上下文不是"能塞更多字"这么简单,它抹平了文档分段带来的信息断层,省掉了开发者在切片逻辑上浪费的时间。对于中小团队,这意味着省掉一个专门做RAG优化的工程师。
4K图片,我改了行代码
Agnes-Image-2.1-Flash这次直接解锁4K输出,最高4096×4096,1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9全比例覆盖。
接入方式简单到离谱,把size参数从"1K"改成"4K",其余代码不动,返回格式依然支持url链接和b64_json。
原来生成1K图的请求:
{ "model": "agnes-image-2.1-flash", "prompt": "提示词", "size": "1K", "ratio": "1:1"}改成4K:
{ "model": "agnes-image-2.1-flash", "prompt": "提示词", "size": "4K", "ratio": "1:1"}其他代码都不用改,响应格式不变,我跑了两组场景来测试4K能力。
第一组是电商产品主图。
生成一张4k图,带光影质感的运动鞋。生成时间比1K稍长,但纹理和材质细节明显更扎实。鞋面网眼的编织结构、颗粒感,还有金属光泽反射都在4K下都保留了层次。

高清大图在这里:

第二组是创意海报。
疯狂星期四的创意海报,测试复杂构图下的文字渲染和细节密度。画面元素密集,但4K分辨率让每个局部都经得起放大。我特意检查了几个小字区域,边缘清晰,没有涂抹。


两组测试下来,4K和1K的扣费完全一样,零。RPM做了限制,4K图片1分钟只能请求一次,但免费框架下能拿到这个级别的画质,我之前没见过。设计师以前用Midjourney跑4K得按月订阅,现在Agnes改个参数就行。
GitHub生态已经动起来了
开源社区的反应速度快得惊人,GitHub上已经出现一批围绕Agnes的公开Skill、工具和项目,使用正在从单次体验扩展到真实开发者生态。

Yacey做了agnes-ai-generation-skill,支持Codex、Claude Code、OpenClaw等Agent工具直接调用Agnes生图和生视频。kangaroking整理了agnes-free-model-skills集合,覆盖多种工作流。
仓库地址:
https://github.com/Yacey/agnes-ai-generation-skill
16nic做了ComfyUI节点,让Agnes-Image-2.1-Flash直接嵌入ComfyUI流水线。anomalyco的OpenCode项目已经提了Feature Request要把Agnes加进模型列表。
仓库地址:
https://github.com/16nic/comfyui-agnes-ai
还有开发者做了Hermes适配、WorkBuddy插件、MCP服务和自动化视频工作流。
飞书社区里也有热心网友整理了详细的教程和多模态Skill接入指南,覆盖从API基础调用到高级工作流搭建的全流程。
Agnes社群里每天有人在晒生成案例,有人拿Agnes-Video-2.0跑短视频素材,有人拿Agnes-Image-2.1-Flash做电商主图批量替换背景,这些真实用法比官方宣传更有说服力。
TTS快来了
Agnes团队计划在本周五灰度上线TTS,20种音色,中英文双语。文本、图片、视频、语音的全模态链路即将闭合,这块我简单掠过,等上线后再看看能力如何。
写在最后
用了一段时间,Agnes 给我最深的感觉不是"多了一个免费模型",是它把两个东西同时做到了:全模态免费,而且质量能打。
这话说出来有点像广告,但 Claw-Eval 和 Artificial Analysis 双榜不是 Agnes 自己评的,OpenRouter 上 4.11T Token 也是实实在在的,几万个开发者连着用三周,不好用早跑了。
免费 API 这件事不好干。烧钱容易,持续烧且模型能力不打折,难。现在市面上免费的没它能打,很能打的不免费,蛮好,我已经开始用起来了!
• 官网:https://agnes-ai.com/ • 开发者平台:https://platform.agnes-ai.com/login • 开发者文档:https://agnes-ai.com/doc • GitHub问题追踪:https://github.com/AgnesAI-Labs/Agnes-AI/issues
这个公众号曾分享过许多有趣的开源项目。如果你不想逐篇翻阅历史文章,也可以直接关注微信公众号“极客之家”,通过后台留言与我们互动交流

夜雨聆风