AI舍不得放开用?Agnes AI 宣布无限期免费,这几天杀疯了!

前几天我在一个开发者群里刷到一条消息：Agnes AI全模态API免费了，无限期。文本、图片、视频，全部免费。

全球模型榜单前十的AI Lab，Claw-Eval和Artificial Analysis双榜都上了，排第九。这种级别的玩家，把核心模型API全免费开放？不是试用，不是额度，是永久免费，所以赶紧去上手玩了玩。

来看看有多牛

Agnes官方甩出一份数据：单周Token消耗4.11万亿。文本模型吃掉2.67T，图片加视频干掉1.44T。567万张图，237万秒视频。OpenRouter上排全球第二，仅次于DeepSeek V4 Flash。

我按它以前的定价算了笔账，文本模型输入0.15/1M tokens，图片0.3/分钟。4.11T Token加567万张图加237万秒视频，一周烧掉的钱够在一线城市买套房。

现在全部免费，而且调用量三周连涨。第一波薅羊毛的人没走，反而越用越狠。这说明什么？说明有人真拿它干活了。

这帮人到底在做什么

Agnes AI 是全球第九的AI Lab，他们不走"全能但昂贵"的路线，搞了一套Agent-native的全模态矩阵。文本、图像、视频三大能力协同工作，逻辑简单粗暴：省钱，不省能力。

• Agnes-2.0-Flash 是文本核心。Transformer架构，数万亿Token语料训练，覆盖自然语言、代码、数学、学术和多语言材料。持续预训练、监督微调、RLHF对齐优化全走了一遍。它擅长复杂指令理解、长上下文建模、数学与逻辑推理、多任务统一建模、工具调用和Agent任务规划。Claw-Eval真实Agent任务评测里，Agnes-2.0-Flash部分任务超越了Gemini Flash和MiniMax M2.7。
• Agnes-Image-2.1-Flash 基于Diffusion Transformer，约16亿高质量数据训练。Artificial Analysis图像编辑盲评里进了榜单前列。身份一致性做得尤其好，人像编辑时脸部特征不会崩。
• Agnes-Video-2.0 支持原生音画同步，输出可选720P或1080P。首帧生视频、首尾帧生视频、多帧生视频、多镜头内容生成、人物内容生成、景别切换、第一视角运镜、光影氛围塑造都能干。Artificial Analysis图像生视频盲评里，音画同步表现杀入了前列。

三款模型免费之前，定价已经是同类主流商业模型的一半。Agnes-2.0-Flash输入0.03美元/1M tokens，输出0.15美元/1M tokens。Agnes-Image-2.1-Flash 3美元/1000张。Agnes-Video-2.0 0.3美元/分钟，现在全部免费开放了。

4.11T不是刷出来的

免费政策放开第三周，Agnes全模态模型的周调用量冲到4.11万亿Token。文本模型Agnes-2.0-Flash独自吃掉2.67T。图片和视频模型合计贡献1.44T。开发者生成了567万张图，视频模型跑了237万秒。

4.11T跑赢了小米MiMo-V2.5在OpenRouter上的周调用量，仅次于DeepSeek V4 Flash。Agent多轮对话、代码库全局分析、批量图片生成、自动化视频工作流，这些才是真正吃Token的怪兽。开发者以前不敢这么玩，因为账单会吃人。现在全模态API抹到零，大家直接把油门踩死。

567万张图不是设计师一张张点的，是脚本在批量跑。237万秒视频不是创作者熬夜剪的，是工作流在自动吐素材。1.44T的视觉Token占比说明，免费政策直接解放了视觉内容创作和批量创意测试的生产力，以前用不起，现在用不完。

Agnes把19个Issues晾在GitHub上

我顺着官网底部的链接摸到GitHub。AgnesAI-Labs仓库首页挂着19个Issues，全公开，没锁，没藏。TTFT偏慢、图片模型偶发503、Codex接入报400、Claude Code适配问题，Agnes团队把这些真实毛病全列在GitHub Issues里。

更狠的是，Agnes团队在主页直接挂了GitHub Projects看板链接。你打开 https://github.com/users/AgnesAI-Labs/projects/1 就能看见Bug追踪、功能排期、开发进度，全透明。

大多数公司巴不得把问题藏进私域客服池，让用户反复提交工单，然后收一封"我们已收到您的反馈"的自动回复。Agnes团队选择把底牌晾在GitHub上。开发者提Issue，团队公开回复，修复进度实时同步。

我翻了几个具体的Issue。有人反馈图片模型返回503，团队回复正在排查CDN节点。有人问Codex怎么接入，社区开发者直接贴了配置代码。敢免费，也敢把问题公开，敢让人盯着看。这种姿态比任何公关话术都硬。

1M上下文，切片那套可以扔了

Agnes-2.0-Flash本周正式上线1M上下文窗口，高峰时段Agnes会限制在512K，非高峰时段你能直接塞进去一本长篇小说。开发者不用改代码，messages数组总内容量控制在1M Token以内就行。

我跑了两个场景来测试这个1M窗口。

第一个场景比较实用的，我给了他一份面试资料，让他消化掉，秒变面试大师。

随后就可以疯狂提问了，比如：

问：如何用两个栈实现队列

你看，他连这是刚才喂给他的面试题的第几道也说出来了，响应时间十几秒。

我没有做任何RAG切片，没有建向量库，没有写检索逻辑，直接把TXT文件内容全贴进去。以前这种活需要搭一套LangChain流水线，现在一行代码不用改。

第二个场景是代码库全局审查，我把一个小型Java项目的全部源码、配置文件、依赖项一次性打包塞进去，让Agnes-2.0-Flash分析跨文件调用的潜在Bug。

它一口气找出14个Bug，位置精确到行号。这种全局视野是切片方案做不到的，你切十段代码，每段都"看起来没问题"，合起来就崩。

来看看效果：

他还给你整了一份 Markdown 格式的分析报告：

1M上下文不是"能塞更多字"这么简单，它抹平了文档分段带来的信息断层，省掉了开发者在切片逻辑上浪费的时间。对于中小团队，这意味着省掉一个专门做RAG优化的工程师。

4K图片，我改了行代码

Agnes-Image-2.1-Flash这次直接解锁4K输出，最高4096×4096，1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9全比例覆盖。

接入方式简单到离谱，把size参数从"1K"改成"4K"，其余代码不动，返回格式依然支持url链接和b64_json。

原来生成1K图的请求：

{  "model": "agnes-image-2.1-flash",  "prompt": "提示词",  "size": "1K",  "ratio": "1:1"}

改成4K：

{  "model": "agnes-image-2.1-flash",  "prompt": "提示词",  "size": "4K",  "ratio": "1:1"}

其他代码都不用改，响应格式不变，我跑了两组场景来测试4K能力。

第一组是电商产品主图。

生成一张4k图，带光影质感的运动鞋。生成时间比1K稍长，但纹理和材质细节明显更扎实。鞋面网眼的编织结构、颗粒感，还有金属光泽反射都在4K下都保留了层次。

高清大图在这里：

第二组是创意海报。

疯狂星期四的创意海报，测试复杂构图下的文字渲染和细节密度。画面元素密集，但4K分辨率让每个局部都经得起放大。我特意检查了几个小字区域，边缘清晰，没有涂抹。

两组测试下来，4K和1K的扣费完全一样，零。RPM做了限制，4K图片1分钟只能请求一次，但免费框架下能拿到这个级别的画质，我之前没见过。设计师以前用Midjourney跑4K得按月订阅，现在Agnes改个参数就行。

GitHub生态已经动起来了

开源社区的反应速度快得惊人，GitHub上已经出现一批围绕Agnes的公开Skill、工具和项目，使用正在从单次体验扩展到真实开发者生态。

Yacey做了agnes-ai-generation-skill，支持Codex、Claude Code、OpenClaw等Agent工具直接调用Agnes生图和生视频。kangaroking整理了agnes-free-model-skills集合，覆盖多种工作流。

仓库地址：

https://github.com/Yacey/agnes-ai-generation-skill

16nic做了ComfyUI节点，让Agnes-Image-2.1-Flash直接嵌入ComfyUI流水线。anomalyco的OpenCode项目已经提了Feature Request要把Agnes加进模型列表。

仓库地址：

https://github.com/16nic/comfyui-agnes-ai

还有开发者做了Hermes适配、WorkBuddy插件、MCP服务和自动化视频工作流。

飞书社区里也有热心网友整理了详细的教程和多模态Skill接入指南，覆盖从API基础调用到高级工作流搭建的全流程。

Agnes社群里每天有人在晒生成案例，有人拿Agnes-Video-2.0跑短视频素材，有人拿Agnes-Image-2.1-Flash做电商主图批量替换背景，这些真实用法比官方宣传更有说服力。

TTS快来了

Agnes团队计划在本周五灰度上线TTS，20种音色，中英文双语。文本、图片、视频、语音的全模态链路即将闭合，这块我简单掠过，等上线后再看看能力如何。

写在最后

用了一段时间，Agnes 给我最深的感觉不是"多了一个免费模型"，是它把两个东西同时做到了：全模态免费，而且质量能打。

这话说出来有点像广告，但 Claw-Eval 和 Artificial Analysis 双榜不是 Agnes 自己评的，OpenRouter 上 4.11T Token 也是实实在在的，几万个开发者连着用三周，不好用早跑了。

免费 API 这件事不好干。烧钱容易，持续烧且模型能力不打折，难。现在市面上免费的没它能打，很能打的不免费，蛮好，我已经开始用起来了！

• 官网：https://agnes-ai.com/
• 开发者平台：https://platform.agnes-ai.com/login
• 开发者文档：https://agnes-ai.com/doc
• GitHub问题追踪：https://github.com/AgnesAI-Labs/Agnes-AI/issues

点击下方卡片，关注极客之家

这个公众号曾分享过许多有趣的开源项目。如果你不想逐篇翻阅历史文章，也可以直接关注微信公众号“极客之家”，通过后台留言与我们互动交流