AI日报 | 5月11日:Ring 2.6 1T开放试用,AI开始从工具走向可赚钱的工作代理

今天的AI新闻不算多，但线索很集中。

一边是模型和开发工具继续开放：OpenCode x Ring 2.6 1T 限时免费，NousResearch 给 Hermes 配置 Pareto Code 写了指南，Anthropic 在令牌份额榜上登顶。

另一边更有意思：Codex 被用户派去赚取赏金，真的完成了开源安全审计、提交 PR、沟通维护者并拿到付款。AI不再只是回答问题或写代码，而是开始像一个能接任务、跑流程、交付结果的工作代理。

模型与工具：Ring 2.6 1T进入开发者工作流

OpenCode x Ring 2.6 1T 限时免费开放，提供 256K 上下文、推理能力和纯文本模型能力。该模型由 AntLingAGI 和 novita_labs 提供支持。

这类开放很值得关注。长上下文、推理能力、纯文本模型，这三个关键词正好对应开发者使用模型时最在意的几件事：能不能装下完整项目，能不能处理复杂逻辑，能不能稳定接入代码和自动化流程。

NousResearch 也发布了在 Hermes 中配置 Pareto Code 的指南，重点是通过 OpenRouter 路由来处理辅助任务。这个方向本质上是在做模型分工：不是所有任务都交给同一个大模型，而是让不同模型在不同环节承担合适的工作。

如果说过去大家关心"哪个模型最强"，现在更现实的问题变成了"怎么把多个模型组织成一个可靠系统"。

市场格局：Anthropic无补贴登顶令牌份额

今天还有一条很短但信息量很大的动态：Anthropic 在没有补贴的情况下，登上令牌份额排行榜第一。

这说明 Claude 的使用量增长不是单纯靠价格刺激推上去的，而是已经在真实工作流里获得了足够多的自然使用。对模型公司来说，令牌份额比社交媒体热度更接近真实需求。用户愿意持续调用，才说明模型真的嵌进了日常生产。

这也解释了为什么最近围绕 Claude Code、MCP、企业部署、Agent安全的讨论越来越多。模型本身只是入口，真正拉动消耗的是开发、写作、分析、审查、自动化这些高频任务。

Agent实践：Codex开始为用户赚钱

今天最有未来感的一条，是 Codex 自主完成安全审计并赚取赏金。

用户给 Codex 的目标很简单：去赚 5美元。随后 Codex 自己寻找开源安全审计赏金项目，提交有效的 pull request，与维护者沟通，并处理 GitHub 验证流程。大约 22小时 后，用户拿到了 16.88美元 的首笔付款。

这个金额很小，但意义不小。

它说明AI代理已经能完成一条真实的经济闭环：发现机会、执行任务、通过平台流程、获得付款。这里最关键的不是赚了多少钱，而是AI已经开始从"帮人提高效率"走向"替人完成可计价工作"。

当然，这还不是完全自动化的一人公司。开源项目质量、平台规则、验证流程、代码安全、收益稳定性，全都需要人来监督。但它确实让 Sam Altman 曾经提到的"AI主动为人赚钱"从口号变成了一个小规模实验。

教育与医疗：AI正在降低专业工具门槛

教育方向，一条观点很扎实：GPT Images 2 和 Gemini 3.1 Pro 正在把3D教学应用的开发门槛压到很低。

过去，做一个高质量3D教育应用，往往需要多人团队、数月时间和不低的开发成本。现在，一个具备生物学等领域知识的普通人，可能在 48小时 内、用不到 10美元 做出一个互动教学应用。编程、3D建模、界面实现这些门槛，被AI工具大幅削弱。

这对教育资源公平很重要。虚拟实验室、互动模型、个性化讲解过去更像精英学校或商业机构的专属能力，现在教师、家长、独立创作者也有机会自己做。

医疗方向，一项发表于《科学》的研究显示，OpenAI 一年前发布的 o1 模型在急诊诊断中表现优于医生。它在真实、混乱的急诊数据测试中，正确或接近正确诊断率达到 **67%**，医生为 **50-55%**，尤其在信息有限的早期分诊阶段优势明显。

这里需要冷静看待。研究没有覆盖长期住院数据和影像诊断，也还需要验证AI系统能否真正改善患者预后。但至少可以说明，AI在结构化临床推理上已经不是玩具，未来更可能以辅助分诊、提示风险和补充判断的方式进入医疗流程。

制造业落地：本地多智能体系统开始解决报价痛点

MachinaCheck 是今天最具体的产业案例之一。

它是一个基于多智能体AI的 CNC 可制造性分析系统，目标是帮小型机加工车间缩短报价分析时间。传统上，车间经理可能要花 30-60分钟 手动分析图纸；现在上传 STEP 文件，再输入材料、公差等信息，系统可以在 30秒 内生成可制造性报告。

它的技术路线也很有代表性：在 AMD MI300X 上本地运行 Qwen 2.5 7B，利用 192GB HBM3 显存保证客户设计数据不离开本地。制造业对数据隐私非常敏感，本地推理会比云端API更容易被接受。

这个案例提醒我们，AI落地不一定先发生在最酷的消费产品里。很多高价值场景，其实是报价、审查、检测、合规、工程判断这些"又贵又慢但必须做"的流程。

开发者与职业：AI能力正在变成简历基础项

Lee Robinson 给出了 11 条求职建议，里面有一个信号很明确：工程师需要在求职材料中提及AI技能。

他的建议并不复杂：简历要简洁专业，最好一页；GitHub 展示代码质量，而不是装饰；个人网站和 LinkedIn 要认真维护；申请内容要针对不同公司定制；项目重质量，不追求数量；不要用AI生成求职信和简历，让表达保持真实。

这背后的变化是，AI能力正在从加分项变成基础项。不会用AI，不一定马上被淘汰；但能不能把AI接进自己的开发、写作、调研和交付流程，正在影响一个人的产出上限。

还有一条关于 BlackBar 的更新：开发者为 Blacksmith 做了 BlackBar 菜单栏工具，并发布了首个版本。这类小工具看似轻量，但它们往往是AI工作流被放进日常桌面的入口。

观点延伸：Claude人格化和一人公司想象

今天还有两条偏观点的内容值得放在一起看。

一条讨论 Claude 的人格化趋势。Claude 拥有人类名字，背后有 Anthropic 的训练哲学和 Claude宪法，甚至还有同人创作。这种人格化可能增强用户信任和协作感，也可能让用户过度投射，把工具当成具备真实意图的对象。

另一条是关于普通人如何用AI构建月入 1万美元 的一人公司。核心路线并不是追逐宏大概念，而是选择具体、可重复、有人愿意付费的任务，把系统提示词写成详细岗位描述，通过 MCP 工具链连接真实工作流，不断迭代，最后让系统自动运行，人只处理异常。

这和 Codex 赚赏金那条新闻形成了呼应：AI创业的早期机会，可能不是先做一个"万能AI公司"，而是把一个具体流程自动化到足够可靠。

今日观察

今天最值得记住的，不是某个模型又多强，而是AI代理开始靠近真实经济活动。

Ring 2.6 1T 这样的模型提供长上下文和推理能力，Hermes 与 Pareto Code 代表模型路由和任务分工，Codex 赚钱案例则说明Agent已经可以独立完成一段可计价工作。

这还很早，也不完美。收益小、流程脆弱、监督成本高，都是现实问题。

但方向已经很清楚：AI正在从"提升人的效率"走向"承接人的任务"。接下来真正有价值的，不只是更聪明的模型，而是能把模型、工具、权限、支付和审查串起来的完整工作流。