AI 早报 · AI 不再只是回答问题的工具——它开始自己看病、做研究、当数据库了

先听音频👆，后看文章👇

30 秒看懂今天

今天三条新闻讲同一件事:AI 不再只是回答问题的工具——它开始自己看病、做研究、当数据库了。

DeepSeek 首次在 285B(2850 亿参数)大模型上让 AI 全程无人跑通强化学习研究流程。Nature 同一天发两篇 AI 医疗论文,AI 智能体在模拟诊断上得分超过真人专科医生。阿里把对标企业级付费服务 Pinecone 的向量数据库免费开源,加上学界"因果 AI 第四代"框架,下一波 AI 应用门槛要降。

AI 正在从"听你指挥"过渡到"自己干活"。

今日精选 3 条

一、DeepSeek 让 AI 自主跑通 285B 模型研究,首次零人工干预来源 1

让一个新员工从零做项目——立项、写方案、提交任务、debug、改代码、出报告——全程不准问人,他还得真把活儿干完。DeepSeek 这次做的就是这件事。

研究员 Deli Chen 把 AutoResearch 协议开源。在这个框架下,AI 智能体首次完全自主地在 DeepSeek 自家 285B(2850 亿参数)大模型上跑通一整套强化学习(RL)研究闭环。从实验设计、写代码、提交到 GPU 集群、bug 自己 debug、到出结论,全程没人插手。系统还调用了 GRPO 工具。

对你来说意味着什么:AI 工具迭代速度变快。以前大版本升级要工程师花几个月,以后 AI 自己可能一周就能优化一版。ChatGPT、文心、豆包背后训练方式在悄悄变化。

二、AI 开始给你看病:Nature 同日两篇研究,AI 诊断得分超过真人医生来源 2

你去急诊挂号,排两小时队终于轮到你,医生看病不到十分钟。如果 AI 在医生看病前先帮你把可能方向筛一遍,医生是不是轻松很多?

Nature 同一天发两篇 AI 医疗论文,把这件事往前推了一大步。

第一个叫 MIRA,德国团队做的。在模拟电子病历里做 500 多个急诊病例诊断,准确率 88.9%。对比测试(311 例)它 87.8 分,真人资深专科医生 78.1 分,真人+AI 混合队才 71.1 分。阑尾炎(98.6%)和胰腺炎(92.3%)上最稳,整个测试没出现一次危险药物冲突或剂量错误,代码已公开。

第二个是 Google 的 AMIE,用"双智能体"架构互相演练,治疗计划适切率到 95%——初级保健医生才 72%,药物知识基准上也超过真人。

两家团队都提醒:这是模拟不是真实病人,实际可能打折扣,但方向已经清楚。

对你来说意味着什么:短期不会让 AI 直接开药——这也不应该。但接下来一两年,你去医院,医生大概率会先让 AI 做"机器预诊",医生再判断。小毛病不用挤三甲,疑难杂症的诊断速度会快很多。

三、阿里免费开源"国产版 Pinecone",加学界新范式,以后做 AI 应用更便宜了来源 3

想做个"能记住用户历史对话"的 AI 应用?过去基本只有一条路:花钱买 Pinecone 这种向量数据库(帮 AI "记东西"和"找东西"的工具),起步价一个月几十美元。今天这条路不用花钱了。

阿里把自家在用的向量数据库 Zvec 开源了,免费用,一行命令就能装。它对标(月费 70 美元的)Pinecone——能处理十亿条数据、毫秒级检索、全平台都能跑,新版本还加了"全文+向量混合搜索"。

更重要的另一件事:UCSD 黄碧薇教授(因果推断工具包 causal-learn 的作者)提出"AI 四代范式":相关性小模型→因果小模型→相关性大模型(现在的 LLM)→因果大模型。她认为我们现在正站在第三代门口,第四代才是 LLM 之后的下一个台阶。她创立的 Aether AI 也刚完成首轮融资,专门研究怎么让 AI 从视频里自己悟出物理规律。

对你来说意味着什么:国产 AI(豆包、文心、Kimi、通义)背后会有更多免费工具支撑,订阅费可能降。做副业或 AI 知识库产品的朋友,可以关注 Zvec,门槛和成本都会大幅降低。

今天可以做什么

关注常用 AI 工具更新
。ChatGPT 付费用户留意"用量分析"和"企业版控制台";做副业的可以试用 Adobe AI Assistant(目前公开测试版)。
未来一年要换车
:工信部发了国内首部 L3/L4 自动驾驶强制性国标,公示期到 6 月 24 日,2027 年 7 月正式实施。买新车可以关注"是否符合 L3 安全要求"。

我的判断

三条主线讲同一件事:AI 正在从"听你指挥的工具"变成"能自己干活的同事"。

医疗 AI 给真人医生打辅助,研究 AI 自己跑实验,基建工具白菜价——背后是同一个拐点:AI 不再只是"会回答问题",它在某个具体领域里已经能独立完成一整个工作流。

对我们每天用 AI 提效的人来说,意味着两件事:一是 2026 下半年到 2027,你用的工具会越来越"主动";二是 AI 之间的差距会从"谁更会说话"变成"谁更能闭环干活"——以后判断 AI 好不好用,不是看它答题漂不漂亮,而是看它能不能独立把一件事做完。

明日关注

L3/L4 自动驾驶国标公示 6 月 24 日截止
国内 AI 应用厂商是否会跟进开源(类似阿里 Zvec 这种"对标付费产品再免费"的策略)

原始资料

[1] DeepSeek AutoResearch — 聚合自 aihot · Deli Chen X 帖 + AutoResearch GitHub
[2] Nature: MIRA + AMIE 诊断 — 聚合自 aihot · Nature 期刊原文
[3] 阿里 Zvec + UCSD 因果 AI — 聚合自 aihot · 阿里 Zvec 官方 + Aether AI 官方
[4] Anthropic Project Fetch 2 — 聚合自 aihot · Anthropic 官方
[5] L3/L4 自动驾驶国标公示 — 聚合自 aihot · 工信部公示原文
[6] FERC AI 数据中心电网快车道 — 聚合自 aihot · FERC 官网 + Bloomberg