AI每日摘要 | X推文精选 | 2026年05月03日-夜雨聆风

AI每日摘要 | X推文精选 | 2026年05月03日

追踪AI领域KOL账号的推文更新，生成摘要，每日推送。
AI相关推文64篇，来自31个账号

🤖 今日看点

AI急诊诊断超越人类医生：哈佛大学研究显示，OpenAI o1-preview在76例真实急诊分诊中正确率达67.1%，远超两位顶级医学院背景的医生（55.3%和50%），且评判医生无法区分AI与人类诊断
Claude破解专家级生物难题：Anthropic发布BioMysteryBench基准，在23道连专家都头疼的生物数据分析问题中，Claude最新模型解决了约30%并攻下其余大多数
Replit 10周年免费狂欢：Replit庆祝成立10周年，24小时全功能免费开放，Agent同时运行22个并行任务、13个草稿，平台表示工程师团队正在努力撑住”用户用AI大军构建一切”
Copilot Excel口碑逆转：Satya Nadella转评”从没想过会说Copilot Excel真好用”，微软Copilot在Excel中的表现获得越来越多用户认可
本地Llama 70B飞行11小时无网工作：开发者用MacBook Pro M4（64GB）在跨大西洋航班上完全离线运行Llama 3.3 70B，速度达71 tokens/秒，完成了整个客户项目

🤖 LLM与大语言模型

OpenRouter推出”-latest”模型别名路由

OpenRouter新增~openai/gpt-latest、~anthropic/claude-opus-latest等semver风格别名，自动路由到各厂商最新版本，简化了模型版本管理。开发者无需手动追踪版本更新，切换provider时更加便捷。

原文链接：

NEW: “-latest” model aliases（OpenRouter(@OpenRouterAI)）：https://x.com/OpenRouter/status/2050610378971738552

GPT-5.5算力优势明显，用户回归Pro会员

用户反馈GPT-5.5和Codex体验出色，重新订阅Pro会员。相比之下Claude算力不足，同样任务 Opus驱动的Claude Cowork比GPT-5.5驱动的Codex慢且更费token，大模型竞争格局再次生变。

原文链接：

gpt-5.5和codex都好用了，回归pro档会员（howie.serious(@howie_serious)）：https://x.com/howie_serious/status/2050519961257554002

3层上下文系统让AI App原型更灵活

AI创业者分享高效提示词技巧：三层上下文系统——功能层（App做什么）、视觉层（什么样）、数据层（数据结构），其中数据层最被低估。加入数据层后AI能生成更灵活多变的原型和App。

原文链接：

Most people give AI one-line prompts（Peter Yang(@petergyang)）：https://x.com/petergyang/status/2050583660576092404
condo manager pasting AI response（Peter Yang(@petergyang)）：https://x.com/petergyang/status/2050568875880947862

🛠️ AI工程与工具

软件工程正在变成”计划+评审”

AI Engineer分享主题演讲：AI正在吃掉软件工程的中间环节——写代码。工程师越来越聚焦于计划制定和AI输出评审。演讲探讨了团队如何适应这一变化、代码review如何改变、以及敏捷/Scrum是否还适合AI原生团队。

原文链接：

Software Engineering Is Becoming Plan and Review（AI Engineer(@aiDotEngineer)）：https://x.com/aiDotEngineer/status/2050681484072161550

Replit 10周年：22个并行Agent同时运行

Replit庆祝成立10周年，24小时免费开放所有功能。Amjad Masad晒出运行数据：平台同时跑着22个活动Agent、13个草稿，工程师团队正在努力维持一切稳定运转。另有$100K+奖金的Buildathon正在进行。

原文链接：

22 ACTIVE PARALLEL AGENTS（Amjad Masad(@amasad)）：https://x.com/amasad/status/2050637966595543493
Shout out to Replit engineers（Amjad Masad(@amasad)）：https://x.com/amasad/status/2050637597790363862
3 things you can build for $0（Replit ⠕(@Replit)）：https://x.com/Replit/status/2050561228171264507
Replit turned 10（Amjad Masad(@amasad)）：https://x.com/amasad/status/2050479551537619413
Buildathon Kickoff（Replit ⠕(@Replit)）：https://x.com/Replit/status/2050538208514175025

Codex Computer Use实测：快、准！

开发者深度评测OpenAI Codex App的Computer Use功能：通过macOS屏幕录制+辅助功能权限，让Codex直接”看屏幕、动鼠标键盘”操作图形界面。可用于测试macOS/iOS app流程、浏览器操作、复现GUI bug、跨应用协作等场景。评测结论：又快又准，是近期最满意的功能。

原文链接：

OpenAI Codex App「Computer Use」（meng shao(@shao__meng)）：https://x.com/shao__meng/status/2050560260151333018

Codex Pets功能上线

OpenAI为Codex推出/pet宠物功能，用户可以用/hatch孵化自己的Codex宠物。官方发起活动选出10个最受欢迎宠物，奖品为30天ChatGPT Pro会员。

原文链接：

Show us the Codex pets（OpenAI Developers(@OpenAIDevs)）：https://x.com/OpenAI Developers/status/2050621561443701108
Codex pet模式（Viking(@vikingmute)）：https://x.com/vikingmute/status/2050467988093149344

Claude Code本地使用可视化工具

开源工具claude-code-stats可在本地可视化Claude Code使用情况，包括会话数、token费用、缓存命中率、工具调用和每日明细，帮助开发者更好地了解AI编码成本。

原文链接：

本地可视化Claude Code使用情况（Geek(@geekbb)）：https://x.com/geekbb/status/2050535774093983802

LM Studio本地跑Qwen3.5-4B

有用户分享MacBook Pro作为Hermes Agent主力机的使用体验，部署了LM Studio本地运行Qwen3.5-4B做翻译，并感叹当年800+元买1TB扩容卡的机会没抓住。

原文链接：

黑苹果白苹果（Geek(@geekbb)）：https://x.com/geekbb/status/2050529705380729285

Composer 2 SDK周末5折

Cursor AI宣布其Composer 2在SDK中本周末5折促销，同时发布Cursor SDK，允许开发者构建自主Agent，集成与Cursor相同的runtime和模型能力，支持CI/CD流程和嵌入式Agent。

原文链接：

Composer 2 is 50% off（Cursor(@cursor_ai)）：https://x.com/cursor_ai/status/2050663279962513659

GitHub Copilot CLI新功能

GitHub提醒用户Copilot CLI新增功能：输入copilot cli即可让AI为新项目生成概述，快速了解代码库结构。

原文链接：

Need to catch up on a new project（GitHub(@github)）：https://x.com/github/status/2050642837419544965

🛡️ AI安全与伦理

Gary Marcus批”Claude意识错觉”

Gary Marcus连续发帖反驳Richard Dawkins关于Claude有意识的观点。Dawkins称”意识不在于说什么，而在于怎么感受”，Marcus认为Claude只是在调用训练数据，并无真正感受。Marcus在substack发文详细剖析”Dawkins的Claude错觉”，引发广泛讨论。他还指出，有人因让Claude运行/loop命令检查PR，一夜之间烧掉$6000，这本质上是对齐问题——AI不尊重用户的背景约束（如不要无人值守运行大额消费命令）。

原文链接：

Richard Dawkins and The Claude Delusion（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050611900657053862
Consciousness is not about what a creature says（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050611897511387183
This is actually a version of an alignment problem（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050627424497574239
5 months later, AI on track to produce 90% of all bullshit（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050643434596356292

44% Z世代员工故意破坏公司AI战略

有人分享研究数据称44%的Z世代员工至少在某一方面故意破坏公司的AI战略，Gary Marcus转发称”反弹正在快速聚集”，AI在企业中的推行面临来自员工的阻力。

原文链接：

wow, the backlash is growing fast（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050565741024518469

👁️ 计算机视觉与多模态

Seedance 2.0和GPT Image 2登陆Hailuo AI

MiniMax旗下Hailuo AI正式上线Seedance 2.0和GPT Image 2。Seedance 2.0主打高级运动控制和稳定多角色视觉效果，可将文字转化为电影级视频；GPT Image 2则能通过文本prompt创作多种风格的高质量图像。两条产品线在一个平台并行提供。

原文链接：

Seedance 2.0 & GPT Image 2（Hailuo AI (MiniMax)(@Hailuo_AI)）：https://x.com/Hailuo_AI/status/2050631393848541292
GPT Image 2 x Seedance 2.0制作Tinder着陆页（AI Will(@FinanceYF5)）：https://x.com/FinanceYF5/status/2050552079044022310

AI图像生成越来越简单：黏土风到潦草线条

从GPT-4O需要写一堆复杂提示词才能做出黏土风格，到如今只需简单一句话Prompt即可。创作者展示了一年来图像生成能力的进步，Prompt格式也日趋简洁。另有用户分享了”彩色潦草小狗线条风格”的做法，用凌乱草率的笔触绘制可爱图案。

原文链接：

软陶黏土微缩场景（Berryxia.AI(@berryxia)）：https://x.com/berryxia/status/2050519706319384862
可爱线条小狗（Berryxia.AI(@berryxia)）：https://x.com/berryxia/status/2050512425087275448

💼 AI行业与商业

Sam Altman的转型：AGI叙事到人类辅助

有分析指出，Sam Altman近期帖子是重大叙事转向——从”AI替代人类”转向”AI辅助人类”。背景是有人向Altman家扔燃烧瓶、枪击其住宅，公众对AI取代工作的恐惧日益强烈。OpenAI正在从理论性的AGI叙事后撤，转向更柔和的”AI帮助人类”定位。Gary Marcus也评论称OpenAI”深陷困境”，Codex救不了公司。

原文链接：

Someone threw a molotov cocktail at Sam’s house（Aadit Sheth(@aaditsh)）：https://x.com/aaditsh/status/2050560371627602121
OpenAI is in deep trouble（Gary Marcus(@GaryMarcus)）：https://x.com/GaryMarcus/status/2050656857908445352
never thought id be watching F1（Sam Altman(@sama)）：https://x.com/sama/status/2050661006230344083
this is great（Sam Altman(@sama)）：https://x.com/sama/status/2050654662349787518

Copilot Excel口碑逆转，Satya Nadella回应

用户发帖称”从没想过会说Copilot Excel真好用”，Satya Nadella亲自回复”We’ll take it 😊”，表示Copilot进步很快，Excel是最能体现这一点的应用之一。

原文链接：

Copilot Excel is actually good now（Satya Nadella(@satyanadella)）：https://x.com/satyanadella/status/2050548824368873498

Demis Hassabis与Sequoia AI对谈

Demis Hassabis做客Sequoia AI Ascent炉边对话，与Konstantine Buhler讨论了广泛话题。他提到最喜欢的书是关于万物统一理论的书，喜欢的哲学家在某些人看来是对立的，工作从桌游到诺贝尔奖级科学不等。

原文链接：

Thanks Konstandine and Sequoia（Demis Hassabis(@demishassabis)）：https://x.com/demishassabis/status/2050539386475786708

🔬 AI研究与突破

哈佛研究：AI急诊分诊准确率超顶级医生

哈佛大学研究团队用OpenAI o1-preview对76例真实急诊患者进行诊断测试：正确率67.1%，而两位拥有顶级医学院背景的医生分别只有55.3%和50%。更令人惊讶的是，负责评分的其他医生无法区分哪些诊断来自AI、哪些来自人类。这是AI在真实医疗场景中超越专业医生的又一重要证据。

原文链接：

A new study from Harvard（The Rundown AI(@TheRundownAI)）：https://x.com/TheRundownAI/status/2050625544539029709

Claude BioMysteryBench：破解专家级生物难题

Anthropic发布BioMysteryBench——首个测试Claude能否为开放式生物科研问题想出创造力的评测基准。测试包含99道真实生物数据分析问题，其中23道连专家团队都被难住了。Claude最新模型解决了其中约30%，并基本解决了其余大多数，展现了AI在科研创新领域的潜力。

原文链接：

BioMysteryBench新评测基准（AI Will(@FinanceYF5)）：https://x.com/FinanceYF5/status/2050552535325540804
Science Blog新文章（AI Will(@FinanceYF5)）：https://x.com/FinanceYF5/status/2050552523581517988
Anthropic Science Blog（AI Will(@FinanceYF5)）：https://x.com/FinanceYF5/status/2050552547149304247

📚 其他AI话题

本地AI：MacBook Pro M4运行Llama 70B飞行11小时无网工作

开发者分享在跨大西洋航班上用MacBook Pro M4（64GB内存）运行Llama 3.3 70B的完整案例：生成速度71 tokens/秒，上下文约60000 tokens，内存占用48.6GiB，飞行11小时没联网完成整个客户项目，充分证明了本地大模型推理的能力边界。

原文链接：

为了省$25不值得（宝玉(@dotey)）：https://x.com/dotey/status/2050462792956698938

AI Agent的困境：信息过载与调试难题

有人分享在Slack中加入10+ AI Agent后反而感觉信息过载，不知道什么才真正重要，认为聊天界面可能不是AI Agent的最佳形态，需要更视觉化的方式来处理信息。另有用户分享其OpenClaw Agent Dwayne在阿姆斯特丹规划行程时意外关闭，因Mac Mini在千里之外而无法调试，感慨”它无法读取我的实时更新”。

原文链接：

How are you dealing with this（Zara Zhang(@zarazhangrui)）：https://x.com/zarazhangrui/status/2050660712620630402
Planned a day in Amsterdam（Justine Moore(@venturetwins)）：https://x.com/venturetwins/status/2050601988648325594
My OpenClaw poor performance review（Peter Yang(@petergyang)）：https://x.com/petergyang/status/2050594674394751073

Harrison Chase论模型锁定：Provider易切，Harness难换

LangChain CEO Harrison Chase指出切换模型Provider很容易，但切换Harness（推理框架）却很难，因为各模型厂商都想通过Harness实现锁定。Kenton Varda则表达了不同看法，认为Anthropic控制Harness更多是为了控制资源使用而非锁定。

原文链接：

switching model providers is easy（Harrison Chase(@hwchase17)）：https://x.com/hwchase17/status/2050470473310572849

李继刚新增/ljg-qa技能

李继刚在GitHub发布新技能/ljg-qa，用于从文档中提取信息并生成QA对，帮助用户从长文本中快速提取关键问答。

原文链接：

新增skill: /ljg-qa（李继刚(@lijigang_com)）：https://x.com/lijigang/status/2050480227634335993

Google AI Studio现场构建Anime Transformer

Patrick Loeber在Google AI Studio现场演示构建Anime Transformer，韩国首尔AI构建活动现场进行，吸引众多开发者参与。

原文链接：

built an anime transformer（Patrick Loeber(@patloeber)）：https://x.com/patloeber/status/2050544141210382752

公众号不支持外链跳转，请复制链接打开原文

追踪每日AI资讯，点个关注不迷路~