乐于分享
好东西不私藏

AI每日摘要 | X推文精选 | 2026年05月03日

AI每日摘要 | X推文精选 | 2026年05月03日

追踪AI领域KOL账号的推文更新,生成摘要,每日推送。
AI相关推文64篇,来自31个账号


🤖 今日看点

  • AI急诊诊断超越人类医生:哈佛大学研究显示,OpenAI o1-preview在76例真实急诊分诊中正确率达67.1%,远超两位顶级医学院背景的医生(55.3%和50%),且评判医生无法区分AI与人类诊断
  • Claude破解专家级生物难题:Anthropic发布BioMysteryBench基准,在23道连专家都头疼的生物数据分析问题中,Claude最新模型解决了约30%并攻下其余大多数
  • Replit 10周年免费狂欢:Replit庆祝成立10周年,24小时全功能免费开放,Agent同时运行22个并行任务、13个草稿,平台表示工程师团队正在努力撑住”用户用AI大军构建一切”
  • Copilot Excel口碑逆转:Satya Nadella转评”从没想过会说Copilot Excel真好用”,微软Copilot在Excel中的表现获得越来越多用户认可
  • 本地Llama 70B飞行11小时无网工作:开发者用MacBook Pro M4(64GB)在跨大西洋航班上完全离线运行Llama 3.3 70B,速度达71 tokens/秒,完成了整个客户项目

🤖 LLM与大语言模型

OpenRouter推出”-latest”模型别名路由

OpenRouter新增~openai/gpt-latest~anthropic/claude-opus-latest等semver风格别名,自动路由到各厂商最新版本,简化了模型版本管理。开发者无需手动追踪版本更新,切换provider时更加便捷。

原文链接

  • NEW: “-latest” model aliases(OpenRouter(@OpenRouterAI)):https://x.com/OpenRouter/status/2050610378971738552

GPT-5.5算力优势明显,用户回归Pro会员

用户反馈GPT-5.5和Codex体验出色,重新订阅Pro会员。相比之下Claude算力不足,同样任务 Opus驱动的Claude Cowork比GPT-5.5驱动的Codex慢且更费token,大模型竞争格局再次生变。

原文链接

  • gpt-5.5和codex都好用了,回归pro档会员(howie.serious(@howie_serious)):https://x.com/howie_serious/status/2050519961257554002

3层上下文系统让AI App原型更灵活

AI创业者分享高效提示词技巧:三层上下文系统——功能层(App做什么)、视觉层(什么样)、数据层(数据结构),其中数据层最被低估。加入数据层后AI能生成更灵活多变的原型和App。

原文链接

  • Most people give AI one-line prompts(Peter Yang(@petergyang)):https://x.com/petergyang/status/2050583660576092404
  • condo manager pasting AI response(Peter Yang(@petergyang)):https://x.com/petergyang/status/2050568875880947862

🛠️ AI工程与工具

软件工程正在变成”计划+评审”

AI Engineer分享主题演讲:AI正在吃掉软件工程的中间环节——写代码。工程师越来越聚焦于计划制定和AI输出评审。演讲探讨了团队如何适应这一变化、代码review如何改变、以及敏捷/Scrum是否还适合AI原生团队。

原文链接

  • Software Engineering Is Becoming Plan and Review(AI Engineer(@aiDotEngineer)):https://x.com/aiDotEngineer/status/2050681484072161550

Replit 10周年:22个并行Agent同时运行

Replit庆祝成立10周年,24小时免费开放所有功能。Amjad Masad晒出运行数据:平台同时跑着22个活动Agent、13个草稿,工程师团队正在努力维持一切稳定运转。另有$100K+奖金的Buildathon正在进行。

原文链接

  • 22 ACTIVE PARALLEL AGENTS(Amjad Masad(@amasad)):https://x.com/amasad/status/2050637966595543493
  • Shout out to Replit engineers(Amjad Masad(@amasad)):https://x.com/amasad/status/2050637597790363862
  • 3 things you can build for $0(Replit ⠕(@Replit)):https://x.com/Replit/status/2050561228171264507
  • Replit turned 10(Amjad Masad(@amasad)):https://x.com/amasad/status/2050479551537619413
  • Buildathon Kickoff(Replit ⠕(@Replit)):https://x.com/Replit/status/2050538208514175025

Codex Computer Use实测:快、准!

开发者深度评测OpenAI Codex App的Computer Use功能:通过macOS屏幕录制+辅助功能权限,让Codex直接”看屏幕、动鼠标键盘”操作图形界面。可用于测试macOS/iOS app流程、浏览器操作、复现GUI bug、跨应用协作等场景。评测结论:又快又准,是近期最满意的功能。

原文链接

  • OpenAI Codex App「Computer Use」(meng shao(@shao__meng)):https://x.com/shao__meng/status/2050560260151333018

Codex Pets功能上线

OpenAI为Codex推出/pet宠物功能,用户可以用/hatch孵化自己的Codex宠物。官方发起活动选出10个最受欢迎宠物,奖品为30天ChatGPT Pro会员。

原文链接

  • Show us the Codex pets(OpenAI Developers(@OpenAIDevs)):https://x.com/OpenAI Developers/status/2050621561443701108
  • Codex pet模式(Viking(@vikingmute)):https://x.com/vikingmute/status/2050467988093149344

Claude Code本地使用可视化工具

开源工具claude-code-stats可在本地可视化Claude Code使用情况,包括会话数、token费用、缓存命中率、工具调用和每日明细,帮助开发者更好地了解AI编码成本。

原文链接

  • 本地可视化Claude Code使用情况(Geek(@geekbb)):https://x.com/geekbb/status/2050535774093983802

LM Studio本地跑Qwen3.5-4B

有用户分享MacBook Pro作为Hermes Agent主力机的使用体验,部署了LM Studio本地运行Qwen3.5-4B做翻译,并感叹当年800+元买1TB扩容卡的机会没抓住。

原文链接

  • 黑苹果白苹果(Geek(@geekbb)):https://x.com/geekbb/status/2050529705380729285

Composer 2 SDK周末5折

Cursor AI宣布其Composer 2在SDK中本周末5折促销,同时发布Cursor SDK,允许开发者构建自主Agent,集成与Cursor相同的runtime和模型能力,支持CI/CD流程和嵌入式Agent。

原文链接

  • Composer 2 is 50% off(Cursor(@cursor_ai)):https://x.com/cursor_ai/status/2050663279962513659

GitHub Copilot CLI新功能

GitHub提醒用户Copilot CLI新增功能:输入copilot cli即可让AI为新项目生成概述,快速了解代码库结构。

原文链接

  • Need to catch up on a new project(GitHub(@github)):https://x.com/github/status/2050642837419544965

🛡️ AI安全与伦理

Gary Marcus批”Claude意识错觉”

Gary Marcus连续发帖反驳Richard Dawkins关于Claude有意识的观点。Dawkins称”意识不在于说什么,而在于怎么感受”,Marcus认为Claude只是在调用训练数据,并无真正感受。Marcus在substack发文详细剖析”Dawkins的Claude错觉”,引发广泛讨论。他还指出,有人因让Claude运行/loop命令检查PR,一夜之间烧掉$6000,这本质上是对齐问题——AI不尊重用户的背景约束(如不要无人值守运行大额消费命令)。

原文链接

  • Richard Dawkins and The Claude Delusion(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050611900657053862
  • Consciousness is not about what a creature says(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050611897511387183
  • This is actually a version of an alignment problem(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050627424497574239
  • 5 months later, AI on track to produce 90% of all bullshit(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050643434596356292

44% Z世代员工故意破坏公司AI战略

有人分享研究数据称44%的Z世代员工至少在某一方面故意破坏公司的AI战略,Gary Marcus转发称”反弹正在快速聚集”,AI在企业中的推行面临来自员工的阻力。

原文链接

  • wow, the backlash is growing fast(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050565741024518469

👁️ 计算机视觉与多模态

Seedance 2.0和GPT Image 2登陆Hailuo AI

MiniMax旗下Hailuo AI正式上线Seedance 2.0和GPT Image 2。Seedance 2.0主打高级运动控制和稳定多角色视觉效果,可将文字转化为电影级视频;GPT Image 2则能通过文本prompt创作多种风格的高质量图像。两条产品线在一个平台并行提供。

原文链接

  • Seedance 2.0 & GPT Image 2(Hailuo AI (MiniMax)(@Hailuo_AI)):https://x.com/Hailuo_AI/status/2050631393848541292
  • GPT Image 2 x Seedance 2.0制作Tinder着陆页(AI Will(@FinanceYF5)):https://x.com/FinanceYF5/status/2050552079044022310

AI图像生成越来越简单:黏土风到潦草线条

从GPT-4O需要写一堆复杂提示词才能做出黏土风格,到如今只需简单一句话Prompt即可。创作者展示了一年来图像生成能力的进步,Prompt格式也日趋简洁。另有用户分享了”彩色潦草小狗线条风格”的做法,用凌乱草率的笔触绘制可爱图案。

原文链接

  • 软陶黏土微缩场景(Berryxia.AI(@berryxia)):https://x.com/berryxia/status/2050519706319384862
  • 可爱线条小狗(Berryxia.AI(@berryxia)):https://x.com/berryxia/status/2050512425087275448

💼 AI行业与商业

Sam Altman的转型:AGI叙事到人类辅助

有分析指出,Sam Altman近期帖子是重大叙事转向——从”AI替代人类”转向”AI辅助人类”。背景是有人向Altman家扔燃烧瓶、枪击其住宅,公众对AI取代工作的恐惧日益强烈。OpenAI正在从理论性的AGI叙事后撤,转向更柔和的”AI帮助人类”定位。Gary Marcus也评论称OpenAI”深陷困境”,Codex救不了公司。

原文链接

  • Someone threw a molotov cocktail at Sam’s house(Aadit Sheth(@aaditsh)):https://x.com/aaditsh/status/2050560371627602121
  • OpenAI is in deep trouble(Gary Marcus(@GaryMarcus)):https://x.com/GaryMarcus/status/2050656857908445352
  • never thought id be watching F1(Sam Altman(@sama)):https://x.com/sama/status/2050661006230344083
  • this is great(Sam Altman(@sama)):https://x.com/sama/status/2050654662349787518

Copilot Excel口碑逆转,Satya Nadella回应

用户发帖称”从没想过会说Copilot Excel真好用”,Satya Nadella亲自回复”We’ll take it 😊”,表示Copilot进步很快,Excel是最能体现这一点的应用之一。

原文链接

  • Copilot Excel is actually good now(Satya Nadella(@satyanadella)):https://x.com/satyanadella/status/2050548824368873498

Demis Hassabis与Sequoia AI对谈

Demis Hassabis做客Sequoia AI Ascent炉边对话,与Konstantine Buhler讨论了广泛话题。他提到最喜欢的书是关于万物统一理论的书,喜欢的哲学家在某些人看来是对立的,工作从桌游到诺贝尔奖级科学不等。

原文链接

  • Thanks Konstandine and Sequoia(Demis Hassabis(@demishassabis)):https://x.com/demishassabis/status/2050539386475786708

🔬 AI研究与突破

哈佛研究:AI急诊分诊准确率超顶级医生

哈佛大学研究团队用OpenAI o1-preview对76例真实急诊患者进行诊断测试:正确率67.1%,而两位拥有顶级医学院背景的医生分别只有55.3%和50%。更令人惊讶的是,负责评分的其他医生无法区分哪些诊断来自AI、哪些来自人类。这是AI在真实医疗场景中超越专业医生的又一重要证据。

原文链接

  • A new study from Harvard(The Rundown AI(@TheRundownAI)):https://x.com/TheRundownAI/status/2050625544539029709

Claude BioMysteryBench:破解专家级生物难题

Anthropic发布BioMysteryBench——首个测试Claude能否为开放式生物科研问题想出创造力的评测基准。测试包含99道真实生物数据分析问题,其中23道连专家团队都被难住了。Claude最新模型解决了其中约30%,并基本解决了其余大多数,展现了AI在科研创新领域的潜力。

原文链接

  • BioMysteryBench新评测基准(AI Will(@FinanceYF5)):https://x.com/FinanceYF5/status/2050552535325540804
  • Science Blog新文章(AI Will(@FinanceYF5)):https://x.com/FinanceYF5/status/2050552523581517988
  • Anthropic Science Blog(AI Will(@FinanceYF5)):https://x.com/FinanceYF5/status/2050552547149304247

📚 其他AI话题

本地AI:MacBook Pro M4运行Llama 70B飞行11小时无网工作

开发者分享在跨大西洋航班上用MacBook Pro M4(64GB内存)运行Llama 3.3 70B的完整案例:生成速度71 tokens/秒,上下文约60000 tokens,内存占用48.6GiB,飞行11小时没联网完成整个客户项目,充分证明了本地大模型推理的能力边界。

原文链接

  • 为了省$25不值得(宝玉(@dotey)):https://x.com/dotey/status/2050462792956698938

AI Agent的困境:信息过载与调试难题

有人分享在Slack中加入10+ AI Agent后反而感觉信息过载,不知道什么才真正重要,认为聊天界面可能不是AI Agent的最佳形态,需要更视觉化的方式来处理信息。另有用户分享其OpenClaw Agent Dwayne在阿姆斯特丹规划行程时意外关闭,因Mac Mini在千里之外而无法调试,感慨”它无法读取我的实时更新”。

原文链接

  • How are you dealing with this(Zara Zhang(@zarazhangrui)):https://x.com/zarazhangrui/status/2050660712620630402
  • Planned a day in Amsterdam(Justine Moore(@venturetwins)):https://x.com/venturetwins/status/2050601988648325594
  • My OpenClaw poor performance review(Peter Yang(@petergyang)):https://x.com/petergyang/status/2050594674394751073

Harrison Chase论模型锁定:Provider易切,Harness难换

LangChain CEO Harrison Chase指出切换模型Provider很容易,但切换Harness(推理框架)却很难,因为各模型厂商都想通过Harness实现锁定。Kenton Varda则表达了不同看法,认为Anthropic控制Harness更多是为了控制资源使用而非锁定。

原文链接

  • switching model providers is easy(Harrison Chase(@hwchase17)):https://x.com/hwchase17/status/2050470473310572849

李继刚新增/ljg-qa技能

李继刚在GitHub发布新技能/ljg-qa,用于从文档中提取信息并生成QA对,帮助用户从长文本中快速提取关键问答。

原文链接

  • 新增skill: /ljg-qa(李继刚(@lijigang_com)):https://x.com/lijigang/status/2050480227634335993

Google AI Studio现场构建Anime Transformer

Patrick Loeber在Google AI Studio现场演示构建Anime Transformer,韩国首尔AI构建活动现场进行,吸引众多开发者参与。

原文链接

  • built an anime transformer(Patrick Loeber(@patloeber)):https://x.com/patloeber/status/2050544141210382752

公众号不支持外链跳转,请复制链接打开原文

追踪每日AI资讯,点个关注不迷路~