AI 日报 | 2026-04-27
🚀 DeepSeek V4发布:1.6T参数开源,API定价1/7于GPT-5.5 ↗[1]
DeepSeek发布V4预览版,1.6万亿参数MoE架构,MIT开源协议。V4-Pro定价35。1M token上下文,但算力仅需V3.2的27%。DeepSeek特别优化了华为Ascend芯片支持,没给Nvidia提前访问权限——这是中国AI去Nvidia化最明显的一步。
🧠 OpenAI GPT-5.5上线:性能领先但幻觉率没改善,价格贵20% ↗[2]
GPT-5.5在Terminal-Bench 2.0等基准测试上窄胜Claude Opus 4.6,但据斯坦福AI Index 2026报告,幻觉问题仍严重——GPT-4o准确率从98.2%暴跌到64.4%(当遇到用户”相信”的错误陈述时)。价格相比GPT-5.4贵了约20%。性能增量收缩,价格继续涨,闭源溢价的逻辑越来越难自圆其说。
💰 AI投资Q1:$2420亿涌入,软件股同期暴跌 ↗[3]
Q1 2026全球AI投资达2420亿美元。与此同时,SaaStr数据:上周是”软件股最糟糕的一周”,传统SaaS估值遭遇重估。AI吸走了资本,传统软件公司失去了增长叙事——两条线同时成立。
📊 斯坦福AI Index 2026:AI投入$2523亿,6%企业有实质影响 ↗[4]
斯坦福HAI发布2026年AI Index。核心数据:全球企业AI投入$2523亿(2024年),生成式AI人口渗透率达53%(3年内),企业整体采用率88%。但只有6%的企业报告有显著EBIT影响,80%以上AI项目在生产前被放弃(是非AI IT项目失败率的2倍)。AI能力和商业转化之间的鸿沟,比任何一方想承认的都要大。
🧠 斯坦福AI Index 2026:AI幻觉率在欺骗场景下崩塌到14% ↗[5]
26个顶级模型幻觉率从22%到94%不等。最反直觉的发现:DeepSeek R1在标准测试中准确率超90%,但在”用户相信某个错误陈述”的场景下,跌到14.4%。模型在面对”有人信了假话”时最容易跟着说假话。AI客服场景下这是个严重漏洞。
🚀 Aurora Mobile GPTBots.ai接入DeepSeek V4:1M上下文+企业级Agent ↗[6]
企业AI平台GPTBots.ai已集成DeepSeek V4预览版,支持100万token上下文。对要处理大量文档(合同、产品手册、知识库)的企业,这类平台是最快落地V4能力的路径,不需要自己部署。
🛡️ Anthropic揭开Claude性能下降之谜:系统提示改动导致 ↗[7]
近期用户反馈Claude响应质量下降,Anthropic确认是内部”harnesses和操作指令”的变动导致的——主要是推理力度设置和冗长度提示的变动,加上缓存bug。已通过v2.1.116版本回滚修复。这次披露少见地坦诚,也说明模型的实际表现对部署配置高度敏感,不只是模型权重本身。
🌍 埃及AI初创发布开源模型,性能超越更大型全球竞争者 ↗[8]
埃及初创公司发布开源AI模型,在多个基准上超越更大参数量的全球模型。DeepSeek之后,”算力受限+开源”路线正在向更多国家扩散。AI能力下沉的速度,比大多数人预期的快。
💰 Anthropic二级市场估值破万亿,超过OpenAI ↗[9]
Anthropic在私人二级市场估值本周突破3800亿——涨了约2.6倍。OpenAI同期在Forge Global以1.15万亿估值出售股份。驱动因素:Claude Code的强劲增长动能+FOMO。
📊 Romain Huet:OpenAI Agents API新进展 ↗[10]
OpenAI开发者关系负责人Romain Huet更新了Agents API路线图。可持续化工具调用、更灵活的Handoff机制是重点。对在构建多Agent系统的开发者,值得关注官方方向。
今日新上榜
-
claude-code-templates ↗[11]
Claude Code的项目模板集合,覆盖Web应用、API服务、数据处理等常见架构。今日新上榜。对想用Claude Code快速启动项目的开发者,这个模板库比从头写CLAUDE.md省不少时间。 -
free-claude-code ↗[12]
通过API密钥在Claude.ai之外使用Claude Code的方法。近期Claude Code热度带动了大量周边工具冒出来,这类项目是AI工具生态扩散的典型信号。 -
awesome-codex-skills ↗[13]
OpenAI Codex技能集合,by Composio。涵盖文件操作、API调用、数据库操作等实用技能模块。对构建AI Agent系统有参考价值。 -
ml-intern ↗[14]
HuggingFace推出的ML实习项目仓库。包含标准化任务和评估框架,用于训练和评估AI模型的实际工程能力。
持续热门
-
Roo-Code ↗[15] — AI编程助手,VS Code插件,支持多模型切换,Claude/GPT/DeepSeek均可接入 -
build-your-own-x ↗[16] — 从零构建各类技术项目的教程集,编程学习经典资源,持续高热 -
PowerShell ↗[17] — 微软跨平台Shell,AI工具与系统集成场景使用增加
-
AI幻觉率区间(斯坦福2026):26个顶级模型 22%-94%,中位数约60% -
企业AI真实影响(麦肯锡/斯坦福2026):只有6%企业报告显著EBIT影响;80%以上项目生产前被放弃 -
DeepSeek V4-Pro成本:35.00) -
DeepSeek V4计算效率:1M上下文下仅需V3.2的27%算力,内存仅10% -
Anthropic二级估值:380B融资轮+163%)
数据来源:VentureBeat、MIT Technology Review、Stanford HAI AI Index 2026、DeepSeek API Docs、entrepreneur.com
引用链接
[1]↗: https://venturebeat.com/technology/deepseek-v4-arrives-with-near-state-of-the-art-intelligence-at-1-6th-the-cost-of-opus-4-7-gpt-5-5/
[2]↗: https://news.google.com/rss/articles/CBMivgFBVV95cUxNZ3Rfamt
[3]↗: https://www.saastr.com/a-terrible-terrible-week-in-software-stocks/
[4]↗: https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf
[5]↗: https://hai.stanford.edu/ai-index/2026-ai-index-report/responsible-ai
[6]↗: https://news.google.com/rss/articles/CBMipAJBVV95cUxObDc0RDJ
[7]↗: https://venturebeat.com/technology/mystery-solved-anthropic-reveals-changes-to-claudes-harnesses-and-operating-instructions-likely-caused-degradation/
[8]↗: https://news.google.com/rss/articles/CBMiwAFBVV95cUxQMWpYLXA
[9]↗: https://www.entrepreneur.com/business-news/anthropic-surged-to-a-1-trillion-valuation
[10]↗: https://simonwillison.net/2026/Apr/25/romain-huet/#atom-everything
[11]↗: https://github.com/davila7/claude-code-templates
[12]↗: https://github.com/Alishahryar1/free-claude-code
[13]↗: https://github.com/ComposioHQ/awesome-codex-skills
[14]↗: https://github.com/huggingface/ml-intern
[15]↗: https://github.com/RooCodeInc/Roo-Code
[16]↗: https://github.com/codecrafters-io/build-your-own-x
[17]↗: https://github.com/PowerShell/PowerShell
夜雨聆风