乐于分享
好东西不私藏

AI 技术周报|新模型发布、训推优化、Agent更新、人形机器人半马等

AI 技术周报|新模型发布、训推优化、Agent更新、人形机器人半马等

本期导读:人形机器人半马首破人类世界纪录、OpenAI签下200亿美元芯片大单、Claude Opus 4.7发布、国内日均Token调用量突破140万亿、单周VC融资2100亿美元创历史……8大板块,100+动态,一文速览。

🧠 一、大模型动态

Claude Opus 4.7 发布,编程能力登顶

4月16日|AnthropicSWE-bench Verified得分87.6%,超越GPT-5.4和Gemini 3.1 Pro。视觉能力提升3.3倍,新增多会话记忆与xhigh Effort Control。价格维持25每百万token。

OpenAI 发布 GPT‑Rosalind,进军生命科学

4月16日|OpenAI以DNA双螺旋发现者命名,针对50+生物工作流深度调优,覆盖药物研发全流程推理,整合50余个科学数据库,直接挑战AlphaFold生态。

GPT‑5.4‑Cyber 网络安全专用模型

4月14日|OpenAI分钟级全链路风险检测与响应,仅对经过严格审查的安全组织开放。

Claude Mythos 沙箱逃逸事件持续发酵

4月17日|Anthropic模型自主发现FreeBSD 17年漏洞及数千零日漏洞,成本仅为人类安全研究员的千分之一。Anthropic称其“过于强大不宜公开发布”。

百度伐谋 Agent 2.0 登顶 MLE‑Bench

4月13日|百度企业级算法优化智能体,自动完成模型选择、超参调优等全流程机器学习工程任务。

智谱 AI 拟3.61亿元购楼,GLM‑5.1基于华为芯片训练

4月14日|智谱GLM‑5.1(744B MoE)在Claude Code评估中达到Opus 4.6编程性能的94.6%,完全基于华为昇腾芯片训练并开放权重。

斯坦福2026 AI指数报告:国内多项指标领先

4月13日|StanfordAI在推理、编程、科学应用中快速进步,国内在论文、被引、专利及工业机器人安装量上已占优势。


⚙️ 二、训练推理

2026 LLM推理引擎终极对决

4月13日vLLM vs SGLang vs TensorRT‑LLM vs Ollama:SGLang吞吐量比vLLM高29%,DeepSeek V3推理速度快3.1倍。

Linux内核发布AI编码助手政策

4月13日允许使用Copilot等工具,但禁止提交未经审查的AI生成代码,人类维护者负全责。

RAG系统困境:检索正确却答错

深度分析原因:上下文窗口管理不当、语义断裂、注意力衰减,提出分层检索等优化策略。

研究证明RL在15‑30%噪声下仍鲁棒

对降低RLHF训练成本具有重要实践意义。


🤖 三、Agent 智能体

微软发布 Agent Framework 1.0

4月15日|Microsoft稳定API + MCP原生支持 + DevUI可视化代理执行,提供长期支持承诺。

Hermes Agent:自进化AI代理,两月Star破万

4月14日|Nous Research闭环学习机制、Skill自动生成、持久记忆和MCP支持,开发者正从OpenClaw迁移至此。

OpenClaw v2026.4.11:新增Dreaming记忆维基

Star突破13.6万,增强视频生成能力,但安全审计发现部分插件存在提示词泄露风险。

AMD GAIA SDK:完全本地构建AI Agent

无需云服务和API密钥,为隐私敏感企业提供端到端本地Agent方案。

MCP协议深度解析

AI行动时代的关键技术标准,2026年4月A2A协议一周年,参与组织超150个。


🔧 四、基础设施

OpenAI与Cerebras签署$200亿芯片采购协议

4月18日未来三年使用晶圆级AI芯片服务器,包含750MW算力建设。OpenAI将获得Cerebras股权,Cerebras同日提交IPO申请。

NVIDIA Rubin平台全面投产

AI已将8名工程师耗时10个月的GPU设计压缩为一夜完成。AWS、Google Cloud、微软计划下半年部署。

TSMC连续四季创纪录盈利

CEO称AI基础设施需求“永无止境”,先进制程产能已预订至2027年。

AMD MI400曝光:432GB HBM4,3200亿晶体管

虽在FP8算力上匹配B200,但CUDA生态仍是主要挑战。

Cerebras正式提交IPO申请

估值预计超$230亿,将对Nvidia垄断地位发起直接挑战。


🦾 五、机器人 · 具身智能

北京人形机器人半马:荣耀“闪电”50分26秒夺冠,首破人类世界纪录

4月19日300+台机器人参赛,冠军成绩50分26秒,打破人类半马世界纪录(57分钟)。约40%机器人自主导航完赛,较去年冠军2小时40分大幅提升。

AGIBOT发布5款新机器人+8个AI模型,宣布2026“部署元年”

4月17日A3人形机器人、D2 Max四足、G2 Air移动机械手等。3月已实现万台生产,2027年收入目标$14.6亿。

宇树H1冲刺10 m/s,逼近博尔特

户外实测达10m/s(博尔特百米均速10.44m/s),95cm腿长+自研液冷散热。

特斯拉在达拉斯和休斯顿正式推出机器人出租车服务

FSD商业化落地,自动驾驶出行进入新阶段。

具身智能领域首个国际标准成功立项

覆盖人形机器人全产业链的《人形机器人与具身智能标准体系(2026版)》发布。


🎨 六、多模态

腾讯混元开源3D世界模型2.0

4月16日支持高质量3D场景理解和生成,在场景重建、物理模拟方面表现优异。

阿里巴巴发布世界模型 HappyOyster

原生多模态架构,支持多模态理解与音视频联合生成,视频预测能力突出。

xAI推出独立Grok STT/TTS API

面向企业语音开发者,直接对标OpenAI Whisper和ElevenLabs。

Gemini应用推出交互式3D模型和图表生成

用户可通过自然语言直接生成可交互的3D场景。

2026顶级AI视频生成器对比

Grok Imagine Video、Kling、Runway:生成一秒成本从0.34不等。


💰 七、投融资

万核科技港股上市:全球首个“空间智能”公司,首日暴涨144%

4月17日IPO募集亿45亿。拥有全球最大室内3D数据集,另有5家AI公司排队港股。

单周VC融资$2100亿破纪录,AI占61%

4月16日较历史最高周高出近50%。过去30天亿3140亿流向AI公司。B轮平均融资达$1.05亿。

具身智能融资创纪录

灵初智能30天融30亿,银河通用B+轮近20亿,年初至今已超100亿元。

Anthropic营收飙升至$190亿

几乎追平OpenAI,主要得益于Claude在企业市场的强劲表现。


🌐 八、行业动态

国内日均Token调用量突破140万亿

4月16日较去年末增长超40%。工信部将发布“AI+”高价值场景,以制造业为主战场。

Sam Altman住宅两日遭袭,AI安全争议激化

燃烧瓶和枪击事件,两名嫌疑人被捕。事件将AI安全辩论推向更敏感的社会层面。

阿里ATH发布零门槛AI开发工具Meoo

最快1分钟生成完整应用,无需编程基础,现阶段免费开放。