小易AI日报|每日3分钟AI热点速览(2026-05-04)

时间:2026-05-04 08:09 · 共收录 10 条热点 · 关键词:xAI、AI、科技
1. xAI 推出最新旗舰推理模型Grok 4.3
xAI 推出 Grok 4.3 模型,定位为务实过渡版本。模型 API 价格降低 40%-60%,输出速度达 196 Tokens/s,支持 100 万 Token 长上下文,在代理任务和办公辅助能力上提升明显,更擅长生成文档、表格和演示文稿。模型在 Intelligence Index落后于 GPT-5.5和 Claude Opus 4.7,复杂推理、事实核查稳定性不足,且幻觉率有所上升。
• 详情:https://mp.weixin.qq.com/s/-ewhh9yqowqFdieLSecrJA
2. OpenAI Codex 推出宠物模式
OpenAI编程工具 Codex 推出宠物模式,用户可在桌面养一只「赛博桌宠」。输入 /pet 可唤醒电子宠物,支持实时显示 Codex 工作状态(运行中/等待输入/可复核)及进度提示,无需打开应用可查看工作进展。用户可通过 hatch-pet 技能自定义专属宠物形象。
• 详情:https://www.ithome.com/0/945/989.htm
3. 百度智能云推出AI短剧与漫剧创作平台Hogee
百度智能云推出一站式 AI 短剧创作平台 Hogee ,用户上传剧本或输入灵感后,AI 可自动生成角色、场景与分镜视频,覆盖从文本到成片的完整链路。平台支持 .txt/.docx/.pdf 等五种格式剧本上传,内置 OpenClaw 数字员工矩阵,提供社媒运营、营销素材、数据分析等能力。
• 详情:https://ai-bot.cn/hogee/
4. DeepSeek 公布多模态模型技术报告
DeepSeek 在 GitHub 发布多模态大模型并公开技术报告,提出「基于视觉原语的思考」框架,将点、边界框等空间标记提升为推理「基本思维单元」,使模型具备精确空间指代与推演能力,突破传统链式思维在复杂空间参照任务中的瓶颈。模型架构紧凑、视觉标记效率高,在计数与空间推理基准测试中可与 GPT-5.4 、 Claude-Sonnet-4.6 等前沿模型匹敌。
• 详情:https://www.ithome.com/0/945/740.htm
5. 阿里通义开源大模型可解释性工具套件Qwen-Scope
阿里通义开源大模型可解释性工具套件 Qwen-Scope ,工具基于稀疏自编码器(SAE)技术,覆盖 Qwen3 及 Qwen3.5 系列共 7 个模型。Qwen-Scope可在推理阶段定向控制输出结果,用少量种子数据完成数据分类与长尾样本合成,支持定位异常特征优化语言混用和重复生成问题。
• 详情:https://mp.weixin.qq.com/s/3y3cjMJG070RmqZReE6j2A
限时免费体验:https://gzh.yijiayun.com
6. 美国防部与7家AI公司签署机密系统部署协议
美国国防部发布声明,已与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软和亚马逊云(AWS)7 家领先 AI 公司达成协议,加速美军转型为「人工智能主导」的作战力量,增强其在所有战争领域的决策优势。标志着美军正式将顶尖民用 AI 技术深度纳入国防体系,推动 AI 在军事指挥、情报分析与作战决策中的规模化应用。
• 详情:https://mp.weixin.qq.com/s/huUEz1pjnhjeQpwSmalblg
7. 太抓马了!马斯克OpenAI开庭,硅谷巨富互揭老底像极了村口吵架
马斯克和奥特曼这场 世纪庭审 ,瓜也太多了…
马斯克这边, 公开承认xAI蒸馏了OpenAI的模型来训练Grok 。
上午刚说完「我不对人大喊」,下午当庭大喊。
律师Savitt追问捐款: 承诺10亿,到账3800万,兑现不足4% 。
「没有我,OpenAI就不存在!我贡献了我的声誉!我给这个公司起了名字!这些都是有价值的!」
随后被迫承认:「在严格的货币意义上,我捐了3800万美元。
• 详情:https://www.qbitai.com/2026/05/412080.html
8. 不好!1930年的AI都来抢程序员饭碗了
劳动节,马上100岁的vintage大模型也得劳动。
是的,有人给只有1930年知识的大模型,微调成软件工程师了……
过程比想象中轻松,仅用250个训练样本,强悍的老头便解决了自己人生中的第一个编程问题——
一个连电视机都没见过的AI,现在也开始跟Claude们「学坏」,要跟程序员抢饭碗了。(bushi)
这是最近爆火的「老头AI」,全名叫 talkie-1930-13b 。
• 详情:https://www.qbitai.com/2026/05/412896.html
9. 突破视觉仿真算力瓶颈!新一代具身智能仿真框架开源:高吞吐并行高保真渲染助力规模化训练
清华AIR DISCOVER Lab 投稿
具身人工智能领域,正向着以视觉为中心的感知范式,发生全面而深刻的转型。
作为机器人感知世界时信息密度最高、与自然人机交互最契合的模态,视觉是解锁通用机器人智能、实现仿真到真实无缝迁移的核心密钥。
• 详情:https://www.qbitai.com/2026/05/412870.html
10. DeepSeek V4最大的遗憾
DeepSeekV4的技术报告里有mHC,有CSA,有HCA,有Muon,有FP4……
Engram在今年1月由DeepSeek和北大联合开源,主要研究大模型的记忆与效率问题。
自挂上arXiv的那一刻起,圈子里围绕它的探讨就没有停止过…
不仅仅因为它是V4的前奏,而是有了Engram,「伦敦是英国首都」这种事实,模型不用动用整个深层网络去重新推一遍,直接查就行。
• 详情:https://www.qbitai.com/2026/05/412737.html

夜雨聆风