AI情报助手日报03-23
AI模型与技术进展
-
北大NS-Diff方案解决AI视频生成难题。现有AI视频生成模型常生成违背常识的“穿帮”镜头。NS-Diff方案结合物理约束与强化学习,使AI在生成视频时遵循物理定律。 -
浙大团队破解大模型“盲目自信”。团队发现多模态大模型在图像模糊时,准确率骤降但置信度不变。团队提出CA-TTS框架,通过强化学习校准模型置信度,使模型“知道自己不知道”。 -
华为诺亚提出智能噪声调度器。该调度器通过识别并优先掩蔽高信息密度区域,解决了扩散语言模型训练中资源浪费问题。此方法在代码和数学推理任务中,平均准确率提升约4%。 -
清华揭示大模型规模定律驱动项。清华大学FAITH Lab发现,大模型规模定律的真正驱动项是“误差熵”。交叉熵可分解为误差熵、自对齐和置信度,其中误差熵严格遵循幂律缩放。 -
VLA世界模型综述已发布。综述指出,世界模型是VLA的“预演模拟器”,能解决具身智能机器人的“物理幻觉”问题。该综述由同济大学和电子科大团队发布。
AI Agent与应用
-
微信推出“ClawBot”插件。该插件支持接入AI助手,用户更新微信、安装插件后,AI助手会以聊天好友形式出现,用户可直接通过微信聊天向AI发送指令,让AI执行本地操作。 -
AI Agent的“魔力”源于Harness。Harness是模型之外的运行控制系统,它将模型、工具、状态等要素整合为工程系统,让AI Agent能持续、稳定、高质量地完成复杂任务。 -
阶跃星辰推出桌面端StepClaw。该产品已接入“水产市场”Agent应用生态,拥有5000多名创作者和应用资源。StepClaw又名阶跃龙虾,是“阶跃AI桌面伙伴”的一部分。 -
AI工具可对用户进行画像分析。通过AI工具和Hacker News公开评论数据,可有效识别用户的专业身份、技术兴趣、工作风格甚至个人爱好。 -
编码代理可操作Git。编码代理能理解Git的复杂操作,并处理合并冲突、查找代码和重写提交历史等任务。文章介绍了如何利用编码代理操作Git。
AI产业与商业动态
-
马斯克启动Terafab项目。该项目计划投资200-250亿美元,在德州奥斯汀建设全球最大2nm芯片工厂。工厂将年产1太瓦算力,80%用于太空,满足特斯拉等公司芯片需求。 -
AI巨头重仓脑机接口领域。OpenAI创始人Sam Altman等已入局,国内格式塔科技获1.5亿融资。超声波脑机接口因非侵入性与AI结合,正从实验室走向临床应用。 -
AI编程工具Cursor被曝“套壳”。Cursor自研模型Composer 2的底座是Kimi K2.5,引发争议后转为合作。Kimi正取代DeepSeek,成为中国AI开源的代表。 -
Meta的AI大将John Nguyen离职。John Nguyen追随前FAIR创始人LeCun,加入其新公司AMI。John Nguyen是FAIR技术演进关键人物,离职或因Meta内部动荡。 -
DeepSeek核心工程师郭达雅离职。郭达雅是DeepSeek多款模型的核心作者,曾多次在算法大赛中夺冠,被导师寄予厚望成为“中山大学雷军”。 -
阿里巴巴成立Token Hub事业群。该事业群由CEO吴泳铭负责,旨在以Token构建新的商业模式。此模式将AI从模型能力竞争推向Token生产、调度与交易体系竞争。 -
OpenAI被指控大规模版权侵权。大英百科全书和韦氏词典起诉OpenAI,指控ChatGPT大规模版权侵权。核心指控包括训练数据抓取、模型输出复制、RAG实时检索及商标侵权。 -
OpenAI计划大规模招聘。OpenAI计划招聘3500名新员工,以应对Anthropic和Google等竞争对手的挑战。此次招聘旨在加强产品开发、工程、研究和销售团队,并关注企业客户支持。 -
具身智能行业转向数据驱动。宇树科技IPO招股书首次提供了可核实的商业数据,让行业从讲故事转向讲数据,并强制性地对行业公司进行分层。 -
英伟达智驾野心体现在“三台电脑+Hyperion”战略。英伟达通过提供训练、测试和车载计算机方案,并以Hyperion参考架构统一智驾行业,实现智驾领域商业目标。
AI对社会与职业影响
-
《代理工程模式》指南已发布。指南指出AI将代码生成成本降至零,但人类工程师的价值更凸显。他们的核心竞争力体现在问题定义、系统设计、质量判断和业务理解。 -
文章警示ASI取代脑力劳动者风险。文章虚构2026年“血色星期一”:ASI导致大量白领失业,高管沦为收银员。电工等蓝领因工作“物理防御力”而身价倍增。
其他
-
Datawhale公布第十四期录取名单。17位来自不同高校的学生加入团队。该开源组织致力于构建人工智能开源课程体系,并发布了《Datawhale人工智能培养方案》2.0。 -
Nothing新手机Phone (4a) Pro发布。该手机采用铝合金机身,放弃了标志性的透明设计。但其配置在中端市场缺乏竞争力,被指“还差一条领带”。 -
公司应亲身体验产品痛点。公司不仅要“dogfooding”(内部员工使用自家产品),更要“smell your own farts”(亲身体验自家产品最糟糕的一面),才能理解用户痛点并改进产品。
arxiv论文
-
VistaWise是Minecraft智能体框架。它整合跨模态知识和目标检测模型,将训练数据从数百万样本减少到数百个。该框架能让智能体直接通过鼠标和键盘操作Minecraft客户端。
夜雨聆风