乐于分享
好东西不私藏

AI情报助手日报04-25

AI情报助手日报04-25

AI 算力与芯片

  • DeepSeek V4深度适配华为昇腾芯片。
    DeepSeek发布V4系列模型,其Agent能力、世界知识和推理性能均达开源领域领先水平,并深度适配华为昇腾芯片,实现“原生”运行。
  • 寒武纪完成DeepSeek-V4模型适配。
    寒武纪基于vLLM框架,完成对深度求索DeepSeek-V4系列模型的Day 0适配并开源代码,此举得益于其NeuWare软件生态与芯片技术。
  • OpenAI计划2030年实现30GW算力。
    OpenAI泄露的投资人备忘录显示,公司计划到2030年实现30GW算力,预计消耗全美近6%电力,AI算力竞争已转向电力资源。
  • DeepSeek V4 Pro模型价格将下调。
    DeepSeek预计下半年昇腾950超节点批量上市后,V4-Pro模型价格将大幅下调,因其服务吞吐量目前受高端算力限制。
  • 英特尔Q1财报显示AI需求增长。
    英特尔2026年第一季度营收达136亿美元,同比增长7%,AI浪潮显著增加了对英特尔CPU、晶圆及先进封装产品的需求。

大模型应用进展

  • 阿斯利康推出药物发现智能体ChatInvent。
    阿斯利康团队发布基于大语言模型的智能体系统ChatInvent,旨在通过自然语言操作,降低药物发现工具门槛,实现“能力民主化”。
  • 小米MiMo-V2.5-Pro实测表现优异。
    小米MiMo V2.5系列模型开启公测,其Pro版本在Artificial Analysis榜单中位列全球开源大模型第一,在文章总结、逻辑推理、多模态识别和代码生成方面表现出色。
  • 小米发布MiMo-V2.5系列语音模型。
    小米正式发布MiMo-V2.5系列语音模型,包括TTS和ASR,其中ASR模型发布即开源,TTS系列支持语音设计、语音克隆等功能。
  • 北大开源One-Eval自动化评测框架。
    北京大学DCAI团队开源One-Eval,一个面向大模型评测的交互式自动化框架,能从自然语言需求出发,自动规划、执行评测并生成报告。
  • OpenAI推出ChatGPT for Clinicians。
    OpenAI面向美国医生推出免费的ChatGPT for Clinicians,主要处理转诊信、保险预授权、病历文书等非诊断性杂活,旨在提升医生工作效率。
  • GPT-5.5通过Codex向付费用户推出。
    GPT-5.5已通过OpenAI Codex向付费ChatGPT订阅用户推出,OpenAI通过Codex CLI工具支持第三方集成,允许用户通过半官方API访问GPT-5.5。
  • LlamaIndex推出LiteParse网页版。
    LlamaIndex的开源工具LiteParse现已推出浏览器版本,允许用户在浏览器中直接从PDF文件提取文本,支持OCR和空间文本解析。
  • 小米MiMo-V2.5-Pro适合Claude Code。
    小米MiMo-V2.5-Pro大模型及其API已上线,其性能可与GLM-5.1、Kimi K2.6等模型比肩,具备100万上下文窗口,API价格极具性价比。

AI Agent 发展

  • 大厂打响AI应用生成卡位战。
    2025-2026年,百度、字节、阿里等巨头入局AI应用生成赛道,通过产品、生态、补贴等方式展开激烈竞争,用户留存与商业化路径仍是核心挑战。
  • Google Cloud Next 26定义“智能体企业”。
    Google Cloud Next 26大会发布全新统一AI技术栈、第八代TPU等创新,旨在赋能全球企业向“智能体企业”转型,Gemini Enterprise将重塑企业工作流。
  • Era融资1100万美元构建AI硬件编排软件。
    初创公司Era已筹集1100万美元,旨在为AI硬件设备构建智能编排软件层,允许硬件制造商创建AI智能体和编排,以赋能下一代AI设备。
  • 涂鸦智能全面拥抱Agent时代AI战略。
    涂鸦智能联席董事长陈燎罕表示,涂鸦正全面拥抱AI,聚焦AI Home、AI Robot、AI能源三大领域,通过生态共赢降低AI开发门槛。
  • 企业级Agent竞争转向可控交付。
    “云智思享会”指出,企业级Agent竞争焦点已从能力展示转向可控交付,企业更关注Agent能否接入系统、嵌入流程并稳定交付结果。
  • 福客AI获阿里战略投资重构电商客服。
    00后创始人Perry创立的AI初创公司福客AI,近期获阿里巴巴战略投资,双方将聚焦电商客服场景,推动AI从“回复工具”转向“流程执行者”。
  • JiuwenClaw发布Team Skills技能范式。
    openJiuwen社区发布JiuwenClaw Team Skills,这是业界首个面向多Agent协作的标准化能力包规范,将团队协作流程沉淀为SOP。
  • MiniMax M2.7提升Agent适配能力。
    MiniMax M2.7模型结合Agent Harness,显著提升了Agent适配能力和工具调用准确度,实现复杂任务的自动化处理与自我进化。

AI 视觉与多模态

  • 港大俞益洲团队发布高效视频世界模型综述。
    香港大学俞益洲团队发布首篇高效视频世界模型综述,系统梳理其发展脉络、关键技术与最新进展,旨在解决视频生成模型在转化为实用世界模型时面临的巨大计算成本与速度挑战。
  • 谷歌Vision Banana统一所有视觉任务。
    谷歌DeepMind联合何恺明等专家发布Vision Banana模型,通过生成式AI统一了所有视觉任务,实现理解与生成SOTA,预示视觉AI的Transformer时刻到来。
  • 2026年原生音视频同步生成将爆发。
    AI视频生成正告别默片时代,2026年原生视听同步大模型将集体爆发,技术通过联合建模、扩散Transformer与交叉注意力实现音视频同步生成。
  • 港科大等发布Audio-Omni多模态模型。
    港科大联合腾讯微信、北大发布Audio-Omni,这是业界首个统一支持通用声音、音乐、语音理解、生成与编辑的全能型多模态模型,已获SIGGRAPH 2026接收。
  • CVPR 2026世界模型论文全景梳理。
    CVPR 2026论文揭示,世界模型研究正从“生成真实结果”转向“建模合理世界”,核心在于统一描述空间、时间与物理规律,实现推理、预测与决策能力。
  • 中国灵视P1空间相机获国际大奖。
    中国公司其域创新研发的灵视P1空间相机,在NAB Show上斩获四项年度大奖,打破了索尼、富士等巨头在影视技术领域的垄断,能将现实世界转化为可交互三维数字空间。
  • EgoNight基准揭示模型夜间理解不足。
    INSAIT等机构提出EgoNight基准,系统聚焦夜间第一人称视觉理解问题,实测发现主流多模态大模型夜间理解能力普遍显著下降。
  • AI视频工具Buzzy支持自然语言修改。
    AI视频工具Buzzy发布,它支持用户通过自然语言对话精准修改视频细节、画面元素、运镜节奏,甚至能为单机位视频补出多视角。
  • HERMES框架提速流式视频理解。
    复旦大学等机构提出HERMES框架,将KV Cache建模为层次化记忆系统,用于流式视频理解,将首个token生成时间提速10倍。

具身智能与机器人

  • 机器人马拉松超越人类引行业反思。
    人形机器人马拉松成绩超越人类,引发具身智能行业对发展路线的重新审视,本体硬件竞争已趋内卷,以大模型为核心的智能大脑竞争成为行业新焦点。
  • 宇树科技与优必选财务表现迥异。
    宇树科技与优必选同处人形机器人赛道,宇树通过聚焦科研市场和供应链优势实现盈利,而优必选则重金投入工业场景研发,面临持续亏损。

AI 医疗与生物

  • 奥明星程获超亿元A轮融资。
    AI4S企业奥明星程完成超亿元A轮战略融资,致力于构建生物智能基础设施,实现AI从“结果拟合”到“机制建模”的跃迁,并在疾病筛查领域取得突破。
  • 仁康制药构建企业级AI知识平台。
    仁康制药通过语义理解、高质量知识、推理三种图谱协同运作,构建企业级AI知识平台,实现知识的动态演进与高效利用,提升研发效率和决策准确性。
  • PRET系统实现零样本泛癌识别。
    香港科技大学团队开发PRET系统,通过上下文学习实现零样本泛癌识别,无需针对特定示例训练,在23项国际测试中表现优异。

AI 伦理与安全

  • 日本成立网络安全小组应对Mythos。
    日本财务大臣片山皋月宣布,日本将成立专门小组,应对Anthropic公司Mythos人工智能模型引发的金融系统网络安全风险,因该模型能更快识别并利用系统漏洞。
  • 关闭开源项目无法保护代码安全。
    针对Mythos AI可能带来的安全威胁,文章指出关闭开源项目并不能有效保护代码安全,因为代码早已被AI抓取,且大部分安全漏洞存在于供应链而非代码本身。

其他

  • 大模型“超市”模式面临挑战。
    字节、阿里、腾讯等云厂商纷纷推出“模型超市”,以低价整合多家大模型,降低开发者试错成本,但用户反馈服务质量不佳,暴露出算力短板。
  • 极氪8X实现大模型与整车原生融合。
    大模型上车两年后,“真·AI汽车”才开始出现。极氪8X搭载的超级Eva整车智能体,实现了大模型与智驾、底盘、动力的原生融合。
  • AI科学家面临“认知过拟合”风险。
    研究指出AI Scientist面临“认知过拟合”静态评测的风险,论文提出DASES框架,将评测从被动打分变为主动反击,重塑自动科研评价标准。
  • “软件大脑”思维模式引反感。
    文章探讨“软件大脑”思维模式,即把世界视为算法和数据库。这种思维导致科技界对AI极度乐观,而普通人日渐反感。
  • 特斯拉、苹果、字节跳动成都招聘。
    特斯拉、苹果公司和字节跳动三家大厂在成都发布了最新的社会招聘信息,岗位涵盖公共充电商务拓展、零售管理、大客户销售及硬件研发等多个领域。
  • SimpleTES框架横扫21个科学难题。
    清华、北大、斯坦福等团队联合提出SimpleTES框架,通过系统放大“试错—反馈—进化”过程,在21个科学难题上超越现有最佳解决方案。
  • Cory Doctorow发布《Enshittification》视觉标识。
    Cory Doctorow发布了其畅销书《Enshittification》封面设计的免费开放视觉标识,以“便便表情”形象象征平台衰落。
  • 地平线重构智能汽车底层逻辑。
    地平线发布星空舱驾融合芯片、咖咖虾整车OS和HSD V1.6智驾系统,重构智能汽车底层逻辑,实现芯片与OS融合,旨在成为汽车行业“Wintel”。
  • 阅星曈开创“超便携电子纸”品类。
    阅星曈完成累计超亿元融资,其开创“超便携电子纸”品类,将手机背面闲置空间升级为AI时代的注意力入口,解决用户碎片化专注需求。
  • DeepSeek估值翻倍引发行业关注。
    DeepSeek因阿里、腾讯洽谈投资,估值一夜翻倍至200亿美元,引发行业关注,文章分析了中国AI大模型估值体系的两次跳跃。
  • 沈联涛警示过度依赖AI的风险。
    沈联涛指出,数字机器无法获取人类集体隐性知识,过度依赖人工智能将使人成为“人工蠢材”,强调需转变思维模式应对资本主义困境和生态危机。
  • OpenAI总裁讲述72小时内讧始末。
    OpenAI总裁Greg Brockman首次详细讲述Sam Altman被解雇后72小时内讧始末,揭示了董事会决策、员工集体声援及公司未来发展方向。
  • Anthropic承认Claude模型存在降智问题。
    Anthropic承认Claude模型存在降智问题,并公布了三个bug:推理等级被偷偷调低、缓存bug导致对话记录清空、提示词限制影响输出质量。