Anthropic源码泄露;Qwen3性能超Gemini;豆包登顶评测;DeepSeek遭服务中断;AI论文自动完成率达55%-夜雨聆风

Anthropic源码泄露;Qwen3性能超Gemini;豆包登顶评测;DeepSeek遭服务中断;AI论文自动完成率达55%

NEWS

AI智能体新闻速览

Claude Code源码泄露，曝光类似拓麻歌子的宠物功能和常驻智能体

Anthropic在发布Claude Code 2.1.88版本更新后，包含的源码映射文件意外泄露了其完整的TypeScript代码库。此次泄露涉及超过51.2万行代码，暴露了该AI编程工具的内部工作机制、未来产品功能规划、Anthropic对AI助手的指令以及其”记忆”架构的详细信息。开发者发现了包括”拓麻歌子”风格的宠物功能（”坐在输入框旁边并对你的编码做出反应”）、名为”KAIROS”的常驻后台智能体功能等。代码已被上传至GitHub，GitHub仓库已获得超过5万次fork。（来源：theverge.com）

215 项 SOTA 狂揽！阿里发布 Qwen3.5-Omni：全模态性能跨越式超越 Gemini

3月30日，阿里正式发布千问新一代全模态大模型Qwen3.5-Omni。该模型基于混合注意力MoE架构，实现图片、视频、语音及文字的无缝全模态输入与输出。在215项音视频理解、识别与交互测试任务中均获SOTA表现，大幅领先Google Gemini-3.1Pro。支持113种语言及方言识别，包括毛利语、海南方言等小众语言。创新推出音视频编程功能，用户口述需求即可生成复杂UI原型。支持超过10小时音频输入及自动视频切片。阿里云百炼平台同步上线Plus、Flash、Light三种API，每百万Tokens输入成本低于0.8元，定价仅为Gemini的十分之一。目前千问已服务超100万家客户，稳居中国企业级大模型调用市场第一。（来源：aibase.com）

中文大模型 SuperCLUE 测评：豆包跻身全球第一梯队

SuperCLUE最新综合性报告显示，字节跳动旗下的豆包（Doubao-pro）表现强劲，成功跻身全球大模型第一梯队，与国际顶级模型正面竞争。国产大模型在中文语境理解、常识推理及逻辑演绎方面取得显著进步，豆包在复杂任务规划和长文本处理上稳定性获高分。百度文心一言、阿里通义千问等模型稳居前列。小米MiMo大模型首次出现在榜单中，引发行业对手机厂商自研AI能力的关注。报告显示竞争已转向精细化场景竞争，豆包凭借字节系生态在内容创作和社交互动场景突出，小米MiMo则在系统级调度和多设备协同方面展现优势。（来源：aibase.com）

DeepSeek 突发大规模服务中断，修复时长超12小时

AIbase 报道称，DeepSeek 自3月29日21时35分起遭遇大规模服务故障，网页端与移动 App 均出现“服务器繁忙”、对话中断、数据丢失以及无法登录等问题。官方于23时23分宣布初步恢复，但在3月30日凌晨0时20分系统再次波动，1时24分启动新一轮修复。截至30日上午9时，部分功能仍未完全恢复正常，整体修复时长已超过12小时。报道指出，DeepSeek 尚未就更深层技术原因及补偿措施作出完整说明。此次事件凸显大模型平台在用户规模快速增长背景下，对算力调度、后端架构稳定性和多端连续服务能力的更高要求。（来源：aibase.com）

Nature重磅：AI撰写论文在顶级会议同行评审中超过55%人类投稿，单篇成本仅15美元

据《Nature》报道，Sakana AI联合牛津大学等机构推出全自动科研系统“The AI Scientist”，可在给定研究主题后，自动完成想法生成、实验设计、代码实现、图表制作和论文撰写等全流程。输入信息显示，该系统生成的论文在ICLR 2025某研讨会匿名评审中，得分超过55%的人类投稿，单篇成本仅15美元；其配套自动审稿系统在评审一致性上也达到接近人类审稿人的水平。该研究进一步提出AI科研的“Scaling Law”迹象，表明科研自动化可能随着模型与流程扩展持续提升，但也同步带来署名、审稿、可重复性与学术伦理等新挑战。（来源：新智元）

核心启示

本周AI领域在技术突破、应用落地与安全伦理之间上演了“冰与火之歌”。阿里Qwen3-5-Omni实现对Gemini的性能超越，豆包登顶SuperCLUE榜单，展现了模型能力的持续进化与场景化优势；然而，DeepSeek遭遇大规模服务中断，暴露了高并发下的系统稳定性短板。更值得警惕的是，Anthropic因更新失误导致超51万行核心代码泄露，不仅暴露了产品规划与“记忆”架构等商业机密，更引发了对AI系统安全性与开发流程规范性的深刻反思。技术狂飙的同时，稳定性与可信度正成为行业决胜的关键。

中山大学

人工智能研究院智能软件研究中心

我们是中山大学人工智能研究院智能软件研究中心，汇聚多位全球前2%的顶尖科学家与青年教师力量，聚焦AI智能体的可信性问题，面向软件和信息服务、智能制造、电子商务、智慧健康等实际应用场景开展深入研究。

研究中心的使命是将智能体从“可对话”推进到“可交付、可管控”。围绕可靠性与鲁棒性、自主规划、领域检索、工具适配以及可解释性等关键问题开展平台化能力研究。

近年来，中心成员承担了多项国家级和省部级基金项目，主持或参与建设了大湾区生成式人工智能安全发展联合实验室、珠海市可信大模型重点实验室、中山大学-招联数字金融联合研究中心、广东移动-中山大学智慧应用联合实验室等平台，推动了可信智能体在多个行业的落地应用。

产学研合作

企业如在AI智能体有需求梳理、应用开发、项目落地等需求，可通过项目合作、联合攻关等形式与中山大学人工智能研究院智能软件研究中心合作，具体合作欢迎联系叶老师沟通交流。

叶老师电话：13570399471（微信同号）

——咨询联系问卷——

（填写问卷，我们会有专人尽快与您联系）

（关注视频号，了解更多产学研动态）