乐于分享
好东西不私藏

Anthropic源码泄露;Qwen3性能超Gemini;豆包登顶评测;DeepSeek遭服务中断;AI论文自动完成率达55%

Anthropic源码泄露;Qwen3性能超Gemini;豆包登顶评测;DeepSeek遭服务中断;AI论文自动完成率达55%

NEWS 

AI智能体新闻速览

Claude Code源码泄露,曝光类似拓麻歌子的宠物功能和常驻智能体

Anthropic在发布Claude Code 2.1.88版本更新后,包含的源码映射文件意外泄露了其完整的TypeScript代码库。此次泄露涉及超过51.2万行代码,暴露了该AI编程工具的内部工作机制、未来产品功能规划、Anthropic对AI助手的指令以及其”记忆”架构的详细信息。开发者发现了包括”拓麻歌子”风格的宠物功能(”坐在输入框旁边并对你的编码做出反应”)、名为”KAIROS”的常驻后台智能体功能等。代码已被上传至GitHub,GitHub仓库已获得超过5万次fork。(来源:theverge.com

215 项 SOTA 狂揽!阿里发布 Qwen3.5-Omni:全模态性能跨越式超越 Gemini

3月30日,阿里正式发布千问新一代全模态大模型Qwen3.5-Omni。该模型基于混合注意力MoE架构,实现图片、视频、语音及文字的无缝全模态输入与输出。在215项音视频理解、识别与交互测试任务中均获SOTA表现,大幅领先Google Gemini-3.1Pro。支持113种语言及方言识别,包括毛利语、海南方言等小众语言。创新推出音视频编程功能,用户口述需求即可生成复杂UI原型。支持超过10小时音频输入及自动视频切片。阿里云百炼平台同步上线Plus、Flash、Light三种API,每百万Tokens输入成本低于0.8元,定价仅为Gemini的十分之一。目前千问已服务超100万家客户,稳居中国企业级大模型调用市场第一。(来源:aibase.com

中文大模型 SuperCLUE 测评:豆包跻身全球第一梯队

SuperCLUE最新综合性报告显示,字节跳动旗下的豆包(Doubao-pro)表现强劲,成功跻身全球大模型第一梯队,与国际顶级模型正面竞争。国产大模型在中文语境理解、常识推理及逻辑演绎方面取得显著进步,豆包在复杂任务规划和长文本处理上稳定性获高分。百度文心一言、阿里通义千问等模型稳居前列。小米MiMo大模型首次出现在榜单中,引发行业对手机厂商自研AI能力的关注。报告显示竞争已转向精细化场景竞争,豆包凭借字节系生态在内容创作和社交互动场景突出,小米MiMo则在系统级调度和多设备协同方面展现优势。(来源:aibase.com

DeepSeek 突发大规模服务中断,修复时长超12小时

AIbase 报道称,DeepSeek 自3月29日21时35分起遭遇大规模服务故障,网页端与移动 App 均出现“服务器繁忙”、对话中断、数据丢失以及无法登录等问题。官方于23时23分宣布初步恢复,但在3月30日凌晨0时20分系统再次波动,1时24分启动新一轮修复。截至30日上午9时,部分功能仍未完全恢复正常,整体修复时长已超过12小时。报道指出,DeepSeek 尚未就更深层技术原因及补偿措施作出完整说明。此次事件凸显大模型平台在用户规模快速增长背景下,对算力调度、后端架构稳定性和多端连续服务能力的更高要求。(来源:aibase.com

Nature重磅:AI撰写论文在顶级会议同行评审中超过55%人类投稿,单篇成本仅15美元

据《Nature》报道,Sakana AI联合牛津大学等机构推出全自动科研系统“The AI Scientist”,可在给定研究主题后,自动完成想法生成、实验设计、代码实现、图表制作和论文撰写等全流程。输入信息显示,该系统生成的论文在ICLR 2025某研讨会匿名评审中,得分超过55%的人类投稿,单篇成本仅15美元;其配套自动审稿系统在评审一致性上也达到接近人类审稿人的水平。该研究进一步提出AI科研的“Scaling Law”迹象,表明科研自动化可能随着模型与流程扩展持续提升,但也同步带来署名、审稿、可重复性与学术伦理等新挑战。(来源:新智元

核心启示

本周AI领域在技术突破、应用落地与安全伦理之间上演了“冰与火之歌”。阿里Qwen3-5-Omni实现对Gemini的性能超越,豆包登顶SuperCLUE榜单,展现了模型能力的持续进化与场景化优势;然而,DeepSeek遭遇大规模服务中断,暴露了高并发下的系统稳定性短板。更值得警惕的是,Anthropic因更新失误导致超51万行核心代码泄露,不仅暴露了产品规划与“记忆”架构等商业机密,更引发了对AI系统安全性与开发流程规范性的深刻反思。技术狂飙的同时,稳定性与可信度正成为行业决胜的关键。

中山大学

人工智能研究院智能软件研究中心

我们是中山大学人工智能研究院智能软件研究中心,汇聚多位全球前2%的顶尖科学家与青年教师力量,聚焦AI智能体的可信性问题,面向软件和信息服务、智能制造、电子商务、智慧健康等实际应用场景开展深入研究。

研究中心的使命是将智能体从“可对话”推进到“可交付、可管控”。围绕可靠性与鲁棒性、自主规划、领域检索、工具适配以及可解释性等关键问题开展平台化能力研究。

近年来,中心成员承担了多项国家级和省部级基金项目,主持或参与建设了大湾区生成式人工智能安全发展联合实验室、珠海市可信大模型重点实验室、中山大学-招联数字金融联合研究中心、广东移动-中山大学智慧应用联合实验室等平台,推动了可信智能体在多个行业的落地应用。

产学研合作

企业如在AI智能体有需求梳理、应用开发、项目落地等需求,可通过项目合作、联合攻关等形式与中山大学人工智能研究院智能软件研究中心合作,具体合作欢迎联系叶老师沟通交流。

叶老师电话:13570399471(微信同号)

——咨询联系问卷——

填写问卷,我们会有专人尽快与您联系

(关注视频号,了解更多产学研动态)