
点击上方




AI 越强大越危险
安全红线全面收紧
2026
- Artificial Intelligence-
AI狂飙突进的同时,安全危机正全面爆发。4月以来,Anthropic“强到不敢公开”的Claude Mythos 模型、五部门《AI 拟人化互动服务管理办法》、工信部 GEO 数据投毒预警接连登场,标志着行业从“野蛮生长”转向“安全优先”,AI治理进入强监管、严防控的全新阶段。


PART 01

Claude Mythos
TECHNICAL REPORT




Anthropic 于4月7日发布 Claude Mythos(代号 “水豚”),性能全面碾压 Claude 4 Opus:SWE‑bench 编码测试93.9%、CyberGym安全测试83.1%、GPQA科学问答94.6%。最惊人的是其自主漏洞挖掘能力:可发现潜伏 27 年的零日漏洞,单次利用成本低于 50 美元,能自主构造完整攻击链。因风险不可控,Anthropic决定不公开发布,仅对12家科技巨头与40余家关键基础设施机构定向授权,成为首个 “因太强被雪藏” 的旗舰模型。


PART 02

AI 安全风险全景
TECHNICAL REPORT

当前 AI 安全已形成模型能力、数据污染、伦理合规三重风险叠加,行业底线全面收紧:




PART 03

监管重拳
TECHNICAL REPORT

4月10日,国家网信办、发改委、工信部等五部门联合发布《人工智能拟人化互动服务管理暂行办法》,7月15日正式施行。核心禁令:
禁止向未成年人提供虚拟伴侣 / 亲属服务,未满14岁使用需监护人同意
必须显著标注 “非真人”,严禁情感操纵与诱导沉迷、消费
检测到自残 / 自杀倾向须立即人工介入并通知监护人这是全球首部 AI 拟人化专项法规,填补伦理治理空白。

PART 04

数据投毒预警
TECHNICAL REPORT


工信部与信通院密集预警:GEO(生成式引擎优化)数据投毒已成AI头号安全威胁。黑产通过批量投喂虚假软文、操纵信息权重,让 AI 输出 “定制化谎言”,覆盖电商、金融、医疗、政务等场景新华网。攻击成本极低、防御极难,已形成完整灰色产业链,直接动摇 AI “客观可信” 的底层根基。
从Claude Mythos自我限制、拟人化禁令出台到GEO 投毒严打,2026年4月成为AI安全治理分水岭。行业共识已变:AI越强大,安全越刚性。企业必须同步推进技术能力与安全体系,政府监管、企业自律、社会监督三方协同,才能让人工智能在安全可控的轨道上,真正服务于人类福祉。

参考来源
1.Anthropic官方公告:Claude Mythos 预览版发布与安全限制说明
2.新华网:五部门《人工智能拟人化互动服务管理暂行办法》全文与解读
3.中国信通院:GEO滥用与AI数据投毒风险预警报告
4.央视315晚会:AI数据投毒黑色产业链深度调查新华网
5.公安部官网:AI拟人化服务监管政策权威解读中华人民共和国公安部

贞创汇聚焦人工智能、医疗健康和新能源新材料,秉承专业服务、创造价值的企业使命和诚信、专业、承诺、创新的企业价值观,主营科技成果孵化、产业咨询服务和项目投融资业务。 公司是上海张江医谷市场运营主体成员企业、国家级孵化器运营管理机构,累计培育、孵化和加速120多家科创企业,其中直投企业超过15家。公司致力于依托上海张江科学城和临港新片区科创资源和核心优势,科创孵化和产业赋能业务覆盖北京、上海、天津、山东、四川、重庆、广东等区域,以“贞创汇科创走廊”项目为平台,从人才、技术、资本、产业四个方面为各地政府和科创园区围绕科技创新、孵化和投资构建政产学研协同创新和投资孵育联动发展的科创孵化和创投平台。公司旗下贞创汇创新中心作为科技成果投资孵育的平台,专注为入驻企业提供三位一体的持股投资孵育模式:基金直投和股权融资双轮驱动的投融资服务、以对接资本市场为目的的战略咨询服务、全流程孵化和一站式加速的平台式服务。
哲略贞越资本(中基协备案号为P1064372)成立于2017年,管理总部位于上海张江,旗下已经成立并管理了哲略壹期、红禾哲略、哲略清能等多支基金。作为一家致力于科技创新、服务新质生产力发展的投资机构和贞创汇基金直投平台,主要聚焦优质科技创新企业早期股权投资,专注于人工智能、医疗健康和新能源新材料等领域。管理团队由具有多年产业和投资经验的专业人士所组成, 具备了基金投资、科创孵化和产业服务多年工作经验和深厚资源。秉承“思哲启智,谋略观远”的投资理念,哲略资本致力于成为一家专注于科技创新和价值发现,并且长期陪伴科学家和企业共同成长的投资机构,在共同成长的过程中实现共赢和投资价值的最大化。



扫描二维码
更多精彩等你来发现
贞创汇 021-68068966

夜雨聆风