MiniMax发布全球首个云端自我进化AI助手MaxHermes | AI日报


Adobe发布Firefly AI Assistant——跨应用创意智能体
Firefly AI Assistant是一款具备Agent能力的创意助手,可在单一对话界面中跨Photoshop、Illustrator、Premiere Pro、Lightroom等Adobe创意云应用编排和执行复杂的多步骤工作流。与传统指令响应式AI不同,该智能体无需用户持续引导,只需设定目标即可独立规划并完成编辑、调整、导出等任务。公开测试版预计将于本月晚些时候上线。Adobe同时宣布与Anthropic合作,将Firefly AI能力引入Claude平台。
MiniMax发布全球首个云端自我进化AI助手MaxHermes
MiniMax上线 MaxHermes,全球首个基于Hermes Agent构建的云端自我进化 AI 助手。MaxHermes 将 Hermes Agent 的学习闭环与自我进化能力与 MiniMax M2.7 模型结合,用户无需本地部署,10 秒内可在云端拥有一个自主迭代的AI 智能体,目前已打通飞书、钉钉、企业微信等多 IM 渠道,用户可在常用聊天应用中直接与 MaxHermes 实时对话。
阿里ATH事业群发布首款AI开发工具秒悟
4月15日,阿里ATH事业群发布旗下首款AI开发工具Meoo(秒悟),该工具集成千问、Kimi、GLM、MiniMax四大模型,并内置阿里云数据库、存储等核心产品服务,用户只需用自然语言描述想法,Meoo最快1分钟就能自动生成前端后端完整的网站、H5页面,在阿里云上一键部署上线。
科大讯飞发布AstronClaw软硬一体智能体矩阵
4月15日,科大讯飞正式推出全新软硬一体智能体矩阵。硬件端,讯飞办公本、AI眼镜(GlassClaw)及Guide01机器人全面接入Claw能力,同时亮相WallEX及NOVA智能空间产品,推动AI从对话框走向物理世界。

Google推出Gemini‑TTS文本转语音模型,支持实时多语言情感控制
Google推出Gemini‑TTS文本转语音模型,该模型是Gemini 3.1系列的新成员,支持通过提示词精确控制语音的情感、节奏与停顿,生成自然、高保真的语音。它覆盖约70种语言,包括中文、英语、日语等,可自动检测语种无需手动标注,开发者可通过统一API在多语言场景中快速集成。Gemini‑TTS还与Gemini 3.1 Flash Live等模型协同,在实时对话、语音翻译等任务中实现低延迟、可精细调控的语音输出,适用于有声读物、客服机器人、实时会议等场景。
Anthropic为Claude推出身份证件验证机制,部分功能需持证自拍
4月14日,Anthropic发布公告称,正在为Claude的部分用例引入身份验证。当用户访问某些功能时,可能需出示政府颁发的有效带照片身份证件(护照、驾照等),并使用手机或电脑摄像头拍摄实时自拍照以完成验证。官方表示,该措施是平台完整性检查及安全合规的一部分,验证数据仅用于确认身份,整个过程通常不超过五分钟。此外,若账户因重复违反使用政策、从不支持位置创建、未满18岁等原因,可能在验证后被禁用。
OpenAI拟为ChatGPT广告引入按点击计费模式,并探索转化导向广告
据某广告代理商高管透露,OpenAI计划对部分ChatGPT广告采用按点击量计费(CPC)模式,而非仅按曝光量(CPM)收费。同时,OpenAI还在探索推出旨在引导用户完成特定操作(如下载应用或完成购买)的转化导向广告,但具体落地时间尚未确定。此举旨在提升ChatGPT对营销人员的吸引力,以挑战Meta和谷歌在数字广告领域的地位。目前ChatGPT广告于2月初上线,早期广告主仅能获得曝光、点击等汇总数据,尚不如Meta和谷歌提供的受众特征及转化详情。
微软推出MAI-Image-2-Efficient
近日,微软推出MAI-Image-2-Efficient,该模型是微软旗舰文生图模型MAI-Image-2的低成本高速变体,据称在保持生产级质量的前提下,推理成本降低近一半,速度显著提升。模型已登陆Microsoft Foundry平台,面向开发者和企业用户开放。这是微软MAI自研模型系列的最新扩展,此前微软已在4月初发布了MAI-Transcribe-1(语音转录,支持25种语言)和MAI-Voice-1(语音生成)两款专业模型,显示微软正加速构建独立于OpenAI的多模态AI技术体系。
Google DeepMind发布Gemini Robotics-ER 1.6具身智能模型
4月13日,Google DeepMind发布Gemini Robotics-ER 1.6具身智能模型,这个模型被描述为机器人“理解世界”能力的重要升级,注于提升机器人在复杂环境中的环境感知和推理能力,旨在弥合演示与真实部署之间的鸿沟。
国内首个AI智能体数据扶持计划落地 企查查切入企业级AI领域
4月15日,国内首个针对AI智能体创新创业的大规模数据基础设施扶持计划在江苏省落地,企业级数据服务商企查查宣布面向全国OPC(“一人公司”)创业者,免费开放3个月价值2000万元的智能体数据平台MCP专项服务。该平台(agent.qcc.com)提供企业全维度动态数据“知识库”,可实时调取400多个维度的企业真实信息,其“MCP协议+CLI命令行”双轨架构,为AI智能体规模化落地提供新路径。此前召开的江苏省人工智能发展季度工作推进会明确提出支持OPC创新创业,围绕融资、渠道、产业链接等方面强化保障。
百度“搭子DuMate”升级多模态与IM接入能力
百度智能云透露,旗下AI助手“搭子DuMate”自3月22日上线以来,25天内累计更新13个版本,升级图片视频生成、主流IM渠道打通、技能广场等能力,并推出付费订阅方案。目前搭子DuMate提供免费版、Pro版及Max版三档订阅方案。
小红书开源大模型强化学习训练引擎Relax
小红书AI平台团队4月14日正式开源Relax,一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。
Relax基于Megatron-LM 和SGLang高性能后端构建,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax 验证了图像、文本、音频和视频四种模态的RL 训练稳定收敛;在16xH800多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。

OpenAI内部备忘录曝光:锁定企业AI与Agent平台,剑指Anthropic
科技媒体《The Decoder》披露的备忘录显示,OpenAI首席营收官Denise Dresser规划了2026年第二季度战略蓝图,核心聚焦企业级AI落地、下一代模型(代号“Spud”)与Agent平台建设,并直接点名Anthropic为主要竞争对手。备忘录还指出OpenAI目前面临的最大瓶颈并非需求不足,而是产能限制,九位数美元规模的多年度合作订单正在增加。据称代号Spud的新模型对标Anthropic的Claude Mythos,上市后可能命名为GPT-5o或GPT-5.5。
DeepMind CEO哈萨比斯:AGI或五年内到来,AI正经历“短期被过度炒作、长期被严重低估”
哈萨比斯在最新播客访谈中预测AGI有望在五年内实现,同时警告当前AI正处于特殊阶段——短期被过度炒作、长期被严重低估。他重申AI最值得优先投入的方向不是娱乐或生产力工具,而是科学发现、人类健康和那些原本需要几十年才能推进的领域。此外,访谈中还提及DeepMind对AI水印技术的支持态度,认为所有生成式AI公司都应采用水印技术以应对Deepfake和虚假信息。
AI内容电商OS “K2 Lab”完成数千万天使轮融资
AI内容电商OS K2Lab宣布再次完成数千万元天使轮融资,这也是K2Lab三个月以来完成的第二轮融资,本轮融资由华控资本领投、云时资本跟投,本轮融资资金将用于A2A原生电商Agent OS建设、多模态垂直模型打造、海外用户规模化增长和AI Native团队的持续建设。
美国民众日益用LLM寻求健康建议,医院推出“PatientGPT”应对
据Ars Technica报道,美国民众越来越多地使用大型语言模型获取健康建议。多家医院和医疗系统推出了自家品牌的医疗聊天机器人(如PatientGPT),旨在提升患者体验和数字平等,并声称比商业AI版本更安全、更符合医疗监管要求。
IBM警告AI驱动型黑客攻击加速,朝鲜黑客已使用AI进行社会工程攻击
IBM发布安全预警称,攻击者正开始使用前沿AI模型加速黑客操作,可帮助发现漏洞、规划攻击路径并自动执行入侵的部分环节。与此同时,加密货币钱包Zerion披露,朝鲜关联黑客已使用AI增强的社会工程技术进行了针对性攻击,从其热钱包中盗取了约10万美元。
Allbirds宣布转型AI算力租赁,股价一夜暴涨超800%
曾以环保运动鞋走红的“硅谷神鞋”Allbirds于4月15日宣布彻底剥离鞋履业务,携5000万美元可转债融资全面进军GPU算力租赁赛道,并计划更名为“NewBird AI”。此前公司鞋类业务整体估值仅约3900万美元,濒临退市边缘,而消息公布后股价单日飙升超800%。



夜雨聆风