AI周热点:AI正在从工具变成“员工”:龙虾开始替你打工了.

AI周报
2026.03.29
互联网资讯
了解最新AI动态 掌握最新资讯

AI资讯热点导读

本周AI最大变化是Agent全面走向企业级生产力:阿里Accio Work、百度DuMate、微信ClawBot等推动“龙虾”从工具升级为自动运营与办公系统。同时OpenAI关停Sora,转向企业级AI与商业化;谷歌、Cohere发力语音与多模态基础能力。监管层也开始警示AI金融风险。AI正从“能生成内容”迈向“能真正干活”的阶段。
NO:1
国内
商汤科技推出商汤输入法和AI语音开放平台
商汤科技推出商汤输入法AudioClaw及SenseAudio AI语音开放平台。AudioClaw集成语音输入、AI会议助理、知识库等功能,支持微信接入和语音交互。SenseAudio提供70+精品音色及ASR、TTS、文生图/视频等能力。

字节跳动 Seedance 2.0 正式出海,面向全球多地推出
字节跳动旗下剪映(CapCut)宣布推出CapCut Video Studio,集成Dreamina Seedance 2.0音视频模型正式出海。产品无需时间轴即可在无限画布上完成从构思到导出的全流程视频创作,支持最长15秒视频和6种宽高比,已覆盖非洲、南美、中东和东南亚地区。

美团开源多模态大模型LongCat-Next
美团推出LongCat-Next多模态模型,核心创新为LoZA稀疏注意力机制。模型支持1M超长上下文,通过智能筛查将50%低重要模块替换为流式稀疏注意力,实现128K解码速度提升10倍、算力节省30%。模型包含Flash-Exp和Flash-Lite两个版本,在长文本任务表现超越Qwen-3。
阿里在海外推出”企业级龙虾”Accio Work
阿里在海外上线企业级Agent产品Accio Work ,定位”企业版龙虾”。用户只需提出想法,内置的AI Agent团队可7×24小时自动完成选品、采购、建站、运营等全流程,30分钟生成可运营的海外网店。产品支持单个Agent对话或Agent Team群聊模式,可自定义角色与技能,关键操作需用户授权保障安全。
JVS Claw全面开放,无需邀请码快乐养虾
阿里云JVS Claw全面开放公测,用户无需邀请码可访问使用。新版本新增语音输入、5GB专属文件空间、一键修复、Skill开关等功能,支持定时任务管理和Clawbot一键升级。新用户可享7天免费体验,付费版”匠心版”首月低至39元,用户无需购买Mac mini硬件或承担API费用可使用云端OpenClaw服务。

MiniMax Office Skills:开源一套生产级办公文档引擎
MiniMax开源一套生产级Office文档引擎MiniMax Office Skills,包含Word、Excel、PDF、PPT四大组件,采用MIT协议。方案能解决AI生成文档”能用但不好用”的痛点,确保公式、格式、数据透视表等高级功能完整保留。技术选型上,Word采用.NET OpenXML SDK非python-docx,Excel直接操作XML非openpyxl,换取更高保真度。https://mp.weixin.qq.com/s/JKkdMqnHQUnpt0UYRsLTTA
阿里达摩院祭出开源架构CPU王炸:玄铁C950
阿里达摩院推出新一代旗舰RISC-V CPU IP——玄铁C950,SPECint2006基准测试突破70分,成为全球最强RISC-V CPU。产品首次实现RISC-V CPU原生流畅跑通千亿参数大模型(Qwen3、DeepSeek V3),集成4K超宽Vector引擎和Matrix引擎,单核算力达8TFLOPS。

阿里通义推出PrismAudio:声画同频,音效随行
阿里通义实验室推出视频生成音频框架 PrismAudio,专注环境音/音效合成。模型首创将强化学习与思维链结合,通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频,引入四位”老师”(语义、时序、美学、空间)分别打分优化。
智象未来推出首个多模态应用“龙虾”产品——HiDreamClaw
智象未来推出首个图片视频原生AI Agent产品HiDreamClaw,已接入旗下创意平台vivago web端面向海外用户开放。产品基于自研超百亿参数HiDream-I1多模态大模型,内置AIGC Skill,支持图片、视频、文字等多模态创作,集成Nano Banana、Veo、Sora等SOTA模型。

微信推出官方龙虾插件微信ClawBot
微信推出微信ClawBot插件,支持接入 OpenClaw(龙虾)。用户通过「我-设置-插件」获取安装指令,扫码可将龙虾连接至微信,实现聊天式远程操控。目前插件逐步放量中,需更新至微信最新版本。同时,腾讯云 Lighthouse(含企业版 Claw Pro)、自研 WorkBuddy、本地 QClaw 等也已支持微信通道。

首个国产企业级满血版OpenClaw「DuMate」上线!
百度智能云DuMate(中文名:搭子)正式上线,成为国内首个企业级满血版OpenClaw产品。产品用自然语言为交互入口,支持Word、Excel、PPT等办公软件的原生操作,具备文件智能管理、多源数据分析、办公操作自动化三大核心功能。DuMate内置百度搜索等Skills全家桶能力,支持灵活扩展。

NO:2
国际
OpenAI 推出 Codex 插件:支持一键打包技能与 MCP 配置
OpenAI 推出 Codex 插件,可一键打包技能、应用集成与 MCP 配置,方便团队快速同步开发配置。插件侧重团队共享,区别于个人定制的技能功能,目前已接入 Slack、Notion 等工具。Codex 开发者用户破百万,GPT-5.2-Codex 发布后用量翻倍,AI 辅助编程正走向标准化与规模化。

维基百科向 AI 下“逐客令”
维基百科通过投票正式禁止使用大语言模型生成或重写文章,仅允许 AI 提供少量编辑建议并经人工严格审核,且不得新增事实内容。新规旨在解决 AI 内容不实、不可靠等问题,维护百科信息准确性,违规者或将受处罚,体现其守护知识严谨性、坚持人工编辑主导的立场。
六周狂赚 1 亿美元!ChatGPT 广告业务成“印钞机”
OpenAI 的 ChatGPT 广告业务试点上线仅六周,年化收入便突破 1 亿美元大关,远超市场预期,标志着这家 AI 巨头在探索可持续商业模式上取得关键进展。从依赖订阅费到挖掘广告价值,OpenAI 正加速多元化收入结构,而在对话式 AI 成为新流量入口的背景下,如何平衡商业利益与用户信任,将是其面临的长期课题。
Cohere 发布开源轻量化语音模型 Transcribe
Cohere 推出开源语音识别模型 Cohere Transcribe,20 亿参数,以 Apache 2.0 协议开源,适配边缘设备。该模型支持含中文在内的 14 种语言,性能超越 ElevenLabs Scribe、Qwen3 等竞品,可本地部署、降延迟、保隐私。Cohere 从文本生成跨界语音,将其整合进 AI 智能体平台 North,发力边缘计算与实时语音翻译市场。
谷歌推出Gemini 3.1 Flash Live实时语音模型
谷歌推出Gemini 3.1 Flash Live模型,是其最高质量的实时语音模型,已在Gemini App、Search Live及Google AI Studio开放。模型核心升级包括:语音可直接驱动应用开发(vibe coding),上下文窗口扩大2倍,支持200+国家多语言实时交互。在ComplexFuncBench音频测试中函数调用准确率达90.8%,显著优于前代。
Suno推出 AI 音乐生成模型Suno V5.5
Suno推出Suno V5.5Suno推出Suno V5.5,模型首次引入”个性化资产”体系,推动AI音乐从生成工具迈向创作平台。新增 Voices 声音定制、Custom Models 自定义模型和 My Taste 个性化推荐三大功能。同时优化工作流,支持音轨分离、部分替换等编辑功能,音质与情感表达显著提升。
谷歌推出AI音乐生成模型 Lyria 3 Pro
谷歌推出旗下先进AI音乐生成模型Lyria 3 Pro,较前代在生成结构和长度上大幅提升。模型可精准处理前奏、主歌、副歌、桥段等编曲要素,支持生成最长约3分钟的完整音轨。模型不会直接模仿特定艺术家风格,训练数据仅使用合法授权内容,且所有生成音频均嵌有SynthID数字水印。
OpenAI宣布关停Sora,战略转向企业级生产力工具
OpenAI宣布关停Sora视频生成平台,包括App、API及ChatGPT视频功能。关停根本原因是OpenAI为筹备IPO进行的战略收缩,将算力转向下一代模型”Spud”及企业级生产力工具。同时OpenAI刚与迪士尼达成三年IP授权协议并获10亿美元投资意向,现已终止合作。
Meta收编 AI 智能体公司 Dreamer
Meta收购AI创业公司Dreamer及团队,公司由前小米全球副总裁雨果·巴拉等人创立,能帮助用户创建AI智能体。Dreamer团队将加入Meta超级智能实验室,负责AI智能体研发。目前协议条款未披露,但投资方将获得高于投资额的回报,Dreamer保留独立法人实体地位,Meta获得非排他性技术许可。

夜雨聆风