AI资讯快报
2026-04-15 08:00:05 · 10条最新AI动态
Seedance 2.0全面开放API服务
Seedance 2.0全面开放API服务 火山引擎正式上线 Seedance 2.0 API 服务,面向企业和个人开放视频生成能力。模型支持文、图、音、视频四模态输入,具备多模态内容参考与编辑能力,并建立肖像版权安全标准。目前已应用于影视文娱(如贾樟柯导演短片、春晚)、漫短剧、广告营销、AI工具、具身智能、自动驾驶等行业,助力创作效率提升。 来源:火山引擎
🔗https://mp.weixin.qq.com/s/2oxw4hYB97LdYt-TtecIAQ
MiniMax Agent 更新,重新设计 Agent 操作电脑的方式
MiniMax Agent 更新,重新设计 Agent 操作电脑的方式 MiniMax Agent 桌面端推出两项更新:Pocket 功能(Beta版)支持接入飞书、微信等主流 IM,用户可在聊天中直接指挥电脑执行任务并回传结果;Computer Use 功能让 Agent 可像人一样看屏幕、操作鼠标键盘,直接操控本地软件和系统设置。 来源:MiniMax 稀宇科技
🔗https://mp.weixin.qq.com/s/dmF0PRj6OMQ-TWAIoc-kqg
MiniMax开源新一代自我进化AI模型 MiniMax M2.7
MiniMax开源新一代自我进化AI模型 MiniMax M2.7 MiniMax正式开源 MiniMax M2.7 ,成为首个由AI深度参与自我迭代的模型,支持构建复杂Agent Harness及Agent Teams等能力,在软件工程与办公场景表现优异。开源首日与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA及Together AI、Fireworks等国内外芯片与推理平台完成适配。 来源:M
🔗https://mp.weixin.qq.com/s/2xLm89eZNnQS7PP2aav06w
MiniMax推出全新AI音乐生成模型 MiniMax Music 2.6
MiniMax推出全新AI音乐生成模型 MiniMax Music 2.6 MiniMax推出 Music 2.6 音乐生成模型,新增Cover功能可基于现有歌曲改编风格与编曲,同时优化国风乐器时序演进、中低频表现及人声自然度。模型首包延迟降至20秒内,支持BPM、调性、段落结构等精准指令控制。同步开源三款Music Skill供Agent调用。 来源:MiniMax 稀宇科技
🔗https://mp.weixin.qq.com/s/KYFyMoTxxyP5nbo73pAN9A
米哈游蔡浩宇AI公司推出首个AI视频模型LPM 1.0
米哈游蔡浩宇AI公司推出首个AI视频模型LPM 1.0 米哈游创始人蔡浩宇的AI公司Anuttacon推出首个视频模型 LPM 1.0 。模型拥有170亿参数,支持实时生成能说话、唱歌、倾听并表达情绪的AI角色视频,可保持长时间身份一致性生成(支持22-48分钟视频)。技术上采用扩散Transformer架构与因果式流生成器,解决表现力、实时性与长视频一致性难题。 来源:量子位
🔗https://mp.weixin.qq.com/s/gH8nEfvu9d_iii4FfNOk7w
阿里通义开源全模态知识库 RAG 框架 VimRAG
阿里通义开源全模态知识库 RAG 框架 VimRAG 阿里通义实验室推出 VimRAG 框架,用动态有向无环图(DAG)替代线性上下文拼接,通过分支试错机制、视觉能量分配策略及图引导优化(GGPO),实现跨文本、图像、视频的精准检索与关联推理。实验显示,模型在Qwen3-VL-8B模型上准确率达50.1%,显著优于传统方案。 来源:通义实验室
🔗https://mp.weixin.qq.com/s/VyE8ayVY2DI5UYzliWp7aA
即梦推出 AI 原生动态叙事创作工具 Octo
即梦推出 AI 原生动态叙事创作工具 Octo 即梦AI正式推出智能创作助手 Octo 小章鱼,以”Vibe Create”为核心理念,支持无流程束缚、无场景限定的自由创作体验。产品现已上线即梦官网开放内测申请,助力用户打破繁琐流程束缚,让创作回归纯粹自由的对话体验,随时随地轻松落地灵感。 来源:AI工具集
🔗https://ai-bot.cn/octo/
Meta 推出原生多模态大模型 Muse Spark
Meta 推出原生多模态大模型 Muse Spark Meta超级智能实验室(MSL)推出首个模型 Muse Spark ,在Artificial Analysis跑分从Llama 4的18分跃升至52分,仅次于GPT-5.4和Gemini 3.1 Pro,推动Meta股价暴涨近10%。模型为原生多模态推理架构,具备视觉思维链、多Agent编排及”沉思模式”,在CharXiv视觉理解和Health
🔗https://mp.weixin.qq.com/s/3e9d8ErFARmaSvW_ehE-GA
萌友智能 ropet 完成轮超千万美元融资
萌友智能 ropet 完成轮超千万美元融资 AI 陪伴机器人公司萌友智能 ropet 完成 A 轮超千万美元融资,由北京市人工智能产业投资基金、峰瑞资本等投资。ropet 桌面 AI 宠物售价约 2000 元,累计出货近 2 万台,90 天留存率达 80-90%,核心用户日均互动超 2 小时。产品主打”生物性”体验,通过性格养成、轻互动建立情感连接。 来源:极客公园
🔗https://mp.weixin.qq.com/s/RQrEODEwt0cj74iQZxp7yQ
字节跳动推出原生全双工语音大模型 Seeduplex
字节跳动推出原生全双工语音大模型 Seeduplex 字节跳动Seed团队推出全双工语音大模型 Seeduplex ,已在豆包App全量上线。模型基于”边听边说”框架,实现听说同步,具备精准抗干扰和动态判停能力,误回复率和抢话比例分别降低50%和40%,判停延迟减少250ms。评测显示模型对话流畅度提升12%,用户满意度提升8.34%,标志着全双工语音技术首次实现规模化落地。 来源:字节跳动See
🔗https://mp.weixin.qq.com/s/ymyF-nBO-VT7ehnGO255qg
AI资讯晨报 · 每日精选AI领域重要动态
适合零碎时间快速了解行业前沿
夜雨聆风