今日AI资讯
【AI 应用、模型】
- 谷歌:推出实验性文本扩散模型DiffusionGemma,本地推理速度最高提升 4 倍
- 小米 MiMo Code:开源终端编程 Agent,内置了限时免费的 MiMo-V2.5 多模态模型
- OpenAI :Codex 更新桌面端导入配置功能与插件界面改版
- 阿里:推出通义千问高考志愿 Agent,免费提供志愿规划及问答服务
【AI 创作】
- 字节:火山方舟版权商业化平台发布,周星驰电影 IP 首批入驻,一键制作同款经典桥段视频
- Runway:更新视频自由调节不同宽高比画幅功能
- Midjourney :V8.2即将开始测试,V8两周后停用
- 谷歌:Project Genie 的使用权限扩大至全球 Google AI Ultra 5X 订阅用户
👇进群,不错过每日最新AI资讯噢~


🤖️AI 应用/模型
谷歌:推出实验性文本扩散模型DiffusionGemma,本地推理速度最高提升 4 倍
Google 发布了实验性文本扩散模型 DiffusionGemma,该模型基于 Gemma 4 架构,采用离散文本扩散机制支持并行生成 256 token 的文本,显著提升了推理速度,最高可达 4 倍。

备注:目前大多数语言模型的工作方式就像打字机一样,从左到右一次生成一个词元,当在本地为单个用户运行时,这种逐字处理的方式会导致专用 GPU 或 TPU 的利用率不足。
DiffusionGemma 扭转了这种低效局面。它并非按顺序预测单词,而是同时生成一个包含 256 个词元的完整段落。通过一次性将更大的工作量分配给计算机处理器,DiffusionGemma 可以充分发挥硬件的性能。


在 H100 GPU 上,其生成速度可达 1000+ tokens/s,在 RTX 5090 上也能达到 700+ tokens/s。
迭代式自我修正,模型将生成过程拆分为多个阶段:先从随机占位符生成草稿,再在双向注意力机制中不断“通读”整段文本,识别并纠正不当片段,最后进行整体润色。这种方式类似写作文时的“打草稿—修改—定稿”,在提高速度的同时保持文本质量。

DiffusionGemma 擅长在长文本或需要快速输出的场景使用。它是基于 Gemma 4 自研的扩散模型,并为开发者提供 API 预览。

⭐阅读更多:
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/
小米 MiMo Code:开源终端编程 Agent,内置 MiMo-V2.5 多模态模型
小米 MiMo 团队正式发布了开源终端编程 Agent “MiMo Code” V0.1 版本。MiMoCode 是一个终端原生的 AI 编程助手。它能读写代码、执行命令、管理 Git,通过持久化记忆系统,在多次会话间保持对项目的深度理解,并自我进化。
该 Agent 内置了限时免费的 MiMo-V2.5 多模态模型,具备百万 token 上下文窗口。
MiMo Code 旨在解决长周期自动化编程任务中的决策质量和状态连续性问题,并支持从 Claude Code 零成本迁移配置。它通过维护一个 Markdown 格式的项目级内存文件,持久存储项目背景、用户规则、架构决策等关键知识,确保 Agent 在复杂任务中保持高效和准确。

⭐消息来源:
https://mimo.xiaomi.com/blog/mimo-code-long-horizon
OpenAI :Codex 更新桌面端导入配置功能与插件界面改版
OpenAI Codex 桌面端迎来重要更新,新增了从 Claude Code 与 Claude Cowork 导入配置的功能、便利了用户迁移和管理现有 Agent 配置。
同时,插件界面进行了全面改版,引入了独立的标签页、市场和类别筛选器,并优化了键盘导航和安装流程。
此外,应用增加了邀请好友重置免费使用时长的机制。

⭐信息来源:
https://developers.openai.com/codex/changelog
阿里:推出通义千问高考志愿 Agent,免费提供志愿规划及问答服务
阿里巴巴旗下 Qwen(千问)面向全国考生推出 高考志愿填报 Agent,利用大模型与夸克积累的多年高考数据,免费提供志愿规划和咨询服务。
- 三大能力:Agent 提供 志愿报告、志愿日历和志愿问答三项功能,基于千问高考志愿模型和夸克 8 年数据,生成个性化填报建议和日程提醒。

- 个性化咨询:系统通过对话获取考生的学科组合、兴趣、期望城市、性格特点等信息,利用专业排名定位和历史录取数据输出志愿建议,并生成包含院校偏好、职业发展、就业前景等内容的“志愿报告”。
- 数据覆盖面广:千问团队表示,知识库涵盖全国约 3000 所高校和 2000 多个专业,并整合院校转专业政策、学生评价、食堂质量等非结构化信息。
官方强调 AI 只是决策辅助工具,其价值在于帮助考生理解取舍。
⭐消息地址:
https://mp.weixin.qq.com/s/ocE80lRyRyQ1g-AfCTGmxw
🤖️AI 创作
字节:火山方舟版权商业化平台发布,周星驰电影 IP 首批入驻
火山方舟版权商业化平台正式上线,周星驰旗下比高集团的《喜剧之王》、《食神》、《长江七号》三大经典电影 IP 首批入驻,并基于 Seedance 2.0 模型推出电影经典桥段的 AI 创作模板。
火山方舟提供“授权—保护—审核—分发—变现”的完整链路,允许企业和个人创作者在合规框架下使用这些影片素材创作 AI 视频。
该平台旨在通过 AI 技术赋能版权内容创作和商业化,相关 AI 创作模板已面向个人及企业用户开放。

⭐消息来源:
https://mp.weixin.qq.com/s/g3DxNO_3aYI4g26gQ2Yvig
Runway:更新视频自由调节不同宽高比画幅功能
Runway 推出了一项实用的视频画面调整功能,允许用户将视频轻松调整为不同的宽高比。内容创作者可以根据不同社交媒体平台(如 TikTok、Instagram、YouTube)或显示设备的需求,快速适配视频的尺寸和比例,从而提高内容的传播效率和视觉呈现效果
⭐消息来源:
https://x.com/runwayml/status/2064350871048077756/video/1
Midjourney :V8.2即将开始测试,V8两周后停用
AI 图像生成工具 Midjourney 宣布其 8.2 版本即将开始测试。官方尚未公布详细功能,但会以 V8 系列模型的改进为基础。同时 V8.1 目前已设置为 Midjourney 所有用户的新默认版本,V8 版本将在两周后停用。

⭐消息来源:
https://x.com/runwayml/status/2064350871048077756/video/1
谷歌:Project Genie 的使用权限扩大至全球 Google AI Ultra 5X 订阅用户
谷歌的“开放世界创建”工具 Project Genie 今日在全球范围内向美国以外的Google AI Ultra 5X 订阅用户开放。Project Genie 是允许用户通过简单的指令创建和探索复杂的开放世界环境。这项技术的普及将极大地降低虚拟世界创作的门槛,为游戏开发、虚拟现实体验和数字内容创作带来无限可能.


⭐消息来源:
https://x.com/GoogleLabs/status/2064801929339752527
⚠️部分内容由AI生成,可能存在偏差
💗有任何疑问,请提前联系邮箱:alolg@163.com
夜雨聆风