2026年4月30日AI日报 | Gemini 文件生成上线,Anthropic 接入创意软件生态

1. 谷歌 Gemini 上线文件生成功能,一句话直接导出 PDF、Word、Excel
Google Gemini 正式上线文件生成功能。用户现在可以直接在聊天界面输入一句话,生成并下载 PDF、Word、Excel、CSV、Markdown 等多种格式文件,不再需要手动复制粘贴或二次排版。
-
支持 Google Docs、Sheets、Slides 以及 PDF、DOCX、XLSX、CSV、TXT、RTF、Markdown、LaTeX 等格式
-
可直接下载到本地,也可导出到 Google Drive
-
该功能已面向全球 Gemini 应用用户开放
2. Mistral AI 发布 Medium 3.5,并推出远程编码 Agent 与 Work 模式
Mistral AI 发布首个旗舰融合模型 Mistral Medium 3.5,同时上线云端远程编码 Agent“Vibe”和 Le Chat 的 Work 模式。整体方向很明确,就是把推理、编码和 Agent 工作流进一步打通。
-
Mistral Medium 3.5 为 128B 稠密模型,支持 256K 上下文,SWE-Bench Verified 得分 77.6%
-
模型权重以 Modified MIT 许可证开放,可通过 Hugging Face 获取,并提供 API 服务
-
Vibe 支持云端异步长期编程任务,Le Chat Work 模式可处理邮件、日历、文档等多步工作流
3. IBM 发布 Granite 4.1 系列开源模型,覆盖语言、视觉、语音与安全
IBM Research 发布 Granite 4.1 系列开源模型,采用 Apache 2.0 许可证。除了多种参数规模的语言模型,还同步覆盖视觉、语音、安全检测和多语言嵌入等方向。
-
包含 3B、8B、30B 参数量级的密集解码器语言模型,含基础版和指令微调版
-
同步推出 Granite Vision 4.1、Granite Speech 4.1、Granite Guardian 4.1、Granite Embedding Multilingual R2
-
已上架 Hugging Face、watsonx 等平台,适合企业和开发者直接接入
4. 科大讯飞发布星火 X2-Flash,基于华为昇腾 910B 训练
科大讯飞正式发布星火 X2-Flash,并同步开放 API 接口。该模型总参数量为 30B,完全基于华为昇腾 910B 集群训练,重点强化智能体和代码能力。
-
采用 MoE 架构,支持 256K 上下文
-
已有 AstronClaw、Loomy 等率先接入,并兼容 OpenClaw、Claude Code 等 Agent 框架
-
可通过讯飞星辰 Coding Plan、讯飞开放平台和星辰 MaaS 平台体验与调用
5. Google AI Studio build 模式新增联网搜索和多会话功能
Google AI Studio 在 build 模式中推出 web search 和 multi-chat 两项更新,进一步提升 coding Agent 的实用性,尤其适合边开发边查资料的场景。
-
web search 支持实时联网获取最新 API 文档和网络信息
-
multi-chat 支持为不同想法创建独立会话,并在多个会话间自由切换
-
整体更贴近开发者真实的多任务编程流程
6. ima 正式上线知识 Agent 模式,支持自定义模型 API 接入
ima.copilot 正式上线知识 Agent 模式 copilot,支持用户在全平台申请创建专属 Agent,并首次开放自定义模型 API KEY 接入能力。
-
定位为统一入口式个人知识伙伴,内置设定、档案、记忆、技巧等模块
-
支持浮窗式全场景感知,可结合当前内容直接响应
-
除官方 Skills 外,也支持通过 Skillhub 或自行上传扩展能力
7. Anthropic 推出创意工具连接器,Claude 接入 Blender、Adobe 等软件
Anthropic 与 Blender、Autodesk、Adobe、Ableton、Splice 等合作推出一批创意工具连接器,让 Claude 能够直接进入创意工作流,在 3D、设计、音乐和视觉制作场景中协同工作。
-
Blender 连接器支持自然语言编程接口,Autodesk Fusion 可通过对话创建和修改三维模型
-
Adobe 连接器支持在多款创意云应用中处理图片、视频和设计内容
-
Anthropic 还与多所艺术和设计院校合作,推动创意计算教学落地
8. 阿里平头哥发布磐脉 920 智能网卡,面向万卡智算集群
阿里平头哥发布首款智能网卡产品磐脉 920,并已在阿里云数据中心量产部署。该产品面向 AI 训练、推理和高性能存储场景,补上了数据中心“网力”一环。
-
采用全自研 ASIC,支持 400G 带宽、PCIe 5.0、112G PAM4、多路径 RDMA
-
内部实测显示训练和推理完成时间缩短 14%,系统成本降低 30%
-
与真武 AI 芯片、倚天 CPU、镇岳存储主控形成完整数据中心芯片矩阵
9. 《2026 Agent Skills 技术与安全白皮书》发布,强调模块化智能范式
《2026 Agent Skills 技术与安全白皮书》节选内容发布,系统阐述 Agent Skills 的核心价值。白皮书提出,未来 Agent 更像调度器,Skills 才是承载专业能力的可插拔模块。
-
Skills 可将资深员工经验、文档知识和工作方法固化为可执行资产
-
同一 Skill 可跨 Claude Code、Cursor、Trae 等主流助手迁移复用
-
白皮书认为模块化智能将催生 Skill 架构师、AI Agent 编排师等新岗位
10. Claude Code 与 OpenAI Symphony 同步推进,AI 编程进入“编排时代”
华盛顿大学开发者借助 Claude Code 复活 70 万行旧代码,OpenAI 同步发布开源编排项目 Symphony。两条路线都说明,AI 编程的核心瓶颈正从“会不会写代码”转向“怎么管理 AI”。
-
开发团队通过构建上下文仓库、地形图文件和调试技能文档,让 AI 更快理解旧项目
-
两周内完成文件视图面板开发,并实现教程截图自动化维护
-
OpenAI Symphony 将任务看板变成控制中心,自动分配智能体并行处理任务
声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。
欢迎点赞收藏


夜雨聆风