2026年4月14日AI日报 | Mano-P、本地自动化、Agent Cloud成今天焦点

AI日报

2026.4.14日资讯速递

1. Mano-P 1.0 开源，纯视觉方案跑本地 GUI 自动化

视觉语言动作模型 Mano-P 1.0 正式开源，定位是本地 GUI 自动化，不依赖 DOM、CDP 或辅助功能树，只看屏幕内容就能操作桌面应用和浏览器。项目采用 Apache 2.0 许可证，支持本地部署，4B 版本还能在苹果 M4 芯片上端侧运行。

OpenRouter 新增代号为 Elephant Alpha 的 stealth 文本模型，参数规模达 100B，支持 256K 上下文和 32K 最大输出。该模型当前可免费接入，但平台明确说明，提供商会记录提示词和生成内容用于模型改进。

开源项目 Mano-P 同步展示了其端侧隐私保护能力，模型可直接在本地设备上监视屏幕、理解界面并执行操作，不需要上传截图到云端，也不需要 API Key 或联网环境。它在 OSWorld 基准上取得 58.2% 成功率，40 亿参数量化版在 M4 Pro 上峰值内存仅 4.3GB。

月之暗面宣布 Kimi Code 抢先体验计划结束，新模型 k2.6-code-preview 已正式上线。与此同时，团队修复了此前因 Claude Code 2.1.88 工具 Schema 变化导致模型表现下降的问题。

engram 是一个面向 AI 编码场景的代码上下文工具，不走向量数据库路线，而是用正则启发式扫描整个代码库，再把结构化结果存入本地 SQLite。它可以拦截 Claude Code 的文件读取，把一次完整文件读取的 Token 消耗从约 1200 压到约 300。

OpenClaw 发布 2026.4.12 版本，新增 LM Studio provider，并为 macOS Talk Mode 引入实验性本地 MLX speech provider，继续强化本地模型能力。与此同时，版本还集中修复了安全、Gateway 和多平台通信组件的多个缺陷。

AGIBOT 正式推出具身智能基础模型 GO-2，核心思路是把推理和动作统一到同一套系统中，减少传统机器人系统里“想得明白但动作跟不上”的问题。模型在 LIBERO、VLABench 和仿真到现实测试中都拿到了较高成功率。

Google AI Studio 引入名为 Tab Tab Tab 的提示词自动补全引擎，用户只需输入一个模糊想法，系统就能基于 Gemini 自动补齐和扩展提示词内容。这个功能主要面向 vibe coding 和快速交互式创作场景。

Hyper3D 宣布 Rodin Gen-2.5 即将发布，并已开放等待名单。官方表示，这次升级不只是几何细节增强，文本和图像转 3D 的核心能力也会迎来更重要的提升。

Cloudflare 与 OpenAI 宣布合作，将 GPT-5.4、Codex 等模型正式引入 Cloudflare Agent Cloud。与此同时，Codex harness 也已在 Cloudflare Sandboxes 中商用，后续还计划登陆 Workers AI。

Apify 开源了面向网络抓取、数据提取和自动化任务的 Skills 集合，仓库为 apify/awesome-skills。这套工具主要解决 AI 智能体无法高效访问网页搜索之外外部数据的问题，可与 Claude Code 结合使用。

声明：本内容由AI生成，可能包含不准确或推测性信息，请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态

- 立即扫码 -

更多资讯，

点击下方卡片关注赛凡智云协作平台

▲ 赛凡云盒，一款超好用的企业私有云盘