
1. Mano-P 1.0 开源,纯视觉方案跑本地 GUI 自动化
视觉语言动作模型 Mano-P 1.0 正式开源,定位是本地 GUI 自动化,不依赖 DOM、CDP 或辅助功能树,只看屏幕内容就能操作桌面应用和浏览器。项目采用 Apache 2.0 许可证,支持本地部署,4B 版本还能在苹果 M4 芯片上端侧运行。
纯视觉 GUI 自动化路线,无需调用系统底层接口
4B 量化版本可在苹果 M4 设备本地运行,适合隐私敏感场景
为本地自动化和边缘智能体提供了新的技术路径
2. OpenRouter 上线 Elephant Alpha #2,免费但会记录提示词
OpenRouter 新增代号为 Elephant Alpha 的 stealth 文本模型,参数规模达 100B,支持 256K 上下文和 32K 最大输出。该模型当前可免费接入,但平台明确说明,提供商会记录提示词和生成内容用于模型改进。
支持函数调用、结构化输出和提示词缓存
100B 参数,主打高性能和高 Token 效率
免费可用,但不适合处理敏感数据
3. Mano-P 面向端侧发布,本地运行保护 GUI 自动化隐私
开源项目 Mano-P 同步展示了其端侧隐私保护能力,模型可直接在本地设备上监视屏幕、理解界面并执行操作,不需要上传截图到云端,也不需要 API Key 或联网环境。它在 OSWorld 基准上取得 58.2% 成功率,40 亿参数量化版在 M4 Pro 上峰值内存仅 4.3GB。
浏览器、桌面应用、图形工作流都可支持
无需联网和云端推理,适合隐私敏感企业场景
性能仍弱于云端大模型,但本地化优势明显
4. 月之暗面上线 k2.6-code-preview,修复 Claude Code 降智问题
月之暗面宣布 Kimi Code 抢先体验计划结束,新模型 k2.6-code-preview 已正式上线。与此同时,团队修复了此前因 Claude Code 2.1.88 工具 Schema 变化导致模型表现下降的问题。
k2.6-code-preview 已向用户开放
重点修复了 Claude Code 场景中的“降智”问题
对重度编程助手用户来说,这次更新更偏实用修复
5. engram 优化 Claude Code 文件读取,最高省下 27.5 倍 Token
engram 是一个面向 AI 编码场景的代码上下文工具,不走向量数据库路线,而是用正则启发式扫描整个代码库,再把结构化结果存入本地 SQLite。它可以拦截 Claude Code 的文件读取,把一次完整文件读取的 Token 消耗从约 1200 压到约 300。
支持 TypeScript、Python、Go、Rust、Java 等主流语言
0.5 版可整合 Git 历史、缺陷、记忆和文档等 6 类上下文
实测 3 小时会话可节省约 7.2 万 Token
6. OpenClaw 2026.4.12 发布,本地模型支持和安全修复同步增强
OpenClaw 发布 2026.4.12 版本,新增 LM Studio provider,并为 macOS Talk Mode 引入实验性本地 MLX speech provider,继续强化本地模型能力。与此同时,版本还集中修复了安全、Gateway 和多平台通信组件的多个缺陷。
新增 Active Memory 插件,可在主回复前自动提取偏好与上下文
加入 LM Studio 和 Codex provider,强化本地及特定模型支持
安全和稳定性修复覆盖凭证、网关和多平台消息链路
7. AGIBOT 发布 GO-2,统一推理与动作执行
AGIBOT 正式推出具身智能基础模型 GO-2,核心思路是把推理和动作统一到同一套系统中,减少传统机器人系统里“想得明白但动作跟不上”的问题。模型在 LIBERO、VLABench 和仿真到现实测试中都拿到了较高成功率。
LIBERO 平均成功率 98.5%,零样本准确率 86.6%
仿真到现实成功率达 82.9%,降低现实场景失效率
支持在线后训练,效率提升 10 倍,数据需求减少 50% 以上
8. Google AI Studio 推出 Tab Tab Tab,补全提示词输入体验
Google AI Studio 引入名为 Tab Tab Tab 的提示词自动补全引擎,用户只需输入一个模糊想法,系统就能基于 Gemini 自动补齐和扩展提示词内容。这个功能主要面向 vibe coding 和快速交互式创作场景。
核心价值是降低提示词构建门槛
适合想法模糊、需要快速展开的创作流程
本质上是在提升 AI Studio 的交互顺滑度
9. Hyper3D 预告 Rodin Gen-2.5,大版本升级将至
Hyper3D 宣布 Rodin Gen-2.5 即将发布,并已开放等待名单。官方表示,这次升级不只是几何细节增强,文本和图像转 3D 的核心能力也会迎来更重要的提升。
等待名单已开放,可申请早期访问
升级重点不止高精度几何,更涉及生成流程优化
具体技术细节尚未完全披露,当前仍属预热阶段
10. Cloudflare 联手 OpenAI,把 GPT-5.4 和 Codex 引入 Agent Cloud
Cloudflare 与 OpenAI 宣布合作,将 GPT-5.4、Codex 等模型正式引入 Cloudflare Agent Cloud。与此同时,Codex harness 也已在 Cloudflare Sandboxes 中商用,后续还计划登陆 Workers AI。
企业客户可直接在 Agent Cloud 内构建和扩展 AI Agent
Codex harness 已在安全沙箱环境中商用
这标志着模型能力和云端 Agent 基础设施进一步融合
11. Apify 开源 Agent Skills,补强 Claude Code 外部数据能力
Apify 开源了面向网络抓取、数据提取和自动化任务的 Skills 集合,仓库为 apify/awesome-skills。这套工具主要解决 AI 智能体无法高效访问网页搜索之外外部数据的问题,可与 Claude Code 结合使用。
覆盖市场研究、竞品监控、品牌舆情、线索生成等场景
通过连接 Apify Actors,Claude Code 可读取更多结构化外部数据
适合把 AI 智能体从“只会生成”推进到“能抓数、能分析、能执行”
声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。
欢迎点赞收藏


夜雨聆风