
AI 早报 2026-03-24
概览
要闻
Claude 桌面端上线操控电脑功能,限 macOS #1OpenClaw 连更两个版本,增加大量功能 #2
模型发布
Luma AI 发布 Uni-1,推理视觉同步 #3
产品应用
OpenAI 推出 ChatGPT Library 功能 #4网易云音乐推出 CLI 工具,接入 OpenClaw #5千问上线打车能力,支持自然语言叫车支付 #6
前瞻与传闻
Cursor 发文介绍新型文本索引,降低 Agent 搜索延迟 #7
Claude 桌面端上线操控电脑功能,限 macOS #1
Anthropic 宣布在 Claude 桌面端上线“Computer Use”功能,允许 Claude 通过鼠标和键盘操控
macOS电脑,自动完成浏览网页、运行代码及填表等任务,并已支持通过手机端Dispatch远程向电脑发送指令执行后台操作。目前该功能仅面向 Pro 和 Max 订阅用户开放。
Anthropic 官方宣布在桌面端的 Claude Cowork 和 Claude Code 中推出“computer use”功能,使 Claude 能够像人类一样操作用户的计算机。该功能目前处于研究预览阶段,支持 Claude 打开应用程序、浏览网页、运行开发工具及填写电子表格等。
在执行逻辑上,Claude 会优先使用 Slack 或 Google Calendar 等现有连接器;若无现成连接器,则会请求权限后通过控制鼠标、键盘和屏幕来完成任务。
此外,该功能与移动端 Dispatch 深度集成,允许用户通过手机分配任务,由处于唤醒状态的 macOS 电脑端后台执行。
目前该功能仅面向 Claude Pro 和 Claude Max 订阅用户开放,且仅支持 macOS。
官方强调已内置针对提示注入等风险的安全防护机制,但仍建议用户避免处理敏感数据。


https://claude.com/blog/dispatch-and-computer-usehttps://claude.com/product/cowork#dispatch-and-computer-useOpenClaw 连更两个版本,增加大量功能 #2
OpenClaw 近日连续发布了两个版本,其中 3.22 版本上线了 ClawHub 插件市场,新增对
GPT-5.4-mini等模型的支持,以及其他多项改进,但因发布包缺失导致控制台无法加载。随后的 3.23 版本不仅修复了 UI 缺失问题,还解决了部分插件的兼容性故障,建议受影响用户立即升级至最新版本。
OpenClaw 近日连续发布了 2026.3.22 与 2026.3.23 两个重要版本。
2026.3.22 版本作为一次重大更新,正式推出了 ClawHub 插件市场,并新增了对 MiniMax M2.7、GPT-5.4-mini/nano 模型的支持,同时引入了 per-agent reasoning 推理功能、/btw 侧边提问、OpenShell 与 SSH 沙箱,以及 Exa、Tavily、Firecrawl 等多项搜索集成。
然而,在该版本发布后,官方承认由于发布流程遗漏,导致 npm 包缺失了 dist/control-ui/ 目录,使得用户升级后无法加载控制台界面。
针对这一问题及其他稳定性缺陷,官方随后发布了 2026.3.23 版本。
该版本通过自动化流程确保了控制台 UI 资产的完整性,并针对 Browser MCP 连接超时、ClawHub 认证路径冲突、飞书与 Discord 插件消息格式,以及 OpenRouter 定价刷新死循环等多个核心模块进行了全面修复和优化。
目前建议受影响用户尽快更新至该最新版本。



https://github.com/openclaw/openclaw/releases/tag/v2026.3.23https://x.com/openclaw/status/2036043904949330407Luma AI 发布 Uni-1,推理视觉同步 #3
Luma AI 正式发布多模态模型
Uni-1,该模型通过单一架构融合了逻辑推理与视觉生成能力,在RISEBench推理基准测试及人类偏好评测中均排名第一,被视为 Nano Banana 系列的有力挑战者。
Luma AI 正式发布了名为 Uni-1 的新型多模态模型,该模型基于“统一智能”架构,旨在将逻辑推理与视觉想象能力结合在单一系统中。
Uni-1 采用仅解码器自回归 Transformer 架构,通过单一交错序列同时处理文本与图像的输入及输出,实现了思考与像素生成的同步进行。
该模型具备常识场景补全、空间推理、参考引导生成及多风格适应等核心能力。
根据官方提供的数据,Uni-1 在 RISEBench 推理基准测试中达到了最先进(SOTA)水平,并在人类偏好 Elo 评测中的总评、风格与编辑以及参考生成类别中排名第一。

https://lumalabs.ai/uni-1https://x.com/LumaLabsAI/status/2036107826498544110OpenAI 推出 ChatGPT Library 功能 #4
OpenAI 为 ChatGPT 推出了 Library 文件库功能,用户现在可以通过网页侧边栏的新标签页浏览所有文件,或在对话中利用工具栏快速引用历史文件进行提问。该功能目前正陆续向全球 Plus、Pro 及 Business 用户推送。
OpenAI 推出了针对 ChatGPT 的 Library 功能,旨在帮助用户更便捷地查找、复用及基于其上传或创建的文件进行构建。
根据官方声明,用户现可通过工具栏中的“最近文件”在对话中快速引用文件,直接向 ChatGPT 询问有关已上传内容的问题。
此外,用户也可在网页版侧边栏新增的 Library 标签页中浏览所有文件。
该功能目前正逐步向 Plus、Pro 和 Business 用户全球推送。

https://x.com/OpenAI/status/2036183180219392103网易云音乐推出 CLI 工具,接入 OpenClaw #5
网易云音乐推出了命令行工具,同步上线相关的
Skill和OpenClaw插件,正式向 AI Agent 开放核心音乐服务能力。开发者可以通过各类 Agent 利用自然语言直接指挥 AI 完成搜歌、播放及歌单管理等操作。
网易云音乐开放平台近日正式推出 网易云音乐 CLI,该工具基于开放平台 API 构建,旨在为开发者提供歌曲搜索、播放控制、歌单管理及每日推荐等服务能力。
网易云音乐同步上线相关的 Skill,并全面接入 OpenClaw 平台,使得开发者可以通过自然语言对话的方式灵活调用其音乐服务能力。
目前,开发者需完成平台入驻并获取 API 凭证后方可使用相关工具。


https://developer.music.163.com/st/developer/document?docId=2327e302009c437eb02af48f63d6e514千问上线打车能力,支持自然语言叫车支付 #6
阿里巴巴千问AI助手正式上线打车能力,用户仅需一句话即可完成从选车、设途经点到预约的全流程操作。
阿里巴巴官方宣布,其 AI 助手 千问 正式上线打车能力。用户仅需通过自然语言即可在一句话内完成选车型、设途经点及预约时间等全流程操作。
该功能具备意图理解能力,可响应价格不超过 30 元、驾驶平稳等个性化需求。
https://mp.weixin.qq.com/s/7uA3YrtkMqFDUY1CjbT7UACursor 发文介绍新型文本索引,降低 Agent 搜索延迟 #7
Cursor 发文介绍其基于 “稀疏 N-grams” 算法的新型文本索引技术,解决 Agent 在超大单体仓库中执行正则搜索导致耗时过长的问题。
Cursor 介绍其为 Agent 工具构建的新型文本索引技术,旨在解决超大仓库正则搜索延迟问题。针对 ripgrep 在大代码库搜索耗时超 15 秒 的瓶颈,其采用“稀疏 N-grams”算法。
通过确定性哈希权重及字符对频率优化,减少查找次数。索引存于本地,利用 Git 控制状态,通过内存映射实现毫秒级响应。
官方称,配合 Composer 2 模型,该技术能显著缩短代码调查和重构耗时。
https://cursor.com/cn/blog/fast-regex-search提示:内容由AI辅助创作。
作者橘鸦Juya。

夜雨聆风