乐于分享
好东西不私藏

没有API也能让AI操作App?这个开源神器2.4k Star

没有API也能让AI操作App?这个开源神器2.4k Star

 你有没有遇到过这种情况:想让 AI 帮你操作微信发消息,结果对方告诉你”没有 API 接口”—— 

 国内 99% 的 App,对 AI 来说都是一堵墙。 

 但最近,有个开源项目直接把这堵墙踹倒了——它叫 Turix CUA,GitHub 已经超过 2.4k Stars,用一句话说清楚它在做什么:让 AI 像人一样用眼睛看屏幕、动手操作任何 App,不需要任何 API。

开源地址:https://github.com/TurixAI/TuriX-CUA


什么是 CUA?它凭什么颠覆 RPA?

 传统自动化工具(RPA)的逻辑是:给每个 App 写专属脚本,点哪个按钮、填哪个表单,全部硬编码。换一个版本,脚本就可能废掉。 

 CUA(Computer Use Agent)的逻辑完全不同:截屏 → 理解 → 操作。 

❌ 传统 RPA针对每个 App 写专属脚本 / 换版本就失效 / 不会处理突发弹窗 / 维护成本高

✅ CUA(Turix)用眼睛”看”屏幕 / 人能点的它都能点 / 无需 API / 遇到弹窗也能自主处理

 简而言之:RPA 是给”工厂流水线”写死的脚本,CUA 是雇了一个有眼睛有手的临时工——什么活都能干。 

▲ Turix CUA vs 传统 RPA 核心差异对比


Turix 实测:5 个让人吃惊的真实案例

 光说不练假把式。来看 Turix 实测跑通的任务,每一个都是过去需要开发者手写脚本才能完成的活: 

1微信自动通过好友验证一句话指令,自动识别验证弹窗并点击通过,完全没有封号风险。

2播放 QQ 音乐打开 App、找到热歌榜、点击播放,全程无需人工干预。

3淘宝自动下单低价商品输入关键词和价格上限,Turix 自动搜索、筛选、加购、完成下单,全程不需要人盯着。

4钉钉/飞书自动打卡签到每天定时触发,自动打开 App 完成定位打卡,连弹出的”是否确认”提示框都能识别并点击。

5小红书定时发布笔记文案和图片准备好后,Turix 自动打开 App、填写标题正文、添加话题标签、设置定时发布,一套流程全搞定。

更关键的是:这些任务在 OSWorld 基准测试中,Turix 跑出了 64.2% 成功率,全球开源第 3 名,macOS 自测更高达 80% 以上。 


怎么用 Turix?三种接入方式详解

 Turix 提供了三种玩法,从新手到进阶都有对应方案: 

🖥️ 方式一:桌面版(最简单)

从 turix.ai 下载安装,图形界面开箱即用。支持 Work(办公)+ Chat(聊天)双模式,关键操作会弹窗询问,安全性更好。适合不想折腾环境的普通用户。

🔌 方式二:MCP 接入 Agent(推荐进阶用)

Turix 已支持 MCP 协议,可以直接接入 Claude、OpenClaw、CodeBuddy 等任意 Agent 框架,把它变成一个”会操作电脑的工具”。

配置步骤:安装 Turix → 开启 MCP Server → 在你的 Agent 里添加工具。注册赠送 100 万 Tokens,地址:turixapi.io

⚙️ 方式三:开源自部署(最灵活)

从 GitHub 克隆仓库,支持 macOS / Windows / Linux 三端。可自行替换底层 VLM 模型(支持 OpenAI API 格式或本地 Qwen3-VL)。

     conda create -n turix_env python=3.12     pip install -r requirements.txt     # 修改 config.json 填入模型 API Key     python examples/main.py   


Turix vs Codex 桌面版:到底选哪个?

 两者经常被一起比较,差距其实不在准确率,而在以下几点: 

Turix vs Codex 桌面版 对比

开源性:Turix 完全开源(MIT)/ Codex 闭源

执行速度:Turix 更快 / Codex 稍慢

基础准确率:两者差不多,均在 64-80%

鼠标控制:Turix 会”抢”实体鼠标 / Codex 生成虚拟鼠标不打扰

模型可替换:Turix 支持 / Codex 不支持

 简单结论:想要开源灵活、能接 Agent 框架,选 Turix;想要操作时不打扰自己继续用电脑,Codex 体验稍好。

▲ Turix 三种接入方式 + 与 Codex 核心对比


CUA 的终极形态:操作即学习,技能即沉淀

 Turix 团队有一个让人兴奋的路线图:你的操作记录可以沉淀为 Skills(技能包)。 

 这意味着:第一次让 AI 帮你完成”每周发微信群汇报”这件事,可能需要 3 分钟。之后每次只需要一句话,0.5 秒触发。 

 2026 Q2 官方计划还包括: 

🔄 浏览器自动化升级:专门优化 Chrome 类浏览器操作,稳定性大幅提升

💾 持久化记忆:Agent 能记住你的操作习惯,越用越”聪明”

🎓 演示学习:你做一遍,AI 记住流程,下次自动复现

 这不只是”更好的 RPA”,这是一个真正会学习的数字员工雏形。 


写在最后

 如果用一句话总结 Turix:它是目前最接近”雇一个 AI 助手帮你用电脑”这个愿景的开源方案。

 不需要等 API、不需要写脚本、不需要担心 App 版本更新——只需要一句人话,剩下交给它。 

 项目地址(GitHub):TurixAI/TuriX-CUA 官网下载:turix.ai API 注册(免费 100 万 Tokens):turixapi.io


💬 你怎么看?

你有没有遇到过”想自动化但 App 没有 API”的困境?你会考虑用 Turix 这类 CUA 工具来搞定吗?欢迎留言聊聊你的想法!

👍 觉得有用就点个,顺手点个在看,让更多人看到这篇文章~🔔 还没关注的朋友,点右上角 关注,每天 8 点推送最新 AI Agent 干货!