乐于分享
好东西不私藏

按键精灵:中国自动化软件的活化石

按键精灵:中国自动化软件的活化石

横纵分析法深度研究报告_by DeepSeek-V4-Pro

研究时间:2026年4月 | 所属领域:桌面自动化/宏脚本工具 | 研究对象类型:产品


作者: 数字生命卡兹克

研究时间:2026年4月 | 所属领域:桌面自动化/宏脚本工具 | 研究对象类型:产品

一、一句话定义

按键精灵是一个诞生于2001年中国大学宿舍的键盘鼠标模拟自动化工具。它在二十五年间经历了从共享软件到全国装机量数千万的国民级产品、从游戏外挂代名词到中国RPA行业公认鼻祖的完整生命周期。今天,它依然活着,但更像一座纪念碑——它的DNA通过来也科技进入了Gartner魔力象限,而它自己却被锁在Visual Basic 6的技术栈里,被AI时代的自动化新物种从四面八方包围。


二、纵向分析:从诞生到当下

被两只鼠标「逼」出来的软件

2001年7月,国防科技大学的一间学生宿舍里,李玮在玩一款叫《龙族》的韩国网游。

这款游戏有个特点——需要无穷无尽地点击鼠标。李玮硬生生点坏了两只鼠标。崩溃之下,他跑去找同班同学褚瑞,问他能不能写个程序帮他自动点。

褚瑞是那种学校里每个人都知道的”大神”——后来他拿了数学建模国际特等奖,进了”天河”超级计算机团队,拿了国家科技进步二等奖,发了三十多篇论文,申请了一百多项专利。但2001年那个夏天,他面对的是一个更接地气的需求:帮他室友挂机。

第一版代码用C语言写的,核心逻辑就一个死循环:每隔一秒,在屏幕固定坐标模拟一次鼠标点击。没有变量,没有条件判断,更不知道什么叫”适应屏幕变化”。就是一台只会打固定靶的机器。

但它能用了。从此,这个宿舍里的学生项目有了一个直白的名字——按键精灵。

这就是中国自动化软件的开端。不是从某个硅谷实验室,不是从某个大厂研究院,而是从一个被韩国网游逼疯的大学生宿舍开始的。

回头看这个起点,有些东西在当时就已经被锁定了:

第一,它是”长”在游戏场景里的。 按键精灵从来就不是一个冷冰冰的办公效率工具,它从一开始就和游戏绑定在一起。这个基因决定了它后来的用户构成、社区文化、商业模式,也决定了它会面对的一切法律和道德争议。

第二,它解决的是”解放双手”这种最朴素的需求。 中文互联网早期有一句口号叫”解放双手”,这四个字后来成了按键精灵二十多年的精神口号,但它背后的逻辑其实很简单:我的肉身不需要被绑定在一台电脑前面做重复劳动。这个需求在不同的时代会穿不同的外衣——网游挂机、抢票、抢号、批量回帖——但内核从未改变。

第三,创始团队的组合很有意思。 李玮负责产品和商业,褚瑞负责技术和架构。一个面向市场,一个面向系统。这个分工模式从学生时代一直延续到后来的企业RPA时代,几乎没有变过。褚瑞后来回忆说,按键精灵的核心问题不是”怎么模拟键盘”,而是”怎么把业务逻辑和执行平台分离”——让脚本可复用、可适配、可分发。2001年的宿舍代码和2021年的Gartner魔力象限之间,隔着一整套关于”平台抽象”的工程哲学。

2001-2004:一个小众校园工具的野蛮生长

按键精灵1.0在2001年发布,以共享软件的形式挂在中国早期的软件下载站上——天空下载、华军软件园、兄弟工作室自己做的网站vrbrothers.com。

最初的产品形态极其简陋:只能录制和回放键盘鼠标操作。它的核心能力就三个:记录用户的输入序列,然后按顺序重复播放。连”如果屏幕上出现了某个画面,就执行某个操作”这种基本的条件判断都做不到。

但它恰好撞上了一个历史窗口。

2001年到2003年,是中国MMORPG的第一次爆发期。《传奇》在2001年9月公测后迅速成为中国最赚钱的网络游戏,《奇迹MU》2002年上线,《大话西游》2002年上线。这批游戏的共同特征是”泡菜网游”——韩国式的、以无尽刷怪练级为核心机制的网游。玩家的游戏进度和在线时长严格正相关,你要变强就必须花时间,没有捷径。

这恰好是按键精灵最适合的场景。一个玩家睡觉前打开按键精灵,录制一套”点击怪物→使用技能→拾取掉落→回到原点”的动作,然后设成无限循环,第二天早上起来角色已经升了三级。

2003年,按键精灵拿了中国共享软件注册中心的”年度优秀共享软件奖”。2004年拿了”最佳创意奖”和”最佳应用软件奖”。

同一年,李玮注册了福州天下创世数码有限公司(注册资金1000万),按键精灵正式从学生项目变成了一家公司的商业产品。兄弟工作室的八个成员——六个国内、两个国外——从一个编程爱好者社群,变成了一支有商业目标的团队。

2005-2009:插件系统、简单游,以及那个改变一切的「平台化」决策

2005年发生了两件事,它们一起决定了按键精灵未来十五年的走向。

第一件事:插件系统上线。

这个决策在当时可能只是”开放接口让第三方写扩展功能”,但它的实际效果是把按键精灵从一款软件变成了一个平台。COM接口和DLL插件支持意味着用户可以绕过按键精灵本身的能力上限——你想做内存读写?有人给你写插件。你想做后台操作?有人给你写插件。你想做图色识别?有人给你写插件。

这个架构选择的后果是深远的。它创造了一个三方开发者生态,把按键精灵的能力边界从”官方开发了什么功能”扩展到了”社区能写出什么插件”。后来彻底统治了按键精灵插件生态的大漠插件(dm.dll),本质上就是在这个系统上生长出来的——一个个人开发者用VC6.0写了一个COM组件,提供图色识别、后台键鼠、内存读写、OCR文字识别。大漠插件的用户量最终比很多独立软件都大。

但也正是这个COM/DLL架构,后来变成了按键精灵的技术枷锁。COM是Windows 95时代的组件模型,依赖注册表,不支持64位原生调用,和现代沙箱/安全模型天然冲突。VB6的宿主加上COM的插件体系,共同锁定了一个技术栈——而这个技术栈的”保质期”在2005年可能还有十年,但到了2025年,它已经腐烂了二十年。

第二件事:简单游(jdyou.com)上线。

简单游是一个游戏脚本交易平台。脚本作者在这里发布他们的按键精灵脚本,玩家花钱购买或订阅。平台负责分发、支付、流量,然后和作者分成。

这个平台的意义怎么强调都不过分。它直接催生了中国互联网上的一个新职业——脚本作者。在简单游鼎盛时期,一个头部脚本作者的年收入可以超过二十万(2010年的二十万)。平台上的脚本覆盖了超过500款游戏、超过5000个活跃脚本、超过一千万注册用户、超过四十万日活用户。

更关键的是,简单游完成了按键精灵从”工具”到”经济系统”的进化。一个普通用户下载按键精灵→学会写简单脚本→放到简单游上卖→赚到第一笔钱→投入更多时间学习→写出更复杂的脚本。这个飞轮转起来之后,按键精灵就不只是一款软件了,它是一个饭碗。

但硬币的另一面也在这一年显现:简单游刚上线,盛大就和福建省文化稽查队一起查抄了平台。

盛大是谁?2005年的盛大是中国最大的游戏公司,《传奇》的运营商。他们的态度很明确:你在我游戏里搞自动挂机,你就是在破坏我的游戏经济。简单游挺过了这场风暴,继续运营,但”游戏外挂平台”这个标签从第一天就贴上了,而且再也没撕下来。

2009年,按键精灵7.0发布。这个版本带来了三个重大变化:

小精灵功能上线。 “小精灵”是按键精灵的一个革命性功能——你可以把你的脚本编译成一个独立的.exe文件,不依赖按键精灵本体就能运行,可以发给任何人使用。打个比方,这就像Python突然可以一键把脚本编译成不需要Python环境的exe。媒体当时的标题是”可以做软件的软件”。

这个功能的商业含义是最重要的:它让脚本分发变得极其简单。一个脚本作者写一个游戏挂机脚本,编译成小精灵,卖给一百个玩家,每个人直接双击就可以运行。不需要教用户安装按键精灵,不需要教用户怎么导入脚本。加上简单游的商业注册码系统(一机一码),这就成了一个完整的软件销售闭环。

版本免费化。 7.0版本首次以免费软件形式发布。在此之前,按键精灵是典型的共享软件模式——免费试用,付费解锁完整功能。切换到免费模式是一个信号:按键精灵的商业模式已经从”卖软件”变成了”卖生态系统”。

简单百宝箱上线。 这完成了按键精灵生态的第三个支柱——前两个是按键精灵(工具)和简单游(脚本交易),第三个是简单百宝箱(绿色免安装的游戏工具箱)。三个平台同时运行,覆盖了从工具到内容到分发的完整链条。

2010年,按键精灵8.0发布,带来Q语言——一个基于VBScript、设计成中文可读语法的领域专用语言。编辑器和调试器完全重写。官方宣称用户量比前一年翻了三倍。

到2011年十周年的时候,按键精灵的官网累计下载量超过3000万。简单游超过1000万注册用户、日活40万+。如果你把时间拉回2011年的中国PC互联网,这个量级意味着什么?它意味着每十个中国网民里就有一个下载过按键精灵。它不是一个小众极客工具,它是一代人的基础软件素养的组成部分。

2013-2014:巅峰年代

这两个年份是按键精灵自诞生以来的绝对巅峰。

奖项收割机: 2013年拿了中国国际软件博览会的”创新奖”,2014年拿到了该博览会的金奖——这是中国软件行业的最高荣誉之一。加上之前从2003年到2011年累计拿过的十几个年度软件奖,按键精灵的荣誉柜已经快装不下了。

新浪入股。 2014年,新浪成为了按键精灵母公司——福建创意嘉和软件有限公司的主要股东。这是一笔具有标志性意义的投资:一个门户巨头看中了一个桌面自动化工具。新浪和按键精灵随后共同举办了”新浪&按键杯”脚本大赛,斗鱼直播了比赛实况。

PC版最后一次重大更新。 2014年9月3日,按键精灵2014版发布(build 2014.00.14123)。这个版本把版本号从数字序列改成了年份标记——”2014″。这个看似技术的细节,后来成了一个历史的标记点:因为是最后一次。十年过去了,PC版至今停留在2014.06.19549。

2014版增加了云脚本(远程存储和同步)、加密命令库、多界面脚本支持、暂停/继续录制、Win8录制支持,还做了全套UI重设计。这是一个功能完整的、有诚意的更新。

但它也是终章。

从那天起,按键精灵PC版再也没有过结构性更新。小修小补当然有——修bug、兼容性调整、适配一些驱动变化——但核心代码、核心架构、核心技术栈,全部冻结在了2014年。

第一个移动版本发布。 2014年2月,按键精灵Android版上线,使用新设计的MQ语言(和PC版的Q语言基本兼容,但针对移动端做了适配)。

这个时间节点很有趣:移动版的上线和PC版的”终章”是同一年。按键精灵不是没看到移动浪潮,而是选择了”两条腿走路”——PC继续做,移动新开拓。但现实是,移动版从一开始就是一个追随者,而PC版从此变成了僵尸。

2015-2019:裂变与衰落

2015年,李玮和褚瑞在长沙高新区成立了奥森科技(Osen Technology)。这个名字在中国科技媒体上远不如”按键精灵”响亮,但它的产品——UiBot——后来完成了按键精灵创始团队”从消费工具到企业RPA”的惊险一跳。

这一跳的逻辑其实非常自然。2015年前后,不断有大型企业找到李玮和褚瑞,说你们这个按键精灵的思路能不能帮我们做企业流程自动化?银行对账、财务报表合并、ERP数据录入——这些企业级任务和游戏挂机在技术本质上完全一样:识别屏幕上的信息,模拟人类输入,按预设逻辑执行。

区别在于:企业场景不需要”躲避反作弊检测”,但需要SLA 99.9%;不需要后台操作DirectX渲染的游戏窗口,但需要对接SAP、Oracle、用友、金蝶。换句话说,企业级是按键精灵从”游击队”到”正规军”的进化。

就在奥森科技悄悄搭UiBot的时候,按键精灵本体正在经历缓慢但不可逆的衰落。

2016年,移动版从v1.x系列重构为v3.0.0。开发主体从福建创意嘉和转到了福州利倍得网络技术有限公司。这个转移本身说明了一些事:按键精灵的主体公司已经不再把主要研发资源投在按键精灵上了。李玮和褚瑞的注意力在UiBot,按键精灵本体交给了一个关联公司在做维护性开发。

PC版呢?一丝不动。

2019年发生了三件事,彻底改写了按键精灵的命运走向:

第一,简单游关停。 2019年6月10日,运营了十四年的中国最大游戏脚本交易平台正式停止运营。原因不需要多说——十四年间经历了盛大的查抄、搜狐畅游的联合警方打击、无数游戏公司的封号政策和诉讼威胁。简单游的关停不是某一个事件的直接结果,而是长期法律压力和水土不服的终局。一个建立在灰色地带上的商业模式,最终被灰色地带吞噬了。

第二,奥森科技和来也科技合并。 2019年6月27日,按键精灵创始团队所在的奥森科技,和AI创业公司来也科技宣布合并。来也科技的创始人是汪冠春和胡一川——两位普林斯顿/宾大的机器学习博士,2015年创立来也时做的是对话式AI。合并的逻辑是:奥森有RPA产品(UiBot)和二十年自动化DNA,来也有AI技术和资本。

合并同时宣布了3500万美元的B+轮融资,凯辉创新基金领投,光速中国和双湖资本跟投。李玮成为来也科技的联席CEO兼总裁,褚瑞成为高级副总裁兼CPO。

第三,按键精灵本体彻底”孤儿化”。 创始人离开了按键精灵本体的运营,简单游关停了,PC版不再更新,移动版勉力维持。此后的按键精灵,是一个没有创始人、没有战略、没有未来的产品——它在自动运行,就像它让千千万万台电脑自动运行一样。

2020-2026:成为纪念碑

如果你把2020年之后的按键精灵看作一个软件产品,你会得出”它在消亡”这个结论——技术栈老化、用户流失、社区质量下降、被各种新工具替代。

但如果你把按键精灵看作一个文化和技术谱系的源头,你会得到一个完全不同的结论:

2020年2月,来也科技完成4200万美元C轮融资,成为中国融资金额最高的RPA+AI公司。

2021年7月,来也科技成为第一个进入Gartner RPA魔力象限的中国公司。Gartner在报告中特别提到了来也的”40万+开发者社区”——这个社区的”种子用户”是谁?是那些在2005年就开始在简单游上买卖脚本的人,是那些在2008年在百度贴吧里互相教怎么写Q语言的人,是那些在2010年靠写大漠插件脚本月入过万的人。

2022年,来也完成C++轮融资,收购了法国对话式AI公司Mindsay,开始全球化扩张。汪冠春在一次采访中说了一句很有意思的话:”来也的使命是把按键精灵的’解放双手’从个人桌面的尺度,放大到企业流程的尺度。”

2024年10月,沈阳警方破获了一起大案:112名”号贩子”被抓,他们用按键精灵在医院挂号系统中抢号——9个犯罪团伙,2.3万个被恶意抢夺的号源,涉案金额超过300万。央视新闻做了专题报道。按键精灵以这样一种方式再次登上头条:不是作为一个光荣的”国产经典软件”,而是作为一种犯罪工具。

这就是按键精灵的困境的本质:它的技术基因(模拟人类输入)既是它强大的原因,也是它永远摆脱不了的危险。一把能帮你挂机升级的工具,也能帮你抢夺别人的救命号源。这个矛盾的根源,从2001年褚瑞写下第一行死循环代码的那一刻就已经注定了。


三、横向分析:竞争图谱

把镜头从时间轴拉回当下,我们需要回答的问题是:在2026年的自动化软件版图上,按键精灵的竞争对手是谁?它在哪个位置?

先判断场景:竞品充分的C场景

按键精灵面临的不只是一个或两个竞争对手,而是一个从四个方向同时挤压的竞争矩阵。而且有趣的是,这些”竞争对手”来自完全不同的天地——有的是同类工具的进化版,有的是从企业端向下渗透的RPA平台,有的是靠AI新范式直接降维打击的新物种。所以我选了四个维度的代表玩家来逐一展开。

中国本土直系竞争

触动精灵:移动端的另一个”按键精灵”

触动精灵(TouchSprite)成立于2014年,由北京帮你玩科技开发。你可以把它理解为”生在移动时代的按键精灵”——它没有PC包袱,一出生就面对iOS和Android。

触动精灵的脚本语言是Lua,而不是按键精灵的VBScript系。这个选择在当时是务实的——Lua轻量、可嵌入、在游戏行业有广泛的使用基础(魔兽世界的插件系统就用Lua)。但Lua的生态系统比JS小得多,这意味着触动精灵的开发者池子天然比Auto.js小。

触动精灵官方宣称1600万+用户、16万+开发者、29万+脚本。它有一个按键精灵早期简单游的影子——一个云端脚本分发和加密系统,让脚本作者可以安全地销售自己的作品。定价模式也很直接:个人版68元/年(iOS)和32元/年(Android),免费版限时60分钟/天。

触动精灵在iOS端的表现特别值得关注。按键精灵的iOS版本至今需要越狱才能使用完整功能,而触动精灵在免越狱方案上走得更远。这背后是一整套关于iOS沙箱逃逸和辅助功能(Accessibility)接口利用的技术积累。

但触动精灵有一个根本性的天花板:它是纯移动端的。它没有PC产品线,没有桌面自动化能力。而中国大量的自动化需求仍然在PC端——企业办公、网页操作、桌面软件数据录入。触动精灵占领了一个阵地,但它是围城里的胜利者。

Auto.js:开源社区的逆袭与反噬

Auto.js的故事是一个典型的”开发者工具在灰色市场爆红后被原作者抛弃、又被社区捡起来继续养”的故事。

作者”hyb1996″做了一个Android上的JavaScript自动化框架,利用Android的无障碍服务(AccessibilityService)实现无需Root的UI自动化。因为是标准JavaScript(ES5+),前端开发者可以零学习成本上手。开源免费,Pro版45元永久买断。

然后它就炸了。

蚂蚁森林自动收能量、抖音快手自动刷视频、京东自动抢券、拼多多自动签到——中国移动互联网上所有能”薅羊毛”的场景,全被Auto.js覆盖了。大量的脚本开始在CSDN、B站、各种论坛上流传。”Auto.js”从一个技术工具的名字变成了一个动词,就像”百度一下”一样。

原作者在看到自己的项目被灰色产业全面劫持后,删除了GitHub上的开源仓库。但社区立刻fork了——AutoX.js成为主要的社区维护分支,继续更新。

Auto.js和按键精灵之间的关系很微妙。在技术上,Auto.js代表了一种更现代的范式:JS引擎 + AccessibilityService(而非像素识别),可以真正”看到”UI树而非”看图识字”。在用户构成上,Auto.js的用户更偏程序员——前端开发者用熟悉的JS语法写自动化;按键精灵的用户更偏普通玩家——用录制回放和中文化Q语言入门。但在核心使用场景上,两者高度重叠:游戏挂机、App薅羊毛、批量操作。

Auto.js目前面临的最大问题是依赖Android的无障碍服务接口。Google这些年不断收紧AccessibilityService的权限审核——Google Play对使用无障碍服务的App审查越来越严,要求必须”真正帮助残障用户”。非残障用途的无障碍服务App无法上架Google Play。虽然国内安卓生态不受Google Play直接管辖,但各家手机厂商(华为、小米、OPPO、vivo)也在收紧权限管理。

冰狐智能辅助:AI-Native的新物种

冰狐(IceFox)是2020年后冒出来的新玩家,但它的技术栈和上面所有人都不一样。

冰狐的技术方案如果用一句话概括:把YOLOv8目标检测、99.7%准确率的OCR、AI行为模拟、AI代码生成,全部打包进一个移动自动化平台里。

它支持全终端——Android、iOS、模拟器、云手机;支持四种开发模式——无代码拖拽、低代码配置、专业JavaScript代码、AI自然语言生成。这意味着同一个平台可以被完全不会编程的人用(拖拽),也可以被专业程序员用(TypeScript + NPM)。它的底层用ES2022,兼容NPM生态。架构是云-边协同三层架构:云端存储/同步/调度,远程调试,Web IDE。

冰狐声称它的AI行为模拟可以将封号率降低62%。这个数字难以验证,但背后的逻辑是成立的:传统脚本是机械的、重复的、可被检测的。AI驱动的操作可以加入随机延迟、人类化的鼠标轨迹、非均匀点击间隔——模拟出更像真人的行为模式。

冰狐的核心功能免费——OCR、无代码开发、JS编码、在线调试、单设备运行。付费主要在企业和高级功能。

冰狐对按键精灵的威胁是降维式的。它不是”更好用的按键精灵”,而是”完全换了一个物种”。按键精灵的竞争力建立在”录制回放+中文脚本+海量社区资源”上;冰狐的竞争力建立在”AI识别+自然语言编程+云端协同”上。前者的壁垒是历史积累,后者的壁垒是技术代差。

全球经典对手

AutoHotkey:西方世界的”按键精灵”,但更硬核

AutoHotkey(AHK)经常被拿来和按键精灵做对比,两者确实有很多相似之处:都在2000年代初诞生(AHK是2003年),都是Windows桌面自动化工具,都支持热键映射和宏录制。

但两者的气质完全不同。

AHK的语法是出了名的”非标准”——它有自己的脚本语言,简洁到极致但也古怪到极致。^c::Send, Hello 的意思是”按Ctrl+C时发送Hello”。这种语法极其紧凑,对会写的人效率极高,对不会写的人则是一堵密不透风的墙。AHK没有录制回放界面、没有中文命令、没有任何降低入门门槛的东西。

按键精灵正好相反:它的核心卖点就是”不会编程也能用”。录制回放、中文命令、可视化界面编辑、小精灵一键打包——这些都是为了让非程序员能上手。

两者的用户群几乎没有重叠。AHK的用户是程序员和IT管理员,他们在Reddit上讨论怎么用AHK实现窗口管理的tiling、怎么映射复杂的快捷键组合。按键精灵的用户是游戏玩家和普通上班族,他们在百度贴吧上讨论怎么挂《传奇》、怎么自动填Excel报表。

AHK v2.0在2026年发布,目前两个版本(v1和v2)并行维护,社区活跃但面临生态系统分裂的问题。v1有海量的论坛脚本和库,v2用更规范的语法但大量v1脚本不能直接迁移。

值得注意的是AHK在中国也有社区——百度贴吧的AutoHotkey吧有约4600人。但这个规模和按键精灵吧的50万人相比,差了100倍。这背后不只是软件本身的差异,而是整个技术文化路径的差异:中国互联网发展出了一条以”低门槛+中文生态+脚本交易市场”为核心的自动化文化,西方走的是”开源+社区共享+程序员互相帮助”的路线。

AutoIt:IT管理员的最爱

AutoIt v3在2004年发布,和按键精灵几乎是同龄人。但它走的路线完全不一样。

AutoIt的核心卖点是”把脚本编译成无依赖的独立EXE并加密源代码”。这个能力让它成为IT管理员批量部署软件的首选工具——写一个AutoIt脚本自动化某个软件的安装流程,编译成exe,通过组策略推送到全公司两千台电脑,不需要在目标机器上安装任何运行时。

按键精灵也有小精灵功能(编译脚本为exe),但两者的定位不同。AutoIt的exe面向的是”在完全不受控的目标机器上静默运行”,按键精灵的exe面向的是”把脚本卖给不装按键精灵的普通用户”。前者是IT运维工具,后者是软件分发渠道。

AutoIt的语言是BASIC系的,比AHK的语法规范得多。它有一个丰富的标准库,覆盖了几乎所有Windows GUI操作的场景。但它也有两个致命伤:没有内置的热键映射系统(AHK的杀手功能),以及从v3.1.0开始闭源。开发速度极其缓慢——几年才发一个小版本。

Sikuli/Oculix:视觉驱动的学术派自动化

Sikuli是MIT的学术项目,核心思想是”用截图来编程”——你截一张按钮的图,写”点击这个图出现的地方”,Sikuli就会在屏幕上用OpenCV匹配那张图然后点击。

这个思路和按键精灵的FindPic/FindColor如出一辙。但Sikuli的底层是Jython(Java上的Python),可以用完整的Python生态;而按键精灵的图色识别是插件层实现的,底层是C/COM。同样是像素级视觉自动化,Sikuli更强但也更脆弱——像素稍有变化脚本就崩。

Sikuli在2024年停止了开发,原维护者在2026年3月把它重命名为Oculix重新发布。这种”原项目死亡、换个名字继续”的模式在开源世界很常见,但也说明了一个事实:纯视觉驱动的桌面自动化在2026年已经不是一个有足够活力的独立品类。

UI.Vision RPA:浏览器+桌面的缝合怪

UI.Vision(前身Kantu)是个有趣的存在。它是一个浏览器扩展,但通过本地的XModules可以和桌面应用交互。它是开源的,兼容Selenium IDE格式,有录制回放,支持OCR(Tesseract),甚至整合了Claude Computer Use作为AI后端。

UI.Vision努力想同时覆盖Web自动化和桌面自动化,但这种”什么都想做”的定位让它在每个领域都做不到最专业——Web自动化比不过Playwright,桌面自动化比不过AHK和Python。但它有一个很多人忽视的优势:它是唯一一个能把浏览器脚本和桌面脚本写进同一个工作流里的免费开源工具,而且不需要安装复杂的环境。

对按键精灵来说,UI.Vision指出了自动化工具的一个进化方向——Web和桌面的边界正在模糊,未来最好的自动化工具可能不会区分”你在操作浏览器还是在操作桌面”。

企业级降维打击:RPA平台

影刀RPA:按键精灵的”如果它活到了企业时代”版本

影刀RPA是中国RPA赛道的独角兽,它经常被拿来和按键精灵做对比。影刀官方社区里有一个流传很广的说法:”按键精灵能做的影刀都能做,影刀能做的按键精灵不一定能做。”

这个说法基本准确。影刀不是用像素识别,而是用UI Automation(Windows的可访问性API)和DOM解析来”看到”界面元素。这意味着它不和分辨率/窗口位置/主题颜色挂钩,脚本更稳定更可靠。它还不需要任何编程基础——完全可视化的拖拽搭建,比按键精灵的入门门槛更低。背后的企业级支持也是消费品无法比拟的——API对接、数据库交互、AI文档处理、报表、自动化流程编排。

影刀的个人版是免费的,有1000+个自动化指令。企业版年费大约6万起。这个定价对于企业不算什么,但对个人用户来说是一个巨大的”向上跳跃”——你可以在免费版里尝鲜,但一旦想认真用起来,门槛立刻跳到了企业级。

影刀和按键精灵之间最核心的区别不是技术,是目标用户。按键精灵的目标用户是”想节省时间的个人”,影刀的目标用户是”想节省人力的企业”。前者思考的是”怎么帮一个人少点几次鼠标”,后者思考的是”怎么帮一家公司省掉二十个数据录入员的岗位”。

UiBot/Laiye:按键精灵亲儿子

UiBot是按键精灵创始团队的”第二幕”。它和按键精灵之间的关系,不是竞品,而是直系血亲的产业升级。

李玮和褚瑞在2015年创立奥森科技开发UiBot时,手里的牌是:二十年的自动化技术积累、按键精灵积累的数千万用户的场景理解、以及一个已经验证过的”让不会编程的人也能做自动化”的产品哲学。

UiBot在2019年和来也科技合并后的发展速度惊人。2021年进了Gartner魔力象限,2022年出海收购了法国Mindsay,累计融资超过1亿美元。Gartner报告里提到UiBot的”40万+开发者社区”是全球第二大(仅次于UiPath的社区)——这个数字的根基就是那批从按键精灵时代就开始玩自动化的中国开发者。

UiBot也推出了社区版免费策略,试图复制按键精灵当年的”免费工具→开发者生态→商业化变现”路径。但这个模式在企业级市场能不能跑通,还有待验证。企业RPA的决策链条远比个人下载一个免费软件要长——你要说服CIO、要做POC、要做安全审查、要做合规评估。这不是一个”觉得好玩就下一个”的市场。

来自未来的威胁:AI原生GUI Agent

2025年到2026年,自动化领域出现了真正的范式转移。

Anthropic的Claude Computer Use、OpenAI的Operator、Google的Gemini Computer Use——这些产品做的事情本质上和按键精灵一样:看屏幕、模拟人类操作。但它们的实现方式完全不同。

传统脚本的工作流是:人写脚本→脚本执行固定逻辑。AI Agent的工作流是:人口述目标→AI看截图→AI规划动作→AI执行动作→AI看结果截图→AI判断是否达成目标→如果没有就调整策略。

这意味着AI Agent不需要被”教”怎么操作。你说”帮我把这周的报销单填了”,它自己会打开系统、找到表单、读取Excel、逐行填写。按键精灵做不到这些——按键精灵能填表,但你得先花两个小时录一遍正确的操作流程,再花三个小时处理各种异常情况的条件分支。

2026年初,各大AI Agent的能力评测显示了一个惊人的趋势。在OSWorld(一个测试GUI Agent真实桌面操作能力的基准)上,OpenAI的Operator拿到了75%的分数,Claude Computer Use拿到了72.5%,而开源项目Open Computer Use冲到了82%。这些数字意味着什么?意味着一台电脑上最复杂的多步骤桌面操作——下载软件、安装、配置、使用——已经有超过七成的成功率可以由AI独立完成。

而且这些AI Agent不需要Root、不需要开启无障碍服务、不需要写一行代码。它们只需要一个API key——和一张能看截图的多模态模型。

对按键精灵来说,这不是”一个新的竞争对手”,而是”这个品类可能不需要存在了”。

当然,AI Agent目前还有很大的局限性:速度慢(每次决策都要调API)、成本高(屏幕截图消耗大量token)、不可靠(同样的指令可能每次结果不同)。对实时性要求极高的游戏挂机场景,AI Agent还远远赶不上传统脚本。但方向已经明确了。

按键精灵在2001年用”解放双手”的口号定义了中国的自动化文化。二十五年后,AI Agent举着一面写着”解放大脑”的旗号走了过来。


四、横纵交汇洞察

历史如何塑造了当下的竞争位置

当你把纵向的时间线和横向的竞争版图叠在一起看,按键精灵今天的位置不是偶然的。四条历史的线索在时间轴上被一次次”锁定”,最终指向了今天的局面。

第一条线索:VB6技术栈的路径依赖。 2001年用VB6写第一版是合理的选择——当时VB6是Windows桌面开发的主流方案,入门低、生态好、开发快。但2005年的插件系统上线后,COM/DLL架构把整个生态焊死在了VB6上——大漠插件、天使插件、乐玩插件,全部是COM组件,全部依赖32位Windows API,全部无法迁移到现代运行时。到了2010年Q语言发布时,按键精灵的技术债务已经大到不可能偿还了。重写整个平台意味着重写所有插件兼容层、重写所有用户脚本的解析引擎、重写脚本编译和分发系统。这不是一个软件更新,这是脱胎换骨。一个靠免费版赚钱、靠脚本市场抽成的公司,没有动力也没有资源来做这件事。所以2014年的那个PC版本,就是终点。

第二条线索:简单游的”原罪锁链”。 2005年简单游上线是一个天才的商业决策,它让按键精灵从一个工具变成了一个经济系统。但这个经济系统的根基是灰色地带——游戏公司从未认可脚本交易的合法性,法律从未明确界定”模拟操作”是否侵犯计算机信息系统。十四年间,简单游经历了盛大的查抄、搜狐畅游的刑事打击、无数封号潮和诉讼威胁。当2019年简单游最终关停时,按键精灵失去了它最大的商业引擎。更重要的是,它在社会和公众心目中的定位已经被锁死——”游戏外挂平台”。这个标签让按键精灵永远无法进入企业市场,也无法洗白自己的品牌。

第三条线索:创始人的”高阶跃迁”。 李玮和褚瑞2015年创立奥森科技做UiBot,2019年并入来也科技。从创始人的个人角度来看,这是正确的选择:把二十年的技术积累往上一个台阶跳,从个人消费者跳到企业级市场,从游戏脚本跳到Gartner魔力象限。但这个选择对按键精灵的本体来说,就是一记致命的”釜底抽薪”。创始人的注意力、公司的研发资源、融资的能力和渠道,全部被抽到了UiBot和来也。按键精灵本体成了一个被留守的孤城——有守军,没将领,更没援兵。

第四条线索:中国移动互联网的爆发绕过了它。 按键精灵在2014年就推出了Android版本,比大多数移动自动化工具都早。但它的移动版从一开始就是PC版的延伸——同样的Q语言思路、同样的图色识别范式、同样的脚本经济模型。它没有意识到移动时代的自动化需要的不是”PC自动化思路的移植”,而是完全不同的技术范式——AccessibilityService、UI树遍历、JS引擎、云端协同。Auto.js和冰狐抓住了这个范式转移,按键精灵没有。

把这四条线索放在一起,你会发现按键精灵今天的处境几乎是被四条独立的力量同时推到了同一个方向上。VB6让它无法进化,简单游让它无法洗白,创始人的离开让它失去了战略方向,移动互联网的范式转移让它错过了最后的时间窗口。这是一个被”锁死”的系统——每一条路径都被堵住了,没有任何一条路能通向一个不同的未来。

竞品的纵向对比:不同的起点如何导向不同的终点

当你把每个主要竞品也放到时间轴上,会出现一个很有意思的对比:

AutoHotkey(2003-至今):和按键精灵几乎同时代出生,但走了完全不同的路。AHK没有商业化——它一直是开源免费的,没有脚本市场,没有付费会员,没有投资人。这意味着AHK不需要讨好任何人,但也意味着它永远只能靠志愿者的兴趣来维持。AHK发展到今天,有庞大的社区和脚本库,但它的增长曲线是平缓的——没有爆发点,也没有崩塌点。它是一个稳定的小宇宙。

触动精灵(2014-至今):生在移动时代,长在移动时代。它的困境和按键精灵不同——按键精灵的问题是”太老了”,触动精灵的问题是”上不去”。它是一个优秀的移动端脚本工具,但它没有企业级能力,没有PC端延伸,没有技术代差的突破。在一个AI Agent开始能操作手机的2026年,触动精灵的上限已经看得见了。

Auto.js(2017-至今):一个典型的”开源项目被灰色产业绑架”的案例。它在技术上代表了一种更先进的范式(JS+AccessibilityService),但它的生态完全建立在灰色地带——蚂蚁森林、抖音刷量、京东抢券。原作者删除仓库是一个标志性事件:一个技术上有追求的工具,最终被它的使用场景反噬了。这和按键精灵被简单游锁死了品牌定位如出一辙。

影刀RPA(2019-至今):中国RPA赛道最亮眼的独角兽。影刀出生在RPA概念已经成熟的时代,不需要像按键精灵那样”在荒野里开路”。它直接享受了按键精灵二十年来培养的市场认知——中国企业听到”自动化”这三个字不觉得陌生,很大程度上是因为按键精灵已经把这个概念普及过了。

AI Agent(2025-至今):这才是真正的”换赛道”。它不是按键精灵的竞品,而是按键精灵所属的整个品类的终结者。当电脑自己会看了、会想了、会操作了,”录制回放”就从一个先进功能变成了冗余步骤。

优势的历史根源

按键精灵到今天还剩下的优势,每一条都能找到历史的对应节点:

惯性优势 ← 2005的插件系统。 二十年的教程、脚本、论坛帖子、插件、百度知道问答——这是一个巨大的”数据护城河”。一个2026年第一次想学自动化的小白,在百度上搜”怎么自动填表”,排在前面的结果大概率还和按键精灵有关。这个信息生态的惯性极大,大到即使软件本身已经生锈了,它的名字还能继续吸引新用户。

易用性优势 ← 2010的Q语言。 Q语言的中文可读性在当年是革命性的,在今天依然有效。”鼠标移动到坐标100,100″就是比”pyautogui.moveTo(100, 100)”更容易被一个不懂英语的普通用户理解。对大量的非技术用户来说,英语编程语言就是一道过不去的门槛,而Q语言搬掉了这道门槛。

编译分发优势 ← 2009的小精灵。 把脚本编译成独立exe发给别人用——这个能力在2009年是魔法,在2026年依然很实用。AutoHotkey没有原生的一键编译功能(需要安装AHK环境才能运行脚本),Python打包成exe(PyInstaller)出来的文件动不动就上百兆还经常被杀毒软件误杀。按键精灵的小精灵十几兆,双击就跑。

品牌认知优势 ← 2001-2014的十四年积累。 在中文互联网的世界里,”按键精灵”这四个字已经等于”自动化”。就像提到搜索引擎想到百度、提到社交想到微信一样。这个品牌认知是最难复制的竞争壁垒。

劣势的历史根源

每一条劣势也能找到历史源头,而且更讽刺的是,很多今天的劣势恰恰是当年的”正确决策”造成的:

VB6技术债 ← 2001的”合理选择”。 2001年用VB6没错。2005年把插件系统建在COM上也没错。但这两个”没错”叠加二十年,生出了一个无法进化的技术栈。当年不做这个选择,按键精灵可能根本活不到2005年。但做了这个选择,它活不过2025年。这就是技术选型最残酷的地方——没有一个选择是对的或者错的,每个选择只是给了你一段不同的”有效期”。

“游戏外挂”品牌 ← 2005的简单游。 简单游在商业上是天才之作,在品牌上是致命之毒。从2005年开始,按键精灵就不再是一家”生产力工具公司”,而是一家”游戏脚本平台”。这个标签让它的企业客户拓展几乎不可能,让它的融资故事讲不圆,让它的法律风险永远悬在头上。但如果没有简单游,按键精灵可能只是一个几十万用户的共享软件,早就被遗忘了。简单游给了它商业巅峰,也锁死了它的品牌上限。

创始人流失 ← 2015的”正确跳跃”。 李玮和褚瑞去做UiBot是正确的战略选择——消费工具的天花板看得见,企业RPA的空间是无限的。但这个”正确”对按键精灵本身是毁灭性的:一个软件产品失去了创始人,就像一支军队失去了主帅。短期内运营团队可以维持运转,但长期来看,没有人会为了一个停止进化的产品投入最好的工程师。

移动时代掉队 ← 2014的”平移策略”。 按键精灵的移动版本质上是PC版本的思路平移——Q语言→MQ语言,找图找色→移动端找图找色。它没有理解移动端自动化应该走的新路——UI树遍历(AccessibilityService)、JS引擎、云端IDE。不是因为技术能力不够,而是因为做这个决策的人(李玮和褚瑞)的注意力已经不在这里了。

未来推演:三个剧本

剧本一:缓慢消亡(最可能)

按键精灵继续以目前的状态运行——PC版不再更新但依然可用(在部分Windows 10/11上兼容性越来越差),移动版勉力维持版本更新但没有实质性创新,社区用户缓慢流失,百度贴吧从技术讨论变成广告和怀旧帖的混合。

来也科技继续在RPA赛道增长,但”按键精灵”这个品牌和”UiBot”之间的关联越来越弱。新一代用户知道UiBot但不知道按键精灵。在2028-2030年之间的某个时间点,PC版因为Windows的某个大版本更新彻底无法运行,官方宣布”停止维护”。

这个剧本的支撑逻辑是:没有任何一股力量在推动按键精灵复兴。没有创始人、没有研发投入、没有商业引擎、没有战略方向。一个软件产品在没有外力推动的情况下,只会遵循热力学第二定律——熵增。

剧本二:灰色产业链的反向绑架(最危险)

在中国互联网的灰色地带,按键精灵依然有庞大的”地下需求”——游戏工作室、号贩子、薅羊毛团伙。2024年的沈阳医院抢号案只是冰山一角。

如果执法部门对自动化工具的监管升级——比如把”提供具有规避反作弊系统的自动化工具”纳入刑事打击范围——按键精灵可能成为典型案件的”工具被告”。这在法律上目前还是一个模糊地带(按键精灵本身是合法的自动化工具,但可以被用于非法目的),但2022年的”纯模拟脚本入罪”判例已经亮起了红灯。如果未来出现了某个极端案件(比如用按键精灵抢票导致踩踏、抢号导致患者死亡),舆论和政策的压力可能直接压垮这款软件。

这个剧本的支撑逻辑是:按键精灵的”原罪”从未被清洗。它的用户里有大量灰色/黑色产业的从业者,而它没有任何能力(也没有任何意愿)去做用户行为审核。一场足够大的舆论风暴就足以终结它。

剧本三:AI时代的精神文艺复兴(最乐观但可能性最低)

有一个极其浪漫但可能性微乎其微的剧本:按键精灵被重新唤醒。

怎么被唤醒?不是靠技术更新——VB6已经没救了。而是被”重新定义”。

按键精灵最大的资产不是它的代码,而是它的名字和它的文化记忆。在中国,有几千万人曾经下载过、使用过按键精灵。对于一代中国互联网用户来说,”按键精灵”这四个字不只是软件的名字,而是青春回忆的一部分——那些在网吧挂机刷《传奇》的夜晚,那些第一次用”找图”功能写出一个能自己运行的脚本时的成就感。

如果有一个团队能够拿到这个品牌,把它重新定位为”AI时代的自动化入门工具”——保留Q语言的中文可读性和小精灵的编译分发能力,但底层换成现代技术栈(Python/JS引擎+Web界面+云端IDE),并在来也科技的企业生态中找到自己的位置(作为RPA教育和个人入门工具),按键精灵有可能迎来第二春。

甚至,如果来也科技愿意把UiBot的社区版和按键精灵品牌打通——”UiBot是按键精灵的企业版,按键精灵是UiBot的入门版”——这种”一个品牌覆盖两个市场”的策略,在商业上并不罕见。

但这个剧本最大的障碍是意志,不是技术。需要有人(可能是一个人,可能是一个团队)对这款产品有足够的感情,愿意投入足够的资源,去重新激活一座被遗忘的城池。而目前的情况是:最在乎这款产品的人,已经在做更大的事了。


这就是按键精灵。它不是一款伟大的软件,它的技术栈老旧,它的代码有安全漏洞,它的社区充斥着广告和诓骗,它在四面包围的竞争中节节败退。

但它活过了中国互联网的全部历史——从拨号上网到5G,从PC到移动,从共享软件到SaaS,从VB6到Claude。它还”生”出了中国第一家进入Gartner魔力象限的RPA公司。它的名字刻在了几千万中国网民的集体记忆里。它是中国自动化这条漫长的、至今仍在延伸的道路上,立在那里的第一块里程碑。

你可以在技术上超越它,在商业上碾压它,在法律上挑战它。但你无法在历史上抹掉它——早在”RPA”这个词被发明出来的十五年前,在国防科技大学的一间学生宿舍里,两个年轻人为了少点几次鼠标,写下了中国自动化软件的第一行代码。


五、信息来源

一手来源

  • 李玮:”来也科技总裁、按键精灵之父,给开发者的一封信”(2021年,掘金/CSDN)
  • 褚瑞访谈:”从RPA到RPA+AI:褚瑞和他的’未来’梦”(2019年)
  • 褚瑞访谈:”来也科技联合创始人褚瑞:RPA的’连接器’使命”(雷锋网)
  • 按键精灵官方网站:anjian.com
  • 按键精灵官方论坛:bbs.anjian.com
  • 兄弟工作室:vrbrothers.com
  • Gartner 2021 RPA魔力象限报告
  • 央视新闻:沈阳医院号贩子案件报道(2024年11月27日)
  • 简单游(jdyou.com)历史页面(已关停,通过archive.org获取)

百科与参考

  • 百度百科:按键精灵、按键精灵8.0、简单游、靠谱助手
  • 搜狗百科:按键精灵
  • 维基百科:AutoHotkey、AutoIt

行业媒体

  • InfoQ:”国货之光,40万开发者登上世界领奖台”(2021年)
  • 36氪:来也科技C轮融资报道(2020年)
  • PChome:”中国网络游戏十年盘点之:外挂的发展”
  • 澎湃新闻:AFK游戏行为学术分析(2024年)
  • 虎嗅/BB姬:游戏反作弊政策报道(2025年)
  • 雷锋网:来也科技RPA战略报道

社区来源

  • 百度贴吧:按键精灵吧、AutoHotkey吧
  • 知乎:按键精灵相关讨论(包括”按键精灵能厉害到什么程度”等热门回答)
  • 精易论坛(bbs.ijingyi.com):按键精灵技术讨论
  • CSDN:按键精灵插件技术教程与逆向工程分析
  • 52破解论坛(52pojie.cn):安全分析
  • NGA玩家社区:游戏相关使用讨论
  • GitHub:KeymouseGo、TSPlug(天使插件源码)、AutoX.js
  • Reddit:r/AutoHotkey、r/Tasker

企业/法律来源

  • 企查查/天眼查:福建创意嘉和软件有限公司、福州天下创世数码有限公司、福州利倍得网络技术有限公司、湖南奥森伯特科技有限公司、来也科技工商信息
  • 冠若律师事务所:游戏脚本法律责任分析
  • 找法网:游戏外挂相关法律问答

竞品官方来源

  • 触动精灵官方网站:dev.touchsprite.com
  • 冰狐智能辅助(IceFox)官方网站
  • Auto.js/AutoX.js GitHub仓库
  • 大漠插件(dm.dll)文档及更新日志
  • 影刀RPA官方网站

本报告采用横纵分析法(Horizontal-Vertical Analysis),由数字生命卡兹克提出,融合了语言学中的历时-共时分析、社会科学的纵向-横截面研究设计、商学院案例研究法及竞争战略分析的核心思想。


-END-

© Copyright

奔跑的键盘侠原创作品 | 尽情分享朋友圈 | 转载请联系授权

选题/码字/coding/调试/编辑/排版/修订再修订/推送

看起来简单,却远没有你想的那么轻松和容易

「点赞+转发+留言」是最好的肯定与鼓励

如果你来了,请让我知道至少

你「在看