你有没有意识到,我们现在用软件的方式,其实还停留在上个时代?
打开一个企业系统,找到正确的菜单,点击正确的按钮,填写正确的表单,然后等待结果。整个过程里,你其实是在配合软件工作,而不是软件在帮你工作。
这个问题已经存在几十年了,但大家都默默忍受着。直到AI agent出现,这件事才真正开始被挑战。
最近,一家叫CopilotKit的公司宣布完成了2700万美元的A轮融资,由Glilot Capital、NfX和SignalFire联合领投。
这不只是一条简单的融资新闻。它背后指向的是一个更大的问题:当AI agent已经可以真正嵌入应用、理解用户意图、生成动态界面、自主执行任务,我们今天所熟悉的软件交互方式,还能撑多久?
“所有的UI都将变成AI”
CopilotKit的创始人Atai Barkai说了一句话,我觉得极其准确:“所有的UI都将变成AI。”
这不是在描述遥远的未来,而是正在发生的现实。
目前,CopilotKit的工具已经被超过一半的世界500强企业使用,德意志电信、DocuSign、思科、标普全球都是他们的企业客户。他们主导的AG-UI协议,已经被Google、Microsoft、Amazon、Oracle以及LangChain、Mastra等主流AI框架采纳。每周有数百万次的agent与用户交互通过他们的基础设施在生产环境中运行。
数字很硬,不用我多说,大家都能感受到这意味着什么。
AI和应用之间,缺了一层什么?
我一直想不明白一个问题:为什么今天大多数产品里的AI体验还是那么割裂?
你打开一个app,里面有一个聊天框,你跟AI说你想做什么,AI给你一段文字,然后你再自己去操作界面完成任务。这个流程里,AI和应用其实是分开的两件事,没有真正融合在一起。
这就是CopilotKit想解决的核心问题。他们认为,真正有价值的AI体验,不是在app旁边放一个聊天机器人,而是让AI agent真正住在应用里面——理解用户正在做什么,直接采取行动,并且以合适的界面形式呈现结果,而不是返回一大段文字让用户自己去消化。
举个例子。假设你在用一个数据分析工具,你问它“帮我看看上个季度各个产品线的收入分布”。
一个普通的AI聊天机器人会给你一段充满数字的文字回复,你还得自己去阅读和理解。但一个真正嵌入应用的AI agent,会直接生成一个交互式的饼图——样式是你们公司自己的设计规范,你可以点击、筛选、下钻。
这两种体验之间的差距,就是CopilotKit想要填补的那层空白。
Atai Barkai在接受采访时说得非常直白:“agent可以回复你的,不只是一段文字,而是由你们公司自己定义的交互式UI。用户问收入按类别的分布,得到的不是一段难以消化的长段文字,而是一张饼图,是你们自己设计的饼图,用户可以直接与之交互。”
这句话点出了一个很重要的方向:AI的输出形式本身,也需要被重新设计。
不再是把文字塞进聊天框,而是让AI的输出变成一个个可以操作的、活的界面。这才是“智能”该有的样子。
AG-UI:一个正在成为标准的协议
要理解CopilotKit为什么能在短时间内获得这么高的市场认可,必须先说清楚AG-UI是什么。
AG-UI,全称Agent-User Interaction Protocol,是一个开放协议,专门定义AI agent如何与用户界面进行通信和交互。你可以把它理解成AI agent和前端应用之间的“通用语言”。
有了这个协议,agent可以向前端推送流式消息、调用前端工具、同步状态,以及在需要人类介入时暂停执行、等待用户确认。
在AG-UI出现之前,每个团队想把AI agent嵌入自己的应用,都要自己解决这一层的通信问题——每家公司各自为战,重复造轮子,而且互不兼容。AG-UI的价值在于,它把这个问题标准化了,让开发者不需要从零开始解决agent和UI之间的连接问题,直接基于一个开放的标准来构建。
为什么要关注这件事?
从大背景来看,2026年AI产业的市场叙事正在从算力主线逐步切换到应用落地叙事,AI应用端的商业落地正在加速推进。但同时,真正能让AI融入现有应用的成熟工具链仍然是行业痛点。
CopilotKit做的事情,恰恰是解决从“AI能力”到“AI落地”之间那“最后一公里”的连接问题。
回顾软件交互的历史:从命令行到图形界面,再到触屏交互,每一次交互方式的变革都意味着巨大的产业洗牌机会。而今天,AI agent正在成为下一代人机交互的核心——不是让用户去学习怎么操作软件,而是让软件真正理解用户、主动帮用户完成任务。CopilotKit的故事,就是这场变革的一个缩影。
一个值得思考的问题是:几年以后,当我们打开手机或电脑时,看到的还会是今天这些熟悉的图标、按钮和菜单吗?
我个人觉得,答案大概率是:不会。
软件正在从“让你操作”变成“替你完成”。我们熟悉的软件界面,可能真的很快就会变成历史。
夜雨聆风