AI 助手只能等你提问?我做了款能实时参与讨论的主动型 AI Copilot
有趣产品咖啡馆 Funny café :一个能让你更快接触到更多新鲜有趣好玩产品的地方。我会寻找市面上有趣的独立产品,向独立开发者们进行一对一的访谈,挖掘优质产品背后不为人知的故事(文末可加入群聊,有彩蛋!)。
1、可以先简单介绍一下你自己,也介绍一下 Pask ,对于第一次接触这类产品的用户来说,应该怎么理解?
Hello 大家好,我是谢之非,南洋理工大学(NTU)人工智能方向博士生。我的学术研究主要聚焦于音频大模型和语音交互模型,其中我们开源了全球首个实时对话音频模型。除学术研究外,我还和我的导师颜水成老师一起创建 Pask.AI ,致力于打造首个以理解用户意图为核心的实时主动 AI。
对于第一次接触这类产品的用户,我一般会用一个很简单的比喻。
大多数 AI,其实更像是搜索引擎升级版。你需要先想到问题,然后去问,它再给你答案。而 Pask 是一个一直在旁听、会在关键时刻主动给你信息和提示的 AI 助手。
你们在一开始的时候协商好他需要帮你做什么,像是解释同事的行业术语,为你们的讨论实时补充数据,或者一个值得展开的观点时,它会自动帮你补充背景、解释概念、或者整理关键问题。这其实就是我们希望带来的体验。
简单来说,就是你可以用它来看网课,学习,讨论,工作。有了这个产品,你不会再常常停下来问 AI,但 AI 会一直在旁边,把你来不及查、来不及想清楚的东西,实时补给你。

点击“阅读原文”也可以直接下载使用
最早这个想法其实是从学习场景里长出来的。
我们观察到一个很真实的问题:学生在课堂上,只要某一个概念没听懂,或者某一段逻辑没跟上,后面整堂课基本就很难再跟住了。你当然可以去查,但问题是课堂不是会停下来等你,等你查完回来,老师早就讲到下一段了。所以学习一直是我们非常重要的一个场景,因为它特别能说明“及时帮助”这件事的价值。
但后来我们越想越觉得,问题其实不只是时间来不及,或者场合不方便。更核心的是,传统“你问我答”的 AI,有一个很强的前提:I know what I don’t know。也就是说,用户得先清楚地意识到,自己哪里不会、哪里缺信息、哪里需要帮助,然后再把这个问题提出来。
可真实世界里,很多时候根本不是这样。更常见的状态其实是:I don’t know what I don’t know。
尤其在工作里,你经常并不知道自己漏掉了什么。比如开一场 40 分钟的会,里面可能有十几个瞬间你其实非常需要帮助,也有更多瞬间,AI如果能补一把,会让你的理解和判断都更完整。有人提到一个公司、一个概念、一个政策,你其实想知道它的背景;有人抛出一个观点,你会想知道有没有反例、有没有数据支持;有时候你甚至不是有一个明确问题,你只是隐约感觉这里值得被整理成几个关键问题继续往下讨论。
但这些需求往往都来不及问。因为你一旦停下来问 AI,你就会错过会议接下来在讲什么。

所以我们后来意识到一件事:如果 AI 只有在你提问的时候才出现,那它本质上还是一个“离线工具”,而不是一个真正参与当下过程的 copilot。
Pask 的想法就是从这里出来的。我们不是把 AI 当成一个随叫随到的问答助手,而是希望它像一个一直在旁听、一直在理解上下文的 copilot,在合适的时候主动把信息、线索和提醒递出来。这个能力在会议场景里就特别重要,因为会议本身就是一个信息密度很高、但又最没有时间停下来提问的场景。
我理解的“第二大脑”,更像是一个实时参与思考的系统。
它不是一个被动的数据库,而是一个会在合适的时候提醒你:
-
你以前其实见过类似问题
-
这个观点和某个理论有关
-
这个公司之前的融资背景
如果说要补一块能力,我觉得是:把人的长期记忆、实时场景和 AI 的推理能力连接在一起。

当时我们团队其实在讨论一个很技术的问题:我们是不是应该把总结做得更好?比如更精准的会议纪要、更强的知识库、更复杂的 RAG。
但 GPT 给我的回答其实很简单,它说了一句话:
用户真正需要的不是“更好的总结”,而是“在需要的时候得到帮助”。
这句话当时对我冲击很大。
因为它其实是在说:你们现在优化的是“记录系统”,但用户需要的是“参与系统”。
那一刻我突然意识到,我们可能一直在优化会议之后发生的事情,但用户真正需要的是会议正在发生的时候。
Pask 后来很多设计,其实都来自这个认知转变。
最本质的区别其实只有一句话:
大多数工具是在“记录会议”,Pask 是在“参与会议”。
记录工具的核心任务是:把发生过的事情整理出来。
但 Pask 更关注的是:
-
讨论过程中出现的概念 -
有争议的观点 -
可以补充的数据 -
需要进一步追问的问题
它更像是一个一直在旁听的人,在合适的时候递一张小纸条给你。
6、我观察到 Pask 近期也更新了“需求组合”、“场景化 AI 工作流”的功能,不同场景自动挂载不同能力,你们为什么会决定往这个方向走?
这是一个很现实的问题。如果 AI 什么都能做,它其实就会变成什么都做不好。
比如在一场商业播客里,你可能更需要:
-
公司背景 -
行业数据 -
观点补充
但在课堂里,你更需要:
-
概念解释 -
知识延展 -
重点总结
所以我们后来做了一件事情:把 AI 的能力按场景打包。你进入一个场景的时候,AI 自动加载对应的“需求组合”,这样它给出的信息就会更相关,也更稳定。

7、最近像 OpenClaw 这样的产品也很受关注,它们同样在探索“常驻、主动、可调用能力的 AI 助手”这条路。你怎么看这类产品和 Pask 的关系?你觉得 Pask 想走的主动 AI 路径,最不一样的地方在哪里?
我觉得这是一个很好的趋势。过去一年很多 AI 产品其实都在意识到一件事情:AI 不应该只存在于一个聊天窗口里。
像 OpenClaw 这种产品更像是在探索系统级助手,可以帮你操作电脑、执行任务。Pask 的关注点其实有点不一样,我们更关注的是:人在“思考和讨论”的时候,AI 怎么参与。
所以它的核心场景会是会议和课堂这种需要深度谈话的场景。
换句话说:OpenClaw 更像是行动型助手,而 Pask 更像是认知型助手。
我觉得最重要的一次升级是:从“功能思维”变成“系统思维”。
一开始我们想做的是很多功能,比如录音、实时总结,知识库和记忆库。后来慢慢意识到,这些其实都只是组件。真正重要的是:AI 如何理解当前发生的事情,并持续提供帮助。当我们开始用“系统”去看这个问题的时候,很多功能就自然出来了。
9、从实时智能助理到桌面 AI 入口,意味着产品可能会接触到更多上下文和更多用户隐私。在隐私这件事上,你们是怎么处理的?
从实时智能助理走向桌面 AI 入口,确实意味着产品会接触到更多上下文信息。我们的处理方式,首先在底层安全服务器层面,我们具备三层能力:第一,数据在传输、存储、计算全过程都可以验证机密性和完整性;第二,底层有加密和授权访问能力,确保数据不是裸露流转;第三,访问控制是基于细粒度权限模型来做的,谁能接触什么数据都有严格限制。
更重要的是,在这个基础上,我们对用户数据的原则非常明确:数据归用户所有,不归平台所有;我们不会去窥探、转售用户数据;也不会把用户数据拿去做模型训练。换句话说,底层能力解决的是“即使系统处理了数据,也能保证安全”,而产品原则解决的是“我们本来就不应该去碰不该碰的数据”。这两层是同时成立的。
10、你觉得主动 AI 想真正成立,最先要做到的是“聪明”,还是“识趣”?为什么?
我觉得是识趣。
如果一个 AI 很聪明,但总是在不合适的时候打断你,那它其实会变成一种干扰。
主动 AI 最大的挑战其实不是能力,而是时机。
什么时候应该出现,什么时候应该保持安静。
我觉得真正好的主动 AI,应该更像一个很懂分寸的助手,而不是一个一直在说话的专家。
11、除了自己的产品,你还有在用哪些产品?
我其实会用很多 AI 工具。
比如:
-
ChatGPT / Gemini 做深度讨论 -
豆包用来搜索、翻译,飞书/zoom 开会
还有一些比较轻量的工具,比如录音软件、笔记软件之类的。
我其实很喜欢尝试各种新工具,因为很多产品的设计细节都很有启发。
12、如果不聊产品开发,你平时的工作和生活状态更接近什么样子?
其实还挺简单的。大部分时间都在看各种新论文、新技术,做 paper,偶尔打游戏放松一下。
但我也会花时间听播客、看访谈,因为很多灵感其实是从这些地方来的。有时候你会发现,一个很好的 idea,可能比一个很好的答案更重要。







夜雨聆风