Perplexity 放大招:AI 自己决定哪些数据留在你电脑上,哪些送上云端!隐私和性能,一个 agent 全包了

导读Perplexity Computer 即将上线「hybrid agentic inference」——同一个 agent 任务里，敏感数据自动留在本地模型处理，重负载推理交给云端 frontier models，用户全程不用手动选。隐私、成本、能力三件事，被压进了一套自动分流系统里。

你的 AI 助手，要学会自己「分活儿」了

6 月 3 日，科技博主 RoundtableSpace 在 X 上发了一条帖：

"Perplexity Computer is getting hybrid agentic inference. Sensitive tasks run on your local model, heavy lifting goes to frontier models in the cloud. Private data stays on device. Token costs drop. Best of both worlds in one agent."

「Perplexity Computer 正在加入混合智能推理。敏感任务交给你的本地模型，重活交给云端 frontier 模型。隐私数据留在设备上，token 成本降低。一个 agent，两全其美。」

▲ RoundtableSpace 发帖概括 Perplexity 新能力：敏感任务本地跑，重负载上云端

短短几句话，把一个 AI 产品架构层面的变化，浓缩成了一个所有人都能感知到的问题：你用 AI 处理私人文件时，数据到底去了哪里？

而 Perplexity 给出的答案是——让 agent 自己判断。

官方早就埋好了线

这件事并非突然冒出来的。

早在 2026 年 4 月，Perplexity 官方博客就发布了一篇《Personal Computer Is Here》，明确写到：

"Personal Computer brings the multi-model orchestration of Computer to your machine."

「Personal Computer 把 Computer 的多模型编排能力带到了你的机器上。」

"It can work across your local files, native applications, connectors, and the web to complete complex and even continuous workflows."

「它可以跨本地文件、原生应用、连接器和网页，完成复杂甚至持续性的工作流。」

还有一句更关键的：

"Personal Computer makes Perplexity Computer a more personal orchestrator, elegantly hybridizing the local and server environments for maximum security and productivity."

「Personal Computer 让 Perplexity Computer 变成一个更个人化的编排器，优雅地融合本地与服务端环境，兼顾安全与生产力。」

▲ Perplexity 官方博客《Personal Computer Is Here》，4 月已经定调"本地+云端融合编排"

注意这里的措辞：hybridizing the local and server environments。这说明 Perplexity 从一开始就在布局一件事——把纯云 agent 系统的执行范围，延伸到用户自己的设备上。

关键能力：任务中途自动切换执行位置

到了 6 月初，媒体开始集中报道这个能力的具体形态。

9to5Mac 的报道把功能讲得最直白：

"The upcoming task splitting feature will let Perplexity Computer switch between on-device AI models and more powerful server-based models for different jobs."

「即将推出的任务拆分功能，可以让 Perplexity Computer 在设备端 AI 模型与更强大的服务端模型之间切换执行。」

"The compact model runs locally on your device to determine when sensitive data should also be kept locally."

「小型模型在设备本地运行，用来判断哪些敏感数据也应当留在本地。」

更关键的一句：

"Unlike tools that ask you to pick local or cloud up front, this happens on its own, task by task."

「跟那些让你提前选"本地还是云端"的工具不同，这个分流在任务执行过程中自动发生，逐任务决定。」

这就是「agentic」这个词真正的含义——agent 自己在做调度决策，用户不用管。

VentureBeat 点出了真正的新变量

VentureBeat 在 Computex 2026 的报道里，对这个能力给了一个更精确的定性：

"Autonomously decides — in real time and mid-task — which AI workloads stay on a user's device and which get routed to frontier models in the cloud."

「自主决定——实时地、在任务执行中途——哪些 AI 工作负载留在用户设备上，哪些被路由到云端 frontier 模型。」

▲ VentureBeat：Perplexity 在 Computex 2026 上展示 hybrid local-cloud inference system

然后是整篇报道里分量最重的一句：

"The key claim is not that a model can run locally ... It is that Perplexity's system makes the routing decision itself, task by task, without requiring the user to choose in advance."

「核心主张不在于本地能跑模型……在于 Perplexity 的系统自己做路由决策，逐任务判断，不需要用户提前选择。」

这段话把整件事的焦点拉到了正确的位置上。本地跑模型，2025 年就不是什么新鲜事了。真正值得关注的变量，是谁来决定一个 agent 工作流里，哪一步该留在设备端，哪一步值得送上云端。

Perplexity 的答案是：系统自己来。

三个群体的反应，指向同一个痛点

X 帖的回复区分成了三类声音。

第一类，隐私敏感用户：终于不用自己做取舍了。他们的逻辑很简单——如果手上的数据很私密，当然希望它别离开设备；但如果任务需要更强模型，又不想被一个小模型拖慢。现在系统替你做这个判断，他们认账。

第二类，成本敏感用户：以前在不该上大模型的地方烧了太多 token。回复区有人直接说，过去在 Perplexity Computer 上"在错误的地方烧了太多 token"。对他们来说，这个 feature 的价值在成本治理——把不需要 frontier model 的环节压到本地执行，减少不必要的云端消耗。

第三类，技术质疑者：敏感识别本身才是最难的部分。他们的问题很尖锐：

到底谁决定哪些数据算"敏感"？
是小模型自动判断，还是规则系统硬编码？
分类错了怎么办？

这是整个故事里最值得深挖的风险点。

最该担心的事：分错了怎么办？

如果本地小模型对敏感数据的分类出了差错，后果可能朝两个方向走：

方向一：该留在本地的数据被送上了云——隐私承诺落空。

方向二：本可安全上云的数据被拦在本地，用户被迫用小模型硬扛需要 frontier 级别推理能力的任务——体验直线下滑。

这意味着，这套系统的真正门槛不只在于"有没有本地模型"，而在于：

数据分类标准是否足够稳定；
路由规划器（route planner）的决策过程是否可解释；
用户能不能看到哪些部分留在了本地、哪些去了云端；
出错时能不能手动干预。

Perplexity 目前没有公开技术白皮书详述这些机制。所以，「隐私与性能两全」这个卖点，目前更多停留在产品愿景层面，还需要时间验证。

更大的背景：Perplexity 在从搜索工具走向 agent runtime

把视角拉远一点看，hybrid inference 只是 Perplexity 正在推进的更大转型的一部分。

从 Comet 浏览器的定位就能看出来——

▲ Perplexity Comet：「The browser that works for you」，定位是替用户执行任务的浏览器

Perplexity 早就不满足于"问一个问题给一个答案"。它正在推进的方向包括：跨应用执行、本地文件和原生 app 读写、持续任务与委派任务、浏览器 + 助手 + 编排器的统一体验。

所以这次 hybrid agentic inference 更像是runtime 层的补强，而非单点功能更新。它要解决的问题是：一个统一的 agent 系统，如何在不同的执行环境之间自动分工。

token 成本真的能降吗？

RoundtableSpace 帖子里那句「Token costs drop」说得很轻松，但需要打个问号。

本地模型处理任务虽然不消耗云端 token，但设备资源本身也有成本。如果路由决策的协调逻辑需要频繁调用，未必每次都比直接上云更省。某些看似简单的任务，交给本地模型后可能需要更多次返工，反而推高总耗费。

更准确的理解是：Perplexity 试图通过 local-first routing 降低一部分不必要的 cloud token 消耗，但实际的成本收益，仍然取决于任务类型和分流准确率。

时间线：最快 7 月可用

据 9to5Mac 的报道，这项功能计划在 7 月上线。VentureBeat 的措辞则是"coming weeks"。两个口径略有差异，但都指向同一个信号：功能已经进入倒计时，不再停留在 roadmap 阶段。

最后看回这件事

AI 产品过去一直卡在一个老矛盾上：纯云方案能力强但隐私和成本让人顾虑，纯本地方案隐私有保障但能力天花板太低。

Perplexity 这次的尝试，是把这个矛盾变成系统自动处理的问题——不再把"选 local 还是 cloud"的决策压力扔给用户，而是让 agent runtime 自己判断。

如果这个方向跑通了，未来 AI 产品之间比的就不再只是模型跑分，而是谁的调度系统更会分工、更懂什么时候该本地、什么时候该上云、在用户完全不操心的前提下把隐私、成本和任务完成率都兜住。

这场竞争的单位，正在从单个模型，变成整套 agent runtime。

— END —