桌面端AI工具

最近我司在研发AI桌面工具，对接各个开源模型，刚知道这个信息的时候我的第一反应是同样都是对接模型为啥要自研，不直接使用腾讯、阿里的桌面工具，本质都是对token付费，后转念一想，自研的话维护成本较低并且可以自由定制化（自由定制化可以说是我目前最讨厌的词汇了），也没错。

在使用自研桌面工具的起步阶段我又产生了点疑问，操作步骤是：填写apikey->选择模型，在还没有进入页面前的这两步给我带来了深深的疑惑，不知道我在干啥，要干啥，下文探讨下模型、apikey到底是干啥的。

一、大模型生态

市面上的大模型生态我认为可以分为4类

第一类：公司有实力，直接自研大模型，代表典型有OpenAI、Google Gemini、DeepSeek，并且提供api接口，支持调用；

第二类：不仅是模型的研发方，也提供了云服务平台，代表典型有DashScope (阿里云) 、 Volcengine 豆包 (火山引擎)；通过这个云服务平台既能用到自研的“通义千问”、“豆包”模型，也能接入市面上其他第三方的模型；

第三类：本地工具箱，技术定位是大模型的容器，代表典型有Ollama，可以在自己的电脑或服务器上，下载并运行各种开源模型，完全不受制于任何云服务商；

第四类：“AI智能体”桌面工具，代表典型workbuddy、qoderwork、qclaw等，通过对接外部模型充当大脑，在桌面端感知用户的自然语言作为指令，最后通过内置的 Skills（技能）引擎和各种连接器（Connectors）来具体执行操作，相比较于前面几种，这可以称为智能体了；

而我司暂时被我归在了第四类。

二、自研桌面端工具

目前我司属于刚开始，最基础的操作流程：选择厂商->填写Apikey->选择模型->愉快玩耍->老板买单，在这个环节中对于一个非技术流，我需要研究下填写apikey、选择模型到底是什么，所以有了此文。

1.选择厂商（创造者）

厂商：是模型的创造者，模型属于创造物，主要是公司或者平台，比如OpenAI、Google、阿里云 (Alibaba Cloud)、字节跳动 (ByteDance)等。如果要使用模型，必须先在厂商注册账号，并且后续产生的使用费用本质都是要跟厂商结算。

2.API Key

选择了厂商，有了账号，还需要有唯一的apikey，正常来说不管是公司还是个人，只要是需要使用ai模型，都是要先在ai厂商注册账号并且生成唯一的key。

Key不仅仅是钥匙，它是你整个账户（身份 + 权限 + 计费）在 API 调用时的代表。它本身不存储账户的全部信息，但服务端可以通过它唯一确定是你的账户，并执行该账户对应的权限和计费规则。（AI生成）

3.选择模型（AI生成）

目前我还并未发现每一种模型的边界，后续持续了解。

4.基于选择的模型，输入自然语言指令就可以让它完成一些工作了，其中可能涉及了上下文理解、长任务执行、agent调用等等，在此就先不展开了。

5.使用付费：关于付费也展开一点点，目前了解到有两种计费方式

API调用计费：也就是按量（token）付费

Token：模型理解文本的最小单位，可以是一个完整的单词、一个标点符号，甚至是一个汉字的字根或子词。以大语言模型最经典的例子为例，“OpenAI”这个词，在很多模型中会被拆分成["Open", "AI"]两个Token来处理；对于中文：“人工智能”可能被视为一个Token，也可能被拆开。

最常见的计费模型：模型厂商会将一次API请求中消耗的全部Token（包括你上传的+模型回复给你的）数量乘以单价，计算出单次调用的费用；

（AI生成）

企业授权与订阅

可理解为“买月卡”，核心逻辑是用固定的周期性费用，换取确定的资源和服务，一般是超过月卡的费用，服务就直接停了，对于企业的好处是方便做预算。

以上是我司目前工具端实现的流程，但是反过来想想，我们自研的桌面端工具咋就还需要填写apikey，选模型，那使用qoderwork、workbuddy、qclaw这些工具的时候就很丝滑，登陆后直接使用了，继续了解下市面上的桌面端工具。

三、市面上桌面端AI工具

以我最近使用最多的workbuddy为例

我司现阶段的流程：选择厂商->填写apikey->选择模型->用户使用；

workbuddy的流程：登陆即使用；（这很值得学习）

关于workbuddy有两种商业模式：

1.官方商店模式（WorkBuddy统一结算，用户享受套餐）

用户直接在workbuddy注册账号，根据自然语言指令，workbuddy自动调用相关模型以及skill，最后根据用户的使用量进行结算；

在这个环节用户是不用在ai厂商注册账号，只跟workbuddy的平台产生交易行为，最终由workbuddy统一跟ai厂商结算；

结算方：我<->workbuddy，workbuddy<->ai厂商；

2.BYOK（Bring Your Own Key），即“自带密钥”模式（用户与厂商直接结算，WorkBuddy仅提供通路）

用户需要在ai厂商注册账号，在workbuddy的配置页面录入自己的apikey，这样在使用的时候可以选择自己的模型，最终结算也是由用户直接跟厂商结算，这种workbuddy应该要收一个服务费，相当与在美团点外卖，美团提供页面，我们把自己的钱付给商家，得到餐食；

结算方：我<->ai厂商，我<->workbuddy

当然我目前使用workbuddy的高频都是在模式一，后续我将狂吸它的长处，补自己的短处，还发现现在好多人提到的claude code、codex这些，后续有时间了也可以继续了解了解。