一、大模型生态
市面上的大模型生态我认为可以分为4类
第一类:公司有实力,直接自研大模型,代表典型有OpenAI、Google Gemini、DeepSeek,并且提供api接口,支持调用;
第二类:不仅是模型的研发方,也提供了云服务平台,代表典型有DashScope (阿里云) 、 Volcengine 豆包 (火山引擎);通过这个云服务平台既能用到自研的“通义千问”、“豆包”模型,也能接入市面上其他第三方的模型;
第三类:本地工具箱,技术定位是大模型的容器,代表典型有Ollama,可以在自己的电脑或服务器上,下载并运行各种开源模型,完全不受制于任何云服务商;
第四类:“AI智能体”桌面工具,代表典型workbuddy、qoderwork、qclaw等,通过对接外部模型充当大脑,在桌面端感知用户的自然语言作为指令,最后通过内置的 Skills(技能)引擎和各种连接器(Connectors) 来具体执行操作,相比较于前面几种,这可以称为智能体了;
二、自研桌面端工具

1.选择厂商(创造者)
厂商:是模型的创造者,模型属于创造物,主要是公司或者平台,比如OpenAI、Google、阿里云 (Alibaba Cloud)、字节跳动 (ByteDance)等。如果要使用模型,必须先在厂商注册账号,并且后续产生的使用费用本质都是要跟厂商结算。
2.API Key
选择了厂商,有了账号,还需要有唯一的apikey,正常来说不管是公司还是个人,只要是需要使用ai模型,都是要先在ai厂商注册账号并且生成唯一的key。
Key不仅仅是钥匙,它是你整个账户(身份 + 权限 + 计费)在 API 调用时的代表。它本身不存储账户的全部信息,但服务端可以通过它唯一确定是你的账户,并执行该账户对应的权限和计费规则。(AI生成)
3.选择模型(AI生成)
目前我还并未发现每一种模型的边界,后续持续了解。

4.基于选择的模型,输入自然语言指令就可以让它完成一些工作了,其中可能涉及了上下文理解、长任务执行、agent调用等等,在此就先不展开了。
5.使用付费:关于付费也展开一点点,目前了解到有两种计费方式
API调用计费:也就是按量(token)付费
企业授权与订阅
可理解为“买月卡”,核心逻辑是用固定的周期性费用,换取确定的资源和服务,一般是超过月卡的费用,服务就直接停了,对于企业的好处是方便做预算。
以上是我司目前工具端实现的流程,但是反过来想想,我们自研的桌面端工具咋就还需要填写apikey,选模型,那使用qoderwork、workbuddy、qclaw这些工具的时候就很丝滑,登陆后直接使用了,继续了解下市面上的桌面端工具。
三、市面上桌面端AI工具

用户需要在ai厂商注册账号,在workbuddy的配置页面录入自己的apikey,这样在使用的时候可以选择自己的模型,最终结算也是由用户直接跟厂商结算,这种workbuddy应该要收一个服务费,相当与在美团点外卖,美团提供页面,我们把自己的钱付给商家,得到餐食;


夜雨聆风