一个值得注意的变化
不知道你有没有察觉到这样一个趋势:
2024年,人们还在争论“AI到底能不能用”。到了2025年,讨论的焦点已经变成了“哪个AI更好用”。而进入2026年,问题进一步演变为——“你还在用哪个AI?”
由此可见,选择是否使用AI已经不再是问题,真正的关键在于:到底该选哪一个?
基于这一背景,本文将对本人实际使用和研究过的AI工具进行一次系统性的梳理与总结。
先弄清楚几个关键概念
在介绍具体工具之前,有必要先解释几个高频出现的技术术语。理解这些概念,有助于后续内容的阅读。
Token(词元)
Token是AI处理文本的最小单位,可以把它理解为AI的“计量单位”——就像汽油按升计算、电力按度计算,AI的工作量则按Token计算。每次与AI对话,都会消耗一定数量的Token。不同服务商的收费方式各异,有的按使用量计费,有的通过包月套餐提供固定额度。
Agent(智能体)
Agent区别于普通的聊天机器人。它具备自主规划能力,可以自行调用工具,并分步骤完成复杂任务。例如,你只需说一句“帮我把这篇论文复现出来”,Agent就会自动完成读代码、修改代码、安装依赖环境、运行测试等一系列操作。这是2025年以来AI领域最重要的变化之一——AI从“你问我答”的被动响应,进化为“你吩咐我干”的主动执行。
MCP(模型上下文协议)
MCP是一种让AI能够连接外部工具和数据的通用接口。可以把它理解为AI的“USB接口”——有了它,AI就能读取你的文件、调用你的API、访问你的数据库。
Prompt(提示词)
Prompt是你向AI下达的指令。写得好的Prompt能让AI成为得力助手;写得不好,AI的表现则会大打折扣。
Skill(技能)
Skill指的是一套固定的操作流程,明确告诉AI在特定任务中该做什么、怎么做。其理念与SOP(标准作业程序)非常相似。
国内大模型厂商盘点
回顾2024年,国产模型的体验可以用“惨不忍睹”来形容——常识性错误频出,回答经常牛头不对马嘴。
但是,自2025年DeepSeek发布之后,局面发生了根本性改变。国内大模型集体迈入了“可用”阶段。在这一进程中,DeepSeek功不可没。
阿里:通义千问与Qwen

最新模型:Qwen 3.6-Plus(2026年4月2日发布)
特点:阿里的开源策略非常成功。Qwen系列在开源社区中口碑稳定,是许多企业进行本地部署的首选。其API服务平台“百炼”在价格上也具有较强竞争力。
Token价格:输入0.8元/百万Token,输出4.8元/百万Token(128K上下文以内)。新用户可获7000万Token免费额度(各模型各100万),有效期90天。
适用场景:如果你想尝试自行部署一个模型,Qwen可能是最稳妥的起点。
月之暗面:Kimi

最新模型:Kimi K2.6(2026年4月20日发布)
特点:长文本处理能力一直是Kimi的核心优势。其PPT生成功能也非常实用。此外,Kimi Code是其编程工具,Kimi Claw是其智能体平台。
价格:49元/月,新用户享有15元免费额度。
适用场景:如果你经常需要处理长文档或制作PPT,Kimi值得一试。
字节跳动:豆包

模型矩阵:基座模型为Seed 2.0,图像生成模型为Seedream 4.0,视频生成模型为Seedance 2.0。
特点:豆包在C端的用户体验确实是国内做得最好的。桌面端支持划词翻译,可通过“Alt+空格”快捷键快速唤出。音视频能力也处于国内领先水平。
适用场景:如果你只想在手机和电脑上安装一款AI工具,不希望过多折腾,豆包可能是最省心的选择。
智谱:GLM

最新模型:GLM-5.1(2026年4月7日发布),采用75.4B MoE架构,已全量开源。
特点:坦率地讲,目前国产编程模型中最强的就是GLM。它能够连续工作数小时而不间断,代码编写能力和长推理能力都非常突出。
订阅服务:GLM Coding Plan,价格为44.1元/月。但目前所有产品均已售罄,可见其火爆程度。新用户可获2000万Token免费额度。
MiniMax

最新模型:MiniMax M2.7(2026年3月发布)
特点:MiniMax在语音和视频领域能力很强,旗下拥有海螺视频、MiniMax语音等产品。适合配合OpenClaw使用。
价格:29元/月,新用户享有15元免费额度。
DeepSeek

定位:DeepSeek是国产模型中的“技术流”,不追求花哨的产品功能,专注于底层创新。
发展历程:其671B参数的V3模型开源后,直接推动了企业大模型本地部署的浪潮。R1则是国产首个长思维链推理模型。
最新动态:目前最新版本为DeepSeek V4,部分使用华为昇腾GPU,助力国产化进程。
价格:缓存未命中输入1元/百万Token,缓存命中0.02元/百万Token,输出2元/百万Token,没有包月选项。当前deepseek-v4-pro模型享受2.5折优惠,优惠期延长至2026年5月31日。
核心理念:DeepSeek不玩花样,就是专注于把模型做好,把价格打下来。
小米:MiMo

最新模型:MiMo V2.5 Pro
特点:这是一匹可能被你忽略的黑马。该模型匿名上线OpenRouter后,连续多日位居全球调用量第一。社区评价极高,说明小米在AI领域的布局比许多人想象的要深远。
价格:39元/月,目前有赠送百亿Token的活动,成功率很高。适合配合Claude Code使用。
腾讯:元宝与混元

评价:腾讯虽然资金实力雄厚,投入不小,但坦率地说,产品体验一直不太理想。钱花了不少,效果却不尽如人意。
国外大模型厂商:格局已变
OpenAI:ChatGPT与Codex
最新模型:GPT-5.5,图像生成模型为GPT Image 2。
地位:自2022年11月GPT-3.5发布、大模型首次进入公众视野以来,OpenAI至今仍是该领域最大的玩家。ChatGPT的记忆功能是所有AI中做得最好的。
Codex:Codex是OpenAI旗下的编程智能体,属于ChatGPT生态的一部分。它能够读代码、写代码、运行测试,是一个功能强大的编程助手。需要特别说明的是,后面会提到的Claude Code属于Anthropic公司,两者是完全不同的产品,请勿混淆。
订阅价格:Go为8美元/月,Plus为20美元/月,Pro分为100美元/月和200美元/月两档,此外还有Business、Team、Enterprise等更高额度的企业方案。
新功能:新推出的文生图模型据说表现优于Gemini,用户可以通过浏览器直接体验。
Anthropic:Claude
最新模型:Claude Opus 4.7和Sonnet 4.6。
定位:Claude是目前最强的AI编程工具之一。尽管账号容易遭到封禁,用户依然前赴后继地使用。目前平台还要求实名认证,实现了“精准封号”。
Claude Code:这是Anthropic的编程工具,与OpenAI的Codex完全不同。Claude Code运行在终端中,最大的优势在于可以搭配不同模型使用。例如,你可以通过cc-switch将其连接到GLM 5.1或小米MiMo V2.5 Pro上,使用国内模型还无需处理网络问题。
订阅价格:Pro约20美元/月(基础订阅),Max 5x约100美元/月(5倍用量),Max 20x约200美元/月(20倍用量)。
Google:Gemini
最新模型:Gemini 3 Pro;本地部署模型为Gemma 4,支持多模态。
特点:Google的图片生成能力非常强大。免费用户上传图片的额度也很高。如果你的主要需求是用AI处理图片,Gemini是首选。
订阅价格:Google AI Pro为19.99美元/月,Google AI Ultra约249.99美元/月。
xAI:Grok
最新模型:Grok 3。
特点:由Elon Musk推出的AI产品,依托X平台(原Twitter),信息时效性极高。如果你想获取最新的前沿资讯,Grok是不错的选择。不过需要指出的是,就在今天(5月7日),马斯克宣布将停止对xAI的支持,计划将显卡出售给Anthropic。后续发展如何,目前尚不明朗。
开源智能体框架简介
OpenClaw(小龙虾)
这是一个开源免费的智能体框架,可以接入任何外部模型。其定位是“秘书”,主要功能包括协调其他工具、管理定时任务、连接手机等。需要注意的是,不要指望小龙虾直接执行具体任务,它的强项在于协调和管理。目前,Claude Code已经禁止OpenClaw接入。
Hermes Agent
这是一个开源免费的智能体框架,内置自学习循环。它可以直接“夺舍”OpenClaw,功能更为强大。
OpenCode
这是Claude Code的开源替代品,但目前已被Claude Code封禁。
我的实际使用体验
Codex:复现论文的实践
我使用OpenAI的Codex复现了一篇题为VGGT-SLAM的论文。传统方式下,复现一篇论文需要自行阅读论文、理解代码、配置环境、调整参数,折腾好几天是常态。而使用Codex,只需几句话即可完成整个流程——它会自动读论文、读代码、安装依赖、调整参数,我只需在关键节点进行确认即可。最终跑出的结果与论文中的官方数据集结果完全一致。这种效率提升,已经达到了“原来做不到,现在能做到”的程度。
Claude Code:搭配国产模型的使用方案
Claude Code运行在终端中,本身不附带模型。你可以接入Claude自家的模型,也可以通过cc-switch连接到国产模型上。我目前使用的组合是Claude Code搭配GLM 5.1或小米MiMo V2.5 Pro。使用国内模型的好处是不必折腾网络环境,而且这两个模型的编程能力都非常出色:GLM 5.1可以连续工作数小时不间断,MiMo V2.5 Pro在社区中口碑爆棚。坦率地说,我自己还在摸索最佳搭配,但目前的组合用下来确实很顺手。
豆包:桌面端功能让人离不开
豆包桌面端有一个功能:划词后会自动出现翻译和解释选项。同时,通过“Alt+空格”快捷键可以快速唤出豆包。这个功能一旦用习惯了,就真的离不开了。此外,豆包移动端的智能体也很有趣味,可以配合音视频功能进行复试模拟。
用AI做自我分析
大语言模型非常擅长文本总结。我做过一个实验:把我近几年写的笔记和日记输入给AI,让它基于这些内容分析我是一个什么样的人、有什么行为模式,并给出后续建议。结果令人惊艳——AI能够从大量文本中提炼出行为模式、心理特征和变化趋势。它给出的分析报告中,有些洞察甚至比我自己思考得还要深刻。如果你也有长期记录的习惯,强烈建议尝试这个玩法。你会发现,AI看待你的方式,可能和你自己看待自己的方式完全不同。
中美AI发展对比

仔细审视上表,可以发现一个有趣的变化趋势:2024年,国产模型与GPT的差距在于“能不能用”的问题;2025年,这一差距缩小为“好不好用”的问题;到了2026年,已经变成了“哪个更划算”的问题。差距正在以超过许多人预期的速度缩小。
结语:两年后我们毕业时……
看着AI变得越来越好用,难免会产生一些焦虑。但实际上,使用AI这件事本身会越来越简单,简单到几乎不需要专门学习。比这更重要的能力是:你知道要用AI去做什么。
工具从来不是壁垒,想法才是。AI可以帮助你写代码、做PPT、分析数据、复现论文,但它无法替你判断“这件事值不值得做”。
因此,与其焦虑AI是否会取代你,不如想清楚一个问题:你有什么事情,是值得让AI帮你做的? 或者说,有什么事情是我能做到而AI比较难做到的?
想清楚这个问题,你就不会被时代抛下。
夜雨聆风