一、大语言模型
ChatGPT 搭载 GPT-5 系列,支持文本/图像/语音多模态交互。Claude 以超长上下文和企业级安全著称。Gemini 与 Google 办公套件深度整合。DeepSeek 以开源和极低成本受关注。Qwen 开源生态完善。Grok 整合 X 平台。Meta Llama 4 和 Mistral 也是重要开源力量。
二、AI 图像与视频
Midjourney 艺术性最强。DALL·E 集成于 ChatGPT。Stable Diffusion 开源可本地部署。Adobe Firefly 版权安全。视频方面 Sora 引领文生视频,Runway 提供一站式编辑,可灵 中文场景出色,HeyGen 专注数字人。
三、AI 编程
GitHub Copilot 应用最广。Cursor 支持 AI 多文件重构。Codex CLI 在终端中自主执行任务。Windsurf 强调流式编程。Devin 等可自主完成完整开发。
四、AI 搜索与办公
Perplexity 提供生成式回答加引用溯源。Notion AI 集成写作与知识管理。Gamma 一句话生成演示文稿。Grammarly 优化英文写作。Otter.ai 自动生成会议摘要。
五、AI 音乐与音频
Suno 最受欢迎的 AI 音乐生成。ElevenLabs 语音合成和克隆领先。Udio 高质量音乐编曲。
六、AI Agent 与自动化
AI 从"被动回答"走向"主动执行"。OpenAI Agents SDK 和 MCP 协议是核心基础设施。LangChain 是最流行的 LLM 开发框架。n8n 融合 AI 自动化。Browser Use 让 AI 操控浏览器。
选型速查
普通用户:ChatGPT / Claude / Gemini + Perplexity程序员:Cursor / Copilot + Claude + Codex CLI设计师:Midjourney + Adobe Firefly + Canva AI创作者:ChatGPT + Suno + Runway + Midjourney企业团队:Claude 企业版 + Notion AI + Perplexity Pro学生/研究者:Gemini + Perplexity + ChatGPT
组合使用不同工具,注重提示词质量,关注隐私合规。AI 是强大助手,但人类的判断力和创造力不可替代。
本文撰写于 2026 年 6 月
夜雨聆风