常用AI工具使用技巧指南手册-夜雨聆风

常用AI工具使用技巧指南手册

版本号：大展科技V1.0 | 更新日期：2026年3月 | 适配人群：AI新手→进阶全阶段用户

前言

本手册聚焦当前国内主流可及的AI工具，覆盖文本生成、图像创作、视频制作、数据分析、办公效率全场景，兼顾零基础新手的入门需求与进阶用户的效率提升诉求，所有技巧均经过实操验证，配套可直接复用的模板与案例，帮助用户快速掌握AI工具的核心用法，实现效率翻倍。

手册核心覆盖工具：豆包、Kimi、通义千问、腾讯元宝、DeepSeek、ChatGPT、Gemini、Grok、即梦AI，同时补充主流垂类工具的使用方法。

工具分类与选择：功能分类、主流工具解析、选型决策指南
基础操作指南：各类工具入门步骤、界面功能全解析
高级使用技巧：Prompt优化、效率快捷键、多工具协同工作流
全场景应用案例：职场办公、内容创作、学习教育、短视频创作
常见问题解决方案：高频故障、输出异常、合规安全等问题处理
资源扩展：学习资源、社区平台、工具更新追踪渠道
附录：通用Prompt模板、快捷键汇总、合规避坑指南

第一章工具分类与选择

1.1 工具分类体系

按核心功能与使用场景，将主流AI工具分为5大类，覆盖绝大多数用户需求：

工具分类	核心功能	适用场景	核心代表工具
通用对话与文本生成类	多轮对话、文案创作、逻辑推理、文档解析、多语言支持、代码生成	职场办公、内容创作、学习备考、日常问答	豆包、Kimi、通义千问、腾讯元宝、DeepSeek、ChatGPT、Gemini、Grok
视频生成类	文生视频、图生视频、视频扩写、视频编辑、画面渲染	短视频创作、广告制作、自媒体运营、影视素材生成	即梦AI（字节跳动）、剪映AI、Runway
图像创作类	文生图、图生图、图像修复、高清放大、风格转换、商业设计	海报设计、自媒体配图、插画创作、产品渲染、UI设计	豆包AI绘画、Midjourney、Stable Diffusion、DALL·E 3、通义万相
数据分析与代码开发类	数据清洗、可视化分析、代码生成、调试优化、单元测试、算法开发	开发者、数据分析师、科研人员、编程学习者	DeepSeek-Coder、GitHub Copilot、ChatGPT代码解释器、豆包代码模式
办公效率类	文档处理、表格分析、PPT生成、会议纪要、语音转写、多格式转换	职场办公、会议管理、文档协作、汇报总结	WPS AI、Microsoft 365 Copilot、腾讯文档AI、飞书妙计

1.2 核心工具深度解析

1.2.1 通用对话与文本生成类（全覆盖用户指定工具）

豆包

核心定位：抖音旗下全场景智能助手，新手友好度拉满的全能型AI工具
核心优势：中文语境适配极佳，多模态能力均衡（文生图、文生视频、文档解析、代码生成），免费额度充足，与抖音、剪映深度联动，插件生态完善，支持全端访问（PC官网、APP、小程序）
短板：超百万字超长文本处理能力弱于Kimi
适用人群：全年龄段用户，职场人、学生、内容创作者、零基础新手

Kimi

核心定位：主打长文本处理的深度思考型AI助手
核心优势：百万字级超长上下文无损解析，长文档逻辑推理能力顶尖，免费支持大文件上传，对论文、合同、行业报告等长文本处理适配极佳
短板：短文本创作的灵活性与生活化适配弱于豆包、ChatGPT
适用人群：论文撰写者、法律从业者、长文档处理用户、科研人员

通义千问

核心定位：阿里云推出的企业级超大规模语言模型
核心优势：企业级服务能力强，与阿里云生态深度联动，多语言支持优秀，代码与数据分析能力突出，拥有金融、医疗、工业等行业垂直模型
短板：个人免费版功能限制较多，进阶能力需付费开通
适用人群：企业用户、开发者、跨境办公人群、行业垂直领域从业者

腾讯元宝

核心定位：腾讯推出的免费AI智能助手
核心优势：与微信、QQ、腾讯文档生态深度适配，免费额度高，隐私安全合规性强，多模态能力均衡，微信内可直接调用
短板：插件生态完善度不足，垂直场景能力弱于头部工具
适用人群：微信生态重度用户、职场办公人群、新手用户

DeepSeek（深度求索）

核心定位：幻方量化旗下开源大模型与聊天助手，主打代码与数学推理
核心优势：开源模型生态完善，代码生成与数学推理能力顶尖，长上下文支持优秀，本地部署门槛低，免费版额度充足，推理速度快
短板：中文文案创作的生活化适配弱于国内主流模型
适用人群：开发者、科研人员、数学相关从业者、进阶AI用户

ChatGPT

核心定位：OpenAI推出的全球标杆级AI聊天机器人
核心优势：综合能力全球顶尖，插件生态最完善，第三方工具联动性最强，逻辑推理、创作、代码能力均衡，自定义GPT功能强大
短板：国内访问有门槛，付费版成本高，中文语境适配弱于国内主流模型
适用人群：进阶用户、跨境从业者、专业创作者、开发者

Gemini

核心定位：Google推出的多模态AI对话机器人
核心优势：多模态（图像、视频、音频、文本）处理能力顶尖，与谷歌生态深度联动，科学研究与数学推理能力强，移动端体验优秀
短板：国内访问有门槛，中文语境适配一般，长文本处理能力不足
适用人群：科研人员、多模态创作者、海外用户

Grok

核心定位：马斯克旗下xAI推出的人工智能助手
核心优势：实时联网信息获取能力强，科技圈资讯适配度高，风格幽默犀利，支持长上下文，与X（Twitter）生态联动
短板：国内访问门槛高，中文支持一般，垂直场景能力不足
适用人群：科技圈从业者、海外用户、实时资讯需求人群

1.2.2 视频生成类核心工具

即梦AI

核心定位：字节跳动基于Seedance 2.0模型推出的视频生成AI工具
核心优势：中文Prompt适配极佳，生成视频画面流畅、逻辑连贯，支持文生视频、图生视频、视频扩写/编辑，与剪映、豆包深度联动，免费试用额度充足，对短视频创作者友好
短板：长视频（60秒以上）生成限制较多，复杂多主体情节生成稳定性有待提升
适用人群：短视频创作者、自媒体人、广告从业者、新媒体运营

1.3 工具选择决策指南

1.3.1 新手用户零门槛选型

优先选择豆包、腾讯元宝，无需复杂配置，全端免费访问，中文适配好，功能覆盖绝大多数日常场景，新手可快速上手。

1.3.2 按核心需求精准选型

核心需求	首选工具	次选工具
长文档/论文/合同/财报解析	Kimi	DeepSeek
自媒体文案/短视频脚本创作	豆包	通义千问
代码开发/算法编写/数学推理	DeepSeek	ChatGPT
企业级部署/阿里云生态联动	通义千问	腾讯元宝
微信生态办公/文档协作	腾讯元宝	豆包
短视频生成/自媒体视频制作	即梦AI	剪映AI
跨境办公/海外实时资讯获取	Grok	ChatGPT、Gemini
科研文献分析/多模态学术研究	Gemini	Kimi

1.3.3 进阶用户选型建议

个人进阶使用：搭建「豆包（日常全场景）+ Kimi（长文档）+ DeepSeek（代码）+ 即梦AI（视频）」的核心工具组合，覆盖全场景需求
企业级使用：优先选择「通义千问企业版、腾讯元宝企业版」，支持私有化部署，数据安全合规性更强，可对接企业内部系统
海外业务使用：优先选择「ChatGPT、Gemini、Grok」，适配海外语境与生态，跨境业务处理能力更强

第二章基础操作指南

2.1 通用文本生成类工具基础操作

以新手友好度最高的豆包为例，操作逻辑适配所有同类工具，同时标注差异化功能。

2.1.1 通用入门操作步骤

获取访问渠道：PC端打开豆包官网，或在手机应用商店下载豆包APP，微信/抖音搜索豆包小程序，全端数据互通
账号登录：国内工具均支持手机号一键登录，无需复杂注册；海外工具需对应账号与合规访问环境
新建对话：点击页面醒目的「新建对话」按钮，可自定义对话名称，按需选择模型版本（通用模型、长文本模型、代码模型、短视频模型等）
输入指令并发送：在底部输入框中填写你的需求，可点击左侧附件按钮上传文档、图片、音频、视频，按Shift+Enter换行不发送，编辑完成后点击「发送」
对话交互优化：针对AI回复，可使用「复制、重新生成、点赞/点踩、分享、编辑追问」功能，对不满意的内容可直接提出修改意见，进行多轮优化
进阶功能拓展：点击输入框右侧「插件」按钮，或右侧功能库，可唤起文档问答、代码解释器、PPT生成、AI绘画、AI视频等进阶功能

2.1.2 界面功能解析（文字描述截图）

【截图说明：豆包PC端主界面全景截图，整体分为三大核心区域】

左侧导航区：顶部为「新建对话」醒目标题按钮，下方为历史对话列表，支持搜索、重命名、删除、归档对话；底部为模型切换入口、设置按钮、个人中心，可自定义回复偏好、快捷键等
中间核心对话区：顶部显示当前对话的模型名称，主体为气泡式对话展示区，用户提问居右，AI回复居左；每条回复下方配有复制、重新生成、点赞、点踩、分享功能按钮，代码块支持一键复制；底部为Prompt输入框，左侧为附件上传、语音输入按钮，右侧为插件入口、发送按钮
右侧拓展功能区：顶部为「功能库」入口，下方分类展示文档问答、AI绘画、AI视频、代码解释器、PPT生成、翻译、思维导图等快捷功能，点击即可一键唤起，无需切换页面，大幅提升操作效率

2.1.3 核心工具差异化界面功能

Kimi：界面极简，顶部为醒目的「上传文件」按钮，支持最大200M文件、百万字文档解析，无额外拓展功能栏，专注长文本处理，对话区左侧为历史对话，底部为输入框，操作逻辑极简
通义千问：界面核心为阿里云生态入口，右侧集成云产品联动、企业级服务、行业模型专区，左侧为对话列表与行业解决方案入口，适配企业用户需求
ChatGPT：左侧为对话列表，中间为对话区，顶部为GPT-4o、GPT-3.5模型切换入口，左侧底部为插件商店、自定义GPT入口，生态完善度最高

2.2 视频生成类工具（即梦AI）基础操作

2.2.1 入门操作步骤

访问渠道：打开即梦AI官网，或通过豆包「AI视频」入口、剪映「即梦AI」插件一键访问，支持抖音/手机号一键登录
选择生成模式：按需选择「文生视频、图生视频、视频扩写、视频编辑」四大核心模式，新手优先选择文生视频/图生视频
填写Prompt与参数设置：在输入框中填写视频描述，新手可使用官方拆分的「主体描述、画面风格、镜头语言」模块填写，下方设置视频时长（1-10秒）、分辨率、帧率、画面比例（9:16竖屏适配抖音/小红书，16:9横屏适配视频号）
生成与预览：点击「生成」按钮，等待10-30秒渲染完成，生成后可在预览窗口播放、暂停、全屏查看，支持调整参数重新生成
导出与二次编辑：满意后点击「下载」按钮导出原视频，或点击「剪映编辑」一键跳转剪映，进行配音、字幕、转场等二次优化

2.2.2 界面功能解析（文字描述截图）

【截图说明：即梦AI官网文生视频操作界面截图】

顶部导航栏：首页、模型介绍、案例广场、API文档、个人中心，新手可直接进入案例广场，复用官方优质模板
左侧操作区：核心为Prompt输入框，分为「主体描述、画面风格、镜头语言」三个新手友好型输入模块，下方为参数设置栏，可调整时长、分辨率、画面比例、种子数，支持开启高清模式
中间预览区：顶部为生成历史记录，下方为实时预览窗口，生成完成后可播放、暂停、全屏预览，底部配有重新生成、下载、剪映编辑按钮
右侧案例与模板区：展示官方优质爆款案例，按美食、风景、人物、产品等分类，点击案例即可一键复用Prompt与参数，新手可直接修改套用，快速出片

2.3 其他类别工具基础操作逻辑

图像创作类：与视频生成类操作逻辑一致，核心为「选择模式→填写Prompt→设置参数→生成预览→导出优化」，新手优先使用豆包AI绘画，中文适配好，免费额度充足
办公效率类：均集成在对应办公软件内，如WPS AI、腾讯文档AI，打开文档/表格/PPT后，点击侧边栏AI按钮，即可唤起功能，支持内容生成、优化、格式调整、数据分析等操作
代码开发类：核心为「明确开发需求→填写代码Prompt→生成代码→调试优化→测试运行」，新手优先使用豆包代码模式、DeepSeek，支持代码逐行解释、错误调试、单元测试生成

第三章高级使用技巧

3.1 提示词（Prompt）优化策略与实例

3.1.1 通用万能Prompt公式

万能公式 = 角色定位 + 核心任务 + 输入信息 + 输出要求 + 约束条件 + 示例参考

角色定位：给AI明确的身份，让其适配对应领域的专业能力与表达风格
核心任务：清晰说明需要AI完成的具体事情，避免模糊表述
输入信息：提供完成任务所需的背景、素材、参考资料等核心信息
输出要求：明确输出的格式、结构、字数、语气、受众等
约束条件：明确禁止的内容、必须规避的问题、合规要求等
示例参考：提供风格/格式/结构的参考案例，大幅降低AI理解偏差

3.1.2 分场景Prompt优化技巧与实例

1. 文本生成类Prompt优化（适配豆包、Kimi、ChatGPT等）

核心优化策略：精准角色定位、明确量化输出要求、补充约束条件、提供参考示例
正反案例对比：

❌ 反面Prompt：“写一篇工作总结”

✅ 正面Prompt：“你是互联网公司运营部的资深主管，我需要你帮我撰写一份2024年度个人工作总结，核心信息如下：1. 岗位：新媒体运营；2. 核心业绩：全年账号涨粉20万，短视频播放量破5000万，转化GMV800万；3. 核心工作：内容策划、直播运营、达人合作；4. 不足：私域运营能力待提升。输出要求：1. 结构分为年度业绩回顾、核心工作成果、不足与改进计划、2025年工作规划4个部分；2. 语气正式专业，符合职场汇报场景；3. 字数控制在1500字左右；4. 用数据量化成果，避免空话。”

工具专属适配技巧：

Kimi长文档Prompt：“你是专业的学术论文研究员，我将上传一篇10万字的行业研究报告，请你完成以下任务：1. 提取核心论点与数据结论；2. 梳理报告的逻辑框架；3. 总结3个核心行业趋势。要求输出结构化思维导图格式，分点清晰，保留核心数据，严格基于上传的文档内容输出，禁止编造信息。”
DeepSeek代码Prompt：“你是资深Python后端开发工程师，精通Django框架，我需要你实现一个用户登录接口，要求：1. 支持手机号+验证码登录；2. 加入防刷限流机制；3. 附带完整的单元测试代码；4. 每一行代码添加注释。输出格式为：代码块+实现思路+注意事项。”

2. 视频生成类Prompt优化（适配即梦AI）

万能公式：核心主体 + 动作情节 + 场景氛围 + 镜头运镜 + 画面风格 + 画质参数
优质实例：“一只橘色的狸花猫在春日的樱花树下奔跑，花瓣随风飘落，猫咪的毛发蓬松柔软，眼神灵动，全程慢镜头跟拍，画面温暖治愈，日系清新风格，4K超清分辨率，60帧每秒，运镜流畅，无画面抖动，暖色调，自然光”
优化技巧：即梦AI对中文动作描述、镜头语言适配极佳，避免过于复杂的多主体情节，重点突出1个核心主体与核心动作，搭配参考图可大幅提升画面一致性，竖屏视频优先设置9:16比例，适配短视频平台。

3. 图像生成类Prompt优化

万能公式：主体描述 + 场景环境 + 画面风格 + 技术参数 + 镜头语言
优质实例：“一杯冒着热气的拿铁咖啡，放在木质桌面上，旁边有一本翻开的书和一束白色洋甘菊，窗边的自然光洒下来，画面温馨治愈，ins风简约摄影，8K超清，微距镜头，浅景深，高细节，无噪点”

3.1.3 进阶Prompt优化技巧

思维链（CoT）技巧：针对复杂逻辑问题，在Prompt中加入“请一步步思考，先梳理逻辑框架，再逐步输出详细内容”，大幅提升输出内容的逻辑严谨性，降低幻觉
少样本学习技巧：给AI提供2-3个优质示例，让AI学习示例的风格、结构、逻辑，再进行生成，大幅降低理解偏差，提升内容匹配度
反向约束技巧：在Prompt中明确禁止的内容，比如“禁止使用网络热词、禁止空话套话、禁止编造数据、禁止出现血腥暴力画面”，规避不符合需求的内容
迭代优化技巧：不要一次性提出所有需求，先让AI生成大纲/框架，确认无误后再生成详细内容，逐步迭代优化，避免一次性生成后大幅修改，提升效率

3.2 效率提升快捷键与批量操作方法

3.2.1 主流工具通用快捷键大全

操作功能	通用快捷键	适配工具
新建对话	Ctrl+N / Cmd+N	豆包、Kimi、通义千问、ChatGPT
换行不发送	Shift+Enter	几乎所有AI工具输入框
快速聚焦输入框	Ctrl+/ / Cmd+/	豆包、ChatGPT、Kimi
复制AI回复内容	Ctrl+C / Cmd+C（选中后）	全工具适配
代码块一键复制	点击代码块右上角「复制」按钮，快捷键Ctrl+Shift+C	全工具代码模式
重新生成回复	Ctrl+R / Cmd+R	豆包、ChatGPT
清空当前对话	Ctrl+L / Cmd+L	豆包、Kimi
保存/导出对话	Ctrl+S / Cmd+S	大部分工具支持
撤回上一条提问	Ctrl+Z / Cmd+Z	豆包、ChatGPT

3.2.2 高频批量操作实用方法

批量文档处理

适用场景：批量合同解析、批量文献整理、批量报表汇总
操作方法：打开Kimi/豆包，一次性上传所有需要处理的文档，输入Prompt“请批量解析以上所有文档，提取每份文档的【核心信息字段】，输出为Excel格式的表格，每一行对应一份文档，禁止遗漏核心信息”
实例：批量上传10份劳动合同，提取甲方乙方、合同期限、薪资标准、违约责任，一键生成汇总表格

批量文本生成

适用场景：批量产品文案、批量短视频脚本、批量标题生成
操作方法：在豆包中输入Prompt“请基于以下核心信息，批量生成10条【产品标题/短视频脚本/种草文案】，要求每条风格不同，适配不同平台，每条字数控制在XX字，输出为编号列表，每条单独成行”
进阶方法：进阶用户可通过Python代码，批量调用豆包/DeepSeek/通义千问的API，一次性处理上千条数据，比如批量给1000条客户评论做情感分析

批量视觉内容生成

适用场景：批量产品海报、批量短视频素材、批量配图生成
操作方法：在即梦AI/豆包AI绘画中，设置好基础Prompt与统一参数，用分号/逗号分隔不同的场景/主体关键词，设置批量生成数量，一键渲染生成多个素材；也可通过Excel批量整理Prompt，导入工具批量生成

3.3 多工具协同工作流设计

针对高频场景，设计可直接复用的全流程协同工作流，整合各工具的核心优势，实现效率最大化。

3.3.1 自媒体内容全流程协同工作流（图文+短视频）

【适用场景】小红书、抖音等自媒体账号内容创作，从选题到成品全流程

【工具组合】Kimi + 豆包 + DeepSeek + 即梦AI

【完整工作流步骤】

选题与爆款逻辑分析：用Kimi上传10篇同赛道爆款笔记/视频脚本，输入Prompt“请分析以上爆款内容的选题逻辑、核心痛点、流量密码，总结出10个可复用的高流量选题方向，每个选题附带3个切入角度”，完成选题策划
内容初稿生成：用豆包，基于选定的选题，输入优化后的Prompt，生成图文笔记初稿/短视频脚本，完成核心内容创作
内容优化润色：用DeepSeek，上传初稿，输入Prompt“你是资深内容编辑，擅长优化自媒体内容的流量转化能力，请对以上脚本/笔记进行优化，提升开头钩子的吸引力，优化内容节奏，强化结尾的互动引导，修正逻辑漏洞，保持原有风格不变”
配套视觉内容生成：用即梦AI，基于脚本内容，生成对应的短视频画面；用豆包AI绘画，生成图文笔记配图
合规审核与发布准备：用腾讯元宝，对成品内容进行合规审核，检查敏感词与违规内容，同时生成平台适配的标题、话题标签、文案描述，完成最终发布准备

3.3.2 职场办公高效汇报工作流

【适用场景】职场汇报、调研报告、数据分析、PPT制作全流程

【工具组合】WPS AI + 通义千问 + 豆包 + 腾讯元宝

【完整工作流步骤】

数据提取与整理：用WPS AI打开业务数据表格，输入Prompt“请提取这份表格中的核心业务数据，按季度、产品线分类，总结出业绩增长趋势、核心增长点、异常数据，输出为结构化的数据分析报告框架”
行业洞察与深度分析：用通义千问，上传数据框架，输入Prompt“你是资深行业分析师，基于以上业务数据，结合当前行业发展趋势，分析业绩增长的核心原因，找出业务存在的3个核心问题，给出对应的可落地的改进建议”
完整报告撰写：用豆包，基于分析结果，生成完整的年度/季度工作报告，优化语言逻辑，适配职场汇报场景
汇报PPT制作：用腾讯元宝，上传报告内容，输入Prompt“请基于以上工作报告，生成一份完整的汇报PPT大纲，明确每页PPT的核心内容、配图建议、排版逻辑，输出为Markdown格式，可直接导入PPT工具生成”
汇报预案准备：用豆包，生成对应的汇报话术、答辩预案，预判领导可能提出的问题，准备好对应的回答

3.3.3 科研/学习备考全流程工作流

【适用场景】论文撰写、考研备考、知识点学习、文献综述

【工具组合】Kimi + Gemini + DeepSeek + 豆包

【完整工作流步骤】

文献解析与整理：用Kimi批量上传20篇核心参考文献，输入Prompt“请批量解析以上文献，提取每篇文献的核心论点、研究方法、实验数据、研究结论、创新点与不足，输出为结构化的文献综述表格，按研究方向分类”
知识体系搭建：用Gemini，基于教材和文献，梳理核心知识点，搭建完整的知识体系框架，生成思维导图
内容撰写与逻辑优化：用DeepSeek，基于框架，生成论文初稿/学习笔记，强化逻辑推理，保证学术严谨性
刷题与错题巩固：用豆包，基于高频考点，生成对应章节的题库，附带完整答案解析；上传错题，生成知识点解析与同类题拓展，强化薄弱点
格式优化与降重：用Kimi，对论文进行降重优化，调整语句逻辑，保证原创性，同时优化论文格式，符合期刊/学校要求

第四章全场景应用案例

4.1 职场办公场景：竞品分析报告全流程生成

【需求】某快消品牌市场专员，需3天内完成一份10000字的竞品分析报告，包含竞品品牌定位、产品矩阵、价格策略、渠道布局、营销玩法、SWOT分析，最终输出完整报告+汇报PPT

【工具选择】Kimi + 通义千问 + 豆包 + 腾讯元宝

【实操步骤】

竞品资料批量解析：用Kimi上传竞品官网资料、年度财报、近1年营销素材、电商平台产品数据共15份文档（总字数超80万字），Prompt：“请解析以上所有竞品资料，按品牌定位、产品矩阵、价格策略、渠道布局、营销玩法5个维度，提取每个维度的核心信息，保留关键数据，输出结构化信息汇总表，分点清晰，不遗漏核心信息”，10分钟完成人工3天的资料整理工作
行业洞察与竞争分析：用通义千问上传信息汇总表，Prompt：“你是快消行业资深分析师，基于以上竞品信息，结合2024年快消行业发展趋势，完成：1. 每个竞品的核心优势与短板分析；2. 竞品核心竞争壁垒；3. 行业3个核心发展趋势；4. 我方品牌的机会点与风险点”，完成深度洞察
完整报告撰写：用豆包，基于以上内容，输入优化后的Prompt，生成10000字左右的完整竞品分析报告，结构清晰，数据详实，符合职场汇报要求
策略建议与SWOT分析：用DeepSeek，基于报告内容，生成竞品SWOT分析矩阵，以及5条可落地的竞争策略建议
汇报PPT与话术生成：用腾讯元宝上传完整报告，生成20页汇报PPT大纲，每页的核心内容、排版建议、配图方向，同时生成配套汇报话术与答辩预案

【最终成果】1份10000字完整竞品分析报告、1份20页汇报PPT、1套汇报话术与答辩预案，3天工作量压缩至8小时完成，效率提升80%

4.2 短视频创作场景：抖音爆款家常菜短视频全流程生成

【需求】美食赛道抖音博主，需生成一条30秒的番茄炒蛋短视频，完成脚本、分镜、视频画面、配音文案、标题文案全流程

【工具选择】豆包 + 即梦AI

【实操步骤】

爆款脚本与分镜创作：用豆包，Prompt：“你是抖音美食赛道资深编导，擅长30秒爆款家常菜短视频创作，我需要你写一份番茄炒蛋的短视频脚本，要求：1. 开头3秒强钩子，吸引用户停留；2. 步骤清晰，简单易学，适合新手；3. 全程30秒，分6个镜头，每个镜头标注画面内容、时长、配音文案、背景音乐建议；4. 风格接地气，有网感，符合抖音用户喜好”，1分钟生成完整脚本
视频画面批量生成：用即梦AI，基于脚本的每个镜头，输入对应Prompt，生成视频画面。示例镜头Prompt：“特写镜头，热油下锅，金黄的鸡蛋液倒入锅中，瞬间膨胀，滋滋作响，画面明亮有食欲，暖色调，4K超清，60帧，慢镜头，时长5秒”，依次生成所有镜头画面
视频剪辑整合：将生成的视频画面导入剪映，添加AI配音、字幕、背景音乐、转场特效，10分钟完成视频剪辑
标题与流量文案生成：用豆包，生成抖音标题、话题标签、文案描述，优化关键词，提升自然流量
合规审核：用腾讯元宝，检查视频内容与文案，规避违规内容与敏感词，确保符合平台规则

【最终成果】一条30秒的完整爆款短视频，配套标题、文案、话题标签，全流程1小时完成，无需实拍，大幅降低创作成本

4.3 学习教育场景：考研专业课知识点体系搭建

【需求】大三管理学考研学生，需梳理4本专业课教材的知识点体系，生成思维导图、核心考点汇总、背诵笔记、刷题题库

【工具选择】Kimi + Gemini + 豆包

【实操步骤】

教材内容批量解析：用Kimi批量上传4本专业课教材电子版，Prompt：“请解析以上4本管理学考研教材，按教材章节，提取每一章的核心知识点、重点考点、名词解释、简答题考点，输出结构化知识点汇总，按章节分类，不遗漏核心考点”，完成教材核心内容提取
知识体系框架搭建：用Gemini，基于知识点汇总，搭建完整的管理学知识体系思维导图，梳理知识点之间的逻辑关系，区分高频、中频、低频考点
背诵笔记生成：用豆包，基于思维导图，生成精简版背诵笔记，把每个核心考点整理成「考点+核心得分点+记忆口诀」的格式，方便背诵
题库生成与错题解析：用豆包，基于高频考点，生成对应章节的选择题、名词解释、简答题、论述题题库，附带完整答案解析；上传错题，生成对应知识点解析与同类题拓展，强化薄弱点
模拟试卷生成：用Gemini，基于历年考研真题出题规律，生成3套全真模拟试卷，附带评分标准，用于考前模拟

【最终成果】完整的专业课知识体系思维导图、考点背诵手册、章节题库、3套模拟试卷，2周备考工作量压缩至3天完成，大幅提升备考效率

第五章常见问题解决方案

5.1 基础使用类问题

问题1：AI工具响应速度慢、卡顿、长时间无回复

原因分析：网络环境不稳定、Prompt过长、同时访问人数过多、模型负载过高、浏览器缓存过多
解决方案：

检查网络环境，切换稳定的WiFi/移动数据，关闭其他占用带宽的软件
精简Prompt，拆分过长的需求，分多次发送，降低模型处理压力
避开工作日10-12点、14-17点高峰期访问，或切换轻量版模型
清除浏览器缓存，刷新页面，或重启APP，更换Chrome/Edge浏览器
关闭VPN/代理工具，国内工具优先使用国内网络访问

问题2：AI输出内容中途中断、未完成

原因分析：输出内容长度超过模型单次输出上限、网络中断、模型触发安全审核、设置了最大输出长度
解决方案：

最直接方法：输入「请继续上面未完成的内容，保持上下文一致，不要重复已经输出的内容」，让AI继续输出
提前拆分需求，把长内容拆分成多个部分，分多次生成，比如“先写第一部分，完成后我会提示你继续”
在Prompt中明确要求分段落、分批次输出，规避单次输出上限
检查内容是否有违规敏感内容，调整表述，避免触发安全审核

问题3：无法上传文档/图片/视频，或上传失败

原因分析：文件格式不支持、文件大小超过上限、网络不稳定、浏览器权限不足、文件加密/损坏
解决方案：

核对工具支持的文件格式，文档优先使用PDF/Word/TXT，图片优先使用JPG/PNG，转换为支持的格式后重新上传
压缩文件大小，拆分过大的文档，降低图片分辨率，确保在工具的大小限制内
检查网络，更换稳定的网络环境，或切换PC端官网上传（移动端限制更多）
解除文件的密码保护，修复损坏的文件，重新上传
开启浏览器的文件上传权限，关闭广告拦截插件，重新尝试上传

5.2 Prompt与输出内容类问题

问题1：AI输出内容不符合需求、偏离主题、答非所问

原因分析：Prompt表述模糊、缺少核心约束条件、角色定位不清晰、需求过于复杂、模型理解偏差
解决方案：

按照万能Prompt公式重构指令，明确角色定位、核心任务、输出要求、约束条件，避免模糊表述
把复杂需求拆分成多个简单的子需求，分步骤提问，先让AI确认核心需求，再逐步补充要求
提供明确的示例，比如“参考以下示例的格式和风格输出：xxx”，大幅降低模型理解偏差
用精准的量化词汇，比如不要说“写长一点”，要说“字数控制在2000字左右”
针对偏离的内容，直接追问纠正：“你刚才的内容偏离了我的需求，我需要的是xxx，而不是xxx，请重新输出”

问题2：AI输出内容重复、啰嗦、同质化严重

原因分析：Prompt缺少多样性要求、模型陷入循环、需求过于宽泛、模型参数设置不合理
解决方案：

在Prompt中明确要求“内容避免重复，语言简洁精炼，每个段落有明确的核心观点，不要啰嗦赘述”
加入多样性约束，比如“从3个不同的角度分析，每个角度有不同的论点和案例，避免同质化”
调整模型的温度值（Temperature），温度值越高，内容越随机多样，温度值越低，内容越稳定
重新生成，或更换模型版本，避免模型陷入循环
给明确的结构要求，限定每个部分的字数，避免冗余内容

问题3：AI输出内容逻辑混乱、事实错误、编造数据/文献（模型幻觉）

原因分析：模型训练数据截止限制、需求涉及专业领域知识、Prompt缺少严谨性约束、无参考资料的自由生成
解决方案：

在Prompt中明确要求“保证内容的事实准确性，所有数据必须标注来源，禁止编造文献、数据、案例，不确定的内容请标注说明”
针对专业领域内容，上传权威的参考资料，让AI基于参考资料输出，比如“请严格基于我上传的文献内容进行分析，禁止编造文献中没有的信息”
用Kimi等支持长上下文的工具，做检索增强生成（RAG），大幅降低模型幻觉
对输出的内容进行事实核查，尤其是数据、文献、法律法规相关内容，交叉验证权威来源
优先使用专业垂直模型，比如法律领域用幂律法律助手，医疗领域用腾讯觅影，提升内容准确性

5.3 多模态生成类问题

问题1：图像/视频生成内容不符合Prompt要求、主体错乱、画面崩坏

原因分析：Prompt描述模糊、主体过多、参数设置不合理、模型对复杂场景的理解能力有限
解决方案：

按照图像/视频生成的万能Prompt公式重构指令，明确核心主体、动作、场景、风格，避免同时描述多个不相关的元素，优先突出1-2个核心主体
简化Prompt，避免过于复杂的多主体情节，比如不要同时描述“猫、狗、鸟、花、山、海”，聚焦核心内容
搭配参考图，使用图生图模式，大幅提升主体和风格的一致性
优先使用中文适配好的工具，比如即梦AI、豆包AI绘画，避免用海外模型输入复杂的中文Prompt
调整种子数、采样步数等参数，重新生成

问题2：生成的图像/视频画质模糊、有噪点、细节缺失

原因分析：分辨率设置过低、采样步数不足、Prompt缺少画质参数、模型版本过低
解决方案：

在Prompt中加入画质参数，比如“4K超清、8K分辨率、超高细节、锐化、无噪点、高对比度、HDR”
提高分辨率设置，增加采样步数，开启高清模式，提升渲染质量
使用工具自带的高清修复功能，对生成的内容进行二次优化，提升画质
更换更高版本的模型，比如即梦AI Seedance 2.0、Midjourney V6，提升生成质量

5.4 合规与安全类问题

问题1：输出内容触发安全审核、被拦截、无法生成

原因分析：内容包含违规敏感词、涉及违法违规、低俗色情、暴力恐怖、政治敏感、隐私泄露等内容
解决方案：

检查Prompt和生成内容中的敏感词，替换违规表述，调整内容方向
避免生成涉及违法违规、隐私泄露、侵权的内容，严格遵守法律法规和平台规则
针对学术、医疗、法律等专业领域内容，明确要求AI仅提供参考信息，不提供专业诊疗、法律建议等违规内容
更换合规性适配更好的国内工具，比如豆包、腾讯元宝、通义千问，规避海外模型的合规风险

问题2：担心上传的文档/数据/隐私信息泄露

解决方案：

优先选择国内头部大厂的工具，比如字节豆包、阿里云通义千问、腾讯元宝，其隐私合规性更强，有完善的数据安全保障，不会将用户数据用于模型训练
上传文件前，对敏感信息进行脱敏处理，删除个人身份证号、手机号、商业机密、核心数据等敏感内容
仔细阅读工具的隐私政策，确认数据使用规则，选择支持“对话数据不用于训练”的工具
企业用户优先选择私有化部署的模型版本，比如通义千问企业版、DeepSeek开源本地部署，保证数据完全可控

第六章资源扩展

6.1 系统学习资源

官方权威文档（新手优先）

豆包开放平台官方文档：包含Prompt技巧、API开发、插件开发全教程，中文适配好，免费开放
通义千问官方帮助中心：企业级使用教程、模型适配指南、行业解决方案
Kimi官方文档：长文档处理技巧、Prompt优化指南、学术场景使用教程
OpenAI官方文档：ChatGPT进阶使用、插件开发、API调用教程，适合进阶用户

优质书籍与课程

书籍：《Prompt工程指南：从入门到精通》《AI工具实战指南：职场效率提升》《深度学习与大语言模型》
新手课程：B站/抖音秋叶AI办公实战课、李一舟AI课程，零基础可学
进阶课程：极客时间《AI大模型实战课》、阿里云开发者社区通义千问系列课程，适合开发者与企业用户

6.2 优质社区与交流平台

国内社区

豆包社区：官方用户社区，海量优质Prompt模板、使用技巧、案例分享，新手友好
掘金AI专区：开发者社区，大量AI工具开发、Prompt优化、代码实战内容
知乎AI板块：AI工具测评、使用技巧、行业深度分析，避坑指南丰富
机器之心/量子位：AI行业权威资讯平台，最新工具更新、技术进展、行业报告

海外社区

Reddit r/ChatGPT、r/Midjourney：全球最大的AI工具用户社区，海量技巧与案例分享
GitHub：开源AI工具、Prompt模板库、代码项目聚集地，进阶用户必备
Hugging Face：开源大模型、AI工具聚集地，适合开发者与本地部署用户
X（Twitter）：AI领域大佬、官方账号聚集地，第一时间获取最新工具更新动态

6.3 工具更新与资讯追踪渠道

官方渠道：各工具官方公众号（豆包AI、Kimi智能助手、通义千问、腾讯元宝），第一时间推送版本更新、新功能上线；海外工具关注官方X账号
资讯平台：36氪AI板块、虎嗅网、钛媒体、机器之心、量子位，实时更新AI行业最新资讯、工具测评、商业动态
测评渠道：B站/抖音AI测评博主、知乎AI工具测评专栏，实时更新最新工具测评、使用技巧、避坑指南
工具导航网站：AI工具导航、未来工具导航，汇总全球主流AI工具，按功能分类，实时更新最新工具

6.4 实用模板与资源库

Prompt模板库：豆包官方Prompt模板库、GitHub Awesome Prompts、掘金Prompt专区，覆盖全场景可直接复用的Prompt模板
API开发资源：豆包开放平台、阿里云通义千问开放平台、腾讯元宝开放平台，提供API接口、SDK、开发文档，支持二次开发
开源模型资源：Hugging Face、ModelScope（魔搭社区），海量开源大模型，支持本地部署与二次开发

附录

附录1：全场景通用Prompt万能模板

职场工作报告模板、文案创作模板、学术论文模板
代码开发模板、图像生成模板、视频生成模板

（可前往豆包社区获取完整版可直接复制的模板）

附录2：主流工具通用快捷键汇总表

详见本文3.2.1章节，可保存复用。

附录3：AI工具使用合规红线

禁止使用AI工具生成违法违规、低俗色情、暴力恐怖、政治敏感内容
禁止使用AI工具编造虚假信息、谣言、伪造公文证件、虚假证明材料
禁止使用AI工具侵犯他人知识产权、肖像权、隐私权，禁止商用侵权内容
禁止使用AI工具生成诈骗、赌博、传销等违法内容，禁止用于非法牟利
医疗、法律、金融等专业领域，AI生成内容仅可作为参考，不得替代专业机构与人员的服务

前言

目录

第一章 工具分类与选择

1.1 工具分类体系

1.2 核心工具深度解析

1.2.1 通用对话与文本生成类（全覆盖用户指定工具）

1.2.2 视频生成类核心工具

1.3 工具选择决策指南

1.3.1 新手用户零门槛选型

1.3.2 按核心需求精准选型

1.3.3 进阶用户选型建议

第二章 基础操作指南

2.1 通用文本生成类工具基础操作

2.1.1 通用入门操作步骤

2.1.2 界面功能解析（文字描述截图）

2.1.3 核心工具差异化界面功能

2.2 视频生成类工具（即梦AI）基础操作

2.2.1 入门操作步骤

2.2.2 界面功能解析（文字描述截图）

2.3 其他类别工具基础操作逻辑

第三章 高级使用技巧

3.1 提示词（Prompt）优化策略与实例

3.1.1 通用万能Prompt公式

3.1.2 分场景Prompt优化技巧与实例

1. 文本生成类Prompt优化（适配豆包、Kimi、ChatGPT等）

2. 视频生成类Prompt优化（适配即梦AI）

3. 图像生成类Prompt优化

3.1.3 进阶Prompt优化技巧

3.2 效率提升快捷键与批量操作方法

3.2.1 主流工具通用快捷键大全

3.2.2 高频批量操作实用方法

3.3 多工具协同工作流设计

3.3.1 自媒体内容全流程协同工作流（图文+短视频）

3.3.2 职场办公高效汇报工作流

3.3.3 科研/学习备考全流程工作流

第四章 全场景应用案例

4.1 职场办公场景：竞品分析报告全流程生成

4.2 短视频创作场景：抖音爆款家常菜短视频全流程生成

4.3 学习教育场景：考研专业课知识点体系搭建

第五章 常见问题解决方案

5.1 基础使用类问题

问题1：AI工具响应速度慢、卡顿、长时间无回复

问题2：AI输出内容中途中断、未完成

问题3：无法上传文档/图片/视频，或上传失败

5.2 Prompt与输出内容类问题

问题1：AI输出内容不符合需求、偏离主题、答非所问

问题2：AI输出内容重复、啰嗦、同质化严重

问题3：AI输出内容逻辑混乱、事实错误、编造数据/文献（模型幻觉）

5.3 多模态生成类问题

问题1：图像/视频生成内容不符合Prompt要求、主体错乱、画面崩坏

问题2：生成的图像/视频画质模糊、有噪点、细节缺失

5.4 合规与安全类问题

问题1：输出内容触发安全审核、被拦截、无法生成

问题2：担心上传的文档/数据/隐私信息泄露

第六章 资源扩展

6.1 系统学习资源

官方权威文档（新手优先）

优质书籍与课程

6.2 优质社区与交流平台

国内社区

海外社区

6.3 工具更新与资讯追踪渠道

6.4 实用模板与资源库

附录

附录1：全场景通用Prompt万能模板

附录2：主流工具通用快捷键汇总表

附录3：AI工具使用合规红线

第一章工具分类与选择

第二章基础操作指南

第三章高级使用技巧

第四章全场景应用案例

第五章常见问题解决方案

第六章资源扩展