
通义听悟是阿里云推出的 AI 音视频处理工具,能够实现语音转文字、智能总结、多语言翻译、发言人区分等功能,广泛适用于会议纪要整理、网课笔记提取、访谈记录归档、跨语言沟通等场景,大幅提升工作与学习效率。
本教程将从基础注册到进阶用法,全面讲解通义听悟的使用方法,覆盖网页端、手机端全平台操作。
一、前期准备:注册与登录
通义听悟支持网页端、手机 App、微信小程序三端数据同步,所有操作共用同一阿里系账号,首次使用需完成基础注册与授权。
1. 账号注册与登录
网页端入口
打开浏览器,访问通义听悟官方网站:https://tingwu.aliyun.com/
点击右上角「登录 / 注册」,支持以下 3 种登录方式:
手机号注册登录:输入手机号,完成短信验证即可注册
阿里系账号快捷登录:支付宝、淘宝账号扫码一键登录
企业账号登录:支持钉钉企业账号授权登录
手机端入口
在手机应用商店搜索「通义听悟」,下载并安装官方 App
打开 App 后,使用与网页端相同的账号登录即可同步数据
也可直接在微信 / 钉钉搜索「通义听悟」小程序,无需下载即可快速使用
2. 初始设置与免费额度
首次登录后,系统自动为新用户开通90 天免费试用期,每日可享 48 小时实时记录额度,无需手动激活
必须完成实名认证,才能解锁全部转写功能与数据安全保障
可通过绑定阿里云盘、学生认证等方式获取额外免费转写时长:
绑定阿里云盘:自动获赠 50 小时转写时长,还可直接调用云盘内文件无需重复上传
学生认证:使用.edu 邮箱完成高校认证,可领取 500 小时转写时长 + 200G 存储空间
二、网页端核心功能使用
网页端功能最完整,适合电脑前的深度处理与批量操作,是大多数用户的首选。
1. 实时语音记录(边听边转)
适用于正在进行的会议、线下课程、访谈等场景,支持实时转写、标记重点,无需事后整理。
操作步骤:
登录官网首页,点击中央的「开启实时记录」按钮
选择转写语言:支持中文、英文、日文、韩文等 30 余种语言,也可选择「中英自由说」适配中英混说场景
授权浏览器访问麦克风权限,确认后点击红色圆形录音按钮,即可开始录制
录制过程中,你可以:
随时点击「暂停」暂停录制,结束后点击「完成」结束记录
对关键内容点击「标记重点」「标记问题」「标记待办」,所有标记会自动保留在对应文本位置,方便后续回顾
一键开启「实时翻译」,实现中英等多语言互译,适配跨国会议场景
录制结束后,系统会自动完成智能分析,生成结构化的转写结果
实时记录的操作界面如下,你可以直观看到各个功能按钮的位置:

2. 已有音视频文件转写
针对已经录制好的录音、课程视频、会议录屏等文件,支持批量离线转写,速度快、精度高。
操作步骤:
在官网首页点击「上传音视频」按钮
选择文件来源:
本地文件:选择电脑上的音视频文件,支持拖拽上传
阿里云盘文件:绑定阿里云盘后,可直接选择云盘内的文件,无需下载重复上传
选择文件后,可按需勾选以下选项:
「区分发言人」:如果文件内有 2 人及以上发言,系统会自动通过声纹识别区分不同发言人,标注为「发言人 1」「发言人 2」,也可后续手动修改姓名
「开启翻译」:同步对转写内容进行翻译,适配外语视频 / 音频场景
点击「开始转写」,系统会自动处理,处理速度约为 1 分钟处理 40 分钟左右的音视频,进度条可实时查看
转写完成后,结果会自动保存到「我的记录」中,可随时查看
上传音视频的操作界面如下,你可以选择文件来源并设置转写选项:

支持的文件格式与限制:
类型 | 支持格式 | 单个文件限制 | 批量上传限制 |
音频 | MP3、WAV、M4A、FLAC、WMA、AAC 等 | 最大 500MB | 单次最多 50 个文件 |
视频 | MP4、WMV、MOV、MKV、AVI、FLV 等 | 最大 6GB | 单次最多 50 个文件 |
3. 转写结果的编辑与智能分析
转写完成后,通义听悟会自动对内容进行结构化解析,提供多种 AI 辅助功能,帮你快速提取核心信息。

核心智能功能:
全文概要:AI 自动提炼 300 字以内的核心结论,10 秒了解整个内容的重点
章节速览:系统按语义自动切分内容段落,为每个章节生成标题,比如「产品需求讨论」「上线排期确认」,点击章节可直接跳转到对应位置
发言总结:按不同发言人分别整理其观点、承诺事项、疑问,方便快速了解每个人的发言重点
PPT / 白板提取:如果是课程 / 会议视频,系统会自动提取视频内的 PPT 截图、白板内容,生成图文笔记,无需手动截图
与内容对话(小悟问答):这是通义听悟的核心进阶功能,你可以直接向 AI 提问,比如:
「这个会议的待办事项有哪些?分别是谁负责?」
「第三章实验的关键步骤是什么?」
「帮我整理一下这个访谈里用户的核心痛点」 AI 会基于整个音视频的内容给出答案,还会附带对应的时间戳,可直接跳转到视频对应位置
AI 改写:一键将口语化的转写稿转化为书面语,自动去除语气词、重复内容,让文本更精炼,适合整理正式报告
手动标记与筛选:你可以在文本中选中任意内容,标记为重点、问题、待办,所有标记可在右侧面板集中筛选查看,也可批量摘录重点内容
4. 导出与分享
整理完成后,你可以将结果导出为通用格式,或者分享给协作伙伴。
导出操作:
在记录详情页,点击右上角的「导出」按钮
选择需要导出的内容:可单独选择全文摘要、章节速览、发言总结,或者完整的转写原文
选择导出格式,支持 5 种常用格式:
Word(.docx):适合后续编辑归档
PDF:适合正式存档与打印
Markdown(.md):适合导入笔记软件
SRT 字幕:适合给视频添加字幕
TXT 纯文本:适合轻量存储
点击「下载」,文件会自动保存到你的电脑
分享操作:
点击右上角的「分享」按钮
生成加密访问链接,可设置访问权限:
公开链接:任何人都可查看
指定人:仅你授权的账号可查看
密码保护:设置访问密码,保障内容安全
复制链接后,可发送到微信、钉钉、邮件等任意渠道,接收方无需登录通义听悟,即可在线查看完整的转写、摘要、标记内容
三、手机端使用指南
手机端适合随时随地的快速记录,比如临时会议、外出访谈等场景,操作更轻便。
1. 实时录音转写
打开通义听悟 App,点击首页中间的圆形录音按钮
授权麦克风权限后,即可开始录音,系统会实时将语音转写为文字
录音过程中同样可以标记重点、暂停录制
结束后点击完成,系统自动生成智能总结,所有数据会同步到云端,网页端可查看
2. 手机文件转写
在 App 首页点击「上传文件」,选择手机里的音视频文件
选择转写选项后,即可提交转写任务,处理完成后会推送通知提醒你
3. 小程序快捷使用
如果不想下载 App,可直接在微信 / 钉钉搜索「通义听悟」小程序,登录后即可使用基础的录音、转写功能,适合临时应急使用。
四、专项场景使用技巧
1. 快速生成会议纪要
会议开始前,打开网页端的「实时记录」,勾选「区分发言人」
会议中随时标记待办事项,结束后系统会自动生成:
全文会议摘要
分发言人的发言总结
自动提取的待办事项与责任人
点击「AI 改写」将口语化内容转为正式书面语,然后导出为 Word 文档,即可直接作为会议纪要分发,全程无需手动打字整理
2. 网课 / 课程笔记整理
将课程视频上传到通义听悟,提交转写
转写完成后,使用「小悟问答」快速提取知识点,比如问「这节课的重点考点是什么?」
系统会自动提取视频内的 PPT 截图,生成图文笔记,期末复习可直接使用
如果是外语课程,可开启翻译功能,生成双语字幕,方便学习
3. 访谈 / 调研记录整理
上传访谈录音,勾选「区分发言人」,系统自动区分采访者与受访者
转写完成后,使用 AI 改写将口语内容整理为正式的访谈稿
用小悟问答提取用户的核心观点、痛点,快速完成调研分析
五、进阶隐藏技巧
跨记录批量分析:2025 年新版本支持同时分析上百条记录,比如你可以问「Q3 所有会议里,各部门的降本措施有哪些?」,系统会自动汇总所有会议的内容生成对比表格
浏览器插件:安装通义听悟浏览器插件后,可直接对网页上的视频、播客一键转写,比如看 YouTube、B 站视频时,直接生成字幕与总结
阿里云盘联动:绑定阿里云盘后,钉钉、腾讯会议的录屏会自动同步到云盘,你可以直接在听悟里一键转写,无需下载
思维导图自动生成:长内容转写完成后,系统可自动生成五级结构的思维导图,帮你梳理内容逻辑
六、常见问题
转写结果不准确怎么办?
确保音视频的音质清晰,避免嘈杂环境
可以手动修改转写错误的内容,修改后系统会学习你的调整,后续识别更准确
额度不够用怎么办?
每日登录可领取免费时长,绑定阿里云盘、学生认证可领取大量免费额度
也可按需购买付费套餐,价格约为 1-2 元 / 小时
离线可以使用吗?
离线状态下仅支持基础的录音转写,AI 总结、问答、思维导图等功能需要联网使用
长文件可以处理吗?
支持最长 6 小时的单个音视频文件处理,完全满足长会议、长网课的需求
夜雨聆风