乐于分享
好东西不私藏

AI 工具综合应用实践(读书会总结)

AI 工具综合应用实践(读书会总结)

周日,做了一个 AI 工具综合应用实践:把参加的读书会过程记录(语音/照片)下来,总结整理成有趣易懂便于传播和总结的形态。整个操作的过程和思路,简单整理成这篇文章,供大家参考了解,可以结合自己的场景,思考是否能有所帮助。

现场照片

– 最终效果 –

现场素描
内容总结

– 操作方式 –

设备

一个钉钉录音卡片,悄咪咪的把现场的语音记录下来。

贴在iphone 小屏手机后背
记录的文件不是很占空间

AI 转义

通过配套的手机 APP,下载语音并转成文字,根据模板整理成有排版的格式。

可以导出文本

GPT作图

把文字和图片,通过 GPT 进行加工

– 手机 APP 也有此类功能,为什么要用硬件 –

声学链路

录音转写首先是声学问题,其次才是模型问题。专用硬件把麦克风数量、指向/全向方案、拾音距离、码率写得更清楚,意味着你能预判“这台设备在大会议室、教室、采访桌上到底能不能录到”;APP 往往只告诉你“能录”,但不告诉你“录得多干净”。

稳定性

真正拉开差距的是“会不会漏录”。硬件是独立录音系统,手机没电、切到别的 App、来电话,通常不会直接打断机身录制;而 iOS 音频会话和 Android 麦克风前台服务本身就受系统规则约束,所以 APP 方案工程上更容易被中断

实用建议

只有三条:一是长会/外采优先买硬件;二是只做会议纪要且预算低,先用千问,其次豆包;三是若你最怕漏录,而不是最怕多花几百元,硬件通常更值。

– AI录音硬件参考 –

当下市场有不少同类设备,下面是常见的几款,供参考。需要注意的是,一般来说,硬件并不值钱,使用过程中消耗的模型 token 会作为收费项目,比如按月按年收取订阅费之类的模式

DingTalk A1

飞书x安克 录音豆

其他

<扫码加小助手入群,标注:人人智学社>