乐于分享
好东西不私藏

AI学习营打卡DAY14

AI学习营打卡DAY14

AI学习营打卡DAY14

今天是我们学习营的demo day,我这并没有分享我的demo,主要是分享了我的心路历程。
在课程初期,我们跟着老师直播课学习,再通过自己实操消除了很多认知模糊,了解很多地基概念。
最初,我基于群里姐妹的反馈想做一套面向大众的“AI 启蒙课”。
当时我觉得这既能帮到人,也一定很赚钱。但后来用户调研时一位朋友点醒了我:大众市场的付费意愿是分散的,赚钱很慢且不多,但是去服务那些“没有时间学习、只要落地省钱”的老板来钱更多。
我觉的非常有道理,所以就基于朋友的需求定了一个研发“AI 自动化视频剪辑”的目标。
研发初期非常痛苦,从 0 到 1 的路很长,需要不停地与 AI 对话、反复调试。
幸运的是,我在 GitHub 上发现了一个火爆的项目:Video-use。虽然它原有的逻辑不完全适配我的场景,但我意识到:在成熟的框架上修改,效率远高于自己重复造轮子。
这里我拆解一下这套爆火的AI自动化剪辑的底层逻辑:
它绕过了高能耗路径,什么意思? 直接让 AI 识别视频内容非常慢且烧 Token。所以它的策略是:先将音频转为带时间戳的文本。我前面自己从0开发也是这个思路
有了文本和时间戳,就可以根据文字快速定位并切割视频片段。
原项目用的 语音转文本工具Scribe 对中文支持一般,且需要买 API。
所以把我把scribe替换成了阿里开源的 FunASR。虽然它有 2G 体积,但它是本地运行的。这意味着客户不需要申请任何 API,下载即用。
这就是我们作为开发者发挥主观能动性的地方——解决最后的“一公里”体验问题。
通过站在前人的肩膀上进行调整,本来我认为半个月才能解决的问题,3天就顺利进行了交付。
最后,我想分享三点感悟:
第一,赚“省钱”的钱更容易: 找到那些需要降本增效的刚需场景,比单纯传播知识更容易赚到钱。
第二,善用现成工具: 尽可能寻找经过验证的项目,在其基础上通过 Agent 进行二次开发。
第三,要意识到对话即开发: 配合 Cursor 等工具,你不再需要再耗时耗精力研究工具如何用,因为cursor会用。
举个例子:
你现在只需要对 AI 说:“我有个 Skill 压缩包,帮我安装到项目中。” AI 就会自动帮你完成解压、配置和调试。
在这个时代,清晰的业务逻辑比代码细节更重要。希望我的这段心路历程能给大家带来启发。

名称已清空
微信扫一扫赞赏作者

喜欢作者其它金额
作品
暂无作品
喜欢作者
其它金额
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
上海,26分钟前,