这个AI工作流省了我90%的时间(智能体实践分享)
这是我最近做的第四个Agent,这个节省了我们这项工作90%的时间。今天我要解密一下。
(1)登录官网后台;(2)点击创建文章;(3)去公众号文章页复制标题粘贴过来;(4)然后复制文字和图片内容粘贴过来,尤其公众号的图片有时候有一些外部引用限制,所以需要把图片一张张传上去(5)然后以及公众号的一些模板贴过来样式也是乱的,往往要先做一下格式的清理(6)然后根据内容让AI生成一个焦点图(7)点击上传焦点图(8)然后让ai把文章标题翻译成一个简短的英文,作为官网文章的链接别名(https://www.demand-driven.cn/2024/12/26/embarrassed-artificial-intelligence-ai/)(9)然后点击保存。
至少要这些步骤,搬家一篇文章,手速再快也需要5分钟吧。
作为一家AI公司,这个是忍不了的。所以做了一个小的Agent并且把他集成到飞书里,我现在只需要把公众号的链接发给飞书的机器人,就能自动帮我发布。
而且支持并发,也就是我不用等上一篇发完,直接就再发下一个,然后看下我们自动发送文章的封面风格。
从开始有这个想法,到把这个程序部署到飞书,其实也就花了4个多小时。但几百篇文章,一篇篇搬家,可能要花超过40个小时,而且后续会持续花时间。
我说下设计思路,其实大部分心思是花在设计上,而不是编码上,其实这个智能体里有个几百行自定义的代码,但都是GPT帮我完整的。
1、我希望把文章链接丢给智能体,然后智能体可以把这篇公众号文章的完整内容,包括图片,完全提取出来,而且是不带公众号里乱七八糟的模板格式的。
2、然后,要把文章中的图片,单独上传到官网的后台,获得新的图片地址,然后替换原来公众号文章中相应位置的图片地址,为了避免公众号图片被官网引用后,触发盗链策略,变成白图。
3、然后根据标题、内容,让AI给一段适合这个内容的画面场景描述,要作为生图的提示词。然后让AI做一张焦点图(也就是上面大家看到的这些)。
4、然后把标题,让AI翻译成一段英文,用“-”链接不同单词,例如:embarrassed-artificial-intelligence-ai,主要是为了方便SEO,不然url都是中文编码。
5、然后把带着新的图片地址的图文内容,还有焦点图,调用官网的api发布接口,直接发布出去。
简单来说就是这样,但实现起来其实还是花了些心思,就有了如下的工作流:
1、这里面为什么需要自定义的代码,而不是让模型处理。
要知道大语言模型,是基于概率,预测下一个字要回复什么内容,所以这里面就有不确定性,我想把公众号文章的内容和图片精准提取出来,还要过滤模板,这个事情,用大模型直接来做,即消耗token,又保障不了稳定性,让然更重要的是Coze提供的几个32k的模型,也无法处理超长的内容。
所以就添加了代码组件,通过正则表达式,提取,过滤,然后生成干净的内容。大致是这样,其实我过去在百度还写代码的那会,我是php\js技术栈的,我并不咋写python,所以这些代码,全是GPT-O1或者4o帮我完成的,你可以感受下,中文编程:
看起来挺简单,但过程里还是调试了好一阵子,尤其是一些格式的处理,比如公众号的图片的大小如何在官网也能还原一样的大小,这些都是做了精细化的规则处理。
做它擅长的,比如总结文章内容,给我生成头图的描述,还有就是AI来制作图片。让我比较惊讶的是,Coze目前集成的组件还是挺多的,生图的效果基本还是可用状态。
比如发布官网,我们官网用的是很流行的开源建站工具的搭建的,我在Coze 插件库里搜到了调用这个工具发布接口的插件,但要么是压根就用不了,要么就是支持的参数有限,同时有密码泄露的风险。所以这里也是自己又添加了几个模块来处理接口发布。
最后就是引用这个工作流,我做的就比较简单了,这个内部使用就不开放体验了~
为什么来做这个事情,一方面是我们希望能全方位用AI来改善目前的一些繁琐工作,另外也是在探究AI的能力边界,以及商业落地的形式。所以我也很愿意,第一时间和大家分享。如果你有更好的方式,也请告诉我。
当然这个Agent后面也还有很多优化的地方,包括我们多个网站的灵活选择发布,英文内容自动翻译,以及优化的样式排版等等。
另外,我还写了更多有趣,有用的AI文章,可以从这里看过去: