我最近注意到 LibTV,不是因为它又多了一个 AI 视频网页工具。类似工具已经很多,真正让我停下来看的,是它在官网之外,单独放出了 CLI、Skill、OpenAPI、Access Key 这一整套 Agent 接入口。
这件事释放出的信号比较明确:AI 视频工具正在从“人打开网页点按钮”,慢慢走向“Agent 调度创作流程”。以前做视频,是人坐在网页前,一步步选模型、传素材、写提示词、等结果、再改;现在开始出现另一种形态:你把任务交给 Agent,Agent 理解需求,调用视频工具,查询进度,再把生成结果拿回来。
LibTV 值得写,重点就在这里。

LibTV 是什么?
先说清楚,LibTV 不是一个凭空冒出来的小工具。它来自 LiblibAI,也就是哩布哩布 AI 体系。LibTV 官网的标题写得很直接:LibTV,专业视频创作工具。
从官网展示来看,它更像是一个面向视频创作者的 AI 视频工作台。页面里有视频作品、画布内容,也有创作流程的展示。如果只看人类用户这一侧,你可以把它理解成一个 AI 视频创作平台:用户在画布里组织素材、生成画面、处理视频内容,再把多个环节拼成一个创作流程。
这和过去那种“输入一句提示词,等它吐一个视频”的工具不太一样。它更强调工作流。也就是说,视频不是一个按钮生成出来的,而是通过素材、画面、镜头、节点、结果这些环节组合出来的,每一步都可能要调整。
这也是为什么我觉得它和 Agent 的结合有想象空间。因为 Agent 最擅长的,不是替你点一次按钮,而是替你跑一段流程。
它先是一个视频画布工具
先别急着谈 Agent。对普通创作者来说,LibTV 首先还是一个人能直接使用的视频创作工具。
你可以把它看成一个视频版的 AI 画布。人类创作者在里面组织创作任务,处理画面和视频结果。相比单次生成,它更适合做连续创作、反复调整、把多个生成步骤串起来。
这类产品的核心价值,不只是“能不能生成视频”,而是创作者能不能看得懂流程、能不能修改过程、能不能把一个视频项目拆成多个可控环节。
AI 视频现在最大的问题,往往不是“完全不能生成”,而是“生成完之后不够可控”。你想要一个稳定角色,它可能变脸;你想要一个连续镜头,它可能跳戏;你想让背景一致,它可能下一秒换了世界观。
所以,一个带画布和流程感的视频工具,解决的不是炫技问题,而是控制问题。人可以在这里看结果、改节点、换素材、重新生成。
但 LibTV 更有意思的地方,是它没有停在人类端。
Agent 端:入口开始留出来了
LibTV CLI 官方页有一句话很关键:
一行指令,让 LibTV 进入你的 Agent 工作流。
这句话基本把方向说透了。它不是只想让人打开网页使用,而是希望进入 Agent 工作流。官方页面还列出了多个支持入口,包括 Kimi Code、Claw、MiniMax Agent、小龙虾、Trae、腾讯云代码助手、通义灵码、文心快码等。

这还不能说明 LibTV 已经稳定覆盖所有 Agent 场景。更稳妥的说法是:LibTV 明确在往 Agent 接入方向推。
从 GitHub 上的 libtv-skills 仓库说明看,它更像是一个面向 AI Agent 的技能包,通过 LibLib.tv OpenAPI 提供 AI 生图、AI 生视频等 AIGC 能力。它能让 Agent 创建会话、发送创作指令、查询进展,并获取最终图片或视频结果。
这就不是简单的网页自动化了。网页自动化是 Agent 模拟人去点按钮,页面变了、按钮位置变了、登录状态掉了,流程就容易断。而 OpenAPI 和 Skill 的接入方式,是让 Agent 直接通过接口和工具通信。
换句话说,LibTV 正在把 AI 视频工具变成 Agent 可以调度的能力。
具体怎么接入?
从 README 提供的信息看,libtv-skills 的接入至少包含几个关键点。
首先,它需要 LIBTV_ACCESS_KEY。也就是说,你不是随便让 Agent 调一下就能用,它需要访问密钥,需要鉴权。README 里还提到 Bearer Token 鉴权。
可选的环境变量包括 OPENAPI_IM_BASE 或 IM_BASE_URL,默认地址是 https://im.liblib.tv。
接口层面,README 里列出的能力包括创建会话、查询会话、切换项目、上传文件等。比如 POST /openapi/session 用于创建会话,GET /openapi/session/:sessionId 用于查询会话,POST /openapi/file/upload 用于上传文件。

这些接口名字很朴素,但它们说明了一件事:Agent 不是在“猜页面怎么操作”,而是在围绕会话和文件,进入一个创作系统。
当然,这里必须加一句边界:公开权限说明还不完整,普通用户是否都能顺利拿到 Access Key、哪些能力开放到什么程度,不能写死。所以我不会说“所有人现在都能立刻用 Agent 自动做视频”。
更准确的判断是:LibTV 已经把 Agent 接入路径摆出来了,但实际可用范围,还要看 Access Key 权限和后续官方说明。

为什么这件事重要?
因为 AI 视频工具过去很长时间都是“人机交互工具”。
你打开网页,输入提示词,上传图片,选比例,点生成,等结果,不满意就再改。这个流程没问题,但它有一个天然限制:人要一直在场。
如果你只是偶尔玩一下,这没什么。但如果你要做内容生产,问题就来了。比如你要批量生成短视频分镜,要做十个版本的封面动效,要给一篇文章配三段视频素材,要反复测试不同提示词组合,手动点网页就会很累。
Agent 介入之后,流程可能变成这样:我给 Agent 一段文章,让它拆出 3 个视频片段;Agent 自动整理每段视频的画面需求;它调用 LibTV 的 Skill 或 OpenAPI 发起创作;生成过程中,它查询进展;拿到结果后,它把视频链接或文件返回给我;我再做最后判断和人工修正。
注意,这不是“Agent 稳定自动成片”。现在说这句话太早了,也不负责任。
但它确实代表了一个方向:视频生成正在从单点工具,变成工作流组件。一个工具只要能被 Agent 调用,它就不再只是网页里的一个按钮,而是自动化流程里的一个节点。
但别把它吹过头
LibTV 现在值得关注,但不能神化。
第一,价格、会员、积分是否完全打通,不能写死。第三方社区里有讨论,但这类信息变化很快,而且需要官方页面佐证。
第二,模型清单不能写死。AI 视频平台的模型接入经常变化,今天能用的能力,明天可能调整。
第三,API 权限不能默认所有人都有。README 明确提到 LIBTV_ACCESS_KEY,这意味着它不是一个完全无门槛的公开调用。
第四,复杂视频仍然需要人工校正。尤其是角色一致性、镜头连续性、字幕、转场、背景稳定性这些问题,不是接了 Agent 就自动消失。
Agent 能做的是调度流程,不是替代审美和判断。它可以帮你跑任务、串步骤、查进度、拿结果,但最后的视频能不能发,还是要人看。
我对 LibTV 的判断
如果你是普通用户,只想试一个 AI 视频工具,LibTV 可以当成一个专业视频创作平台去看。你关注的是画布好不好用,生成结果稳不稳,创作过程能不能控制。
但如果你本来就在玩 Agent、自动化、OpenClaw、工作流,那 LibTV 更值得看的点,是它的接入方式。
CLI、Skill、OpenAPI、Access Key,这些东西放在一起,说明它至少在把入口往 Agent 工作流方向开放。
这可能不是 AI 视频工具的终点,但它是一个值得记录的观察信号:AI 视频工具开始给 Agent 留门了。
以后看 AI 工具,不只看它网页好不好用,还要看它能不能进工作流。能进工作流的工具,才更有机会成为 Agent 时代内容生产链路里的一个节点。
如果你也在研究 AI 视频工作流,可以留言告诉我:你更关心“自动生成视频”,还是“Agent 帮你跑完整创作流程”?
下期我准备继续拆一个更实用的问题:普通人怎么把文章、分镜、图片、视频生成串成一条半自动内容流水线。
想要我整理 LibTV / Agent 视频工作流的提示词模板,也可以在评论区留一句“视频工作流”。
事实来源卡片
libtv-labs/libtv-skills:README 称其为面向 AI Agent 的技能包,通过 LibLib.tv OpenAPI 提供 AI 生图、AI 生视频等 AIGC 能力。libtv-skills README 接口信息:包含 LIBTV_ACCESS_KEY、Bearer Token 鉴权、会话创建、会话查询、切换项目、文件上传等 OpenAPI 信息。
夜雨聆风