LibTV 是什么?AI 视频工具开始接入 Agent 了

我最近注意到 LibTV，不是因为它又多了一个 AI 视频网页工具。类似工具已经很多，真正让我停下来看的，是它在官网之外，单独放出了 CLI、Skill、OpenAPI、Access Key 这一整套 Agent 接入口。

这件事释放出的信号比较明确：AI 视频工具正在从“人打开网页点按钮”，慢慢走向“Agent 调度创作流程”。以前做视频，是人坐在网页前，一步步选模型、传素材、写提示词、等结果、再改；现在开始出现另一种形态：你把任务交给 Agent，Agent 理解需求，调用视频工具，查询进度，再把生成结果拿回来。

LibTV 值得写，重点就在这里。

LibTV 是什么？

先说清楚，LibTV 不是一个凭空冒出来的小工具。它来自 LiblibAI，也就是哩布哩布 AI 体系。LibTV 官网的标题写得很直接：LibTV，专业视频创作工具。

从官网展示来看，它更像是一个面向视频创作者的 AI 视频工作台。页面里有视频作品、画布内容，也有创作流程的展示。如果只看人类用户这一侧，你可以把它理解成一个 AI 视频创作平台：用户在画布里组织素材、生成画面、处理视频内容，再把多个环节拼成一个创作流程。

这和过去那种“输入一句提示词，等它吐一个视频”的工具不太一样。它更强调工作流。也就是说，视频不是一个按钮生成出来的，而是通过素材、画面、镜头、节点、结果这些环节组合出来的，每一步都可能要调整。

这也是为什么我觉得它和 Agent 的结合有想象空间。因为 Agent 最擅长的，不是替你点一次按钮，而是替你跑一段流程。

它先是一个视频画布工具

先别急着谈 Agent。对普通创作者来说，LibTV 首先还是一个人能直接使用的视频创作工具。

你可以把它看成一个视频版的 AI 画布。人类创作者在里面组织创作任务，处理画面和视频结果。相比单次生成，它更适合做连续创作、反复调整、把多个生成步骤串起来。

这类产品的核心价值，不只是“能不能生成视频”，而是创作者能不能看得懂流程、能不能修改过程、能不能把一个视频项目拆成多个可控环节。

AI 视频现在最大的问题，往往不是“完全不能生成”，而是“生成完之后不够可控”。你想要一个稳定角色，它可能变脸；你想要一个连续镜头，它可能跳戏；你想让背景一致，它可能下一秒换了世界观。

所以，一个带画布和流程感的视频工具，解决的不是炫技问题，而是控制问题。人可以在这里看结果、改节点、换素材、重新生成。

但 LibTV 更有意思的地方，是它没有停在人类端。

Agent 端：入口开始留出来了

LibTV CLI 官方页有一句话很关键：

一行指令，让 LibTV 进入你的 Agent 工作流。

这句话基本把方向说透了。它不是只想让人打开网页使用，而是希望进入 Agent 工作流。官方页面还列出了多个支持入口，包括 Kimi Code、Claw、MiniMax Agent、小龙虾、Trae、腾讯云代码助手、通义灵码、文心快码等。

这还不能说明 LibTV 已经稳定覆盖所有 Agent 场景。更稳妥的说法是：LibTV 明确在往 Agent 接入方向推。

从 GitHub 上的 libtv-skills 仓库说明看，它更像是一个面向 AI Agent 的技能包，通过 LibLib.tv OpenAPI 提供 AI 生图、AI 生视频等 AIGC 能力。它能让 Agent 创建会话、发送创作指令、查询进展，并获取最终图片或视频结果。

这就不是简单的网页自动化了。网页自动化是 Agent 模拟人去点按钮，页面变了、按钮位置变了、登录状态掉了，流程就容易断。而 OpenAPI 和 Skill 的接入方式，是让 Agent 直接通过接口和工具通信。

换句话说，LibTV 正在把 AI 视频工具变成 Agent 可以调度的能力。

具体怎么接入？

从 README 提供的信息看，libtv-skills 的接入至少包含几个关键点。

首先，它需要 LIBTV_ACCESS_KEY。也就是说，你不是随便让 Agent 调一下就能用，它需要访问密钥，需要鉴权。README 里还提到 Bearer Token 鉴权。

可选的环境变量包括 OPENAPI_IM_BASE 或 IM_BASE_URL，默认地址是 https://im.liblib.tv。

接口层面，README 里列出的能力包括创建会话、查询会话、切换项目、上传文件等。比如 POST /openapi/session 用于创建会话，GET /openapi/session/:sessionId 用于查询会话，POST /openapi/file/upload 用于上传文件。

这些接口名字很朴素，但它们说明了一件事：Agent 不是在“猜页面怎么操作”，而是在围绕会话和文件，进入一个创作系统。

当然，这里必须加一句边界：公开权限说明还不完整，普通用户是否都能顺利拿到 Access Key、哪些能力开放到什么程度，不能写死。所以我不会说“所有人现在都能立刻用 Agent 自动做视频”。

更准确的判断是：LibTV 已经把 Agent 接入路径摆出来了，但实际可用范围，还要看 Access Key 权限和后续官方说明。

为什么这件事重要？

因为 AI 视频工具过去很长时间都是“人机交互工具”。

你打开网页，输入提示词，上传图片，选比例，点生成，等结果，不满意就再改。这个流程没问题，但它有一个天然限制：人要一直在场。

如果你只是偶尔玩一下，这没什么。但如果你要做内容生产，问题就来了。比如你要批量生成短视频分镜，要做十个版本的封面动效，要给一篇文章配三段视频素材，要反复测试不同提示词组合，手动点网页就会很累。

Agent 介入之后，流程可能变成这样：我给 Agent 一段文章，让它拆出 3 个视频片段；Agent 自动整理每段视频的画面需求；它调用 LibTV 的 Skill 或 OpenAPI 发起创作；生成过程中，它查询进展；拿到结果后，它把视频链接或文件返回给我；我再做最后判断和人工修正。

注意，这不是“Agent 稳定自动成片”。现在说这句话太早了，也不负责任。

但它确实代表了一个方向：视频生成正在从单点工具，变成工作流组件。一个工具只要能被 Agent 调用，它就不再只是网页里的一个按钮，而是自动化流程里的一个节点。

但别把它吹过头

LibTV 现在值得关注，但不能神化。

第一，价格、会员、积分是否完全打通，不能写死。第三方社区里有讨论，但这类信息变化很快，而且需要官方页面佐证。

第二，模型清单不能写死。AI 视频平台的模型接入经常变化，今天能用的能力，明天可能调整。

第三，API 权限不能默认所有人都有。README 明确提到 LIBTV_ACCESS_KEY，这意味着它不是一个完全无门槛的公开调用。

第四，复杂视频仍然需要人工校正。尤其是角色一致性、镜头连续性、字幕、转场、背景稳定性这些问题，不是接了 Agent 就自动消失。

Agent 能做的是调度流程，不是替代审美和判断。它可以帮你跑任务、串步骤、查进度、拿结果，但最后的视频能不能发，还是要人看。

我对 LibTV 的判断

如果你是普通用户，只想试一个 AI 视频工具，LibTV 可以当成一个专业视频创作平台去看。你关注的是画布好不好用，生成结果稳不稳，创作过程能不能控制。

但如果你本来就在玩 Agent、自动化、OpenClaw、工作流，那 LibTV 更值得看的点，是它的接入方式。

CLI、Skill、OpenAPI、Access Key，这些东西放在一起，说明它至少在把入口往 Agent 工作流方向开放。

这可能不是 AI 视频工具的终点，但它是一个值得记录的观察信号：AI 视频工具开始给 Agent 留门了。

以后看 AI 工具，不只看它网页好不好用，还要看它能不能进工作流。能进工作流的工具，才更有机会成为 Agent 时代内容生产链路里的一个节点。

如果你也在研究 AI 视频工作流，可以留言告诉我：你更关心“自动生成视频”，还是“Agent 帮你跑完整创作流程”？

下期我准备继续拆一个更实用的问题：普通人怎么把文章、分镜、图片、视频生成串成一条半自动内容流水线。

想要我整理 LibTV / Agent 视频工作流的提示词模板，也可以在评论区留一句“视频工作流”。

事实来源卡片

1.LibTV 官网：页面标题为“LibTV - 专业视频创作工具”，用于确认 LibTV 的产品定位与视频创作平台属性。

2.LibTV CLI 官方页：页面写有“一行指令，让 LibTV 进入你的 Agent 工作流”，并展示多个 Agent / 编程助手接入入口。

3.GitHub 仓库 libtv-labs/libtv-skills：README 称其为面向 AI Agent 的技能包，通过 LibLib.tv OpenAPI 提供 AI 生图、AI 生视频等 AIGC 能力。

4.libtv-skills README 接口信息：包含 LIBTV_ACCESS_KEY、Bearer Token 鉴权、会话创建、会话查询、切换项目、文件上传等 OpenAPI 信息。