
这一篇读的是 langflow-ai/langflow。如果只从产品界面看,Langflow 很容易被误读成“React Flow 画布加上一堆 LLM 组件”。源码里更值得抓住的主线,是它怎样把用户画出来的 Flow JSON,变成可以保存、校验、构建、运行,并最终暴露成 API 或 MCP tool 的产品资产。
本文源码基线:本地目录 sources/langflow;分支 main;提交 a0e7fb7c21e2e628fde9566c27df883435606a6a;提交时间 2026-05-29T15:42:04-07:00;提交主题 fix(ci): re-enable migration-pip-venv now that nightly bundles resolve (forward-port #13421) (#13422)。源码侧还确认了根 pyproject.toml 声明 langflow = 1.9.4,src/backend/base/pyproject.toml 声明 langflow-base = 0.9.4,src/lfx/pyproject.toml 声明 lfx = 0.4.4,Python 要求是 >=3.10,<3.15,许可证以仓库根目录 LICENSE 的 MIT 为准。
本文由 AI 辅助整理和改写,可能存在遗漏、理解偏差或版本差异。关键实现请以本文固定的提交、对应源码文件和官方文档为准,自行复核后再用于工程判断。
先看包边界:执行器、平台壳和画布分得很清楚

Langflow 的源码阅读入口,不应该先钻进具体 provider 组件。更有效的顺序,是先看根目录 AGENTS.md 里写明的工作区边界:lfx 是 executor core,langflow-base 是平台层,langflow 是集成发行包,frontend 是 React 19 + TypeScript + Vite 的画布应用。
这个分层很关键。lfx 负责组件基类、graph engine 和内置组件,原则上不应该依赖上层平台;langflow-base 承担 FastAPI routes、auth、persistence、alembic、services、MCP、queue、telemetry;根包 langflow 把这些能力包装成用户能启动的入口;前端只通过 HTTP、WebSocket 或 SSE 和后端交互。

所以 Langflow 的核心不是画布本身。前端画布负责编辑,langflow-base 负责平台生命周期和 API,lfx.Graph 才负责把 Flow JSON 转成可执行图。源码里也承认边界还在收敛,AGENTS.md 提到 lfx 仍有已知边界违规;读代码时要把“目标依赖方向”和“当前每个 import 都完全干净”分开看。
启动链路:先建平台,再让图运行
langflow run 的入口在 src/backend/base/langflow/__main__.py。这里不是简单调用一次 uvicorn.run():它先处理 Typer 命令参数,把 lfx serve、lfx run 挂成子命令;再处理 macOS 下 fork 相关环境变量;非 Windows 场景会创建 LangflowApplication,启动子进程,并轮询 /health 等服务真正就绪。
真正的平台生命周期在 src/backend/base/langflow/main.py。lifespan 里会初始化 settings、telemetry、服务、LLM cache、profile pictures、superuser、bundles,并调用 get_and_cache_all_types_dict() 缓存组件类型。随后还会创建 starter projects、初始化 agentic 变量、启动 MCP Composer、加载 flows、启动 filesystem sync task 和 queue service。
这说明 Langflow 启动的不是一个孤立 API server,而是一个带组件 registry、数据库、MCP 服务、队列、文件同步和前端静态资源的应用平台。理解这点后,再看后面的 build/run,就不会把一次运行误解成“前端发请求,后端同步算完”。
组件 schema:Python class 如何变成前端节点

Langflow 的组件协议主要落在 src/lfx/。Component 基类会把一个 Python 组件转成前端和执行器都能理解的结构:map_inputs() 映射输入字段,map_outputs() 映射输出字段,to_frontend_node() 生成前端 node dict,并把组件源码、参数、输出类型和校验结果放进模板。真正运行时,build_results() 会按 selected outputs 调用对应 output method,产出 results 和 artifacts。
组件发现和缓存由 lfx/interface/components.py 管。它会读取 component index,校验 hash 和版本,动态 import 模块,寻找符合组件继承关系的 class,实例化后生成组件模板;同时维护 all_types_dict、fully_loaded_components、type_to_current_hash 和 all_known_hashes。这些 hash 后面会服务于组件兼容性、outdated 检测和自定义组件升级判断。
对前端来说,组件 schema 通过 /api/v1/all 暴露。浏览器拿到这些 templates 后,才能生成 palette、输入控件、输出 socket 和运行前检查。也就是说,Langflow 的节点不是前端写死的 UI 配置,而是从 Python 组件协议生成出来的跨端 schema。
Flow JSON:真正的产品资产
Flow 的平台属性在 api/v1/flows.py 里很明显。列表、读取、更新、导入都围绕数据库里的 Flow 对象展开,而 Flow 的 data 字段保存了画布和执行所需 JSON。这个字段不是“画布状态备份”,而是后端认可的可迁移资产。
更直接的证据是 simple_run_flow()。它会拿 flow.data.copy(),把请求里的 tweaks 合并进 graph data,然后调用 Graph.from_payload(graph_data, flow_id, user_id, flow_name, context) 反序列化成执行图,生成 run id,选择 outputs,最后进入 run_graph_internal()。保存后的 Flow 能够通过 /run/{flow} 被重新构造成 graph,这就是 Langflow 能把画布发布成 API 的基础。
这里最容易犯的错误,是把 ReactFlow 的 nodes/edges 当成最终边界。前端对象当然重要,但工程上更稳定的边界是后端接受的 flow.data:组件 type 是否存在、code hash 是否过期、tweaks 会改哪些字段、可运行 output 是哪些、这个 Flow 暴露成 API 或 MCP tool 时输入输出 schema 长什么样,都应该围绕它分析。
Build API:一次点击运行,是一串 graph 事件

前端点击运行后,flowStore.ts 会先记录 build 参数、清空 buildInfo、设置 building 状态,再校验 nodes 和 edges。如果用户指定 start/stop node,会先裁剪上下游 subgraph;如果 custom components disabled,又遇到 blocked 或 outdated component,前端会在 build 前阻止继续。
真正发请求的是 buildUtils.ts。它会组装 build URL、start/stop 参数、event delivery、nodes、edges、input value、session 和 client timestamp。事件消费支持 direct streaming,也支持先 POST build 拿 job_id,再 GET events endpoint 读取 NDJSON。前端会处理 vertices_sorted、build_start、end_vertex、message、token、end 等事件,并把 vertex build data 写回 verticesBuild、flowPool 和 buildStatus。
后端的 build 核心在 api/build.py。start_flow_build() 创建 job_id 和 event manager;generate_flow_events() 构建 graph、设置 run id、排序顶点、缓存 graph;_build_vertex() 调 graph.build_vertex(),拿 result、artifacts、valid,再通过 graph.get_next_runnable_vertices() 找下一批可运行顶点;build_vertices() 递归创建下一层任务,并在每个 vertex 结束时发送 end_vertex。
lfx.Graph 是这条链的执行核心。from_payload() 从 Flow JSON 拆出 nodes 和 edges,并做当前设置下的防御性校验;prepare() 初始化、排序并把第一层顶点放入 run queue;build_vertex() 处理 frozen、cache、loop component,再调用 vertex build;get_next_runnable_vertices() 在锁内更新 run manager,寻找后继可运行顶点。
这一套机制解释了 Langflow 的画布反馈为什么能细到每个 vertex。它没有把“运行一个 Flow”包装成单个黑盒请求,而是把 graph build 拆成可排序、可缓存、可流式反馈的事件序列。
Run 和 MCP:Flow 可以离开画布

/run/{flow_id_or_name} 注册在 api/v1/endpoints.py。内部会先检查用户权限,再解析请求体,从 X-LANGFLOW-GLOBAL-VAR-* headers 提取 request-level variables,并合并进 context。stream 模式会创建 token queue 和 event manager,返回 text/event-stream;non-stream 模式会生成 run id,调用 simple_run_flow(),最后记录 telemetry。
执行继续下沉到 processing/process.py 的 run_graph_internal():它设置 input components、session id、outputs 和 stream 参数,再调用 graph.arun()。Graph.arun() 支持多组 inputs,补齐 input components/types,逐组调用内部执行逻辑,最终返回 RunOutputs 列表。
更值得注意的是 MCP。mcp_utils.py 是 global MCP 和 project MCP 的 shared source of truth:它能列 flow 文件和 user files,读取 resource 时做 filename traversal 防御,并按当前用户和 project_id 授权;tool handler 会根据 flow 生成 tool schema,tool call 时仍然调用 simple_run_flow()。mcp_projects.py 又在项目维度过滤 tool 列表,只有启用 MCP 的 flow 才会出现在 project-scoped MCP server。
这条线说明,Langflow 的 Flow 不只是画布里的“可运行项目”。它可以通过三种边界被调用:前端 build/run、HTTP /run API、MCP tool call。真正稳定的资产仍然是同一份 Flow JSON,只是外层入口不同。
实用判断:最值得沉淀的是 Flow Inspector
读完这条主线,我对 Langflow 的判断是:它最有复用价值的不是复制一个节点画布,而是围绕 Flow JSON 和组件 schema 做解释器。
第一优先级是 Flow JSON Inspector:解析 data.nodes、data.edges、viewport 和 templates,告诉用户这个 Flow 有哪些组件、边是否合法、哪些 type 在当前 /all 里找不到、哪些组件 hash 可能过期、tweaks 会影响哪些字段、可运行 output 是什么。第二优先级是 Component Schema Browser:展示每个组件的输入、输出、分类、代码 hash、tool mode,以及是否 blocked/outdated。第三阶段才是 Build Trace Replay:读取 build NDJSON 或 streaming events,回放 vertices_sorted、build_start、end_vertex、error、message 和 token。
这也是 Langflow 和 n8n、ComfyUI 对照时最有意思的地方。n8n 的核心资产是 workflow JSON、credentials 和 executions;ComfyUI 是 prompt graph、workflow UI JSON 和 history;Langflow 是 Flow JSON、component templates 和 sessions。三者都在解决“用户画出来的图如何被持久化、校验、调度、执行、回放、暴露成外部接口”,但 Langflow 在 MCP 和组件 schema 这两条线上特别适合做源码级工具化。
Langflow 的源码价值就在这里:它把看似低代码的 LLM 画布,落到了组件协议、Flow JSON、graph build、run API 和 MCP tool 这些明确边界上。对读源码的人来说,关键不是它集成了多少 provider,而是它怎样让一张图成为可以保存、检查、运行和对外提供服务的工程资产。
夜雨聆风