做小团队数据处理、个人日常数分的朋友肯定烦过:要么ETL工具太臃肿占几十G,要么连云传数据不安全,想用AI搭流程还得配付费API key。这个工具把可视化拖曳ETL、本地AI生成、DuckDB高速执行全塞到30M安装包里,断网都能用。

它一句话是什么
一个完全本地运行的开源可视化ETL/ELT桌面工作室,基于Rust开发,拖曳就能搭建数据管道,自动编译为SQL跑在DuckDB列存引擎上,还带本地AI助手,全程不需要任何服务器。
为什么值得看
现在市面上的ETL要么是重得要死的企业级工具,要么是功能简陋的玩具级工具,要么必须连云、要付费、有数据泄露风险。这个项目现在虽然只有170星,但刚出公开beta就有170+集成测试覆盖全平台,把本地优先、轻量化、AI原生、Git友好这几个数分党最需要的点全踩中了,没有多余的依赖,连AI模型都是可选本地下载,数据完全不碰外网。
最有意思的3个功能
① 完全离线的AI管道生成助手:
内置Qwen 2.5 Coder 1.5B模型,第一次用下载1.1G之后就全程本地跑,不用申请任何API key,断网都能用。你用大白话输入“把我桌面上的用户CSV去重之后,按地区分组统计消费额,导出成Parquet存到D盘”,它会直接生成完整的管道配置,点一下就能插到画布上。还支持自己对接Ollama、OpenAI等兼容OpenAI接口的模型,而且模型只能输出文本,完全碰不到你的文件和网络,安全性拉满。
② 拖曳搭管道,自动转可读SQL秒级执行:
自带290+现成连接器,从普通CSV、Parquet文件,到MySQL、PostgreSQL等SQL库,再到向量数据库、SaaS的API、甚至FTP、IMAP邮箱都能直接连,还有50+数据转换节点,拖到画布上连起来就行。每个节点都能实时预览数据,还能直接看生成的原生SQL,完全不是黑盒,底层跑DuckDB列存引擎,普通数分任务比Excel快几个量级。
③ 30M超小体积,Git友好无锁-in:
整个安装包才30M左右,支持Windows、Mac、Linux全平台,还内置60种语言,直接就能切简/繁中文界面。工作区就是你自己选的普通文件夹,所有管道、配置、连接信息都是明文存的普通文件,直接能用Git做版本管理、分支、diff对比,还自带内置调度器,能设定时任务跑管道,完全没有厂商锁,不用怕换工具导不出配置。

可以怎么玩/怎么用
个人临时数分:把CSV/Excel拖进画布,跟AI说清楚统计规则,不用写一行SQL或Python,几秒出结果,直接导出成需要的格式; 小团队数据协作:不用搭重型ETL服务器,所有人把管道配置存在同一个Git仓库里,改了配置直接diff评审,数据全在本地或内部存储,不会泄露到第三方工具; 敏感数据预处理:处理内部用户数据、医疗数据等不能外传的内容,全程本地跑清洗、去重、格式转换流程,处理完直接导入本地向量库,数据从来不出你的电脑; 定时自动化任务:比如每天自动拉取运营后台的API数据、自动爬取公开行业数据,清洗合并之后存到本地数据库,不用写维护脚本,拖几个节点设个时间就行。
适合谁
经常要做数据处理的产品、运营、个人分析师,不想写复杂SQL/Python的; 小团队的数据工程师,不想搭重型ETL平台,追求轻量化的; 处理敏感数据、对隐私要求高,不能用云工具的从业者; 喜欢本地优先工具、讨厌臃肿软件、爱折腾效率工具的工具党。
GitHub 地址
https://github.com/SouravRoy-ETL/duckle
🔍 发现更多好玩的开源项目
专注于 Arduino、开源硬件与端侧 AI 技术分享

长按二维码关注「arduino」
夜雨聆风