乐于分享
好东西不私藏

OpenClaw养虾与数据分析的AI开源项目集合

OpenClaw养虾与数据分析的AI开源项目集合

一、OpenClawAI 圈“养虾”)

1核心

OpenClawAI 圈 “养虾”)是本地优先、开源免费、可自主执行任务的 AI 智能体框架,核心是让 AI “长出手脚” 接管电脑、自动完成多步骤工作流。一句话定义,就是本地优先、自托管的开源 AI Agent 平台,连接大模型 → 调用本地工具 → 自动执行任务 → 数据完全私有。

2亮点

AI 不应只回答问题,而应主动帮你完成任务。开源免费、高度可扩展,本地部署、隐私可控、高度可扩展,适合个人、开发者、企业实现自动化与效率提升。

3如何“养虾”(部署)

部署:在本地服务器安装 OpenClaw

投喂:接入大模型(OllamaDeepSeek、通义等)、配置工具权限

训练:设定目标、喂数据技能、让它自动执行

结果:AI 自主数据分析、整理文件、发邮件、做报表、自动化流程等

4)开源地址

官方主仓库(GitHub

地址:https://github.com/openclaw/openclaw

语言:TypeScriptSwiftPython

国内镜像社区版(推荐国内用户)

GitCode 镜像:https://gitcode.com/GitHub_Trending/cl/openclaw

Gitee 镜像:https://gitee.com/OpenClaw-CN/openclaw-cn

中文社区版(OpenClaw-CN):https://open-claw.org.cn/

(内置国产模型、国内网络优化、中文提示、飞书集成)

5)玩法

个人助理:自动整理文件、发邮件、做周报

开发者:自动写代码、调试、部署、生成文档

数据分析师:自动清洗数据、做可视化、生成报告

运营:自动发消息、监控数据、生成报表

AI 数据分析开源项目(自动分析 / Agent/Claude Skills

1DeepAnalyze

①核心

这是由清华大学和中国人民大学联合开发的端到端AI 数据分析智能体(Agent),也是数据分析领域极具代表性的开源项目,核心目标是让非技术人员也能通过自然语言完成全流程数据分析。

亮点

端到端数据分析Agent,自动完成数据清洗、建模、可视化、报告生成,支持结构化 半结构化 非结构化数据。单来说,DeepAnalyze 是一个「全自动数据分析师」:你只需上传数据(CSV/Excel/ 数据库)、用自然语言提出分析需求(比如 “分析近 个月的销售数据,找出销量下滑的原因并可视化”),它就能自动完成数据清洗→特征工程→建模分析→可视化→生成分析报告 全流程,无需手动写一行代码。

GitHub开源地址:https://github.com/ruc-datalab/DeepAnalyze

2. AI Data Analyst

①核心

是全流程数据分析平台,用AI 智能体自动完成从数据接入到报告输出的全链路数据分析,让非专业人员也能快速获得数据洞察。

②亮点

一句话定位,AI 驱动、端到端、全流程自动化的开源数据分析平台,替代人工完成数据处理、分析、建模、可视化与报告,降低门槛、提升效率。模块化Agent 架构,内置数据接入、智能分析、自然语言查询、可视化、报告生成 Skill。支持 CSV / 数据库 / API 多源数据,开箱即用的 Web 界面。

GitHub开源地址

https://github.com/pushpitkamboj/AIDataAnalyst

3awesome-claude-skills 

①核心

Anthropic 最近推出的Claude Skills 能力。awesome-claude-skills 是一个开源、高质量的 Claude 技能(Skills)精选合集。它把社区里各种好用的 Claude 技能包整理在一起,你可以直接下载使用,用来扩展和定制 Claude AI 的工作能力。

②亮点

项目汇集了各类实用技能,采用模块化设计,覆盖文档处理、软件开发、数据分析、营销、创意写作等多个场景,方便用户直接复用与组合使用。

③开源地址

https://github.com/ComposioHQ/awesome-claude-skills

三、高质量开源数据集(多领域精选)

1DataCube

智源 DataCube多模态数据集平台,支持自定义检索,开源超 100 个数据集。

地址:https://datacube.baai.ac.cn/

2魔搭社区ModelScope开源数据集

①中科天机高质量气象数据集

本数据集为中科天机公里级融合数据——2025 年华北区域历史数据集,基于中科天机自主研发的全球区域一体化数值模拟系统,运用全球自由变焦核心技术生成,可实现华北区域高精度气象模拟,空间分辨率达0.025°(约 2.5 公里)。数据集涵盖辐射、温度、降水、风速、湿度、气压等类核心气象要素,提供2025 年华北区域完整逐小时历史数据,并支持10 天逐小时预测模拟,能够满足新能源、电力、水利、农业等领域对精细化气象数据的应用需求。

数据集链接:

https://www.modelscope.cn/datasets/tjweather/tjweather_TJ-CN_2025_huabei

Fineweb-Edu-Chinese V2.2

Chinese Fineweb Edu Dataset OpenCSG(开放传神)发布的专为中文教育领域大模型开发的高质量数据集系列,是目前开源界少有的、覆盖从预训练(Pre-train)到监督微调(SFT)全流程的高质量中文教育数据集。

数据集链接:

https://modelscope.cn/datasets/opencsg/Fineweb-Edu-Chinese-V2.2

Ps之前也分享关于数据集的文章,也可参考:

跨模态音乐信息AI 数据集

AI人像相关的数据集资源汇总

AI音乐相关的数据集资源汇总
AI医疗方面的数据集资源汇总

Ps本公众号还可阅读更多精彩好文:

1、把想法串联起来分享,我的“AI专利助手”

2、这么灵光的“最强产品经理”,全民都可手搓闪应用

3、Wan2.2-Animate-14B:一键让静态角色 “活” 成电影主角

感谢你的阅读与关注