一、OpenClaw(AI 圈“养虾”)
(1)核心
OpenClaw(AI 圈 “养虾”)是本地优先、开源免费、可自主执行任务的 AI 智能体框架,核心是让 AI “长出手脚” 接管电脑、自动完成多步骤工作流。一句话定义,就是本地优先、自托管的开源 AI Agent 平台,连接大模型 → 调用本地工具 → 自动执行任务 → 数据完全私有。
(2)亮点
AI 不应只回答问题,而应主动帮你完成任务。开源免费、高度可扩展,本地部署、隐私可控、高度可扩展,适合个人、开发者、企业实现自动化与效率提升。
(3)如何“养虾”(部署)
部署:在本地/ 服务器安装 OpenClaw
投喂:接入大模型(Ollama、DeepSeek、通义等)、配置工具权限
训练:设定目标、喂数据/ 技能、让它自动执行
结果:AI 自主数据分析、整理文件、发邮件、做报表、自动化流程等
(4)开源地址
①官方主仓库(GitHub)
地址:https://github.com/openclaw/openclaw
语言:TypeScript、Swift、Python
②国内镜像/ 社区版(推荐国内用户)
GitCode 镜像:https://gitcode.com/GitHub_Trending/cl/openclaw
Gitee 镜像:https://gitee.com/OpenClaw-CN/openclaw-cn
中文社区版(OpenClaw-CN):https://open-claw.org.cn/
(内置国产模型、国内网络优化、中文提示、飞书集成)
(5)玩法
个人助理:自动整理文件、发邮件、做周报
开发者:自动写代码、调试、部署、生成文档
数据分析师:自动清洗数据、做可视化、生成报告
运营:自动发消息、监控数据、生成报表

二、AI 数据分析开源项目(自动分析 / Agent/Claude Skills)
1、DeepAnalyze
①核心
这是由清华大学和中国人民大学联合开发的端到端AI 数据分析智能体(Agent),也是数据分析领域极具代表性的开源项目,核心目标是让非技术人员也能通过自然语言完成全流程数据分析。
②亮点
端到端数据分析Agent,自动完成数据清洗、建模、可视化、报告生成,支持结构化 / 半结构化 / 非结构化数据。简单来说,DeepAnalyze 是一个「全自动数据分析师」:你只需上传数据(CSV/Excel/ 数据库)、用自然语言提出分析需求(比如 “分析近 3 个月的销售数据,找出销量下滑的原因并可视化”),它就能自动完成数据清洗→特征工程→建模分析→可视化→生成分析报告 全流程,无需手动写一行代码。
③GitHub开源地址:https://github.com/ruc-datalab/DeepAnalyze

2. AI Data Analyst
①核心
是全流程数据分析平台,用AI 智能体自动完成从数据接入到报告输出的全链路数据分析,让非专业人员也能快速获得数据洞察。
②亮点
一句话定位,AI 驱动、端到端、全流程自动化的开源数据分析平台,替代人工完成数据处理、分析、建模、可视化与报告,降低门槛、提升效率。模块化Agent 架构,内置数据接入、智能分析、自然语言查询、可视化、报告生成 Skill。支持 CSV / 数据库 / API 多源数据,开箱即用的 Web 界面。
③GitHub开源地址
https://github.com/pushpitkamboj/AIDataAnalyst
3、awesome-claude-skills
①核心
Anthropic 最近推出的Claude Skills 能力。awesome-claude-skills 是一个开源、高质量的 Claude 技能(Skills)精选合集。它把社区里各种好用的 Claude 技能包整理在一起,你可以直接下载使用,用来扩展和定制 Claude AI 的工作能力。
②亮点
项目汇集了各类实用技能,采用模块化设计,覆盖文档处理、软件开发、数据分析、营销、创意写作等多个场景,方便用户直接复用与组合使用。
③开源地址
https://github.com/ComposioHQ/awesome-claude-skills

三、高质量开源数据集(多领域精选)
1、DataCube
①智源 DataCube:多模态数据集平台,支持自定义检索,开源超 100 个数据集。
②地址:https://datacube.baai.ac.cn/
2、魔搭社区ModelScope开源数据集
①中科天机高质量气象数据集
本数据集为中科天机公里级融合数据——2025 年华北区域历史数据集,基于中科天机自主研发的全球区域一体化数值模拟系统,运用全球自由变焦核心技术生成,可实现华北区域高精度气象模拟,空间分辨率达0.025°(约 2.5 公里)。数据集涵盖辐射、温度、降水、风速、湿度、气压等9 类核心气象要素,提供2025 年华北区域完整逐小时历史数据,并支持10 天逐小时预测模拟,能够满足新能源、电力、水利、农业等领域对精细化气象数据的应用需求。
数据集链接:
https://www.modelscope.cn/datasets/tjweather/tjweather_TJ-CN_2025_huabei
②Fineweb-Edu-Chinese V2.2
Chinese Fineweb Edu Dataset 是OpenCSG(开放传神)发布的专为中文教育领域大模型开发的高质量数据集系列,是目前开源界少有的、覆盖从预训练(Pre-train)到监督微调(SFT)全流程的高质量中文教育数据集。
数据集链接:
https://modelscope.cn/datasets/opencsg/Fineweb-Edu-Chinese-V2.2
Ps之前也分享关于数据集的文章,也可参考:
Ps本公众号还可阅读更多精彩好文:
3、Wan2.2-Animate-14B:一键让静态角色 “活” 成电影主角
感谢你的阅读与关注

夜雨聆风