使用AI搭建AI数据叙事系统Day3:openclaw的局限性(本篇文案纯手打)
(1)今天做了一下代码模块运行和检测,里面的bug还是很多。当项目比较大的时候代码审核具有一定的难度。因此今天让它把当前的系统运行逻辑总结了一下放到最后。今天在忙其他的事情,所以在修改这部分做的不太多,今天先看具体逻辑,明天继续修改。
(2)由于我是每天工作完之后使用openclaw来半自动进行小红书和微信公众平台的发布。我发现openclaw在做项目的时候,把小X书和公众平台的相关文案总结和发布也做成脚本放进去了,当前的AI数据叙事系统是不应该有这部分内容的,在使用的时候还是没有做好严格的限制说明。
(3)今天小X书给我封了7天,查出来我的自动发送了。之前使用小红书的mcp发布的时候被检测到一次,这次使用的是操作浏览器打开小红书的方式,也被查出来了,似乎仍旧是通过。7天解封再试试使用纯视觉+模拟点击的形式继续操作自动化发布小X书。
最后附上当前的项目核心流程及系统架构:
核心流程(单条流水线)数据上传→ 数据加载 + 类型推断(src/data_input/)→ 数据质量检查(src/data_understand/)→ 数据清洗(src/cleaning/)→ 统计特征提取(src/data_understand/)→ 数据洞察(src/insights/)→ 多维度分析(src/analysis/)→ 叙事策略匹配(src/narrative/)→ 基础图表生成(src/visualization/)→ 高级图表生成(src/visualization/)→ 数据故事生成(src/narrative/)→ LLM 增强(src/llm_integration/)→ 报告组装(src/report/)→ 平台适配(src/publishing/)→ 输出 |
系统架构(模块分层)
|
层级 |
职责 |
对应目录 |
|
入口层 |
CLI / Web 界面 |
run.py, src/web/ |
|
配置层 |
全局配置、环境变量 |
src/config.py, .env |
|
编排层 |
主流水线,串联所有模块 |
src/pipeline.py |
|
数据层 |
加载、理解、清洗 |
src/data_input/, src/data_understand/, src/cleaning/ |
|
分析层 |
洞察、统计、ML |
src/insights/, src/analysis/, src/performance/ |
|
叙事层 |
策略、故事线 |
src/narrative/ |
|
可视化层 |
图表推荐与生成 |
src/visualization/ |
|
增强层 |
LLM 调用、缓存 |
src/llm_client.py, src/llm_integration/ |
|
报告层 |
HTML/Markdown 组装 |
src/report/ |
|
发布层 |
多平台内容适配 |
src/publishing/, src/api_publish/ |
|
扩展层 |
插件、国际化、数据源扩展 |
src/plugins/, src/i18n/, src/data_input/connectors.py |
|
监控层 |
日志、性能、健康检查 |
src/monitoring/ |
|
自动化层 |
定时任务、批量处理 |
src/automation/ |
夜雨聆风