趣谈AI精选:《最系统的AI开发学习精品手册》
徐小夕

我花了一个月时间,调研了市面上所有主流方案:
WPS:功能强大,但私有化部署成本极高,二次开发几乎不可能
开源方案(OnlyOffice/Luckysheet等):协同体验差,中文排版兼容性问题多,AI能力弱
自研路线:前端要重做Word渲染引擎,后端要处理OT/CRDT协同算法,还要接大模型...
"既然没有现成的,那就自己造一个。" 就这样,JitWord 项目启动了。
话不多说,先上链接:
创业历程:3个架构师,365天,踩过的那些坑
第1-3个月:证明"这件事能做"
最开始团队只有3个人:我负责架构,一个前端 specialist,一个后端架构师,基本上在大厂都有丰富的研发经验。
我们第一个要攻克的问题是:如何在浏览器里精准还原Word文档?
Word 的 docx 格式本质上是一组XML文件的ZIP包,里面涉及:
段落样式(Styles)
编号列表(Numbering)
表格嵌套
页眉页脚
复杂格式(分栏、文本框、首字下沉...)
我们花了整整6周,写了一个可扩展的高精度 docx 解析引擎,能把复杂公文、标书、论文的排版还原度做到 95%以上。
具体实现方案我在之前的文章中有详细的介绍,大家可以参考一下:
一个普通Word文档,为什么99%的开源编辑器都"认怂"了?我们选择正面硬刚
比如对于红头公文,我们解析的效果如下:

还有一种更复杂的格式,标题有压缩字体,如下:




文档渲染搞定了,下一个硬骨头是多人实时协同。
我们调研了两种技术路线:
OT(Operational Transformation)算法:Google Docs在用,理论上比较成熟,但是实现相对复杂,冲突处理容易出现 bug
CRDT(Conflict-free Replicated Data Type):去中心化方案,成本低,但性能开销大
最终我们选择了"改良型CRDT + 心跳同步"的混合方案:
操作粒度细化到字符级
引入版本向量解决并发冲突
本地优先(Local-first)架构,弱网环境下也能流畅编辑



{"documentId": "doc_123456","versions": [{"id": "v_001","title": "初始版本","description": "文档创建","content": {...},"author": "user_001","isAutoSave": false,"createdAt": "2024-01-01T10:00:00Z","metadata": {"wordCount": 1500,"characterCount": 8000,"changesSinceLastVersion": 150}}]}
- 文本级对比
基于字符和单词的精确差异识别 - 结构级对比
识别段落、标题、列表等结构变化 - 样式级对比
检测格式、颜色、字体等样式变化 - 组件级对比
图表、表格等复杂组件的变化识别
第7-9个月:AI能力不是"锦上添花",是"刚需"
做到这个阶段,JitWord 已经是一个"能用的在线Word"了。但后面我们的客户又问了一个灵魂拷问:
"你们和WPS的区别是什么?"
我们的答案是:AI原生。

从底层架构设计上,我们遵循了 AI Native 的产品设计理念,预留了AI扩展点:
AI续写:基于上下文语义,一键生成公文段落
AI排版:自动识别文档类型(通知/报告/函件),应用对应模板
AI纠错:错别字、语法、政治用语规范检查
公式解析:支 持LaTeX实时渲染,科研论文一键导出Word

用户输入↓意图识别模型 (Intent Classifier) ──→ 公文/论文/标书/通用写作↓领域知识库检索 (RAG) ──→ 模板匹配 + 规范校验↓大模型生成 (LLM) ──→ 内容生成 + 润色优化↓后处理引擎 ──→ 格式标准化 + 排版美化
第10-12个月:打磨"最后一公里"
最后三个月,我们死磕了如下难啃的“骨头”:
Office文件预览:支持将OFD,Docx,PDF,Excel等文件嵌入文档
修订模式:完整的"批注+修订+接受/拒绝"工作流,满足公文审签场景
目录大纲:可拖拽、可展开收起的智能目录,长文档导航效率提升10倍
国产化适配:兼容主流浏览器和国产服务器,全面支持信创环境
附加价值:表格 + 思维导图 多人协同功能支持





当然我们还在持续迭代优化,打造更高精度,更可靠,更智能的AI协同文档系统,让个人和企业能更低成本将传统 Office “搬到”线上。
附加价值: 表格 + 思维导图的多人协同编辑能力


产品功能对比:JitWord vs WPS
我总结了一个对比表,供大家参考:
| 在线协同 | |||
| AI写作 | |||
| 数学公式 | |||
| 修订模式 | |||
| 二次开发 | |||
| 国产化适配 | |||
| 部署成本 |
核心价值复盘
我从四个维度来分享一下 JitWord 对比 WPS 来说,体现的价值点:
1. 数据主权
WPS 的在线版数据存储在金山云
JitWord 支持完全私有化部署,数据留在客户服务器
2. 深度定制
WPS是封闭产品,无法二次开发
JitWord提供SDK+API,可嵌入OA、ERP、CRM等任意系统
3. 场景垂直
WPS 是通用办公工具
JitWord 深耕公文写作、科研论文、招投标文件、多人协作等垂直场景,AI能力更精准
4. 成本优势
WPS 企业版年费数千元起,长期使用成本压力非常大
JitWord 私有化部署成本
最后的感悟:我们不是要做"颠覆者",而是"补缺者"
做 JitWord 这一年,我最大的感悟是:
"大厂做不到的事,小公司有机会;大厂不愿做的事,小公司必须做。"
WPS 无疑是一款伟大的产品,20年积累,几亿用户,它的地位无可撼动。
但是, WPS 也有它的边界(优劣势):
它要服务C端用户,所以必须有广告和会员
它要维护通用性,所以无法深耕垂直场景
它要保护商业利益,所以无法开放二次开发
JitWord的定位从来不是"打败WPS",而是做一个"WPS做不到/不愿做"的补充方案,服务于有成本预算,希望打造自己的AI办公产品的客户。
如果你的公司满足如下情况:
是一家数据敏感的国企/金融机构
是一个需要深度定制文档能力的SaaS厂商
是一支预算有限但需求明确的中小团队
那么 JitWord 可能是你一直在找的答案。

JitKnow V2.0.0:从可视化知识库到企业级AI中台,开放API+数据分析重构知识管理边界
夜雨聆风