小遥搜索v1.7.0版本更新【飞书文档+知识库支持】
版本预览

v1.7.0 版本更新说明
发布日期:2026年04月07日版本类型:重大功能更新主题:飞书文档+知识库支持
📋 版本概述
小遥搜索 v1.7.0 正式支持 飞书文档数据源,配合小遥搜索飞书导出工具(https://github.com/dtsola/xiaoyaosearch-feishu-export-md),让您能够搜索从飞书导出的本地 Markdown 文档,在搜索结果中清晰标识飞书文档来源,并支持一键跳转到飞书原文。
核心亮点
-
📄飞书文档识别:自动识别从飞书导出的 Markdown 文档 -
🔗原文链接跳转:搜索结果支持直接跳转到飞书原文 -
🎨飞书标识展示:搜索结果中使用紫色”飞书”标识区分数据来源 -
🔌插件化架构:基于插件化框架,扩展数据源更灵活 -
🛠️配套导出工具:独立的飞书导出 CLI 工具,支持批量导出
✨ 新增功能
飞书文档数据源支持
功能定位:
为小遥搜索添加飞书文档数据源识别能力,让用户能够搜索从飞书导出的本地 Markdown 文档。
使用流程:
┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐│ 飞书文档/知识库 │ ───▶ │ 飞书导出工具 │ ───▶ │ 本地MD文件 │└─────────────────┘ └──────────────────┘ └─────────────────┘ │ ▼ ┌─────────────────┐ │ 小遥搜索 │ │ 自动识别 │ └─────────────────┘ │ ▼ ┌─────────────────┐ │ 搜索+跳转原文 │ └─────────────────┘
使用场景:
|
使用场景 |
描述 |
价值 |
|
产品经理 |
搜索本地产品文档 + 飞书需求文档 |
统一搜索入口,提升效率 |
|
开发者 |
搜索本地代码 + 飞书技术文档 |
快速定位技术资料 |
|
团队协作 |
将飞书团队知识库导出后本地搜索 |
知识沉淀与备份 |
飞书导出工具(配套)
小遥搜索飞书导出工具是独立的 CLI 工具,支持将飞书文档/知识库导出为 Markdown 格式。
工具特性:
-
✅ 支持单个文档导出 -
✅ 支持知识库文档导出 -
✅ 支持批量文档导出 -
✅ 支持文件夹递归导出 -
✅ 支持完整知识库导出 -
✅ 自动下载图片和附件 -
✅ 增量导出(仅导出有更新的文档) -
✅ 并发控制(可配置 API 并发数)
安装方式:
# 全局安装npm install -g xiaoyaosearch-feishu-export# 验证安装feishu-export --version
快速开始:
# 1. 初始化配置feishu-export init# 2. 导出单个文档feishu-export export -d doxcnXXXXXXXX# 3. 导出知识库feishu-export export -w wiki_node_token# 4. 批量导出feishu-export docs --file docs.txt
导出格式示例:
导出的 Markdown 文件末尾包含元数据:
---> 更新: 2026-03-30 02:52:46> 来源类型: feishu> 原文: <https://feishu.cn/wiki/XXXXXXXXXXXXXXXXXXXX>---
小遥搜索会自动识别这些元数据,并将文档标记为”飞书”数据源。
项目地址:https://github.com/dtsola/xiaoyaosearch-feishu-export-md
搜索结果飞书标识
标识样式:
-
图标:云朵图标(CloudOutlined) -
颜色:紫色(#722ed1) -
文本:显示”飞书”来源标识
搜索结果展示:
┌────────────────────────────────────────────────────┐│ 🔍 搜索结果 │├────────────────────────────────────────────────────┤│ 📄 产品需求文档_v1.2.md ││ ...摘要内容... ││ 💾 本地文件 │ 🕒 2026-03-15 │├────────────────────────────────────────────────────┤│ 📄 飞书技术方案.md ││ ...摘要内容... ││ 🟣 飞书 │ 🔗 原文链接 │ 🕒 2026-03-20 │└────────────────────────────────────────────────────┘
原文链接跳转
跳转功能:
-
搜索结果中的飞书文档显示”原文链接”按钮 -
点击按钮在新标签页打开飞书原文 -
自动填充文档的完整 URL
适用条件:
-
文档包含飞书元数据 -
用户有飞书文档访问权限 -
飞书原文链接有效
📚 技术实现
插件化架构
技术栈:
-
Python ABC – 插件接口定义 -
正则表达式 – 元数据解析 -
importlib – 插件动态加载
插件实现:
class FeishuDataSource(DataSourcePlugin): """飞书数据源插件""" def get_file_source_info(self, file_path: str, content: str) -> Dict[str, Any]: """从飞书导出的文档中提取元数据""" # 1. 检测文件末尾的飞书元数据格式 # 2. 解析来源类型(feishu) # 3. 提取原文链接 # 4. 返回标准化的数据源信息 pass
元数据解析流程:
读取文件内容 ↓提取最后 500 字符 ↓正则匹配飞书元数据 ↓解析原文链接 ↓返回 source_type=feishu, source_url=xxx
数据库变更
说明:数据库表结构已在 v1.2.0 插件化架构版本中完成
已有字段:
source_type TEXT DEFAULT 'filesystem'
– 数据源类型(filesystem/yuque/feishu) source_url TEXT
– 原文链接
无需修改:本特性直接复用现有字段,无需数据库迁移。
前端支持
说明:前端已在 v1.2.0 插件化架构版本中支持
已有支持:
-
数据源类型映射: feishu: t('searchResult.sourceFeishu') -
图标映射: feishu: CloudOutlined -
样式定义: .source-type.source-feishu紫色样式
无需修改:本特性无需前端代码修改。
🔄 升级指南
从 v1.6.0 升级到 v1.7.0
https://www.dtsola.com/archives/a685353b-7e61-4e02-b24c-620f9e65f621
📦 下载地址
- 小遥搜索 v1.7.0
:
-
百度网盘:https://pan.baidu.com/s/1lDaWjMCRXIT-Sqx9UFjerg?pwd=37ed -
GitHub:https://github.com/dtsola/xiaoyaosearch/releases/tag/v1.7.0
- 飞书导出工具
:
-
npm: npm install -g xiaoyaosearch-feishu-export -
GitHub:https://github.com/xiaoyaosearch/xiaoyaosearch-feishu-export-md
📖 使用示例
场景一:产品经理搜索需求文档
背景:产品经理将需求文档写在飞书中,同时本地有产品设计的 Markdown 文档。
操作步骤:
-
使用飞书导出工具导出飞书需求文档:
feishu-export export -w doxcnReqDocId -o D:\docs\feishu
-
在小遥搜索中添加扫描路径: D:\docs\feishu -
搜索关键词”用户登录” -
搜索结果同时显示:
-
本地产品设计文档(来源:本地文件) -
飞书需求文档(来源:飞书)
-
点击飞书需求文档的”原文链接”,跳转到飞书原文查看最新版本
场景二:开发者搜索技术文档
背景:开发团队在飞书中维护技术规范文档,需要与本地代码一起搜索。
操作步骤:
-
批量导出飞书技术文档:
# 创建文档ID列表文件echo "doxcnDoc1" > tech-docs.txtecho "doxcnDoc2" >> tech-docs.txt# 批量导出feishu-export docs --file tech-docs.txt -o D:\docs\tech
-
在小遥搜索中添加扫描路径: D:\docs\tech -
搜索技术关键词”API设计” -
快速定位到飞书中的技术规范文档
场景三:知识库定期备份
背景:企业知识库需要定期备份到本地,防止数据丢失。
操作步骤:
-
设置定时任务(Windows 计划任务):
# 每周日凌晨 2 点执行feishu-export wiki wiki_token -o D:\backup\feishu --incremental
-
小遥搜索自动索引新增/更新的文档 -
随时搜索备份的知识库内容
❓ 常见问题
Q1: 如何使用飞书文档搜索?
A: 将飞书文档导出为 Markdown 格式,放到小遥搜索的扫描目录即可,系统会自动识别。
导出方式:
-
安装飞书导出工具: npm install -g xiaoyaosearch-feishu-export -
初始化配置: feishu-export init -
导出文档: feishu-export export -d <doc_id> -o <输出目录>
Q2: 飞书导出格式是什么?
A: 飞书导出的 Markdown 文件末尾包含元数据块,标明来源类型和原文链接。
示例格式:
---> 更新: 2026-03-30 02:52:46> 来源类型: feishu> 原文: <https://feishu.cn/wiki/MZKMwqpljiod1ak38Cscnr8hnkh>---
Q3: 可以搜索飞书文档中的图片吗?
A: 目前支持文本搜索,图片搜索需要飞书文档导出时包含图片。
飞书导出工具支持自动下载图片:
feishu-export export -d <doc_id> --images
Q4: 飞书原文链接会过期吗?
A: 如果您有飞书文档的访问权限,原文链接可以正常打开。
权限要求:
-
文档对您可见(公开或您有访问权限) -
飞书账号正常登录
Q5: 如何批量导出飞书知识库?
A: 使用飞书导出工具的知识库导出功能:
# 导出完整知识库feishu-export export -w <wiki_id> -o <输出目录># 仅生成索引文件(不下载文档)feishu-export export -w <wiki_id> --index-only
Q6: 搜索不到飞书文档怎么办?
A: 请检查以下几点:
-
确认文档已导出到小遥搜索的扫描目录 -
确认文档末尾包含飞书元数据 -
确认索引已构建完成(查看索引管理页面) -
尝试重新索引该目录
🙏 致谢
感谢以下开源项目的支持:
-
Python ABC – 抽象基类 -
飞书开放平台 – API 支持 -
Node.js – 飞书导出工具运行环境
特别感谢所有贡献者和用户的支持!
让我们一起打造更好的本地搜索体验!🚀
加入用户交流 ↓

📝 版本历史
|
版本 |
日期 |
主要更新 |
|
v1.7.0 |
2026-03-31 |
飞书文档数据源支持 |
|
v1.6.0 |
2026-03-26 |
云端嵌入模型支持 + Bug 修复 |
|
v1.5.0 |
2026-03-20 |
Agent Skills 支持 |
|
v1.4.0 |
2026-03-15 |
MCP 服务器支持 |
|
v1.3.0 |
2026-03-10 |
OpenAI 云端模型支持 + Bug 修复 |
|
v1.2.0 |
2026-03-05 |
插件化架构 + 语雀数据源 |
|
v1.1.0 |
2026-02-28 |
i18n 国际化支持 |
|
v1.0.0 |
2026-02-20 |
MVP 版本发布 |
#独立开发者 #知识工作者 #知识库 #AI工具 #内容创作者 #一人公司 #ai搜索 #dify #ragflow #vibecoding
夜雨聆风