乐于分享
好东西不私藏

ScreenPipe: AI 私人记忆助手,让电脑真正"懂你"

ScreenPipe: AI 私人记忆助手,让电脑真正"懂你"

AI代码蜂巢X

探索编程的无限可能

编辑:嘉禾


“AI 终于知道你在做什么了”

在信息过载的数字时代,我们每天都在电脑上处理海量内容——会议、文档、代码、网页、对话……但人类的记忆是有限的。当你想找回三天前看过的某个 API 文档、上周会议中提到的预算数字,或是刚关闭的某个重要标签页时,往往只能无奈叹息。

ScreenPipe 正是为解决这一痛点而生。这是一款开源的 24/7 桌面 AI 记忆系统,它让你的电脑成为一位不知疲倦的私人助理,完整记录并智能理解你的一切数字活动,且完全本地化运行,隐私零妥协。


项目概述:不只是录屏,而是”数字记忆”

ScreenPipe 的核心定位是**”基于 24/7 桌面历史的 AI 应用商店”**。它不仅仅是一个屏幕录制工具,而是一个完整的本地 AI 基础设施:

┌─────────────────────────────────────────┐│  screen + audio → local storage → AI   │└─────────────────────────────────────────┘

项目由 Rust 和 TypeScript 构建,采用 MIT 开源协议,是 Rewind.ai、Microsoft Recall、Granola 等商业产品的领先开源替代方案。自 2024 年发布以来,多次登顶 GitHub Trending,并获得 Founders, Inc 的投资支持。


核心功能亮点

🎯 事件驱动的智能捕获

与传统录屏软件”无脑”连续录制不同,ScreenPipe 采用事件驱动架构——它监听系统事件(应用切换、点击、输入停顿、滚动),仅在内容真正变化时捕获画面。每次捕获同时获取截图和系统可访问性树(按钮、标签、文本字段的结构化数据),当可访问性数据不可用时(如远程桌面、游戏),自动降级为 OCR 识别。

这种设计带来显著优势:CPU 占用仅 5-10%,存储约 5-10GB/月(相比连续录制的 2GB/8 小时),且避免了处理数千张重复帧图的资源浪费。

🎙️ 本地音频转录

ScreenPipe 持续捕获系统音频(你听到的)和麦克风输入(你说的),使用本地运行的 OpenAI Whisper 模型实时转录为文字,支持说话人识别与区分。无论是 Zoom、Google Meet、Teams 还是任何应用的音频,都能被准确记录并建立索引。

🔍 自然语言搜索

所有 OCR 文本和音频转录内容都被索引到本地 SQLite 数据库,支持:

  • • 自然语言查询(如”昨天我看的那个 API 文档”)
  • • 按应用名称、窗口标题、浏览器 URL、日期范围筛选
  • • 基于嵌入向量的语义搜索
  • • 返回截图、音频片段与文本结果

你不再需要记住文件名或关键词,直接用日常语言询问即可。

🔌 插件系统(Pipes)

Pipes 是 ScreenPipe 的杀手级特性——用 Markdown 文件定义的定时 AI 智能体。每个 pipe.md 包含提示词和执行计划,ScreenPipe 会调度 AI 编码助手(如 Claude Code)查询你的屏幕数据、调用 API、执行操作。

内置 Pipes 包括:

  • • Obsidian 同步:自动将屏幕活动同步为 Obsidian 日志
  • • 智能提醒:扫描活动中的待办事项并创建 Apple 提醒
  • • 创意追踪:从浏览内容中挖掘创业点子

开发者可以在 ~/.screenpipe/pipes/ 中创建自己的 Pipes,甚至发布到商店获利。

🤖 MCP 服务器集成

ScreenPipe 作为 MCP(Model Context Protocol)服务器运行,Claude Desktop、Cursor、VS Code(Cline、Continue)等 AI 助手可直接查询你的屏幕历史。零配置即可让 AI 获得完整的工作上下文,实现如”总结今天的会议”或”我过去 5 分钟看了什么”的智能问答。


技术架构解析

ScreenPipe 采用模块化 Rust 架构,核心 crate 包括:

模块
职责
screenpipe-vision
屏幕捕获与 OCR(支持 Apple Vision、Windows OCR、Tesseract)
screenpipe-audio
音频录制与语音转文字
screenpipe-core
基础服务与 LLM 集成
screenpipe-server
数据存储与查询服务(SQLite + FTS5)

桌面应用基于 Tauri(Rust + TypeScript)构建,提供跨平台原生体验。REST API 运行在本地 3030 端口,配套 JavaScript/TypeScript SDK 供开发者集成。


隐私与安全:100% 本地优先

ScreenPipe 将隐私作为核心设计原则:

  • • 数据完全本地:所有录制、转录、索引均在你的设备上完成,默认不连接任何外部服务器
  • • 无需账号:核心功能无需注册即可使用
  • • 开源可审计:MIT 协议,代码完全透明
  • • 本地 AI 支持:通过 Ollama 接入 Llama、Mistral 等本地模型,实现零云端依赖
  • • 确定性权限控制:每个 Pipe 支持 YAML 前置配置,通过 allow-appsdeny-windowstime-range 等字段精确控制 AI 可访问的数据范围,在操作系统层面三层强制拦截(技能门控、代理拦截、服务器中间件),而非依赖提示词约束

适用人群

  • • 知识工作者:需要随时回溯电脑上的任何信息
  • • 开发者:为 AI 编程助手(Cursor、Claude Code)提供工作上下文
  • • ADHD 用户:解决标签页、文档、对话丢失问题
  • • 远程工作者:自动会议转录与笔记生成
  • • 企业团队:通过 ScreenPipe Teams 实现可控的 AI 部署,支持集中配置管理、共享 Pipes 和细粒度数据权限

快速开始

macOS / Linux:

curl -fsSL get.screenpi.pe/cli | sh

Windows:

iwr get.screenpi.pe/cli.ps1 | iex

首次启动需授予屏幕录制和麦克风权限。安装完成后,ScreenPipe 将在系统托盘静默运行,通过 http://localhost:3030 提供 API 服务。


与商业方案的对比

特性
ScreenPipe
Rewind/Limitless
Microsoft Recall
Granola
开源
✅ MIT
跨平台
macOS/Win/Linux
macOS/Win
Win 独占
macOS
数据存储
100% 本地
云端
本地
云端
开发者 API
✅ 完整 REST + SDK
有限
插件系统
✅ Pipes
AI 模型选择
任意本地/云端
专有
微软 AI
专有
定价
一次性 $400
订阅制
捆绑 Windows
订阅制

结语

ScreenPipe 代表了个人计算的一个新范式——从”工具被动等待指令”到”AI 主动理解上下文”。它不仅是 Rewind.ai 的开源替代,更是一个开放的 AI 应用平台。通过本地优先的设计,它在提供强大能力的同时,将数据所有权完全交还用户。

无论是想拥有一个完美的数字记忆,还是希望构建基于桌面上下文的 AI 应用,ScreenPipe 都值得深入探索。


🔗 项目地址: https://github.com/screenpipe/screenpipe

📖 官方文档: https://docs.screenpi.pe💬 社区 Discord: https://discord.gg/screenpipe🌐 官方网站: https://screenpi.pe

“关注公众号AI代码蜂巢x 获取更多信息