一个纯浏览器本地运行的 AI 监控工具,用闲置设备做宠物/婴儿/老人看护

SafeOS Guardian 由 Frame 团队（开发了 AgentOS 和 Paracosm）构建并开源，作为“10% for Humanity”倡议的一部分承诺永久免费。

它把 TensorFlow.js 和 Transformers.js 跑在浏览器里，利用设备自带的摄像头和麦克风做实时监控：检测到异常时本地触发警报，所有数据留在浏览器 IndexedDB 里，不上传、不遥测，内存中只保留最近 5 到 10 分钟的视频帧，更早画面自动覆盖丢弃。

它明确将自己定位为补充性监控工具——增强人类注意力，不替代直接看护和专业设备。

它以 PWA（渐进式 Web 应用）的形态运行，首次加载后，Service Worker 缓存应用外壳、字体和模型权重，断网也能继续跑检测。

静态页面可以托管在 GitHub Pages、Vercel 等 CDN 上，零服务器成本。

视觉采用两级检测，画面像素变化时先触发 COCO-SSD 模型（约 5MB），在消费级硬件上跑 10-30 FPS，能识别 80 多种常见物体。

遇到难以判定的模糊场景时，则调用基于 Transformers.js 的 ViT-base 模型（约 89MB）做细粒度场景交叉验证。

音频检测通过 Web Audio API 实时抓取麦克风 FFT 频段数据，不额外加载模型就能检测婴儿哭声、玻璃碎裂声和长时间异常安静。

它还自带了一套“失物招领”机制，只要上传 1-5 张走失宠物或人员的照片，系统就会将每张照片压缩成小于 1KB 的视觉指纹（颜色直方图 + 边缘特征），以 1-2 FPS 的频率在实时画面中做余弦相似度匹配。

分级警报

按 info、low、medium、high、critical （信息→低危→中危→高危→致命）五级分级。等级越高，本地警报音量越大，并推动浏览器通知。

核心功能不需要服务器。但如果部署了可选 API 服务器（Docker），可以解锁多渠道推送（Resend 邮件、Twilio 短信、Telegram 机器人通知）、局域网 Ollama 模型（moondream、llava:7b 等）做复杂场景深度分析，或云端模型兜底（Gemini、GPT-4o-mini、Claude）。

适用场景

宠物监控（进食、禁区入侵）、婴儿看护（哭声、呼吸异常）、老人辅助（跌倒、长时间不动）、走失宠物/人员匹配、独居者安全签到、小企业下班后入侵检测等。

项目地址：https://github.com/framerslab/safeos