SafeOS Guardian 由 Frame 团队(开发了 AgentOS 和 Paracosm)构建并开源,作为“10% for Humanity”倡议的一部分承诺永久免费。
它把 TensorFlow.js 和 Transformers.js 跑在浏览器里,利用设备自带的摄像头和麦克风做实时监控:检测到异常时本地触发警报,所有数据留在浏览器 IndexedDB 里,不上传、不遥测,内存中只保留最近 5 到 10 分钟的视频帧,更早画面自动覆盖丢弃。
它明确将自己定位为补充性监控工具——增强人类注意力,不替代直接看护和专业设备。
它以 PWA(渐进式 Web 应用)的形态运行,首次加载后,Service Worker 缓存应用外壳、字体和模型权重,断网也能继续跑检测。
静态页面可以托管在 GitHub Pages、Vercel 等 CDN 上,零服务器成本。
视觉采用两级检测,画面像素变化时先触发 COCO-SSD 模型(约 5MB),在消费级硬件上跑 10-30 FPS,能识别 80 多种常见物体。
遇到难以判定的模糊场景时,则调用基于 Transformers.js 的 ViT-base 模型(约 89MB)做细粒度场景交叉验证。
音频检测通过 Web Audio API 实时抓取麦克风 FFT 频段数据,不额外加载模型就能检测婴儿哭声、玻璃碎裂声和长时间异常安静。
它还自带了一套“失物招领”机制,只要上传 1-5 张走失宠物或人员的照片,系统就会将每张照片压缩成小于 1KB 的视觉指纹(颜色直方图 + 边缘特征),以 1-2 FPS 的频率在实时画面中做余弦相似度匹配。
分级警报
按 info、low、medium、high、critical (信息→低危→中危→高危→致命)五级分级。等级越高,本地警报音量越大,并推动浏览器通知。
核心功能不需要服务器。但如果部署了可选 API 服务器(Docker),可以解锁多渠道推送(Resend 邮件、Twilio 短信、Telegram 机器人通知)、局域网 Ollama 模型(moondream、llava:7b 等)做复杂场景深度分析,或云端模型兜底(Gemini、GPT-4o-mini、Claude)。
适用场景
宠物监控(进食、禁区入侵)、婴儿看护(哭声、呼吸异常)、老人辅助(跌倒、长时间不动)、走失宠物/人员匹配、独居者安全签到、小企业下班后入侵检测等。
项目地址:https://github.com/framerslab/safeos
夜雨聆风