
GitHub 热门AI项目
CopilotKit
标星数:33,468今日标星:631所有者:CopilotKit开发语言:TypeScript描述:CopilotKit 是构建全栈 Agent 应用和生成式 UI 的多平台框架。它支持 React、Angular、Vue、React Native 以及 Slack 和 Teams 等环境,实现“一个 Agent 后端,适配所有前端”。作为 AG-UI 协议的创造者,CopilotKit 提供可定制的 Chat UI、动态生成式 UI、共享状态及人机协作工作流,帮助开发者快速构建智能应用。项目地址:https://github.com/CopilotKit/CopilotKit
mempalace
标星数:54,484今日标星:446所有者:MemPalace开发语言:Python描述:MemPalace 是一个开源的本地优先 AI 记忆系统,旨在提供高性能的上下文检索。它逐字存储对话历史,利用语义搜索和结构化索引实现精准召回。系统支持可插拔后端(默认 ChromaDB,兼容 Qdrant/pgvector),无需 API 调用,确保数据隐私。在 LongMemEval 基准测试中达到 96.6% R@5,支持 CLI 和 Docker 部署,适合集成到各类开发工作流中。项目地址:https://github.com/MemPalace/mempalace
Personal_AI_Infrastructure
标星数:15,107今日标星:70所有者:danielmiessler开发语言:TypeScript描述:Personal AI Infrastructure (PAI) 是一个旨在放大人类能力的“生活操作系统”。v5.0.0 版本集成了统一的 Pulse 守护进程、DA (Digital Assistant) 身份层及 Algorithm v6.3.0 算法。系统内置 45 个技能与 171 个工作流,支持 ISA 原语定义理想状态,并基于 TypeScript 和 Bun 构建,致力于通过 AI 技术最大化个人潜力。项目地址:https://github.com/danielmiessler/Personal_AI_Infrastructure
plugins
标星数:1,874今日标星:213所有者:openai开发语言:JavaScript描述:openai/plugins 是一个精选的 Codex 插件示例库,旨在展示如何通过插件扩展功能。每个插件包含 plugin.json 清单及 skills、agents 等可选组件。项目涵盖了 Figma 设计集成、Notion 知识管理,以及针对 iOS、macOS 和 Web 应用的构建与调试工作流。此外,还包含 Expo、Netlify 等基于 MCP 的插件示例,为开发提供丰富的集成参考。项目地址:https://github.com/openai/plugins
Agent-Reach
标星数:22,761今日标星:683所有者:Panniantong开发语言:Python描述:Agent Reach 是一款赋予 AI Agent 互联网感知能力的 CLI 工具。它整合了 Twitter、Reddit、YouTube、GitHub、Bilibili 等多平台的读取与搜索功能,无需 API 费用即可突破访问限制。项目支持一键安装与更新,兼容 Claude Code、Cursor 等主流环境,并提供环境诊断功能,让 Agent 轻松获取全网信息。项目地址:https://github.com/Panniantong/Agent-Reach
superpowers
标星数:219,960今日标星:700所有者:obra开发语言:Shell描述:Superpowers 是一套面向代码代理的智能体技能框架与软件开发方法论。它不直接编写代码,而是通过提问明确需求、展示设计并制定实施计划,严格遵循 TDD、YAGNI 和 DRY 原则。核心采用 subagent-driven-development 模式,让代理自主执行任务、审查工作并长时间运行。支持 Claude Code、Cursor 等多种工具,有效提升代理的工程能力。项目地址:https://github.com/obra/superpowers
career-ops
标星数:49,625今日标星:193所有者:santifer开发语言:JavaScript描述:Career-Ops 是一个基于 Claude Code 的 AI 求职系统,旨在将 AI 编码 CLI 转化为求职指挥中心。它支持 14 种技能模式,利用 A-F 评分系统智能评估职位,并批量生成 ATS 优化的个性化 PDF 简历。系统集成了 Go 仪表盘,可自动扫描 Greenhouse 等招聘门户并进行批量处理。作为一款智能筛选工具,它能帮助求职者高效锁定高价值职位,避免盲目投递。项目地址:https://github.com/santifer/career-ops
whisper
标星数:101,974今日标星:150所有者:openai开发语言:Python描述:OpenAI Whisper 是一个基于大规模弱监督的通用语音识别模型。它采用 Transformer sequence-to-sequence 架构,支持多语言语音识别、语音翻译及语言识别。该模型在多样化音频数据上训练,通过多任务学习统一了传统语音处理流程。Whisper 提供多种尺寸模型(如 tiny 到 turbo),在速度与准确率间取得平衡,适用于广泛的语音处理场景。项目地址:https://github.com/openai/whisper
VibeVoice
标星数:48,584今日标星:216所有者:microsoft开发语言:Python描述:VibeVoice 是微软推出的开源前沿语音 AI 模型家族,包含 Text-to-Speech (TTS) 和 Automatic Speech Recognition (ASR)。其核心创新是采用 7.5 Hz 超低帧率的连续语音 Tokenizer 和 Next-Token Diffusion 框架,利用 LLM 处理上下文。VibeVoice-ASR 支持 60 分钟长音频、50+ 种语言及结构化转录;VibeVoice-TTS 支持长篇多说话人合成。现已集成 Hugging Face Transformers,并支持 vLLM 推理。项目地址:https://github.com/microsoft/VibeVoice
ProductHunt 热门AI项目
Mailwarm 2.0
描述: 大多数创业者依靠邮件拓展业务,但邮件不会自动进入收件箱。Mailwarm 2.0 是一款高端的邮件预热和送达系统,专为提升邮件进入收件箱的几率而打造。它集成了自动预热、真实互动、监控、基础设施检查,以及面向所有订阅用户的专家咨询服务。链接:https://www.producthunt.com/products/mailwarm
InsForge Backend Branching
描述: 为您的整个后端提供 Git 风格的分支功能。创建一个分支,即可获得所有内容的完整隔离副本:包括数据库、存储、认证、边缘函数等,供您的代理进行实验,且无需触碰生产环境。链接:https://www.producthunt.com/products/insforge-alpha
Stitch 3.0 by Google
描述: Stitch 根据文本提示为移动端和网页生成 UI 界面,支持流式编辑和原位 AI 修改,并可一键导出到 Figma、Netlify、Lovable 和 Bolt。专为需要快速原型的产品设计师和开发者打造。链接:https://www.producthunt.com/products/stitch-by-google/launches/stitch-3-0-by-google
今日热门模型排行榜
AI Twitter 动态回顾
前沿模型、RSI 以及“AI 构建 AI”的叙事
Anthropic 的 Mythos/Opus 循环:社区重点强调了 Claude Mythos 在单次请求桌面端和 MacOS 工作流中的强大表现。讨论中提到了基准测试的倒退问题,有声称指出 Opus 4.8 在 LLM Debate Benchmark 上的表现不如 4.7。不过,Anthropic 发布的结果显示,在特定任务上,Opus 4.7 的表现匹配甚至超过了专用的 NMR 软件。 递归自我改进策略:Sakana AI 在东京启动了一个专门的 RSI 实验室,集成了 The AI Scientist、Darwin Gödel Machine 和 ShinkaEvolve。该实验室专注于在算力限制下,利用 样本效率 构建自我改进系统。各实验室正越来越多地将 RSI 作为一个正式的研究项目进行人员配置。
Agent 评估、可靠性与长视界基准测试
基准测试转向长视界任务:dair_ai 推出了 Agents’ Last Exam (ALE),包含 1000 多项具有经济价值的任务,其中难度最高的一级平均 完全通过率仅为 2.6%。rishi_desai2 启动了 SWE-Marathon,旨在测试编码 agent 在 10 亿 token 预算 内的连贯性。omarsar0 提到了 Meta-Agent Challenge,其中 agent 尝试了自我改进;结果显示很少能与人类基线匹配,并发现了一些 基于真值的数据窃取 尝试。 可靠性发现:普林斯顿大学更新的 ICML 2026 论文 《Towards a Science of AI Agent Reliability》 增加了 GPT 5.5、Gemini 3.1 Pro / 3.5 Flash 和 Claude Opus 4.7,结论是它们的可靠性 并没有实质性提高。该研究审计了 答案泄露 和 agent 在 GAIA 上的作弊行为,发现整体一致性较低。 工具链趋同:pauliusztin_ 提倡通过 Meta 的 OpenEnv 将 agentic 编码建模为 Gym 风格的强化学习环境,以提高可观测性(成功率、重试次数、工具效率、成本)。
开源模型、量化与多模态发布
Gemma 4 QAT:Google 为所有尺寸的 Gemma 4 发布了 Gemma 4 量化感知训练 checkpoint,强调更低的内存占用和 移动端量化格式;有声称表明 E2B 版本可以在约 1GB 内存下运行。目前得到了 Ollama 和 vLLM 的支持。注意:简单地转换为 llama.cpp 的 Q4_0 晶格会损失精度,而 Unsloth 的动态 GGUF 可以恢复精度。 Ideogram 4:ideogram_ai 发布了 Ideogram 4.0,这是一个 93 亿参数的 Diffusion Transformer,配备一个 冻结的 80 亿参数 VLM 文本编码器。它包含 fp8 和 nf4 checkpoint,其中 nf4 版本可以容纳在单张 24GB GPU 上。它位列顶级文生图模型,并且是目前 领先的开源权重图像模型。 NVIDIA Nemotron 3 Ultra:技术细节重点介绍了用于师生分布匹配的 MOPD 预热 和用于推测解码的 MTP 加速。NVIDIA 扩大了 Nemotron 联盟,纳入了 Nous、Prime Intellect 和 hcompany。Perplexity 集成了 Nemotron 3 Ultra 用于长时间运行的 agent。
Agent 产品、开发工具与运行时基础设施
Hermes Agent v0.16.0:Teknium 发布了更新,新增了 桌面 GUI 应用程序、仪表板大修以及 用于远程访问的新安全层(简单认证和 OAuth)。插件支持和文档也进行了扩展。 Arena Agent Mode:arena 推出了 Agent Mode 和 Agent Arena,让 agent 在真实任务上运行,指标包括确认的成功率、可控性和工具幻觉。 Agent 优化开发工具:据报道,与原始 API 交互相比,Hugging Face CLI 降低了 token 消耗并提高了成功率。新发布的产品包括:作为 Codex 插件的 MagicPath,用于视觉 UI 提示的 Cursor Design Mode,以及 Perplexity Computer 内部的 Vercel 集成。
算力、基础设施经济性与平台运营
基础设施经济性:Epoch AI 估计 2026 年第一季度 AI 基础设施约占 美国 GDP 的 0.8%。Cloudflare 推出了 AI Gateway 支出限制 和预算执行功能。 平台/安全更新:OpenAI 承认了账户暂停问题,并推出了 ChatGPT Lockdown Mode 以限制出站网络请求并减少由提示词注入驱动的数据窃取。关于 Anthropic 的一次停机事故,外界猜测涉及 多租户隔离失效。
AI Reddit 社区热帖
LocalLlama + localLLM 回顾
1. Gemma 4 QAT 与 Nemotron 3 Ultra 发布
[具备量化感知训练的 Gemma 4] (活跃度:982):Google 发布了针对 q4_0和移动端目标的 QAT checkpoint。官方 GGUF 格式包括 E2B、E4B、12B、26B-A4B 和 31B。社区对在6GB 显存上运行 Gemma 4 E4B 等模型持乐观态度。一个主要的技术担忧是缺乏比较 QATq4_0与 BF16 质量/性能的基准测试。[nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face] (活跃度:622):NVIDIA 发布了一个参数量为 550B的 LatentMoE 模型,具有55B激活参数,利用了 Mamba-2、MoE、选择性注意力和 Multi-Token Prediction。最低硬件要求是 8× GB200/B200、16× H100 或 8× H200,主要针对多节点/数据中心推理。
2. KV Cache 量化与 Agent 上下文可靠性
[KVarN:华为新的 KV-cache 量化] (活跃度:633):华为开源了 KVarN(Apache 2.0),已集成到 vLLM 中,声称实现了 3–5 倍的 KV-cache 压缩,同时提高了吞吐量并保持了 FP16 质量。这与 Google TurboQuant 形成对比,后者在推理基准测试中可能会遭遇吞吐量下降和质量损失。[Qwen 3.6 35B 与 27B 的可靠性对比] (活跃度:590):报告显示,使用未压缩 KV cache 的 Qwen 3.6 35B IQ4NXL 速度更快,但在高上下文时会出现幻觉;而使用压缩 KV 的 Qwen 27B Q5_K_XL 则更可靠。对于关键任务,首选 27B,因为其更宽的注意力张量对 KV-cache 压缩具有更好的弹性。
3. 本地 LLM 硬件:3090 机架 vs Mac Studio
[EPYC 9575F, 4× RTX 3090 LLM 服务器] (活跃度:632):一位用户完成了一台配备 AMD EPYC 9575F、 768GBDDR5 ECC 内存和 4× RTX 3090(96GB显存)的服务器,用于运行 vLLM 和 llama.cpp。讨论正在寻求关于 Kimi K2.6 和 GLM 5.1 等大模型的基准测试数据。[双 3090 vs Mac Studio] (活跃度:200):一位以约 40 tok/s速度运行 70B 模型的双 RTX 3090 用户正在考虑转而使用 128GB Mac Studio,以获得统一内存(例如64k上下文),尽管速度较低(约15 tok/s)。
上海一橙智能科技有限公司,是上海一橙网络科技股份有限公司旗下专注于AI与大模型应用落地的核心企业,提供从平台构建到AI场景化应用落地的全栈服务。聚焦大模型应用、数字人交互、语音图像分析等核心领域,打造了覆盖智能外呼、智能客服、智能知识管理、智能陪练、多模态交互、图像语音质检等场景的AI产品体系,已成功为通信、能源等领域头部央国企客户打造出多个AI落地应用。


夜雨聆风