
GitHub 热门AI项目
telegraf
标星数:17,080
今日标星:13
所有者:influxdata
开发语言:Go
描述:Telegraf 是一个用于收集、处理、聚合和写入指标、日志及任意数据的 Agent。它提供超过 300 个插件,涵盖系统监控、云服务及消息传递(如 Kafka、Prometheus)等领域。Telegraf 支持用户自定义代码,编译为无外部依赖的独立静态二进制文件,并采用 TOML 进行配置。该项目由拥有 1,200 多名贡献者的庞大社区维护,部署简便且功能强大。
项目地址:
https://github.com/influxdata/telegraf
scientific-agent-skills
标星数:21,360
今日标星:99
所有者:K-Dense-AI
开发语言:Python
描述:Scientific Agent Skills 提供了 135 个即用型科研技能,兼容支持 Agent Skills 标准的各类 AI Agent(如 Cursor、Claude Code)。该项目涵盖生物信息学、药物发现、临床研究、机器学习等广泛领域,通过集成专业的科学库与数据库,将 AI Agent 转化为能执行复杂多步骤工作流的研究助手,显著提升科研效率。
项目地址:
https://github.com/K-Dense-AI/scientific-agent-skills
Personal_AI_Infrastructure
标星数:13,564
今日标星:435
所有者:danielmiessler
开发语言:TypeScript
描述:PAI (Personal AI Infrastructure) 是一个旨在放大人类能力的“生活操作系统”。作为智能体 AI 基础设施,v5.0.0 版本引入了统一的 Pulse 守护进程、数字助手 (DA) 身份层及 Algorithm v6.3.0。该项目内置 45 个技能和 171 个工作流,支持一键安装。其技术栈基于 Claude、TypeScript 和 Bun,强调结构化隐私,致力于通过 AI 增强每个人的能力。
项目地址:
https://github.com/danielmiessler/Personal_AI_Infrastructure
acton
标星数:276
今日标星:18
所有者:ton-blockchain
开发语言:Rust
描述:TON 智能合约开发及更多的工具链
项目地址:
https://github.com/ton-blockchain/acton
cua
标星数:16,659
今日标星:245
所有者:trycua
开发语言:HTML
描述:Cua 是一套用于 Computer-Use Agents 的开源基础设施,提供沙箱、SDK 和基准测试工具,旨在构建能控制全桌面(macOS、Linux、Windows)的 AI Agent。核心组件包括 Cua Driver(支持 macOS 后台控制应用)、Cua Sandbox(跨 OS 统一 API,支持云与本地环境)及 CuaBot(为 Agent 提供无缝沙箱)。项目支持屏幕交互、Shell 命令及手势操作,适用于 Agent 的训练与评估。
项目地址:
https://github.com/trycua/cua
ProductHunt 热门AI项目
Kilo Code v7 for VS Code
描述: 我们彻底重构了 VS Code 版 Kilo Code,基于 OpenCode 服务器构建。拥有全新的可移植核心、并行工具调用、子代理委派、内联代码审查和多模型对比。立即开始:kilo.ai/install
链接:
https://www.producthunt.com/products/kilocode
Velo 2.0
描述: Velo 2.0 是制作视频消息的全新方式。它能将原始屏幕录制转化为精美的视频和文档,配备聊天原生编辑器、实时处理、语音克隆和智能脚本重写功能。通过聊天进行编辑,而非使用时间轴。一次录制,同时生成视频和文档。即使没有音频,也能编写脚本。随时调整语气。所有内容实时更新,让整个体验更快、更轻松、更自然。
链接:
https://www.producthunt.com/products/velo-4
Kelviq
描述: Kelviq 是 SaaS、AI 和数字产品的完整变现平台。它在一个平台上统一处理支付、全球税务、订阅、用量计费、数字交付、许可密钥和合规,每笔交易收费 3.5% + 40¢。
链接:
https://www.producthunt.com/products/kelviq
今日热门模型排行榜
类型:Text-to-Video 下载量:627k | 类型:视觉多模态理解 下载量:83714 | |
类型:Image-Text-to-Text 下载量:16.8k | 类型:文本生成 下载量:8515 | |
类型:文本生成 下载量:131k | 类型:视觉多模态理解 下载量:2345 | |
类型:Image-Text-to-Image 下载量:9.86k | 类型:图像生成 下载量:2142 | |
类型:Text Generation 下载量:2.59M | 类型:文本生成 下载量:3350 | |
类型:Text-to-Speech 下载量:9.48k | 类型:文本生成 下载量:3457 | |
类型:Text-to-Image 下载量:12.1k | 类型:文本生成 下载量:107326 | |
类型:Image-to-Video 下载量:90.6k | 类型:统一多模态 下载量:8103 | |
类型:Image-Text-to-Text 下载量:74.8k | 类型:图片生成3D 下载量:30415 | |
类型:Image-Text-to-Text 下载量:2.94M | 类型:3D重建 下载量:15294 |
AI Twitter 动态回顾
Agent 基础设施、控制框架及开发者平台
Cline、LangChain、Notion 和 Cursor 进化为 Agent 平台:Cline 开源了重构后的 Cline SDK,并更新了带有 TUI(文本用户界面)、Agent 团队、定时任务和连接器的 CLI。 LangChain 在 Interrupt 大会上发布了 Agent 生命周期基础设施:LangSmith Engine、SmithDB、Sandboxes、Managed Deep Agents、LLM Gateway、Context Hub 以及 Deep Agents 0.6。SmithDB 是一个用于嵌套跟踪的可观测性数据库,在关键工作负载上实现了 12–15 倍的访问速度提升,并基于 Apache DataFusion and Vortex 构建。Notion 的 External Agents API 允许第三方 Agent(如 Claude、Codex、Cursor、Decagon、Warp、Devin)在 Notion 内部作为共享上下文层进行操作。Cursor 扩展了云 Agent 功能,推出了完全配置的 开发环境,包括代码仓库克隆、依赖项管理、版本历史记录、回滚、受限出站访问以及隔离的密钥管理。 Agent 用户体验转向长期状态、流式传输和编排:Duet Agent 提出了一种针对持续 数周甚至数月 任务的基于状态机的控制框架。LangChain 的开源更新增加了流式类型投影、checkpoint 存储、代码解释器、harness 配置文件以及特定模型的调优功能。Tabracadabra 转型为上下文感知助手,而 VS Code 则引入了 Agent 窗口。生产级 Agent 越来越需要具备 持久化执行、可检查的中间状态以及工具原生 UI 界面。
模型训练、架构与数据效率
预训练效率与架构实验:Nous Research 的 Token 叠加训练 (TST) 修改了早期预训练阶段,使其在标准的下一个 token 预测之前读取/预测连续的 token 包;据报告,在无需更改推理架构的情况下,在相同 FLOPs 下实现了 2–3 倍的 实际运行加速,已在从 270M 到 3B 的密集模型 和 10B-A1B MoE 模型上得到验证。Jonas Geiping 等人发布了一篇关于 多流 LLM 的论文,声称降低了延迟并实现了更清晰的关注点分离,详见此处。δ-mem 提出了一种具有 8×8 状态的外部在线联想记忆,平均得分提升了 1.10 倍,并比基线高出 1.15 倍。 后训练/压缩与数据策展:NVIDIA 的 Star Elastic 声称,一次后训练运行即可衍生出一个推理模型系列,成本比预训练低 360 倍,且比 SOTA 压缩技术效果好 7 倍。Datology 的 VLM 工作表明,仅 数据策展 一项在 20 个基准测试中就能提升 11.7 分(基于 2B 模型),以 17 倍更少 的训练计算量击败了 InternVL3.5-2B 约 10 分,并且以比 Qwen3-VL-4B 低 3.3 倍 的响应 FLOPs 达到了接近前沿的 4B 性能。Marin 的目标是在其混合数据中达到 18T tokens。 开源评估与数据集:Kevin Li 的 SWE-ZERO-12M-trajectories 是目前最大的开源 Agent 轨迹数据集:包含 112B tokens、12M 轨迹、122K PR(Pull Request)、3K 仓库以及 16 种语言。Steve Rabinovich 和 Sayash Kapoor 指出,可信的 Agent 评估需要 日志分析,而不仅仅是基于结果的指标。
企业 AI 定价、平台竞争与分发
Anthropic 与 OpenAI 的企业竞争:Andrew Curran 引用的 Ramp 数据显示,4 月份 Anthropic 占据 34.4% 的份额,而 OpenAI 为 32.3%。ClaudeDevs 宣布付费 Claude 计划将获得专门用于编程用途的月度额度(Agent SDK、 claude -p、GitHub Actions)。此举因限制订阅补贴的控制框架而招致 Theo 等人的批评。Anthropic 部分回击,宣布在 7 月 13 日之前将 Claude Code 的每周额度提高 50%。OpenAI 的 Codex 企业激励措施:OpenAI Devs 和 Sam Altman 为转向使用的企业提供 两个月免费 Codex 使用权。OpenAI 发布了一份 Windows 沙箱设计,详细说明了本地用户、防火墙规则、ACL(访问控制列表)、写入受限 token、DPAPI(数据保护 API)以及辅助可执行文件,以确保安全的编码 Agent 执行。 企业运行时/安全保证:Perplexity 描述了一种具有 VPC 级隔离、短期代理 token 和操作前扫描的硬件隔离沙箱。Agent 供应商正在推销 有界执行环境。
自主科学、网络能力与机器人技术
递归自我改进:Recursive 启动,旨在构建自动化科学并进行自我改进的 AI。Adaption 的 AutoScientist 旨在自动化整个训练-研究循环。 网络能力:英国 AI 安全研究所指出,前沿模型的网络任务完成长度每隔几个月就会翻一番。Anthropic/Glasswing 的 Logan Graham 表示,Claude Mythos Preview 是首个解决 AISI 端到端网络靶场(Cooling Tower)并清除 2.5M token 限制下所有任务的模型。XBOW 发现了 数千个高/严重级别漏洞。 机器人部署:Figure 的 Brett Adcock 直播了人形机器人在包裹分拣上进行 8 小时自主轮班 的过程,使用了 Helix-02。机器人从摄像头像素进行推理,以与人类同等的速度(约 3 秒/包)运作,执行 端侧推理,作为车队进行协调,更换电池并进行自我诊断。
热门推文(按互动量排序)
Claude Code 定价/限制:ClaudeDevs 限制 & 额度;来自 @theo 的反弹。 Codex 企业推广:@sama & @OpenAIDevs。 Figure 的 8 小时轮班:@adcock_brett。 Cline SDK 发布:@cline。 Token 叠加训练:@NousResearch。
AI Reddit 社区热帖
LocalLlama + localLLM 回顾
1. 高效的端侧 LLM 推理
Needle:我们将 Gemini 工具调用蒸馏为一个 26M 模型:Cactus Compute 开源了 Needle,这是一个参数量为 26M的单次函数/工具调用模型,采用了“简单注意力网络”架构(注意力 + 门控,无 FFNs/MLPs)。它在200Btoken 上进行了预训练,并在2BGemini 合成 token 上进行了后训练,声称预填充速度可达6000 tok/s,解码速度为1200 tok/s。代码和权重已在 GitHub 和 Hugging Face 上以 MIT 许可证发布。讨论集中在其作为轻量级路由器的潜力,以及依赖外部知识的模型可能不需要 FFNs 这一架构含义。安全警告指出其中包含了pickle文件。Game Boy Color 上的 Transformer:Andrej Karpathy 的 TinyStories-260K 被转换为 INT8/定点格式,并在原版 Game Boy Color (TINYSTORIES Q8 GBC) 上运行。使用 GBDK-2020、用于权重的 MBC5 ROM 以及用于 KV 缓存的 SRAM。由于量化,生成速度缓慢且内容多为乱码,但预填充 + 自回归循环功能正常。源代码:github.com/maddiedreese/gbc-transformer。太阳能供电的 Qwen 3.6 服务器:一名用户在配备 32GB 内存的 M1 Max 上以约 ~10 tok/s的速度运行 Qwen 27B GGUF (UD-Q4_K_XL,100k上下文)。由3 × 100 W太阳能板和一个 Anker1.25 kW设备供电。功耗为~80–85 W(推理时)和≤5 W(空闲时)。停止浪费电力:在 RTX 4090 ( 262144上下文) 上使用llama.cpp运行Qwen3.6-27B受限于 GPU 功率上限。将功率限制降低至 40% 可以减少功耗,而对 解码 吞吐量的影响极小。预填充 速度下降15–20%(从 450W 降至 270W)。
2. 开源本地 Agent 界面
TextGen 原生桌面应用:oobabooga/TextGen 重构为一款便携的、免安装的 Electron 桌面应用,适用于 Windows/Linux/macOS。构建版本支持 CUDA、Vulkan、CPU、ROCm、Apple Silicon。功能包括 ik_llama.cpp支持、MCP 工具调用、网络搜索、PDF 提取以及兼容 OpenAI/Anthropic 的 API。源代码:AGPLv3 许可证,位于 oobabooga/textgen。让我们从零开始构建 claude code!:这是一个自定义 CLI 编码 Agent 的教程和仓库,品牌定为 “NANO CLAUDE” (YouTube,GitHub)。评论者警告了商标风险,并指出 opencode是一个现有的替代方案。
轻技术 AI Subreddit 回顾
1. 现实世界 AI Agent 的失败模式
从一位“氛围工程师”那里继承了一个 3 个月前的代码仓库:一个 PR diff 显示了 +10,197/−3,618,778行的变更。一个通过“Agent”方式构建的后端代码仓库积累了巨大的技术债(309k行代码,1M+行日志,220个大多未使用的处理程序)。作者在一周内使用 Claude 重写了它。讨论强调了 AI 生成技术债 的风险,以及 Agent 编程赞誉中的可信度差距。为婚礼客人准备的 AI 礼宾服务:一个为在 毛里求斯 举行的婚礼定制的礼宾服务(“Aido”),通过 API/MCP 连接。报告显示: 719次会话,8,678条消息,29位用户。使用情况:35% 为后勤咨询,25% 为 jailbreak(越狱)尝试。
上海一橙智能科技有限公司,是上海一橙网络科技股份有限公司旗下专注于AI与大模型应用落地的核心企业,提供从平台构建到AI场景化应用落地的全栈服务。聚焦大模型应用、数字人交互、语音图像分析等核心领域,打造了覆盖智能外呼、智能客服、智能知识管理、智能陪练、多模态交互、图像语音质检等场景的AI产品体系,已成功为通信、能源等领域头部央国企客户打造出多个AI落地应用。


夜雨聆风