AI基础设施日报
🔥 头条
1. GLM-5 登顶 GitHub 全站热榜,主打"从 Vibe Coding 到 Agentic Engineering",并放出 5.2/5.1 系列;Unsloth 同日支持 GLM-5.2 及 3 倍长上下文微调。
2. SAC:面向稀疏注意力 LLM 的 CXL 解耦式 KV Cache 系统,长上下文推理降本新方向,与 Mooncake/Dynamo 的 PD 分离思路一脉相承。
3. ARGUS:万卡级(>10000 GPU)生产集群链路追踪与性能诊断框架,瞄准大规模训练可观测性痛点。
🔧 推理与硬件
· imec/ASML/TSMC 在 300mm 晶圆以 50nm 间距制成互补 2D 材料晶体管,逼近后硅时代。
· Tensordyne 押注对数运算(用加法替代乘法)挑战 Nvidia。
· Intel Foundry 挖角前 SK 海力士掌门主管先进封装。
· 开源发布:Unsloth 支持 GLM-5.2;OpenAI Agents SDK v0.17.6 新增工具预审批 guardrails;AWS Bedrock AgentCore Web Search 正式 GA。
🆕 新项目雷达
· Kaelio/ktx(★1307)面向数据/分析智能体的可执行上下文层。
· mohitsoni48/Turbo-LLM(★40)按 GPU 自动调优运行本地 LLM。
· 热榜:zai-org/GLM-5、withastro/flue(Agent Harness)、livekit/agents(实时语音 Agent)。
📄 值得读的论文还包括:Online Dynamic Batching for LLM Training、边缘端 LoRA 微调显存削减、SPSD 边缘提示压缩。
夜雨聆风