Daily AI Briefing
AI深度信号
2026-06-26 · AI资讯深度解读
今日速览
今天对 AI 开发者最实用的工具是 MinerU v3.4——一个把 PDF 转成 Agent 可读 Markdown 的开源引擎,OCR 准确率 95%+,直接提供 MCP Server 让 Claude Code/Cursor 调用。同时 AWS 正式发布了 Agent Toolkit——40+ Skills、15000+ API 的官方工具包。另外三条:IBM 发布了亚纳米芯片技术、演语科技成为中国首个 3 亿美元 ARR 的 AI 应用独角兽、OpenKnowledge 给 Obsidian/Notion 提供了一个开源的 AI 原生替代品。
MinerU v3.4:PDF 转 Agent 可读 Markdown,准确率 95%+
6 月 18 日,OpenDataLab 的 MinerU 发布了 v3.4 版本。这不是一个普通的 PDF 解析器——它是专门为 LLM、RAG 和 Agent 工作流设计的文档上下文引擎。
项目地址:https://github.com/opendatalab/MinerU
核心能力:把 PDF、DOCX、PPTX、图片等复杂文档转成结构化的 Markdown/JSON——保留表格(转 HTML)、公式(转 LaTeX)、阅读顺序、多栏布局,自动去除页眉页脚。v3.4 升级了 PP-OCRv6,OCR 准确率提升约 11%,速度翻倍。双引擎架构:Pipeline(CPU,85.75%)和 VLM(GPU,95.30%),v3.3 新增 Hybrid 混合模式在两者之间取平衡。
对 Agent 开发者最实用的是:它提供 MCP Server——Claude Desktop、Cursor 等可以直接把它作为工具调用,Agent 说"读这个 PDF"就能拿到结构化 Markdown。也原生集成 LangChain、LlamaIndex、Dify、FastGPT、RAGFlow 等 RAG 链路。109 种语言的 OCR 识别、跨页表格合并、阅读顺序恢复——这些都是传统 PDF 解析器做不到的。
💡 解读把 PDF 直接塞给 Agent 是很多开发者踩过的坑——Agent 看到的是一堆乱码或者丢失了表格/公式/排版结构。MinerU 的价值在于"预处理"——在文档进入 Agent 上下文之前先把它变成 Agent 真正能理解的结构化格式。v3.4 的 Hybrid 模式解决了 GPU 成本和精度之间的取舍,对个人开发者更友好。如果你在做 RAG 或者 Agent 知识库,先把 PDF 过一遍 MinerU 再喂给 Agent,效果提升是立竿见影的。
AWS 发布 Agent Toolkit:40+ Skills,让你的 Agent 不再幻觉 AWS API
6 月初正式 GA 的 AWS Agent Toolkit 是 AWS 官方维护的一套开源(Apache 2.0)工具包,专为 AI 编程 Agent 设计。
项目地址:https://github.com/aws/agent-toolkit-for-aws
核心包括四个组件:
AWS MCP Server:一个托管的 MCP 服务器,通过单个端点提供对 15000+ AWS API 的安全访问,外加沙箱化 Python 执行和实时文档搜索。6 月 5 日新增了跨账户/跨角色访问——Agent 可以在单个会话中切换多个 AWS 账户,无需重启。
Agent Skills:40+ 个按需加载的技能包,覆盖存储、网络、Serverless、容器等 AWS 服务。Agent 不会一次性加载所有技能(浪费上下文),而是在需要时才拉取对应的指令和参考文档。
Plugins:一键安装的插件包,捆绑了 MCP Server 配置 + 精选技能。已上架的有 aws-core、aws-agents、aws-data-analytics、aws-agents-for-devsecops 等。Claude Code 用户直接 /plugin install aws-core@claude-plugins-official 即可。
安全控制:支持 IAM 条件键区分 Agent 操作和人类操作——你可以让 Agent 的底层角色有写权限,但通过 aws:ViaAWSMCPService 条件限制 Agent 只能读。所有 MCP Server 调用都记录到 CloudTrail,可审计。
💡 解读这是 AWS 在 Agent 时代最重要的开发者工具发布。之前让 Agent 操作 AWS 的最大痛点是——Agent 会幻觉 API 名称、参数格式、权限范围。AWS Agent Toolkit 从根本上解决了这个问题:不是让 Agent 自己猜怎么调 API,而是给它一份官方维护的、实时更新的"使用说明书"。40+ Skills 的按需加载设计也很聪明——Agent 上下文窗口有限,不可能把所有 AWS 文档塞进去。
IBM 发布全球首个亚纳米芯片:3D 纳米堆叠突破物理极限
6 月 25 日,IBM 发布了"纳米堆叠"(nanostack)3D 芯片架构,将芯片制程推进到 1 纳米以下——突破了长期以来被认为不可逾越的硅基芯片物理极限。
传统芯片制程的瓶颈在于:当晶体管缩小到 2-3 纳米时,量子隧穿效应让电子不再受控——它们会直接"穿过"晶体管栅极,导致漏电和发热失控。这就是为什么业界在 2nm 节点之后普遍认为摩尔定律走到了尽头。
IBM 的方案不是继续缩小晶体管——而是向三维空间要密度。纳米堆叠把多个超薄芯片层垂直堆叠,层间通过纳米级互连通孔(inter-via)实现电连接和数据传输。每一层可以用成熟的 3nm 或 5nm 制程制造,堆叠 3-4 层后的整体晶体管密度等效于 1nm 以下节点。更重要的是,这种方法不需要依赖 ASML 下一代 EUV 光刻机——现有设备就能造。首个应用场景是 AI 推理芯片。
💡 解读这是摩尔定律的"第二曲线"。不是靠光刻精度——是靠立体架构。IBM 历史上一直是半导体基础技术的输出方(FinFET、EUV、铜互连都来自 IBM Research),这次纳米堆叠的路线大概率也会通过授权进入台积电和三星的产线。如果量产验证通过,AI 推理芯片的成本结构将发生根本变化。
演语科技成中国首个 3 亿美元 ARR 的 AI 应用独角兽
6 月 25 日,演语科技(Evoken)宣布完成近 3 亿美元 B+ 轮融资,由 Granite Asia、腾讯、顺为资本联合领投,HT Investment、时代资本跟投。老股东高榕、蚂蚁、红杉中国、源码、渶策、明势持续加码。投后估值超 20 亿美元。同日披露 ARR 超 3 亿美元,同比增长超 3000%。
演语科技旗下有三款产品。LiblibAI 是一站式 AI 创意社区,累计用户超 3000 万,原创模型超 50 万个,中国每 3 个设计师中就有 1 个在使用。LibTV 是专业 AI 视频创作工具,今年 3 月上线,首月单日收入即破百万美元,5 月收入达到首月的 13 倍。星流是 AI 设计 Agent,累计服务用户超千万。它的模式值得注意:不做底层大模型,三款产品都在应用层调用外部模型,核心壁垒是产品体验和商业化闭环。
💡 解读中国 AI 行业有个悖论:底层模型在追平美国,但应用层的价值长期被低估。演语科技 3 亿美元 ARR 是一个有力的反例——不做模型、不烧钱训参数、不跟 OpenAI 拼 benchmark,就做产品。3000% 的年增速说明 C 端用户对 AI 应用的付费意愿不是"有没有"的问题——是"好不好用"的问题。
OpenKnowledge:开源 AI 原生笔记,Obsidian/Notion 替代品
6 月 25 日登上 HN 首页的 OpenKnowledge 是 Inkeep 团队开发的一个本地优先的开源 Markdown 编辑器兼 LLM wiki。直接对标 Obsidian 和 Notion,但核心差异在于:AI 不是插件——是原生内置的。
项目地址:https://github.com/inkeep/open-knowledge
核心功能:WYSIWYG Markdown 编辑(基于 Tiptap+ProseMirror,类似 Notion 的富文本体验但底层是纯 Markdown)、AI 辅助写作和编辑、基于知识库的 RAG 问答、自动标签和反向链接。17 个 MCP 工具让 Claude Code 等 Agent 可以直接读写你的笔记库。支持直接打开已有的 Obsidian vault。Git 原生的团队共享和 CRDT 实时协作。CLI 安装:npm install -g @inkeep/open-knowledge && ok init && ok start。
💡 解读OpenKnowledge 解决了一个真实需求:我的笔记应该是 Agent 可以直接读写的知识库,而不是一个 Agent 访问不到的封闭系统。当 Claude Code 通过 MCP 协议直接搜索和引用你的笔记时,笔记工具就从"个人知识管理"变成了"Agent 的外部记忆"。GPL-3.0 开源、本地 Markdown 存储、不用 Obsidian 的付费同步——对个人开发者来说门槛为零。
今日小结
今天的五条从四个维度展示了 AI 开发者生态的成熟:MinerU 在数据层让 PDF 变成 Agent 可消费的结构化输入,AWS Agent Toolkit 在基础设施层解决了 Agent 调用云服务的"幻觉"问题,OpenKnowledge 在个人工具层让笔记变成 Agent 可读写的知识库,IBM 芯片和演语科技则从硬件和商业两个方向证明了 AI 不是一个泡沫——底层有芯片突破,上层有真金白银的 ARR。
觉得有用?
如果今天的资讯对你有价值,欢迎点赞、在看、转发,让更多人看到。

长按识别二维码 · 关注「AI深度信号」
每天早上 8:30 · AI 资讯深度解读
夜雨聆风