百度新OCR模型,4B参数完成文档理解.腾讯预告 HY 3.0,Agent 评测与本地推理继续推进|「03.19」AI技术进展
速看今日 AI 能力进展|文档理解 / 模型预告 / Agent 评测 / 本地推理 / 算力基础设施
百度把 OCR 继续往“单模型、一遍过、可直接部署”推进,文档理解门槛明显下降。腾讯在财报后的媒体沟通中预告 HY 3.0,将把推理和 Agent 能力继续往上拉。 Amazon 开始把 Agent 评测做成更系统的方法框架。是 Ollama 继续补本地推理和轻量运行侧的工程能力。英伟达 Isambard-AI 上线,算力底座还在继续往上堆。
百度
Qianfan-OCR 把表格、公式、图表和关键信息提取合进一个 4B 模型
百度新模型 Qianfan-OCR,这是一款4B 参数的端到端文档理解模型。它把表格提取、公式识别、图表理解和关键信息提取这些原本常常要拆成多步处理的任务,合进了一个模型里,一次推理就能完成。
以后文档理解这件事会变得更简单。以前这类系统往往要拼很多模块,现在如果一个模型就能做完,部署门槛、维护成本和出错点都会下降,对做票据、报表、论文、合同处理的团队会更友好。

除了模型本身,百度还给出了部署信息:4B 参数可以单卡运行,W8A8 量化下单张 A100 每秒可处理 1.024 页,而且只需要单个 vLLM 实例,不需要多阶段编排。
这让这条能力更新不只是“实验室里更强了”,而是更接近真正能用起来。很多时候,模型有没有价值,不只看它能做什么,还要看它需不需要很重的工程才能跑起来。百度这次把能力和部署一起给出来,实际意义会更强。
腾讯
腾讯预告 HY 3.0 将于 4 月推出,重点拉升推理和 Agent 能力
腾讯在财报发布后的媒体沟通中透露,HY 3.0 正在内部业务测试中,计划于 4 月对外推出。按照目前披露的信息,这会是混元模型的一次重大升级,相比 HY 2.0,推理和 Agent 能力会有明显提升。
这条虽然还是预告,不是正式发布,但价值不低。因为它说明国内大模型竞争已经不只是比聊天和生成,而是在往“推理更强、能做更多事的 Agent”这条路上加速靠拢。后面谁先把这类能力真正做成可体验、可调用的产品,谁就更容易抢到下一阶段的注意力。

Amazon
Strands Evals 把 Agent 评测做成更系统的框架
Amazon 这次放出的重点,不是新模型,而是一套更系统的 Agent 评测方法。Strands Evals 提供了案例、实验、评估器、用户模拟、多轮对话测试和工具调用评测这些能力,想解决的是:Agent 不像传统软件那样结果固定,应该怎么更稳定地衡量它到底好不好用。
这类变化对行业很重要,因为 Agent 现在最大的问题已经不只是“能不能跑”,而是“怎么知道它真的靠谱”。评测框架开始变成熟,意味着 Agent 正在从演示阶段往可交付、可上线、可持续优化的阶段走。

Ollama
Ollama 继续补本地推理工程能力,MLX、量化和 websearch 都在往前推
Ollama 这次更新看起来像一串工程项,但核心方向很清楚:
继续补本地和轻量运行能力。里面包括 MLX 相关优化、预量化 tensor packing、量化 embeddings、更快的 SwiGLU、运行时修复,以及给 OpenClaw 注册 websearch。
这类更新声量不一定最大,但它代表另一条很重要的路:不是所有 AI 能力都要往更大模型走,很多团队更在意的是能不能在本地、更轻、更便宜地跑起来。谁把这条路铺得更顺,谁就更容易吃到开发者和个人部署的长期需求。
夜雨聆风