Mistral发布OCR4:更强的文档识别,和翻了四倍的价格

Mistral OCR 4官方发布页(mistral.ai,2026-06-23)
Mistral又把OCR模型更新了一版,这回叫OCR4。6月23日发的,模型名mistral-ocr-latest。我盯着它的发布页看了半天,最在意的反而不是benchmark分数,是价格——它一边说自己更强,一边把价格翻了倍。
先把事情说清楚。OCR这门技术,简单讲就是把PDF、扫描件、照片里的字认出来,变成机器能读、能检索的结构化文本。听着不性感,但它是现在AI落地最实在的一环:企业那堆合同、发票、报表、老档案,得先被机器读进去,后面的搜索、RAG、问答才有东西可吃。最近这块特别热,百度刚推过Unlimited-OCR,各家都在卷。Mistral这次的OCR4,是它在这条线上的第四代。

纸质文档的录入与整理,正是OCR要替人省下的活。图:Fred Bell/公有领域
它到底强在哪
官方给的卖点,核心是”结构化输出”。过去OCR吐给你的是一大段文字,OCR4不一样,它会标出每块内容在页面上的坐标框(bounding box),还会给每一块打上类型标签——这是标题、这是表格、这是公式、这是签名,分得清清楚楚。更细的是,它给每一页、甚至每一个词都附了置信度分数,等于告诉你”这个字我有几成把握认对了”。对要做企业级文档处理的人来说,这个置信度比单纯认字更值钱,因为你能据此决定哪些地方需要人工复核。
语言支持也铺得很广,号称覆盖170种语言、10个语系,里面特意点了印地语、日语、格鲁吉亚语、孟加拉语、亚美尼亚语、希伯来语、泰米尔语这些平时没人管的小语种。格式上吃PDF、DOC、PPT和OpenDocument。部署方式给了两条路:一条走云端API(Mistral Studio、亚马逊SageMaker、微软Foundry都能调),另一条是单容器自托管,整个塞进自己机房——对那些数据不能出门的金融、医疗、政府客户,这条自托管的路是刚需。
分数和价格,得放一起看
benchmark这块,OCR4在OlmOCRBench上拿了85.20,是榜单最高分;OmniDocBench上是93.07。Mistral还做了一组盲测,找独立标注员把OCR4和市面上各家领先的OCR、文档AI系统两两对比,OCR4的平均胜率是72%。客户那边给的引用更具体:一家叫Anaqua的说,比原来用的供应商”每页快4倍”;另一家Rogo说,对比那些走Agent的文档解析方案,”成本低8倍、延迟低17倍”。
不过这些数字我得替读者打个折。OlmOCRBench和OmniDocBench这类榜单,本身在某些输出的打分方式上是有已知缺陷的,一个汇总分既可能高估也可能低估真实表现。有第三方做过更细的对照:在多页文档(DUDE)上,微软Azure的Document Intelligence和Mistral OCR打成平手;但在单页表单(DocVQA)上,Azure反而比Mistral高出3.3个百分点。所以”SOTA”这顶帽子,分场景戴。
真正让我皱眉的是定价。OCR4标准API是每1000页4美元,批量API打五折,2美元一千页;另外那个无代码的Document AI是5美元一千页。单看不贵,问题在趋势——Mistral第一代OCR在2025年3月发布时,是1美元一千页;去年12月的OCR3涨到2美元;现在OCR4直接4美元。一年多时间,标准价翻了四倍。模型确实更强了,但”document AI白菜价”那套故事,正在被它自己一步步改写。

海量纸面资料数字化,是OCR的主战场。图:Lauri Veerde/CC BY-SA 4.0
我怎么看
OCR4这一版,技术上我是认可的。带坐标、带类型、带置信度的结构化输出,正好卡在企业最需要的地方——它不只是”把字认出来”,而是把一份文档拆成机器能直接消化的零件,喂给后面的搜索和RAG。能自托管这一点,对中国和欧洲那些数据敏感的客户尤其关键,这是很多纯API厂商给不了的。
但我不太喜欢只看那个72%胜率和85.20的高分就下结论。盲测是Mistral自己组织的,胜率这种东西,比的样本和评判标准都在出题人手里。倒是第三方那组Azure的对照更有参考价值——在单页表单上慢了3.3个百分点,说明它不是哪儿都无敌,老牌的文档智能服务在某些细分场景依然能打。
价格这条线,我觉得才是OCR4最该被讨论的地方。一年从1美元涨到4美元,方向已经很明确:Mistral不再想当那个用低价砸市场的搅局者,而是认定文档智能这块愿意为质量买单的客户够多,开始往上提价、往高端走。这对它自己是好事,毛利更舒服;但对盯着成本算账的中小团队,得重新掂量——OCR4更强没错,可你那点活,是不是真用得上这第四代,还是OCR3甚至开源方案就够了。技术领先和性价比领先,从来不是一回事,OCR4这次很清楚地选了前者。
资料来源:Mistral AI官方发布页mistral.ai/news/ocr-4/(2026-06-23)、CryptoBriefing、AI Weekly、第三方Azure OCR对照评测,及Mistral历代OCR定价公开资料。基准分数为厂商自报,定价以官网为准。
一年价格翻四倍还往上走,你会为OCR4这种结构化能力多掏钱,还是宁可用便宜的旧版?说说你的账怎么算。
夜雨聆风