📖 产品简介
Mistral OCR 4 是法国 Mistral AI 于 2026/6/23-24 发布的新一代文档识别模型,**核心定位从传统的「文本提取」转向更具深度的「结构化文档理解」**。这是 Mistral 给 Document AI 栈配的「视觉前端」——不仅把字读出来,还能返回**段落级边界框(bounding box)+ 结构化块标签**(标题、表格、列表、公式、脚注等),把扫描件、PDF、图片直接变成「可被 LLM 直接消费的结构化数据」。
**覆盖 170 种语言**——这是它和 GPT-5.5 Pro / Gemini 3.1 Pro 等通用多模态相比最大的杀手锏:欧洲小语种、阿拉伯语、印地语、东南亚多种文字都能稳定识别。实测基准上**性能超过 GPT-5.5 Pro 与 Gemini 3.1 Pro 等主流多模态模型**(Mistral 官方榜单)。
**定价极具杀伤力**:API 基础调用**每千页 4 美元**(约 ¥30)、**批处理享 50% 折扣**降到 2 美元每千页;上层 **Document AI 套件每千页 5 美元**(包含 OCR + 结构化解析 + 工作流)——比 AWS Textract、Google Document AI、Azure Document Intelligence 等都更低,是想做 RAG 文档预处理、企业知识库、合同 / 票据 / 票据 / 财报解析的开发者的高性价比选项。
这是 Mistral 在「全栈大模型」与垂直 AI 公司双线夹击中找到的最锋利的差异化突破口——**欧洲 AI 切入文档智能赛道的标志性产品**。
⚡ 核心功能
- 段落级边界框:原生输出每段文字的精确边界框(bounding box),适合下游 PDF 重排 / 高亮 / 检索定位
- 结构化块标签:区分标题 / 段落 / 表格 / 列表 / 公式 / 脚注等结构块,直接喂给 LLM 不再丢失版式信息
- 覆盖 170 种语言:包含欧洲小语种、阿拉伯语、印地语、东南亚多种文字,跨国企业文档场景必备
- 性能领先 GPT-5.5 Pro:实测基准超过 GPT-5.5 Pro / Gemini 3.1 Pro 等通用多模态模型(官方榜单)
- API 每千页 4 美元:基础 API 调用 $4 / 千页,批处理享 50% 折扣降到 $2 / 千页
- Document AI 套件:$5 / 千页打包提供 OCR + 结构化解析 + 工作流,企业开箱即用
- Mistral 生态原生:与 Le Chat / Codestral / Mistral Large 等深度协同,欧洲合规友好
🎯 适合谁用
以下类型的用户会特别受益于 Mistral OCR 4:
- RAG 知识库的文档预处理(PDF / 扫描件 / 图片 → 结构化文本)
- 合同 / 财报 / 票据 / 发票解析
- 多语言文档(欧洲、中东、东南亚)批量数字化
- 学术论文 / 教科书的版式保留型 OCR
- 企业内部文档智能搜索 / 抽取 / 归档
- 对欧盟数据合规(GDPR / AI Act)有刚需的客户
✅ 优点亮点
- 段落级边界框 + 结构化块标签,输出可直接 LLM 消费
- 170 种语言覆盖,跨国企业刚需
- 实测性能超过 GPT-5.5 Pro / Gemini 3.1 Pro
- $4 / 千页(批处理 $2)的定价对企业级 OCR 是极强冲击
- 欧洲 AI 公司、对合规与数据主权敏感的客户友好
- Document AI 套件开箱即用,从 OCR 到结构化一站式
💰 价格与方案
**Mistral OCR 4 API**:$4 / 千页;**批处理** 50% 折扣,$2 / 千页。**Document AI 套件**:$5 / 千页(含 OCR + 结构化解析 + 工作流)。**自托管 / 企业版**:联系 Mistral 销售。
📝 总结与建议
Mistral OCR 4 是 2026 年 6 月最具杀伤力的 OCR / Document AI 发布——**段落级边界框 + 170 种语言 + 性能超 GPT-5.5 Pro + $4 / 千页**让它在 AWS Textract、Google Document AI、Azure Document Intelligence 等老牌对手面前显得性价比突出。如果你做 RAG 知识库、合同 / 财报 / 票据解析、多语言文档数字化,Mistral OCR 4 是当前最值得评估的选项之一;如果你已经深度使用 Gemini / GPT 多模态做 OCR,可以考虑用 Mistral OCR 4 把这部分剥离出来降低成本。
🕐 版本演进
- Mistral OCR 4 (2026-06-23):段落级 bounding box + 结构化块标签;170 种语言;性能超 GPT-5.5 Pro / Gemini 3.1 Pro;API $4 / 千页(批处理 $2);Document AI 套件 $5 / 千页