法国大模型独角兽 Mistral AI 宣布推出 Mistral OCR,号称是「世界上最好的 OCR 模型」。
据介绍,Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。
与其他模型不同,Mistral OCR 能够以前所未有的准确度和认知能力理解文档的每个元素(媒体、文本、表格、公式)。它以图像和 PDF 作为输入,并从有序交错的文本和图像中提取内容。
因此,Mistral OCR 称得上一种理想的模型,可以与以多模式文档(如幻灯片或复杂 PDF)作为输入的 RAG 系统结合使用。
从现在开始,Mistral OCR 功能可以在 Le Chat 上免费试用。
Mistral AI 已经将它作为 le Chat 上数百万用户的默认文档理解模型,并以 1000 页 / 美元的价格发布了 API「mistral-ocr-latest」。
目前,该 API 已经在开发者套件 la Plateforme 上提供,并将很快提供给 Mistral AI 的云和推理合作伙伴,同时可以有选择地本地部署。
以上就是Mistral 发布 Mistral OCR,号称「世界上最好的 OCR 模型」的详细内容,更多请关注全栈开发网其它相关文章!