A Mistral AI 2025. március 6-án bemutatta a Mistral OCR-t, egy fejlett dokumentum-értelmezési API-t, amely 1000 oldal feldolgozását kínálja 1 dollárért, kiemelkedő 94,89%-os pontossággal felülmúlva versenytársait.
A szolgáltatás képes komplex dokumentumok értelmezésére, beleértve a képeket, táblázatokat és matematikai képleteket, miközben megőrzi a dokumentum struktúráját és hierarchiáját. A technológia különösen hasznos lehet RAG (Retrieval Augmented Generation) rendszerekkel kombinálva, amelyek multimodális dokumentumokat dolgoznak fel. A Mistral OCR kiemelkedik a versenytársak közül teljesítményével – a hivatalos benchmark tesztek szerint 94,89%-os általános pontosságot ér el, szemben a Google Document AI 83,42%-os, az Azure OCR 89,52%-os és a GPT-4o 89,77%-os eredményével. A szolgáltatás többnyelvű funkciókat kínál, támogatva ezer különböző írást, betűtípust és nyelvet, 99,02%-os egyezési aránnyal a generálásban. A feldolgozási sebesség különösen figyelemre méltó, percenként akár 2000 oldal feldolgozására is képes.
A szolgáltatás széles körű alkalmazási lehetőségeket kínál, beleértve a tudományos kutatások digitalizálását, a történelmi és kulturális örökség megőrzését, valamint az ügyfélszolgálat optimalizálását. A Mistral OCR API ingyenesen kipróbálható a Le Chat platformon, valamint elérhető a La Plateforme fejlesztői felületen, és hamarosan a felhő és következtetési partnereknél, valamint helyszíni telepítéssel is. A dokumentumfájlok nem haladhatják meg az 50 MB-os méretet és nem lehetnek hosszabbak 1000 oldalnál, miközben a szolgáltatás ára versenyképes, mindössze 0,001 dollár oldalanként. A Mistral OCR már széles körben elérhető az üzleti felhasználók számára, és jelentős hatást gyakorolt számos iparágra, különösen a pénzügyi, jogi és egészségügyi szektorokban, ahol a dokumentumok pontos és gyors feldolgozása kritikus fontosságú.
Források:
1.

2.

3.
