كل المقالات

Mistral OCR 4: نموذج التعرف الضوئي الذي تفوّق على المنافسين في 72% من الاختبارات العمياء

عمر حسن4 يوليو 2026 في 12:36 م4 دقيقة للقراءة
Mistral OCR 4: نموذج التعرف الضوئي الذي تفوّق على المنافسين في 72% من الاختبارات العمياء

أبرز النقاط

  • فاز OCR 4 بنسبة 72% في اختبارات التفضيل العمياء أمام النماذج المنافسة
  • يدعم النموذج 170 لغة ويُصنّف عناصر المستند تلقائياً (عناوين، جداول، معادلات، توقيعات)
  • التسعير: 4 دولارات لكل 1000 صفحة، أو 2 دولار في وضع الدفعات

أعلنت شركة Mistral AI الفرنسية عن إطلاق OCR 4، أحدث نماذجها للتعرف الضوئي على النصوص، والذي حقق تفوقاً بنسبة 72% في اختبارات التفضيل العمياء التي أجراها مراجعون مستقلون على أكثر من 600 مستند مقارنةً بالنماذج المنافسة. هذا الإصدار يمثّل نقلة نوعية من مجرد استخراج النصوص إلى الفهم الدلالي لبنية المستندات.

Advertisement

ما الجديد في OCR 4 مقارنةً بالإصدارات السابقة؟

يتجاوز OCR 4 الوظيفة التقليدية لأدوات التعرف الضوئي. فبدلاً من استخراج النص الخام فحسب، يُحدد النموذج موقع كل عنصر على الصفحة ودوره الوظيفي: هل هو عنوان رئيسي، أم جدول بيانات، أم معادلة رياضية، أم توقيع؟ هذا التصنيف الذكي للكتل يُمكّن من تقسيم المستندات إلى أقسام ذات معنى تلقائياً.

يُخرج النموذج أيضاً درجات ثقة لكل كلمة أو صفحة يقرأها، مما يُتيح للمطورين معرفة مدى يقين النظام من نتائجه. هذه الميزة بالغة الأهمية للتطبيقات المؤسسية التي تتطلب دقة عالية في معالجة المستندات.

لماذا يُعد تصنيف العناصر مهماً لأنظمة RAG؟

تُعدّ ميزة تصنيف الكتل حاسمة لمن يبني أنظمة استرجاع المعلومات المعززة بالذكاء الاصطناعي (RAG). عندما يعرف النظام أن نصاً معيناً هو عنوان وليس فقرة عادية، أو أن مجموعة أرقام هي جدول وليست نصاً متتالياً، تتحسن جودة الفهرسة والاسترجاع بشكل ملحوظ.

  • تغذية أنظمة البحث المؤسسي بمستندات مُهيكلة بدقة
  • تمكين وكلاء الذكاء الاصطناعي من معالجة المستندات المعقدة
  • أتمتة استخراج البيانات من العقود والتقارير المالية
  • تحسين دقة الإجابات في تطبيقات المحادثة المبنية على المستندات
170 لغة
عدد اللغات التي يدعمها OCR 4، بما فيها اللغات الأقل انتشاراً

ما أنواع الملفات المدعومة وكيف يمكن الوصول للنموذج؟

يتعامل OCR 4 مع تشكيلة واسعة من صيغ المستندات تشمل ملفات PDF وWord وPowerPoint. النموذج متاح عبر واجهة برمجة التطبيقات (API) الخاصة بـ Mistral، ومنصة Mistral Studio، إضافةً إلى Microsoft Foundry.

واجهة منصة Mistral Studio لاستخدام نموذج OCR 4
واجهة منصة Mistral Studio لاستخدام نموذج OCR 4
Advertisement

كم يكلف استخدام OCR 4؟

حددت Mistral سعر الاستخدام بـ 4 دولارات لكل 1000 صفحة في الوضع العادي، أو 2 دولار فقط في وضع المعالجة الدفعية (batch mode). هذا التسعير يجعله منافساً لخدمات مثل Amazon Textract التي تبدأ من 1.5 دولار لكل 1000 صفحة للاستخراج الأساسي لكنها ترتفع كثيراً مع الميزات المتقدمة، وGoogle Document AI التي تتراوح أسعارها حسب نوع المعالجة المطلوبة.

72%
نسبة تفضيل المراجعين المستقلين لنتائج OCR 4 في اختبار أعمى شمل أكثر من 600 مستند

كيف أُجريت اختبارات المقارنة؟

أجرت Mistral اختباراً أعمى استعانت فيه بمراجعين مستقلين لتقييم أكثر من 600 مستند. عُرضت نتائج OCR 4 جنباً إلى جنب مع نتائج النماذج المنافسة دون الكشف عن هوية أي منها. في 72% من الحالات، فضّل المراجعون مخرجات OCR 4.

تدّعي الشركة أيضاً تفوق نموذجها على جميع المنافسين الذين اختُبروا في المقاييس المرجعية (benchmarks)، وإن كانت تفاصيل هذه المقاييس لم تُنشر بالكامل بعد.

ℹ️

رأي Logicity

دخول Mistral بقوة إلى سوق OCR المؤسسي يُصعّب المنافسة على اللاعبين الحاليين. ميزة تصنيف الكتل مع درجات الثقة تجعل OCR 4 جذاباً لبناة أنظمة RAG تحديداً. لكن السؤال الحقيقي: هل ستصمد نسبة الـ 72% أمام اختبارات مستقلة خارج نطاق الشركة؟ المنافسون مثل Amazon Textract وGoogle Document AI وAzure AI Document Intelligence يملكون تكاملات أعمق مع منظوماتهم السحابية، وهذا عامل حاسم للمؤسسات الكبرى.

الأسئلة الشائعة

ما الفرق بين OCR 4 والإصدارات السابقة من Mistral؟

يتميز OCR 4 بتصنيف العناصر تلقائياً (عناوين، جداول، معادلات، توقيعات) وإخراج درجات ثقة لكل كلمة، بينما كانت الإصدارات السابقة تستخرج النص الخام فقط.

هل يدعم OCR 4 اللغة العربية؟

يدعم النموذج 170 لغة بما فيها اللغات الأقل انتشاراً وفقاً لـ Mistral، لكن لم تُحدد الشركة صراحةً مستوى دقة اللغة العربية مقارنةً باللغات الأوروبية.

كم يكلف استخدام OCR 4 للشركات؟

4 دولارات لكل 1000 صفحة في الوضع العادي، أو 2 دولار في وضع المعالجة الدفعية عبر API.

ما أفضل استخدامات OCR 4 في المؤسسات؟

أتمتة معالجة العقود والفواتير، تغذية أنظمة البحث المؤسسي، بناء تطبيقات RAG، وتمكين وكلاء الذكاء الاصطناعي من قراءة المستندات المعقدة.

كيف يقارن سعر OCR 4 بالمنافسين؟

سعره تنافسي مقارنةً بـ Amazon Textract وGoogle Document AI، خاصةً في وضع الدفعات بسعر 2 دولار لكل 1000 صفحة.

ℹ️

هل تحتاج مساعدة في التطبيق؟

إذا كنت تبني نظام معالجة مستندات أو تطبيق RAG وتريد تقييم OCR 4 مقابل البدائل، تواصل مع فريق Logicity للحصول على استشارة تقنية مخصصة لاحتياجات مشروعك.

Advertisement
ع

عمر حسن

كاتب تقني وابتكار

أُنتِج هذا المقال بمساعدة الذكاء الاصطناعي وراجعه فريق التحرير في لوجيسيتي. اعرف المزيد في سياسة التحرير.

مقالات ذات صلة

اقرأ أيضاً