أعلنت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن إطلاق نموذجها الجديد متعدد الوسائط DeepSeek-OCR، الذي يهدف إلى ضغط النصوص البصرية المعقدة باستخدام عدد أقل من الرموز النصية دون فقدان المعلومات الأساسية.
ويُعد هذا الابتكار من أبرز التطورات في تقنيات الذكاء الاصطناعي خلال عام 2025، إذ يجمع بين الإدراك البصري والتحليل اللغوي المتقدم لمعالجة المستندات الكبيرة مثل الجداول، الصيغ الرياضية، والمخططات الهندسية.
مكونات النظام وآلية عمله
يتكون نموذج DeepSeek-OCR من مكونين رئيسيين:
- DeepEncoder: يعمل كمحرك أساسي لضغط النصوص مع الحفاظ على المعنى والدقة.
- DeepSeek3B-MoE-A570M: وحدة فك تشفير تعتمد على بنية “مزيج الخبراء” (Mixture of Experts – MoE)، حيث توزّع المهام على شبكات فرعية متخصصة لتحقيق أعلى كفاءة في المعالجة.
ووفقاً للشركة، يعتمد النظام على آلية الإدراك البصري كأداة أساسية لضغط المعلومات، مما يتيح تقليص حجم البيانات النصية دون التأثير في قدرتها على الفهم أو التحليل.
نتائج الأداء والتطبيقات العملية
بيّنت نتائج الاختبارات أن النموذج حقق:
- دقة 97٪ عند ضغط النصوص بنسبة 10 أضعاف.
- دقة 60٪ عند ضغط بنسبة 20 ضعفاً.
هذه النتائج تبرز قدرة DeepSeek-OCR على الحفاظ على كفاءة عالية حتى في عمليات الضغط المكثفة، ما يجعله مناسباً للاستخدام في:
- المجال المالي لتحليل البيانات المعقدة.
- القطاع الأكاديمي لمعالجة الأبحاث والمخططات.
- الهندسة والعلوم التطبيقية التي تتطلب دقة عالية في قراءة الجداول والصيغ.
آفاق مستقبلية لتقنيات ضغط النصوص البصرية

تسعى شركة DeepSeek إلى تطوير مزيد من النماذج المعتمدة على الذكاء الاصطناعي متعددة الوسائط خلال عام 2026، مع تركيز خاص على دمج تقنيات OCR الذكية في أنظمة الأعمال الضخمة.
ويرى خبراء التكنولوجيا أن هذا الابتكار قد يمهد الطريق أمام ثورة في إدارة البيانات والمحتوى البصري، خصوصاً في المؤسسات التي تتعامل مع ملايين الوثائق الرقمية يومياً.