أعلنت شركة علي بابا الصينية عن إطلاق مجموعة نماذج ذكاء اصطناعي جديدة تحت اسم Qwen2.5-VL. يتميز هذا النموذج بقدراته الفائقة على تحليل النصوص والصور، وفهم مقاطع الفيديو، وتحليل المستندات. بالإضافة إلى ذلك، يُمكنه التحكم في الحواسيب والتطبيقات، مما يضعه في منافسة مباشرة مع أدوات حديثة مثل Operator من OpenAI.
علي بابا تُطلق Qwen2.5-VL نموذج ذكاء اصطناعي يتحكم في الحواسيب
وفقًا لاختبارات فريق Qwen، يتفوق النموذج الرئيسي في السلسلة Qwen2.5-VL-72B على نماذج بارزة مثل GPT-4o من OpenAI، وClaude 3.5 Sonnet من Anthropic، وGemini 2.0 Flash من Google. هذا التفوق يظهر في مجالات مثل فهم محتوى الفيديو، العمليات الحسابية، وتحليل المستندات.
علي بابا تُطلق Qwen2.5-VL نموذج ذكاء اصطناعي يتحكم في الحواسيب
ميزات مبتكرة وتجربة استخدام متعددة الأوجه
النماذج متاحة للتجربة عبر تطبيق Qwen Chat من علي بابا، أو للتنزيل من منصة Hugging Face. ومن أبرز ميزاتها:
تحليل البيانات المعقدة: مثل الرسوم البيانية والجداول والفواتير والنماذج الممسوحة ضوئيًا.
فهم محتوى الفيديو الطويل: بما يشمل التعرف على الشخصيات والأعمال الفنية والمنتجات.
التحكم في الأجهزة: سواء الحواسيب أو الهواتف المحمولة. وقد استعرض أحد الخبراء استخدام النموذج لحجز رحلة طيران عبر تطبيق “بوكينج”، مما يبرز قدرته على التعامل مع التطبيقات العملية.
تتضمن سلسلة Qwen2.5-VL نماذج بأحجام مختلفة، مثل Qwen2.5-VL-3B وQwen2.5-VL-7B، والمتاحة بموجب تراخيص متساهلة. أما النموذج الأكبر والأكثر تطورًا Qwen2.5-VL-72B، فيخضع لترخيص خاص يفرض على الشركات ذات القاعدة الكبيرة من المستخدمين النشطين شهريًا (أكثر من 100 مليون مستخدم) الحصول على موافقة خاصة لاستخدامه لأغراض تجارية.
مع إطلاق سلسلة Qwen2.5-VL، تُواصل علي بابا تعزيز مكانتها في سوق الذكاء الاصطناعي العالمي، بتقديم حلول مبتكرة تلبي احتياجات المستخدمين والمطورين. هذا الإطلاق يُشكل خطوة مهمة في المنافسة مع شركات أخرى مثل DeepSeek وOpenAI، مما يعزز من دور الصين في ريادة تقنيات الذكاء الاصطناعي.