أخبار تقنية

OpenAI تكشف عن GPT-Image 1.5 جيل جديد من توليد الصور بدقة أعلى وسرعة قياسية

Published

on

أعلنت شركة OpenAI عن إطلاق نموذجها الأحدث لتوليد الصور GPT-Image 1.5، مؤكدةً أنه يمثل نقلة نوعية في فهم الأوامر النصية، ودقة التفاصيل البصرية، وسرعة التنفيذ مقارنةً بالإصدار السابق، في خطوة تعزز حضور الشركة في سوق نماذج الذكاء الاصطناعي التوليدية.

OpenAI تكشف عن GPT-Image 1.5 جيل جديد من توليد الصور بدقة أعلى وسرعة قياسية

بحسب OpenAI، يتميّز النموذج الجديد بسرعة معالجة تصل إلى أربعة أضعاف سرعة الإصدار السابق، ما ينعكس مباشرة على تجربة الاستخدام. وقد أصبح GPT-Image 1.5 متاحًا حاليًا لجميع مستخدمي ChatGPT، إلى جانب المطورين عبر واجهة البرمجة (API)، ما يفتح المجال أمام دمجه في تطبيقات وخدمات متنوعة.

OpenAI تكشف عن GPT-Image 1.5 جيل جديد من توليد الصور بدقة أعلى وسرعة قياسية

ChatGPT يتحول إلى منصة توليدية متكاملة

في سياق متصل، أوضحت فيدجي سيمو، الرئيسة التنفيذية لتطبيقات OpenAI، أن قدرات توليد الصور الجديدة تأتي ضمن تحوّل أوسع في دور ChatGPT، من مجرد أداة محادثة نصية إلى واجهة توليدية شاملة، قادرة على استدعاء المكوّنات المناسبة تلقائيًا وفقًا لما يرغب المستخدم في إنجازه.

تحرير بصري أدق واتساق أعلى

يوفّر GPT-Image 1.5 نهجًا أكثر تقدّمًا في تحرير الصور، حيث يتيح إجراء تعديلات دقيقة على عناصر محددة دون التأثير في بقية المشهد، مع الحفاظ على اتساق الإضاءة والتكوين والوجوه. ويدعم النموذج عمليات الإضافة والحذف والدمج والمزج ونقل العناصر داخل الصورة بسلاسة أكبر.

استخدامات احترافية ومتعددة

تشمل حالات الاستخدام التي يدعمها النموذج تحرير الصور الاحترافي، وتجارب القياس الافتراضي للملابس وتسريحات الشعر، إضافةً إلى التحويل بين الأساليب الفنية المختلفة. واستعرضت OpenAI أمثلة متقدمة، مثل دمج أشخاص وحيوانات أليفة من صور منفصلة في مشهد واحد، أو تحويل صورة عادية إلى ملصق سينمائي بطابع كلاسيكي.

التزام أعلى بالأوامر المعقّدة

أكّدت الشركة أن النموذج الجديد يُظهر التزامًا أكبر بالتعليمات التفصيلية والمعقّدة. ففي اختبار يتطلب ترتيب 36 عنصرًا داخل شبكة واحدة، نجح GPT-Image 1.5 في تنفيذ المهمة بدقة عالية، على عكس الإصدار السابق، ما يسهّل إنتاج صور تعتمد على توزيع دقيق للعناصر.

تحسّن في عرض النصوص داخل الصور

شهدت قدرة النموذج على تضمين النصوص داخل الصور تحسنًا ملحوظًا، بما في ذلك النصوص الصغيرة والكثيفة، مثل مقتطفات المقالات والجداول المختصرة والإنفوجرافيك الرقمي. ومع ذلك، أقرت OpenAI باستمرار بعض التحديات، مثل التعامل مع النصوص الطويلة، والخطوط غير الشائعة، وتعدد الوجوه في الصورة الواحدة، أو إنتاج محتوى بلغات متعددة.

منافسة قوية في سوق توليد الصور

في اختبارات داخلية لمشاهد فوتوغرافية معقّدة وغير مألوفة، أظهر GPT-Image 1.5 أداءً قويًا ومقاربًا لنموذج Google Nano Banana Pro، مع تفوق واضح على الإصدار السابق من OpenAI. ومع ذلك، تبقى التجربة الواقعية هي الفيصل في تحديد موقع النموذج الفعلي مقارنةً بمنافسيه في سوق سريع التطور.

Trending

Exit mobile version