أخبار تقنية

كل ما تحتاج معرفته عن Gemini 2.5 Flash ثورة جوجل الجديدة في توليد الصور وتحريرها

Published

on

أعلنت Google DeepMind عن إطلاق نموذجها الأحدث Gemini 2.5 Flash – المعروف داخليًا باسم nano-banana – ليشكل نقلة نوعية في عالم الذكاء الاصطناعي المخصص لتوليد الصور وتحريرها. يجمع هذا النموذج بين السرعة والجودة العالية والتحكم السلس، مما يجعله واحدًا من أقوى الأدوات المتاحة عالميًا في مجال تحرير الصور.

كل ما تحتاج معرفته عن Gemini 2.5 Flash ثورة جوجل الجديدة في توليد الصور وتحريرها

ركزت جوجل في هذا الإصدار على حل واحدة من أبرز التحديات في تحرير الصور بالذكاء الاصطناعي: الحفاظ على اتساق الشخصيات والعناصر الأساسية عند إنشاء صور متعددة لنفس العنصر. هذا التطوير يفتح الباب أمام استخدامات جديدة، مثل:

كل ما تحتاج معرفته عن Gemini 2.5 Flash ثورة جوجل الجديدة في توليد الصور وتحريرها

  • تجربة وضعيات مختلفة لشخص أو منتج واحد مع الحفاظ على الملامح الأصلية.

  • دمج صور متعددة في مشهد واحد متكامل، كإضافة مستخدم وحيوانه الأليف في صورة على ملعب رياضي.

  • إجراء تحرير متسلسل متعدد الخطوات (مثل إعادة تصميم غرفة فارغة، ثم إضافة مكتبة، ثم أثاث).

  • نقل التصاميم والأنماط بين الصور، مثل استلهام تصميم فستان من ألوان فراشة.

  • خلل خطير يضرب هواتف بيكسل 10 وغوغل تتعهد بالإصلاح أو الاستبدال

أبرز المزايا

  • اتساق الهوية البصرية: مثالي للحملات الإعلانية والمنتجات التي تحتاج صورًا متعددة بنفس المظهر.

  • تحرير بالأوامر النصية: يمكن للمستخدم تعديل الصور باستخدام اللغة الطبيعية (طمس الخلفية، إزالة عناصر، تغيير الوضعيات، تلوين الصور القديمة…).

  • فهم عميق للسياق الواقعي: بفضل قاعدة معرفية موسعة، يستطيع النموذج تحويل الرسومات إلى مشاهد واقعية، ما يجعله مفيدًا لمجالات مثل تصميم الأزياء والديكور الداخلي.

  • دمج صور بدقة عالية: إدخال عدة صور وتحويلها إلى صورة تسويقية أو إبداعية واحدة.

  • الصين تُلزم المنصات الرقمية بتصنيف المحتوى المُولّد بالذكاء الاصطناعي

التسعير والتوافر

يتوفر النموذج للشركات والمطورين بسعر 30 دولارًا لكل مليون رمز إخراج (Output Tokens). توليد صورة واحدة يعادل نحو 1290 رمزًا فقط، أي ما يقارب 0.039 دولار للصورة.
أما عبر تطبيق Gemini، فيمكن للمستخدمين العاديين الاستفادة من القدرات مباشرة عبر الأوامر النصية. وتظهر كل صورة مُنشأة أو مُعدلة بعلامة مائية مرئية، إضافة إلى العلامة الرقمية غير المرئية SynthID للتأكد من مصدرها.

أمثلة عملية

جوجل عرضت عدة أمثلة عملية لقدرات النموذج، منها:

  • تحويل غطاء الرأس إلى زهور حمراء.

  • إنشاء خمس صور لشخصية واحدة بملابس مختلفة من الثمانينيات.

  • إظهار شخص واحد في أدوار مهنية متعددة (معلم، نحات، ممرض، خباز).

  • دمج صورتين معًا أو جعل رجل يحتضن كلبه.

  • إعادة تلوين عناصر، مثل تغيير الأزرق إلى الأخضر.

  • تعديل مشاهد كاملة بإضافة عناصر (أحواض زهور، أجواء خريفية أو شتوية).

  • إعادة ترميم الصور القديمة أو إعادة تصميم غرفة وفق عينات ألوان محددة.

Trending

Exit mobile version