أعلنت Google DeepMind عن إطلاق نموذجها الأحدث Gemini 2.5 Flash – المعروف داخليًا باسم nano-banana – ليشكل نقلة نوعية في عالم الذكاء الاصطناعي المخصص لتوليد الصور وتحريرها. يجمع هذا النموذج بين السرعة والجودة العالية والتحكم السلس، مما يجعله واحدًا من أقوى الأدوات المتاحة عالميًا في مجال تحرير الصور.
كل ما تحتاج معرفته عن Gemini 2.5 Flash ثورة جوجل الجديدة في توليد الصور وتحريرها
ركزت جوجل في هذا الإصدار على حل واحدة من أبرز التحديات في تحرير الصور بالذكاء الاصطناعي: الحفاظ على اتساق الشخصيات والعناصر الأساسية عند إنشاء صور متعددة لنفس العنصر. هذا التطوير يفتح الباب أمام استخدامات جديدة، مثل:
كل ما تحتاج معرفته عن Gemini 2.5 Flash ثورة جوجل الجديدة في توليد الصور وتحريرها
تجربة وضعيات مختلفة لشخص أو منتج واحد مع الحفاظ على الملامح الأصلية.
دمج صور متعددة في مشهد واحد متكامل، كإضافة مستخدم وحيوانه الأليف في صورة على ملعب رياضي.
إجراء تحرير متسلسل متعدد الخطوات (مثل إعادة تصميم غرفة فارغة، ثم إضافة مكتبة، ثم أثاث).
نقل التصاميم والأنماط بين الصور، مثل استلهام تصميم فستان من ألوان فراشة.
اتساق الهوية البصرية: مثالي للحملات الإعلانية والمنتجات التي تحتاج صورًا متعددة بنفس المظهر.
تحرير بالأوامر النصية: يمكن للمستخدم تعديل الصور باستخدام اللغة الطبيعية (طمس الخلفية، إزالة عناصر، تغيير الوضعيات، تلوين الصور القديمة…).
فهم عميق للسياق الواقعي: بفضل قاعدة معرفية موسعة، يستطيع النموذج تحويل الرسومات إلى مشاهد واقعية، ما يجعله مفيدًا لمجالات مثل تصميم الأزياء والديكور الداخلي.
دمج صور بدقة عالية: إدخال عدة صور وتحويلها إلى صورة تسويقية أو إبداعية واحدة.
يتوفر النموذج للشركات والمطورين بسعر 30 دولارًا لكل مليون رمز إخراج (Output Tokens). توليد صورة واحدة يعادل نحو 1290 رمزًا فقط، أي ما يقارب 0.039 دولار للصورة. أما عبر تطبيق Gemini، فيمكن للمستخدمين العاديين الاستفادة من القدرات مباشرة عبر الأوامر النصية. وتظهر كل صورة مُنشأة أو مُعدلة بعلامة مائية مرئية، إضافة إلى العلامة الرقمية غير المرئية SynthID للتأكد من مصدرها.