أعلن مارك زوكربيرغ، رئيس مجموعة ميتا، أن أداة “ميتا إيه آي” التي توفر إجابات على الأسئلة بلغة بسيطة وتتيح إنشاء الصور، قد جذبت 400 مليون مستخدم شهرياً منذ إطلاقها في أبريل.
وتُدمج “ميتا إيه آي” حالياً في شبكات التواصل الاجتماعي الشهيرة مثل فيسبوك وإنستغرام وواتساب ومسنجر، كما يمكن الوصول إليها عبر موقع مخصص.
من جهة أخرى، أعلنت شركة “أوبن إيه آي” أن واجهة “تشات جي بي تي” الشهيرة قد تجاوزت عتبة 200 مليون مستخدم أسبوعياً، وهو ما يمثل ضعف العدد الذي تم الإعلان عنه في نوفمبر الماضي.
في نفس السياق، أفادت شركة مايكروسوفت في نهاية يوليو أن 77 ألف عميل من أوساط الأعمال يستخدمون مساعد الذكاء الاصطناعي “كوبايلوت” Copilot، مما يعكس الانتشار الواسع لهذه التقنية.
على الرغم من هذا النمو الكبير، اختارت “ميتا” حالياً عدم تقديم واجهتها في المملكة المتحدة والاتحاد الأوروبي والبرازيل. وفي ظل هذا التوسع الملحوظ، تبرز واجهة “جيميناي” Gemini من جوجل كأحد الخيارات المفضلة الأخرى في منصات الذكاء الاصطناعي التوليدي.
أظهرت تجربة عملية أجراها أحد الباحثين في أمن التطبيقات فروقات ملحوظة بين نماذج الذكاء الاصطناعي الرائدة عند التعامل مع سيناريو يحاكي اختبار اختراق واقعي، حيث تفوق نموذج GPT-5.5 من حيث معدل النجاح، بينما برزت نماذج أخرى بقدرتها على خفض التكلفة أو التزامها بقيود السلامة.
دراسة عملية تقارن نماذج الذكاء الاصطناعي في اكتشاف الثغرات الأمنية GPT-5.5 يتصدر وGemini يتراجع
أجرى الباحث Kasra Rahjerdi التجربة باستخدام تطبيق تجريبي يحمل اسم Book Review، تم تصميمه ليحتوي على ثغرة أمنية مقصودة.
واعتمد السيناريو على وجود بيانات اعتماد خاصة بخدمة Firebase مكشوفة داخل ملف APK الخاص بالتطبيق، وهو ما يسمح بالوصول إلى قاعدة البيانات مباشرة وتجاوز بعض آليات الحماية الموجودة في واجهة البرمجة.
دراسة عملية تقارن نماذج الذكاء الاصطناعي في اكتشاف الثغرات الأمنية GPT-5.5 يتصدر وGemini يتراجع
أكثر من 12 نموذجًا تحت الاختبار
شملت الدراسة اختبار أكثر من 12 نموذج ذكاء اصطناعي مختلفًا، مع تخصيص ميزانية قدرها 10 دولارات لكل محاولة وسقف زمني يصل إلى ساعتين لكل اختبار.
وبلغ إجمالي الإنفاق على التجربة نحو 1500 دولار، بهدف قياس قدرة النماذج على تحليل التطبيق والوصول إلى نقطة الضعف الموجودة فيه.
GPT-5.5 يحقق أعلى معدل نجاح
بحسب نتائج التجربة، جاء GPT-5.5 في المركز الأول من حيث الأداء العام، إذ تمكن من إكمال المهمة بنجاح في 7 محاولات من أصل 10.
وأظهر النموذج قدرة على التركيز على المسار الصحيح للحل، حيث استطاع اكتشاف ثغرة Firebase بسرعة بعد تحليل التطبيق وتفكيك ملفاته، دون إهدار وقت كبير في فحص مكونات غير مرتبطة بالمشكلة الأساسية.
كما سجل تكلفة تقارب 9.46 دولارات لكل محاولة ناجحة، وهو ما يعكس توازنًا بين الكفاءة ومعدل النجاح المرتفع.
في المقابل، برز نموذج DeepSeek V4 Pro باعتباره الأكثر توفيرًا من الناحية الاقتصادية.
ورغم نجاحه في 3 محاولات فقط من أصل 10، فإن تكلفة الحل الناجح بلغت نحو 0.62 دولار، ما يجعله خيارًا منخفض التكلفة مقارنة بالنماذج الأعلى أداءً.
نتائج متواضعة لنماذج Claude
سجل كل من Claude Sonnet 4.6 وClaude Opus 4.8 نجاحًا محدودًا بواقع محاولتين ناجحتين لكل نموذج.
وأشار الباحث إلى أن Claude Opus اقترب من الوصول إلى الحل الصحيح في أكثر من مناسبة، إلا أن بعض المحاولات توقفت نتيجة تطبيق قيود السلامة المدمجة داخل النموذج.
على الجانب الآخر، جاءت نماذج Gemini في ذيل الترتيب خلال هذا الاختبار.
ووفقًا للتجربة، رفض Gemini تنفيذ العديد من الخطوات المطلوبة في أغلب المحاولات، وهو ما انعكس على انخفاض استهلاك الرموز مقارنة بباقي النماذج. كما أظهرت نسخة Gemini Flash سلوكًا مشابهًا مع عدد محدود جدًا من المحاولات المكتملة.
اختلافات في فلسفة التعامل مع المهام الأمنية
لاحظ الباحث وجود تباين واضح في طريقة تعامل النماذج مع السيناريو الأمني.
ففي حين أبدت بعض النماذج، خاصة الصينية منها، استعدادًا أكبر للتفاعل مع قواعد البيانات والمسارات التقنية المرتبطة بالاختبار، أظهرت بعض النماذج الغربية قدرًا أكبر من التحفظ حتى بعد تحديد المسار الصحيح للحل.
ويعكس ذلك اختلافًا في سياسات السلامة والقيود المفروضة على النماذج أكثر من كونه اختلافًا في القدرات التقنية البحتة.
أكد الباحث أن هذه النتائج لا تمثل دراسة علمية شاملة أو معيارًا رسميًا لتقييم نماذج الذكاء الاصطناعي، وإنما تجربة عملية موثقة تهدف إلى مراقبة سلوك النماذج في سيناريو محدد.
أثارت التعديلات الأخيرة التي طالت نظام التسعير والاستخدام في خدمة GitHub Copilot موجة من الجدل بين عدد من المشتركين، بعدما فوجئ بعض المستخدمين باستنفاد حصصهم الشهرية بوتيرة أسرع من المعتاد، الأمر الذي أدى في بعض الحالات إلى فقدان الوصول إلى مزايا الذكاء الاصطناعي داخل بيئات التطوير الخاصة بهم.
تغييرات GitHub Copilot الجديدة تثير استياء المطورين بعد استنزاف الحصص بشكل أسرع
تغييرات GitHub Copilot الجديدة تثير استياء المطورين بعد استنزاف الحصص بشكل أسرع
بدأت المشكلة بالظهور عقب تطبيق تحديثات جديدة على الخدمة مطلع يونيو، حيث اعتمدت الشركة آلية مختلفة لاحتساب الطلبات المرسلة إلى نماذج الذكاء الاصطناعي.
فبدلًا من احتساب كل طلب كوحدة استخدام واحدة كما كان الحال سابقًا، أصبحت بعض النماذج المتقدمة تستهلك عدة وحدات من الرصيد مقابل الطلب الواحد، وذلك وفقًا لمستوى التعقيد والموارد الحاسوبية اللازمة لمعالجة المهمة.
النماذج المتقدمة تستهلك الرصيد بوتيرة أعلى
أدى هذا التغيير إلى زيادة ملحوظة في استهلاك الحصص المخصصة للمستخدمين، خاصة أولئك الذين يعتمدون بشكل يومي على نماذج الاستدلال المتقدمة في البرمجة وتحليل الأكواد وإنجاز المهام المعقدة.
وبحسب تقارير المستخدمين، فقد نفدت الحصص الشهرية لدى بعض المشتركين خلال فترة أقصر بكثير من المتوقع، رغم عدم وجود تغيير كبير في أنماط استخدامهم المعتادة.
لم تتوقف المشكلة عند استهلاك الحصص فقط، إذ واجه عدد من المطورين صعوبات في شراء أرصدة إضافية بشكل فوري.
وترتبط هذه العقبات بعدة عوامل، من بينها عمر الحساب ومتطلبات التحقق وإعدادات الفوترة، ما أدى إلى توقف بعض الخدمات المدفوعة مؤقتًا إلى حين تجديد الحصة الشهرية أو ترقية خطة الاشتراك.
مايكروسوفت: التكاليف يجب أن تعكس الموارد المستخدمة
من جانبها، ترى Microsoft أن هذه التعديلات ضرورية لتحقيق توازن أفضل بين تكاليف التشغيل والاستخدام الفعلي للنماذج المتقدمة.
وتؤكد الشركة أن بعض نماذج الذكاء الاصطناعي تتطلب قدرات حاسوبية أكبر بكثير من النماذج التقليدية، وهو ما يستدعي اعتماد نظام تسعير أكثر ارتباطًا بحجم الموارد المستهلكة.
دفعت هذه التغييرات بعض فرق التطوير والمؤسسات التقنية إلى إعادة تقييم استراتيجيات استخدامها لأدوات الذكاء الاصطناعي، خاصة مع تحول التكلفة من نموذج ثابت نسبيًا إلى نموذج يعتمد بصورة أكبر على نوع النموذج المستخدم وطبيعة المهام المنفذة.
ويعتقد مراقبون أن هذه الخطوة قد تشجع المطورين على استخدام النماذج المتقدمة بشكل أكثر انتقائية، مع الاعتماد على النماذج الأقل تكلفة في المهام اليومية التي لا تتطلب قدرات استدلالية عالية.
تعكس التغييرات الأخيرة اتجاهًا متزايدًا داخل قطاع الذكاء الاصطناعي نحو ربط التكلفة الفعلية بمستوى الموارد الحاسوبية المطلوبة لكل مهمة، وهو نهج قد يصبح أكثر انتشارًا مع تزايد الاعتماد على النماذج المتقدمة وارتفاع تكاليف تشغيلها.
تشهد الصين تحولًا متسارعًا في طريقة استخدام الخدمات الرقمية، مع توجه كبرى شركات التكنولوجيا نحو استبدال تجربة التطبيقات التقليدية بوكلاء ذكاء اصطناعي قادرين على تنفيذ المهام اليومية من خلال المحادثة المباشرة، دون الحاجة إلى التنقل بين عشرات التطبيقات والواجهات المختلفة.
وكلاء الذكاء الاصطناعي يهددون هيمنة التطبيقات الصين ترسم ملامح الجيل القادم من الخدمات الرقمية
تتصدر شركتا علي بابا وتينسنت جهود تطوير هذا النموذج الجديد، حيث تعملان على بناء وكلاء ذكيين يستطيعون تنفيذ مجموعة واسعة من المهام اليومية، مثل طلب الطعام والتسوق وحجز الرحلات وإجراء المدفوعات، من خلال أوامر نصية بسيطة داخل المحادثات.
ويهدف هذا التوجه إلى تحويل الدردشة من وسيلة تواصل فقط إلى مركز متكامل لإدارة مختلف الأنشطة الرقمية.
وكلاء الذكاء الاصطناعي يهددون هيمنة التطبيقات الصين ترسم ملامح الجيل القادم من الخدمات الرقمية
Qwen.. مساعد ذكي يتجاوز حدود التطبيقات
تسعى علي بابا إلى تعزيز قدرات مساعدها الذكي Qwen ليصبح قادرًا على تنفيذ المهام التي كانت تتطلب سابقًا الانتقال بين تطبيقات متعددة، بدءًا من طلب الوجبات السريعة وحتى التخطيط للسفر وإدارة الحجوزات.
ويأتي ذلك في بيئة رقمية اعتاد فيها المستخدم الصيني على الاعتماد على التطبيقات الشاملة التي تجمع العديد من الخدمات داخل منصة واحدة، وعلى رأسها تطبيق WeChat الذي يوفر المراسلة والمدفوعات والتسوق وخدمات النقل والترفيه في مكان واحد.
انضمام العلامات التجارية إلى المنظومة الجديدة
وسّعت علي بابا نطاق مشروعها عبر إتاحة المجال أمام الشركات الخارجية لتطوير وكلائها الذكية داخل منظومة Qwen، حيث شاركت عدة علامات تجارية بارزة في المراحل التجريبية الأولى، من بينها KFC وLuckin Coffee وMixue وChina Eastern Airlines.
ويمنح هذا التوجه الشركات فرصة لتقديم خدماتها مباشرة عبر الذكاء الاصطناعي بدلًا من الاعتماد الكامل على التطبيقات التقليدية.
تُظهر النماذج التجريبية قدرة Qwen على تنفيذ سلسلة كاملة من الإجراءات من خلال طلب واحد فقط.
فعند طلب وجبة غذائية مثلًا، يستطيع المساعد تحديد أقرب فرع مناسب، واختيار طريقة الاستلام، والتحقق من العروض المتاحة، وتقدير زمن التجهيز، ثم إرسال الطلب مباشرة دون تدخل إضافي من المستخدم.
ويعكس ذلك رؤية علي بابا لتحويل الذكاء الاصطناعي إلى طبقة تشغيل ذكية تعمل فوق الخدمات الرقمية الحالية.
خدمات استباقية تعتمد على تفضيلات المستخدم
لا يقتصر دور الوكلاء الأذكياء على تنفيذ الأوامر، بل يمتد إلى اقتراح إجراءات وخدمات قبل أن يبدأ المستخدم بالبحث عنها.
فعلى سبيل المثال، يمكن لوكيل Luckin Coffee اقتراح طلب القهوة في الأوقات المناسبة لتجنب الازدحام، بينما يستطيع وكيل China Eastern Airlines تقديم خطط سفر تتوافق مع عادات المستخدم وتفضيلاته السابقة.
تينسنت تستعد لإطلاق وكيلها الذكي داخل WeChat
في المقابل، تعمل تينسنت على تطوير وكيل ذكاء اصطناعي خاص بها سيتم دمجه داخل تطبيق WeChat، مستفيدة من القاعدة الضخمة للمستخدمين الذين يعتمدون على التطبيق في مختلف تفاصيل حياتهم اليومية.
ومن المنتظر أن يتيح الوكيل الجديد تنفيذ مهام متعددة عبر رسالة واحدة، مثل حجز وسائل النقل، وإتمام المدفوعات، وتنظيم الرحلات، والوصول إلى الخدمات المصغرة المرتبطة بالتطبيق.
قد يؤدي انتشار الوكلاء الأذكياء إلى تغيير جذري في طريقة استخدام التطبيقات الرقمية، إذ لن يكون المستخدم مضطرًا للبحث عن الخدمة المطلوبة أو تذكر التطبيق المسؤول عنها، بل سيكتفي بإخبار الوكيل بما يريد، ليتولى الأخير اختيار الخدمة المناسبة وإتمام المهمة تلقائيًا.
التجارة الإلكترونية ساحة المنافسة الكبرى
عززت علي بابا بالفعل التكامل بين Qwen ومنصة Taobao، مما يسمح للمستخدمين بالبحث عن المنتجات ومقارنتها وإتمام عمليات الشراء مباشرة من خلال المحادثة.
ويمنح هذا التكامل الوكيل الذكي دورًا محوريًا في قطاع التجارة الإلكترونية، الذي يُعد أحد أكثر المجالات تنافسية في السوق الصينية.
الثقة.. التحدي الأكبر أمام الوكلاء الأذكياء
رغم الإمكانات الكبيرة التي توفرها هذه التقنيات، فإن نجاحها يعتمد بشكل أساسي على ثقة المستخدمين. فالأخطاء في اختيار المنتجات أو تجاهل العروض المناسبة أو حجز خدمات لا تتوافق مع التفضيلات الشخصية قد تدفع الكثيرين إلى الاستمرار في استخدام التطبيقات التقليدية.
لا يبدو أن التطبيقات الشاملة ستختفي بالكامل في المستقبل القريب، لكن دورها قد يتغير جذريًا. فبدلًا من أن تكون نقطة التفاعل المباشر مع المستخدم، قد تتحول إلى بنية خلفية تعمل بصمت، بينما يتولى الذكاء الاصطناعي إدارة العمليات وتنفيذ الأوامر نيابةً عن المستخدم.