كشفت شركة علي بابا الصينية عن ابتكار جديد يحمل اسم ZeroSearch، وهو نهج ثوري يسمح بتدريب أنظمة الذكاء الاصطناعي على مهارات البحث واسترجاع المعلومات دون الحاجة لاستخدام واجهات برمجة التطبيقات (APIs) الخاصة بمحركات البحث التقليدية مثل غوغل. هذا الابتكار يهدف إلى خفض التكاليف وتعزيز التحكم في عملية تدريب النماذج اللغوية الكبيرة (LLMs)، وذلك من خلال محاكاة عمليات البحث بدلاً من تنفيذها فعليًا على محركات حقيقية.
وتأتي “ZeroSearch” لتقدم حلاً فعّالًا عبر تحويل النموذج اللغوي إلى أداة بحث تولّد مستندات متعلقة وغير متعلقة استجابةً لاستعلامات المستخدم، مما يعزز كفاءته دون الاعتماد على خدمات خارجية.
أداء يفوق التوقعات.. ويتفوق على غوغل في بعض الحالات
بحسب تجارب عملية أجريت على سبع مجموعات بيانات للأسئلة والإجابات، لم تكتفِ تقنية ZeroSearch بمضاهاة أداء النماذج التي تعتمد على محركات البحث، بل تفوقت عليها في العديد من السيناريوهات.
نموذج يحتوي على 7 مليارات معلمة حقق نتائج مشابهة لمحرك بحث “غوغل”.
أما النموذج ذو 14 مليار معلمة فقد تفوق على غوغل من حيث دقة النتائج وجودة الاسترجاع.
انخفاض كبير في التكاليف: من 586 إلى 70 دولارًا فقط
وفقًا لتحليل الباحثين، فإن تنفيذ حوالي 64,000 استعلام بحث عبر واجهة “SerpAPI” الخاصة بغوغل قد يكلف ما يقارب 586.70 دولارًا، بينما لا تتجاوز تكلفة نفس العملية باستخدام نموذج “ZeroSearch” 70.80 دولارًا فقط، وهو ما يمثل تخفيضًا في التكلفة بنسبة 88%.
يرى باحثو علي بابا أن النماذج اللغوية الكبيرة، بفضل المعرفة التي اكتسبتها خلال مراحل التدريب المسبق، قادرة على توليد محتوى يرتقي إلى مستوى نتائج محركات البحث من خلال معالجة لغوية متقدمة دون اتصال مباشر بالإنترنت.
ويُتوقع أن تُحدث هذه التقنية نقلة نوعية في تدريب الذكاء الاصطناعي، خصوصاً للشركات الناشئة والمؤسسات التي تسعى لتقليل الاعتماد على خدمات البحث الخارجية ذات التكلفة العالية.