شهدت الفترة الأخيرة تحولًا لافتًا في قدرات الذكاء الاصطناعي، مع انتقاله من مجرد تقديم النصائح وإتمام المهام البسيطة إلى العمل كوكلاء مستقلين يمكنهم اتخاذ قرارات وتكييف أنفسهم مع البيئات الجديدة. وكيل الذكاء الاصطناعي Operator من OpenAI يمثل خطوة محورية في هذا الاتجاه، حيث يعزز قدرات التفاعل مع واجهات الإنترنت والعمل بشكل مستقل.
واجهة الاستخدام الخاصة بـOperator تعرض الخطوات التي ينفذها بشكل شفاف مع إمكانية التدخل اليدوي من المستخدم في أي وقت.
القدرات التقنية وراء Operator
يعتمد Operator على نموذج Computer-Using Agent (CUA)، الذي يجمع بين القدرات البصرية والتحليلية لنماذج GPT-4o مع الاستدلال المتقدم.
أداء Operator في الاختبارات:
WebVoyager Benchmark: حقق نسبة نجاح 87% في التعامل مع مواقع ويب حقيقية مثل Amazon وGoogle Maps.
WebArena Benchmark: أظهر قدرة بنسبة 58.1% في أداء المهام الافتراضية.
OSWorld Benchmark: أحرز 38.1% في المهام المعقدة متعددة الخطوات.
النتائج: تفوق Operator في المهام الواقعية مقارنة بالبيئات الافتراضية، مما يعكس مدى تشابهه مع أساليب التعلم البشري.
كيفية الوصول إلى Operator
في الوقت الحالي، يتوفر Operator ضمن اشتراكات ChatGPT Pro بسعر 200 دولار شهريًا للمستخدمين في الولايات المتحدة، مع خطط مستقبلية لإتاحته عبر الاشتراكات الأخرى مثل Plus وTeam وEnterprise. كما سيتم توفير نموذج CUA عبر واجهة برمجة التطبيقات للمطورين لإنشاء وكلاء ذكاء اصطناعي مخصصة.
يمثل Operator بداية حقبة جديدة لوكلاء الذكاء الاصطناعي، حيث يتجاوزون دورهم التقليدي ليصبحوا أدوات قادرة على التنفيذ المستقل للمهام. ومع تقدم هذه التكنولوجيا، سنشهد زيادة في الإنتاجية والسرعة في إنجاز المهام اليومية، مما يجعل من المهم أن نتعلم كيفية الاستفادة من وكلاء الذكاء الاصطناعي بطريقة ذكية وفعالة.