أخبار الانترنت

أنثروبيك تطلق Claude Opus 4.5 قفزة جديدة في ذكاء البرمجة ووكلاء المهام الذكية

Published

on

أزاحت شركة أنثروبيك الستار عن نموذجها الأحدث Claude Opus 4.5، الذي تقدّمه بوصفه واحدًا من أقوى نماذج الذكاء الاصطناعي المتخصصة في البرمجة وإدارة الوكلاء الذكيين. وتؤكد الشركة أن النموذج الجديد يتفوّق في عدد من اختبارات البرمجة على أحدث إصدارات منافسيه، بما في ذلك Google Gemini 3، ما يجعله خطوة بارزة في سباق تطوير نماذج الذكاء الاصطناعي المتقدمة.

أنثروبيك تطلق Claude Opus 4.5 قفزة جديدة في ذكاء البرمجة ووكلاء المهام الذكية

ورغم القدرات الكبيرة للنموذج، فإن Opus 4.5 لم يحقق بعد انتشارًا واسعًا على منصة LMArena المخصصة لتقييم نماذج الذكاء الاصطناعي. كما ما تزال التحديات الأمنية المرتبطة بوكلاء الذكاء الاصطناعي تشكّل عقبة مهمة، وخصوصًا تلك المتعلقة بالمهام التي تُنفّذ تلقائيًا نيابة عن المستخدم.

أنثروبيك تطلق Claude Opus 4.5 قفزة جديدة في ذكاء البرمجة ووكلاء المهام الذكية

تحسينات واسعة في البحث والوثائق والتكامل مع التطبيقات

تشير أنثروبيك إلى أن الإصدار الجديد يقدم تحسينات جوهرية مقارنة بالإصدار السابق، خصوصًا في:

  • مهارات البحث العميق

  • التعامل مع العروض التقديمية (Slides)

  • معالجة جداول البيانات بشكل متقدم

كما أعلنت الشركة عن مجموعة أدوات برمجية جديدة ضمن نموذج Claude Code الموجّه للمبرمجين. ويضاف إلى ذلك تحسينات في تطبيقات Claude الخاصة بالمستخدمين، والتي تشمل دعمًا أقوى للوكلاء الذكيين، وإمكانيات جديدة للعمل داخل Microsoft Excel، ومتصفح Chrome، وأجهزة الكمبيوتر المكتبية.

النموذج بات متاحًا اليوم عبر تطبيقات الشركة، وواجهات البرمجة (APIs)، ومنصات الخدمات السحابية.

تركيز مكثف على الأمان ومواجهة هجمات حقن الأوامر

في ظل المخاوف المتزايدة من إساءة استخدام الوكلاء الذكيين، ركزت أنثروبيك في هذا الإصدار على مواجهة الاستخدامات الخبيثة وهجمات حقن الأوامر (Prompt Injection)، التي تستغل تعليمات مخفية داخل مواقع أو بيانات معينة لتجاوز آليات الأمان أو الحصول على استجابات مضللة.

وتؤكد أنثروبيك أن Opus 4.5 “أكثر صمودًا أمام التضليل” مقارنةً بالنماذج المتقدمة الأخرى، مع الإقرار بأنه ليس محصنًا بشكل كامل، ولا تزال بعض الهجمات قادرة على اختراقه.

اختبارات صارمة تكشف تقدّم النموذج وحدوده

أجرت الشركة اختبارات داخلية وخارجية لقياس قدرة النموذج على التصدي للهجمات المحتملة في بيئات البرمجة والمتصفح والحاسوب.

أداء ممتاز عند رفض الطلبات المحظورة

وفقًا لتقييم متخصص في مجال البرمجة، صُمّم لاختبار استجابة النموذج لـ 150 طلبًا ضارًا محظورًا وفق سياسة أنثروبيك، فقد نجح Opus 4.5 في:

نتائج أقل قوة داخل منصة Claude Code

لكن عند تجربة النموذج ضمن بيئة Claude Code المتخصصة بالبرمجة، جاءت النتائج أضعف، إذ بلغت نسبة الرفض:

سباق مستمر لبناء نماذج قوية وآمنة

تكشف هذه النتائج – رغم التقدّم الواضح – عن استمرار التحدي الكبير أمام أنثروبيك وغيرها من شركات الذكاء الاصطناعي:
كيفية بناء نماذج قوية وقادرة على الإنجاز، وفي الوقت نفسه محمية بشكل كافٍ من الاختراق والاستغلال الخبيث.

Trending

Exit mobile version