Connect with us

الذكاء الاصطناعي

Stability AI تطلق نموذج Stable Video 4D لتوليد فيديوهات متعددة الزوايا

Avatar of هدير ابراهيم

Published

on

Stability AI تطلق نموذج Stable Video 4D لتوليد فيديوهات متعددة الزوايا

أطلقت شركة Stability AI نموذج ذكاء اصطناعي جديد يدعى نموذج Stable Video 4D يهدف إلى تحويل مقطع فيديو قصير إلى 8 مقاطع فيديو كل منها يظهر المشهد من زاوية مختلفة وفي الوقت الحالي يأخذ النموذج فيديو لبضع ثواني يحتوي على كائن واحد مثل سمكة وينتج 8 مقاطع فيديو لهذا الكائن من زوايا متنوعة.

النموذج متاح للتجربة والتقييم لأغراض البحث والتطوير على منصة Hugging Face ولم تعلن الشركة بعد عن خطة لإطلاقه بشكل تجاري.

مميزات نموذج Stable Video 4D

يتميز النموذج بتصميم جديد لآلية الانتباه حيث يأخذ في الاعتبار كل الإطارات المجاورة والزوايا المختلفة عند توليد كل إطار مما يجعل الإطارات المولدة أكثر انسجام واتساق من حيث الشكل وانسيابية الحركة.

رغم أن اسمه نموذج Stable Video 4D إلا أنه ينتج فيديوهات ثلاثية الأبعاد ديناميكية ويأتي الاسم لتمييزه عن النموذج السابق Stable Video 3D الذي يحول صورة أو نص إلى فيديو ثلاثي الأبعاد كما يتميز النموذج الجديد بأنه ينتج فيديوهات ديناميكية من زوايا متعددة حيث يضاف موقع الكاميرا إلى اعتباره وليس فقط الشكل والمظهر ثلاثي الأبعاد.

تطبيقات واستخدامات نموذج Stable Video 4D

يمكن استخدام هذا النموذج في صناعة الأفلام لإضافة تأثيرات بصرية وكذلك من قبل مطوري الألعاب لعرض الكائنات من زوايا مختلفة، كما يمكن أن يكون مفيداً في إنشاء العوالم الافتراضية.

تعمل الشركة حاليا على تحسين فعالية النموذج لتوليد مقاطع فيديو أطول وأكثر تعقيد تتضمن مشاهد متعددة.

التطبيقات المحتملة لنموذج Stable Video 4D

نموذج Stable Video 4D يعتبر خطوة متقدمة في مجال الذكاء الاصطناعي التوليدي حيث يمكن أن يستخدم لتطوير تطبيقات جديدة في مجالات متعددة فعلى سبيل المثال يمكن للنموذج أن يستخدم في تطوير تطبيقات التعليم الإلكتروني حيث يمكن للطلاب رؤية تجارب علمية أو عروض تعليمية من زوايا مختلفة مما يعزز من فهمهم للمحتوى.

في مجال التسويق والإعلانات يمكن للنموذج أن يحدث ثورة في كيفية عرض المنتجات حيث يمكن للمشاهدين رؤية المنتجات من جميع الزوايا دون الحاجة إلى التواجد الفعلي في المتجر وهذا يمكن الشركات من تقديم تجارب تفاعلية أكثر واقعية لعملائها.

كما يمكن أن يكون للنموذج تطبيقات في مجال الطب والرعاية الصحية حيث يمكن للأطباء استخدامه لعرض صور ثلاثية الأبعاد من زوايا مختلفة للأعضاء البشرية مما يسهل عملية التشخيص والعلاج.

تستطيع الشركات الناشئة في مجال التكنولوجيا استخدام النموذج لإنشاء محتوى تفاعلي جديد مثل تطبيقات الواقع الافتراضي والواقع المعزز حيث يمكن للمستخدمين التفاعل مع البيئة الافتراضية بشكل أكثر واقعية.

تعمل Stability AI على تحسين دقة النموذج ليتمكن من التعامل مع محتوى أكثر تعقيد مثل مشاهد تضم حركات متداخلة وكائنات متعددة وهذا التطوير يمكن أن يمكن النماذج المستقبلية من إنتاج محتوى بصري أكثر تفصيل وإثارة.

تحديثات دورية وأبحاث مكثفة

تخطط الشركة لإطلاق تحديثات دورية للنموذج تشمل تحسينات على أداء الذكاء الاصطناعي ودمج تقنيات جديدة لزيادة كفاءة توليد الفيديوهات كما تجري الشركة أبحاث مكثفة لتوسيع نطاق استخدام النموذج ليشمل تطبيقات جديدة ومبتكرة.

بتطبيق هذه التقنيات الحديثة ستتمكن الشركات والأفراد من الاستفادة من إمكانيات الذكاء الاصطناعي في خلق محتوى غني ومتعدد الزوايا مما يفتح آفاق جديدة للإبداع والابتكار في مختلف المجالات.

أخبار تقنية

AlphaEvolve نظام ذكاء اصطناعي من DeepMind يحدث ثورة في حل المسائل العلمية والرياضية

Avatar of هدير ابراهيم

Published

on

AlphaEvolve نظام ذكاء اصطناعي من DeepMind يحدث ثورة في حل المسائل العلمية والرياضية

أعلنت شركة DeepMind، التابعة لجوجل، عن إطلاق نظام ذكاء اصطناعي جديد يُدعى AlphaEvolve، مصمم لحل المسائل المعقدة في مجالات الرياضيات وعلوم الحوسبة. يعتمد AlphaEvolve على نماذج Gemini المتقدمة، ويتميز بقدرته على تطوير خوارزميات جديدة وتحسين البنية التحتية لتدريب نماذج الذكاء الاصطناعي داخل جوجل.

AlphaEvolve نظام ذكاء اصطناعي من DeepMind يحدث ثورة في حل المسائل العلمية والرياضية

يعتمد AlphaEvolve على نموذج لغوي كبير مدعوم بتقنيات تقييم آلي، حيث يقوم بتوليد حلول متعددة للمسائل المطروحة، ثم يُخضعها لتقييم داخلي للتحقق من صحتها ودقتها. تُستخدم هذه الآلية لتقليل ظاهرة “الهلوسة” التي تعاني منها النماذج اللغوية الحديثة، مما يُعزز من موثوقية النتائج.

AlphaEvolve نظام ذكاء اصطناعي من DeepMind يحدث ثورة في حل المسائل العلمية والرياضية

AlphaEvolve نظام ذكاء اصطناعي من DeepMind يحدث ثورة في حل المسائل العلمية والرياضية

إنجازات رياضية بارزة: تحسينات في مسائل معقدة

تمكن AlphaEvolve من إعادة اكتشاف أفضل الحلول المعروفة في 75% من مجموعة مختارة من 50 مسألة رياضية متنوعة، ونجح في اقتراح حلول محسّنة في 20% منها. من بين هذه الإنجازات، قدم النظام تحسينًا في مسألة “العدد التقبيل” (Kissing Number) في 11 بُعدًا، حيث زاد الحد الأدنى المعروف من 592 إلى 593.

تحسينات في البنية التحتية: كفاءة أعلى في مراكز البيانات

ساهم AlphaEvolve في تحسين كفاءة مراكز البيانات التابعة لجوجل، حيث ابتكر خوارزمية أدت إلى استرجاع ما نسبته 0.7% من الموارد الحاسوبية العالمية. كما اقترح تحسينات قللت زمن تدريب نماذج Gemini بنسبة قدرها 1%.

تصميم خوارزميات جديدة: تجاوز الإنجازات البشرية

نجح AlphaEvolve في تصميم خوارزميات جديدة تتفوق على الأساليب البشرية التقليدية، بما في ذلك تجاوز خوارزمية Strassen التي استمرت 56 عامًا في مجال ضرب المصفوفات. تُظهر هذه الإنجازات قدرة النظام على تقديم حلول مبتكرة في مجالات الحوسبة والرياضيات.

قيود النظام: مجالات محددة للتطبيق

يعمل AlphaEvolve بشكل فعال على أنواع محددة من المسائل التي يمكن تقييمها آليًا، مثل مسائل علوم الحاسوب وتحسين الأنظمة. ولا يُعد مناسبًا للمجالات التي تتطلب تفسيرات لغوية أو مفاهيم غير عددية، إذ يقتصر على تقديم الحلول بصيغة خوارزميات.

Continue Reading

الذكاء الاصطناعي

تيك توك تعزز تجربة المستخدمين بإطلاق ميزات وصول جديدة مدعومة بالذكاء الاصطناعي

Avatar of هدير ابراهيم

Published

on

تيك توك تعزز تجربة المستخدمين بإطلاق ميزات وصول جديدة مدعومة بالذكاء الاصطناعي

أعلنت منصة تيك توك عن مجموعة من الميزات الجديدة التي تهدف إلى تحسين تجربة المستخدمين، خاصةً ذوي الإعاقات البصرية، من خلال استخدام تقنيات الذكاء الاصطناعي.

تيك توك تعزز تجربة المستخدمين بإطلاق ميزات وصول جديدة مدعومة بالذكاء الاصطناعي

بعد تقديم ميزة إضافة نصوص بديلة (ALT Text) للصور يدويًا، بدأت تيك توك في اختبار ميزة جديدة تعتمد على الذكاء الاصطناعي لتوليد أوصاف تلقائية للصور. تُقرأ هذه الأوصاف بصوت عالٍ للمستخدمين الذين يعتمدون على برامج قراءة الشاشة، مما يسهل عليهم فهم المحتوى البصري حتى في حال عدم إضافة أوصاف يدوية من قبل صانعي المحتوى.

تيك توك تعزز تجربة المستخدمين بإطلاق ميزات وصول جديدة مدعومة بالذكاء الاصطناعي

تيك توك تعزز تجربة المستخدمين بإطلاق ميزات وصول جديدة مدعومة بالذكاء الاصطناعي

وضع التباين العالي لتحسين الرؤية

أضافت تيك توك خيار “تباين الألوان” ضمن إعدادات “تسهيلات الاستخدام”، والذي يعزز من تباين الألوان في النصوص والرموز وعناصر الواجهة. يساعد هذا الوضع المستخدمين الذين يعانون من ضعف البصر أو حساسية تجاه التباين المنخفض على التفاعل بشكل أفضل مع التطبيق.

دعم إعدادات النص العريض من الجهاز

أصبح التطبيق يدعم تلقائيًا إعدادات النص العريض الخاصة بالجهاز. هذا يعني أن كافة النصوص داخل التطبيق ستُعرض بخط عريض إذا فعّل المستخدم ذلك من إعدادات النظام، مما يُحسّن من قابلية القراءة للمستخدمين الذين يفضلون الخطوط الواضحة.

التزام تيك توك بتوفير تجربة شاملة

أوضحت تيك توك في بيانٍ رسمي: “ندرك أنه عندما يشعر الناس بأنهم مرئيون ومسموعون ومدعومون، فإنهم يصبحون أكثر قدرة على نشر قصصهم وبناء الروابط مع الآخرين بطرق ذات معنى. ولهذا، نواصل تطوير منتجات تخدم الجميع”.

ميزات الوصول الحالية في تيك توك

تنضم هذه التحديثات إلى مجموعة أدوات تسهيلات الاستخدام الحالية في تيك توك، والتي تتضمن:

  • الترجمة التلقائية لمقاطع الفيديو

  • الوضع الداكن

  • تحويل النص إلى كلام

  • إمكانية تعديل حجم الخط داخل التطبيق

Continue Reading

أخبار تقنية

ChatGPT يتوسع تحليل ملفات OneDrive في الوقت الفعلي

Avatar of هدير ابراهيم

Published

on

ChatGPT يتوسع تحليل ملفات OneDrive في الوقت الفعلي

بعد أن أصبحت الأنظمة الذكية مثل ChatGPT قادرة على تصفح الإنترنت والبحث عن المعلومات، يُتوقع أن تتوسع قدراتها إلى ما هو أبعد من ذلك. ففي خطوة جديدة، أصبح ChatGPT قادرًا الآن على تحليل مستندات OneDrive وSharePoint في الوقت الفعلي، مما يفتح آفاقًا جديدة في مجال الإنتاجية الشخصية والمهنية.

ChatGPT يتوسع تحليل ملفات OneDrive في الوقت الفعلي

وفقًا لـ OpenAI، أصبح بإمكان مستخدمي ChatGPT من الاشتراك في خطة PLAY أو PRO، أو الفرق الذين يعيشون خارج المنطقة الاقتصادية الأوروبية و المملكة المتحدة، ربط حساباتهم مع OneDrive و SharePoint لتحليل الملفات المخزنة على السحابة. ولكن، يتطلب الأمر منح ChatGPT الإذن للوصول إلى هذه الملفات عن طريق تمكين وظيفة البحث العميق، التي كانت تتيح له في السابق تصفح الإنترنت.

ChatGPT يتوسع تحليل ملفات OneDrive في الوقت الفعلي

ChatGPT يتوسع تحليل ملفات OneDrive في الوقت الفعلي

بمجرد تمكين هذه الوظيفة، يمكن للمستخدم تحديد المجلدات في Microsoft Cloud التي يسمح لـ ChatGPT بالوصول إليها، مثل OneDrive أو SharePoint، وذلك من خلال واجهة المستخدم التي توفر خيار “السهم لأسفل” لتحديد الخدمة المناسبة. كما يمكن للمستخدم أيضًا الانتقال إلى إعدادات ChatGPT لربط التطبيقات واختيار Microsoft OneDrive (العمل/المدرسة).

الخصوصية والمشاركة مع Microsoft

من ناحية الخصوصية، يتم إرسال استفسارات البحث التي يولدها ChatGPT إلى Microsoft. وأوضحت OpenAI أنه يتم استخدام هذه الاستفسارات لتحديد المعلومات ذات الصلة من مستندات Microsoft المتصلة، وهذا يعني أن المعلومات التي يتم التعامل معها ستكون مشتركة بين الشركتين.

مقارنة مع Microsoft Copilot

على الرغم من التشابه في الوظائف بين ChatGPT و Microsoft Copilot الذي أطلقته Microsoft منذ عام، فإن هناك بعض الفروق الجوهرية. Microsoft Copilot مخصص فقط للمستخدمين الذين يمتلكون حسابات عمل أو دراسي، كما أن الخدمة محدودة في التعامل مع خمسة ملفات فقط في وقت واحد. في المقابل، لا توجد قيود على عدد الملفات التي يمكن لـ ChatGPT التعامل معها.

التوجهات المستقبلية

بينما تسارع OpenAI في تطوير وتحسين ChatGPT، قد يكون تكامل الخدمة مع OneDrive و SharePoint خطوة نحو توفير إمكانيات أكبر للمستخدمين في مجال إدارة المستندات وتحليل البيانات. ومع ذلك، تبقى المنافسة مع Microsoft قائمة، وقد يشهد السوق المزيد من التطورات المثيرة في المستقبل القريب.

Continue Reading

Trending

Copyright © 2023 High Tech. Powered By DMB Agency.