أعلنت شركة أمازون عن إطلاق نموذجها الجديد Nova Sonic، وهو نموذج ذكاء اصطناعي توليدي متقدّم متخصص في التعامل مع الصوت بشكل مباشر، ويهدف إلى توليد محادثات طبيعية تحاكي التفاعل البشري الحقيقي. ويُعد هذا الابتكار بمثابة استجابة متطورة من أمازون للنماذج الصوتية الحديثة التي بدأت تكتسب شعبية، مثل وضع الصوت في ChatGPT من OpenAI.
أمازون تعزز سباق الذكاء الاصطناعي بنموذج صوتي متطور Nova Sonic
بحسب تصريحات أمازون، فإن Nova Sonic يتمتع بكفاءة عالية في مجالات السرعة، دقة التعرف على الكلام، وجودة التفاعل، ليصبح بذلك منافسًا مباشرًا للنماذج الصوتية المتقدمة من OpenAI وجوجل. ويأتي ذلك في وقتٍ بدأت فيه المساعدات الصوتية التقليدية مثل أليكسا وسيري تفقد بريقها أمام التطورات السريعة في الذكاء الاصطناعي.
أمازون تعزز سباق الذكاء الاصطناعي بنموذج صوتي متطور Nova Sonic
إمكانات متقدمة وتكلفة منخفضة
يتوفر Nova Sonic عبر منصة Amazon Bedrock الموجهة للمطورين، مع دعم لواجهة برمجة تطبيقات (API) جديدة تتيح بثًا صوتيًا ثنائي الاتجاه. وقد وصفت أمازون النموذج بأنه “الأكثر كفاءة من حيث التكلفة” في السوق، إذ تقل تكلفته بنسبة تصل إلى 80% مقارنة بنموذج GPT-4o من OpenAI.
تعزيز تجربة أليكسا بلس
أكد روهيت براساد، النائب الأول لرئيس أمازون وكبير علماء الذكاء الاصطناعي العام، أن تقنيات Nova Sonic تُستخدم حاليًا في تشغيل Alexa Plus، النسخة المحسّنة من مساعد أمازون الصوتي، التي تتيح تفاعلًا أكثر واقعية من خلال القدرة على الاستجابة في الوقت المناسب، ورصد المقاطعات أو فترات الصمت أثناء الحوار.
دقة فائقة في التعرف على الكلام
يتميز Nova Sonic بدقة عالية في فهم كلام المستخدم، حتى في ظل وجود ضوضاء أو همسات غير واضحة. فقد سجل النموذج معدل خطأ قدره 4.2% في اختبار Multilingual LibriSpeech الذي يقيس الأداء عبر لغات مختلفة، كما تفوق بنسبة 46.7% على نموذج GPT-4o-transcribe من OpenAI في اختبار الحوارات الجماعية متعددة الأطراف.
أظهرت اختبارات مؤسسة Artificial Analysis أن Nova Sonic يحقق استجابة صوتية بمتوسط تأخير يبلغ 1.09 ثانية فقط، ما يجعله أسرع من نموذج Realtime API من OpenAI، الذي سجل 1.18 ثانية في المتوسط.
يندرج Nova Sonic ضمن خطة أمازون الكبرى لتطوير الذكاء الاصطناعي العام (AGI)، والذي تصفه الشركة بأنه “الذكاء القادر على أداء جميع المهام التي يستطيع الإنسان تنفيذها عبر الحاسوب”. وتطمح أمازون إلى توسيع قدرات الذكاء الاصطناعي ليشمل التفاعل مع وسائط متعددة مثل الصوت، الفيديو، الصور، بل وحتى البيانات الحسية.
ويأتي هذا النموذج في سياق توسع سريع في قسم الذكاء الاصطناعي لدى أمازون، الذي أطلق أيضًا مؤخرًا نموذج Nova Act لتنفيذ المهام داخل المتصفح، وخدمة “اشترِ نيابة عني” للتسوق التلقائي، إلى جانب نموذج Nova Reel المخصص لتوليد مقاطع الفيديو.
بعد فترة من التخبّط والتساؤلات حول مستقبل مساعد “أبل” الصوتي سيري، يبدو أن الأمور تتجه نحو الأفضل فقد كشفت أحدث التقارير أن سيري سيشهد نقلة نوعية هذا الخريف، بالتزامن مع إطلاق نظام التشغيل iOS 19، في خطوة تهدف إلى تعزيز مكانة أبل في سباق الذكاء الاصطناعي.
تحولات ذكية في سيري تحديثات ثورية قادمة مع iOS 19
واحدة من أبرز التحسينات المرتقبة هي قدرة سيري على فهم المستخدم بشكل شخصي. بفضل ارتباطه العميق بمنظومة “أبل”، سيتمكن “سيري” من استخدام بيانات المستخدم الخاصة بشكل آمن لتقديم ردود وخدمات أكثر تخصيصًا.
تحولات ذكية في سيري تحديثات ثورية قادمة مع iOS 19
أمثلة توضح الميزة الجديدة:
إذا قال المستخدم: “شغّل البودكاست الذي أوصى به جيمي”، سيتولى سيري مهمة البحث والتشغيل تلقائيًا.
أو إذا سأل: “متى تهبط طائرة أمي؟”، سيقوم سيري بتحليل الرسائل وتتبع الرحلة لتقديم إجابة دقيقة.
لطالما كانت وظائف سيري محدودة، لكن التحديث القادم سيغير ذلك. مع iOS 19، سيُضاف مئات الأوامر الجديدة، تشمل القدرة على التفاعل مع عدة تطبيقات في آنٍ واحد.
على سبيل المثال:
“أضف صور هذا الصباح إلى الملاحظة بعنوان Birding” سيري سيتصرف تلقائيًا، دون الحاجة إلى فتح أي تطبيق يدويًا.
في السابق، كان تفاعل سيري مع ما يظهر على الشاشة محدودًا للغاية. أما الآن، فالمساعد الذكي سيكتسب قدرة على تحليل وفهم محتوى الشاشة، تمامًا كما يفعل المساعد البشري.
مثلًا:
عند ظهور عنوان في رسالة نصية، يمكن القول: “أضف هذا العنوان إلى بطاقة جهة الاتصال”، وسيتولى “سيري” المهمة تلقائيًا.
ميزة ستكون مفيدة على أجهزة آيفون، لكن أهميتها تتضاعف عند انتقالها إلى جهاز “Vision Pro”، حيث التفاعل دون لمس يصبح أكثر أهمية.
سيري في طريقه ليصبح مساعدًا حقيقيًا
رغم أن هذه التحديثات ما تزال تحت التجربة، إلا أن التسريبات والبيانات الرسمية تؤكد أن أبل تستعد لإطلاق أقوى نسخة من سيري حتى الآن. نسخة أكثر وعيًا، أكثر تخصيصًا، وأكثر فاعلية… تضع “سيري” في موقع المنافسة الجادة في عالم المساعدات الذكية المدعومة بالذكاء الاصطناعي.
كشفت رسومات براءة اختراع حديثة عن تصميم جديد من شركة سامسونغ قد يغيّر قواعد اللعبة في عالم الهواتف الذكية القابلة للطي. المفاجأة؟ الهاتف لا يُطوى جانبيًا كما هو معتاد، بل يتمدد رأسيًا، مما يفتح آفاقًا جديدة لتجربة الاستخدام اليومي.
هاتف المستقبل من سامسونغ شاشة تتمدد رأسيًا وتقنيات ذكاء اصطناعي مدمجة
البراءة التي رُصدت عبر “DomoAI” بالتعاون مع المسرب الشهير “ديفيد”، تُظهر جهازًا صغير الحجم يمكن تمديد شاشته عموديًا، ما يوفّر عرضًا غنيًا وواسعًا للمحتوى عند الحاجة. وتُبرز الرسومات تصميمًا بحواف رفيعة وهيكل سميك يُعتقد أنه يحتوي على آلية التمدد الجديدة.
هاتف المستقبل من سامسونغ شاشة تتمدد رأسيًا وتقنيات ذكاء اصطناعي مدمجة
كاميرتان وتصميم ذكي غير مكتمل الكشف
يحمل التصميم بعض أوجه الشبه مع هاتف Galaxy Z Flip 6 من حيث الكاميرتين الخلفيتين، إلا أن الغموض يحيط بحجم الشاشة النهائي، حيث لا تظهر الشاشة في وضع الفتح الكامل ضمن الرسومات المسربة، ما يفتح المجال لتكهنات واسعة.
الذكاء الاصطناعي يعزّز تجربة الاستخدام
إضافةً إلى التصميم المبتكر، تخطط سامسونغ لدمج وظائف متقدمة للذكاء الاصطناعي داخل الهاتف، للاستفادة المثلى من الشاشة المتغيرة. من بين الاستخدامات المتوقعة:
عرض ترجمتين متزامنتين عند فتح الشاشة بالكامل.
تلخيص المقالات والرسائل الطويلة لتقليل التمرير.
توسيع مساحة العمل لتحرير الصور بسهولة على الشاشة الكبيرة.
هذا الابتكار لا يهدف فقط إلى الإبهار البصري، بل يستهدف تحسين الاستخدام العملي اليومي، عبر توفير تجربة قراءة، تصفح وتعدد مهام أكثر سلاسة، تتماشى مع احتياجات المستخدمين في العصر الرقمي.
وفي إطار سعيها المستمر للتجديد، كشفت سامسونغ أيضًا عن براءة اختراع أخرى لهاتف بزاوية طي كاملة 360 درجة، يُمكن طيه للداخل والخارج دون الحاجة إلى شاشة خارجية، معتمدًا على زجاج مرن للغاية وشاشة خلفية مصغّرة لعرض الإشعارات.
ورغم أن هذه التصاميم لا تزال ضمن مرحلة براءات الاختراع ولم تدخل بعد حيز الإنتاج التجاري، فإنها تعكس طموح سامسونغ الواضح في إعادة تعريف شكل ووظيفة الهواتف الذكية في المستقبل.
في خطوة جديدة وغير تقليدية، يستعد تطبيق دوولينغو الشهير لتعلم اللغات لإطلاق دورة جديدة مخصصة لتعليم لعبة الشطرنج، لتكون بذلك أول مبادرة تعليمية من نوعها على المنصة لا تعتمد على تعلم اللغات بشكل مباشر.
دوولينغو يدخل عالم الشطرنج دروس تفاعلية لتعلم اللعبة من الصفر
تركز الدورة على ألغاز شطرنجية بسيطة ومباشرة، مثل تحريك الحصان بحركته الشهيرة على شكل “L” أو تنفيذ حركات “كش ملك”، مما يساعد المستخدمين على فهم أساسيات اللعبة بشكل ممتع وتفاعلي.
دوولينغو يدخل عالم الشطرنج دروس تفاعلية لتعلم اللعبة من الصفر
المدرب الافتراضي “أوسكار” في خدمتك
سيكون للمستخدمين الفرصة للعب مباريات مصغّرة أو كاملة ضد شخصية تدعى “أوسكار”، وهي مدرب افتراضي داخل دوولينغو سيساعدهم على التقدم خطوة بخطوة خلال الدروس، وفقًا لتقرير نشره موقع The Verge واطّلعت عليه “العربية Business”.
أوضح إدوين بودغ، مدير المنتجات في دوولينغو، أن فريق العمل سعى إلى تبسيط الشطرنج وجعله في متناول الجميع، حيث تم تصميم الدورة لتناسب مختلف مستويات المهارة، بدءًا من المبتدئين وصولًا إلى من لديهم خبرة مسبقة باللعبة.
تنضم دورة الشطرنج إلى مبادرات تعليمية أخرى غير لغوية مثل الموسيقى والرياضيات، لتُظهر توجه دوولينغو نحو التوسع في مجالات تعليمية جديدة، تقدم قيمة معرفية من خلال طرق تفاعلية مبتكرة.
أعلنت مونيكا إيرل، مديرة العلاقات العامة في دوولينغو، أن الدورة ستُطلق في مرحلة تجريبية أولية لمستخدمي نظام iOS باللغة الإنجليزية، مشيرة إلى أن توسيع نطاق التجربة ليشمل عددًا أكبر من المستخدمين سيتم خلال 4 إلى 6 أسابيع، مع خطط مستقبلية لتوفيرها على أندرويد وبلغات إضافية.