ابتكر باحثون من شركة «مايكروسوفت» أداة ذكاء اصطناعي جديدة، قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي لـ «وجه ناطق»، وذلك بحسب وثيقة بثتها شركة التقنية الكبرى، عبر موقعها الإلكتروني، السبت.
وبيّنت «مايكروسوفت» أن بحثها يركز على الصور الرمزية الافتراضية «أفاتار»، بهدف الاستخدام الإيجابي، مشيرة إلى معارضتهم لأي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار، وقالت: «هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة، وانتحال صفة أيّ كان».
وأوضحت شركة التقنية المستثمر الرئيس في «اوبن إيه آي» مبتكرة برنامج «تشات جي بي تي»، عدم عزمها طرح الأداة الجديدة، أو تقديم معلومات تقنية دقيقة حولها، في الوقت الجاري، مبررة ذلك بأنهم غير متأكدين من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها عالميًا.
وأبانت «مايكروسوفت» أنّ فوائد ابتكار الأداة الجديدة تتمثل بتعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه.
ويلتقط برنامج «مايكروسوفت» المسمى «فاسا-1» VASA-1، صورة وجه بسيطة، ويسجل مقطعًا صوتيًا، ويحولهما إلى شريط فيديو يظهر وجهًا يتحرك ويتكلم بطريقة واقعية جدًا.
من جهة أخرى، تعمل شركات عدة على هذه التقنية، على غرار «رَنواي» Runway، إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو، إضافة إلى إنشاء باحثين من «جوجل» برنامج ذكاء اصطناعي مسمى بـ «فلوجر»، قادر على صُنع مقاطع فيديو واقعية لوجوه ناطقة.

تكبير

تصغير

مشاركة مشاركة