بعد أزمة سكارليت جوهانسون.. استنساخ الأصوات يثير المخاوف
تثير تقنية استنساخ الصوت مخاوف كثيرة مع إقدام عدد من الشركات على اعتمادها، كـ«أوبن إيه آي» مُبتكرة برنامج «تشات جي بي تي» الشهير، التي اضطرت، أخيراً، إلى الاعتذار من الممثلة سكارليت جوهانسون، بعدما نسخت صوتها في أحدث نسخة من برنامجها للمحادثة الآلية.
واعتذر مدير عام «أوبن إيه آي»، سام ألتمان، من الممثلة الشهيرة، وأعلن تعليق صوت أداة المساعدة «سكاي» في «تشات جي بي تي».
وكانت الشركة قد قدمت عرضاً في سبتمبر الماضي، لسكارليت التي أعارت صوتها قبل نحو 10 سنوات لنظام بالذكاء الاصطناعي في فيلم «هير»، لكن الممثلة رفضت أن تكون صوت نظام النسخة الجديدة من «تشات جي بي تي».
ونفت «أوبن إيه آي» من جانبها أن تكون قد استنسخت صوت جوهانسون، مشيرة إلى أنها ابتكرت أداتها باستخدام صوت ممثلة أخرى.
وتتصدر أخبار عن حيل صوتية مشابهة جداً للواقع أو عمليات احتيال أو تضليل باستخدام الاستنساخ الصوتي، عناوين الأخبار باستمرار، مسلطة الضوء على قدرة أنظمة الذكاء الاصطناعي على تقليد الأصوات البشرية.
وفي العام الماضي، حذرت شركة «إيليفن لابز» الناشئة التي تعمل على ابتكار أداة لاستنساخ الصوت باستخدام الذكاء الاصطناعي، من الاستعمال المسيء لبرنامجها.
وكان مستخدمون مجهولون على منتدى «4 تشان» تداولوا رسائل فيها عمليات استنساخ لأصوات مشاهير، وجعلوا هذه الأصوات تتلفظ بأقوال تنطوي على معان جنسية أو عنصرية.
وفي أحد المقاطع الصوتية، يُسمَع صوت مزيّف للممثلة إيما واتسون وهي تقرأ مقطعاً من كتاب «كفاحي» لأدولف هتلر.
وأوضح مدير شركة «سنتيزيا» الناشئة رجل الأعمال الدنماركي، فيكتور ريباربيلي، في حديث إلى وكالة «فرانس برس»، أن هذه التكنولوجيا ابتكرت إلى حد كبير من خلال برنامج مفتوح المصدر يُسمى «تورتس» وأُطلق قبل عامين.
وتحول شركته النص إلى مقطع فيديو باستخدام صورة رمزية (آفاتار) أنشئت بواسطة الذكاء الاصطناعي. وتوظف ممثلين يخضع صوتهم وشكلهم لعقد مدته عامين، مع احتمال تجديده، على قول ريباربيلي، الذي التقت به وكالة «فرانس برس» على هامش معرض «فيفاتك» للتكنولوجيات الجديدة الذي أقيم أخيراً في باريس.
وحلل برنامج التعلم الآلي «تورتس» آلاف الساعات من التسجيلات الصوتية، وكان بمثابة قاعدة لتطبيق «إيليفن لابز».
وقال ريباربيلي: «كان ذلك نقلة نوعية مهمة».
وتستخدم «أوبن إيه آي» برامج مماثلة، على الرغم من أنها لا تكشف تفاصيل ذلك.
وعلى غرار هذه الشركة الأميركية، باتت مئات الشركات تقدم خدمة استنساخ الصوت التي أصبحت واقعية ودقيقة بصورة أكبر. من بينها TALKR.ai، وهي شركة فرنسية للمساعدين الصوتيين الافتراضيين الذين يتم إنشاؤهم بواسطة الذكاء الاصطناعي.
ويمكن لهذه الخدمة التعامل مع 25% إلى 30% من مكالمات خدمة الزبائن من دون أي تدخل بشري، بحسب رئيستها، كاتيا لينيه.
تقليد في دقائق معدودة
مع «تشات جي بي تي 4.0»، يمكن للمستخدم التلفظ ببضع جمل بالفرنسية أمام التطبيق القادر في دقائق معدودة على إعادة إنتاج هذا الصوت واستخدامه لسرد مقطع فيديو قصيرة بخمس لغات مختلفة، بحسب ما أظهرت «أوبن إيه آي» خلال عرض توضيحي للبرنامج في باريس.