قال موقع Axios الأمريكى في تقرير نشره يوم السبت 4 ديسمبر/كانون الأول 2021 إن شركات الذكاء الاصطناعي تعمل على ابتكار طريق لترجمة الأصوات وتركيبها في الإعلانات والأفلام والبرامج التلفزيونية.
تكمن أهمية الأمر فيما قد تقدمه التطورات الجديدة في تركيب الصوت من إسهام على مستوى إصلاح الدبلجة السيئة للأفلام، لا سيما مع تزايد الأهمية التي باتت شركات الإنتاج ومنصات البث تُوليها للمحتوى المعروض دولياً بعد أن أصبح جزءاً أساسياً من عولمة الترفيه.
مخاوف من التلاعب بالأصوات
مع ذلك يثير بعض الخبراء مخاوف بشأن إمكانية التلاعب بالأصوات، وما ينطوي عليه الأمر من مخاطر استخدام صوت أحد المشاهير بعد وفاته.
احتدمت النقاشات حول الموضوع بعد أن بدأت مسلسلات بلغات أجنبية مثل مسلسل Squid Game ومسلسل La Casa de Papel تحقق نجاحات ساحقة وتجتذب مشاهدات غير مسبوقة، لكن الترجمة لا تزال حجر عثرة أمام الاستوديوهات وشركات الإنتاج التي تحول الاستفادة من السوق الدولية المتنامية.
كان عدد المشاهدين للإصدارات المُدبلجة من المسلسل الكوري الجنوبي Squid Game قد تجاوز بكثير عدد المشاهدين للإصدارات المترجمة.
صعوبة العثور على مترجمين
لما كانت البرامج ذات النجاح الساحق تمتص الحصة الأكبر من الاهتمام السوقي، فإن صغار المنتجين للمحتوى باللغات الأجنبية باتوا يواجهون صعوبات جمة في العثور على عدد كافٍ من المترجمين والمدبلجين الصوتيين لتلبية الطلب.
في هذا السياق، يقول رايان ستيلبيرغ، رئيس شركة الذكاء الاصطناعي "فيريتون" Veritone: "ما زلنا عالقين في عقلية نموذج البث من طرف واحد (one-to-many broadcasting model)".
في مقابل ذلك، ابتكرت شركة "فيريتون" منتَجاً يُسمى MARVEL.ai يُتيح لمنتجي المحتوى إنشاء ما تُطلق عليه الشركة أصوات اصطناعية "شديدة الواقعية" وترخيصها للاستخدام.
هذا يعني أنه يمكن لمنشئ المدونات الصوتية، على سبيل المثال، أن يترجم نص إعلان صوتي إلى لغة أخرى، ثم يستعين بتطبيق MARVEL.ai لإنشاء نسخة تريكيبية من صوته لقراءة الإعلان بلغة أخرى.
بحسب ما يقول ستيلبيرغ فإن التقنية الجديدة "تمنحك القدرة على تنمية التخصيص للمحتوى الصوتي عن طريق الذكاء الاصطناعي (hyper-personalize) لاستخدامه على نطاق أوسع بكثير وبتكلفة أقل".
في حين أن تقنيات "تحويل النص إلى كلام" موجودة منذ عقود، فإن منتج شركة "فيريتون" يعتمد على تحويل "الكلام إلى كلام"، وهو ما يسميه ستيلبيرغ "التقديم الخدمي للمحتوى الصوتي".
تدريب منتج الذكاء الاصطناعي
تتمتع شركة "فيريتون" بإمكانية الوصول إلى مئات التيرابايت (بيتابايت) من البيانات من مكتبات الوسائط وتستخدمها لتدريب منتَج الذكاء الاصطناعي الخاص بها، ثم إنشاء نسخة تركيبية من الصوت الأصلي الذي يُمكن ضبطه للتعبير عن أنواع مختلفة من المشاعر أو العواطف، أو ليحل بديلاً للترجمة، أو للتحدث بمنطوق المحتوى لكن بلغة أجنبية وبنفس الصوت.
يقول ستيلبيرغ: "لن يكون الصوت الجديد لشخص آخر يتحدث نيابة عن توم كروز، على سبيل المثال، بل سيكون توم كروز نفسه يتحدث بلغة أخرى".
من جهة أخرى، تعمل شركة "إنفيديا" Nvidia على تطوير تقنية من شأنها أن تسمح لأدوات الذكاء الاصطناعي بتعديل الفيديو أو الرسوم المتحركة بطريقة تأخذ الحركات الشفاهية للممثل وتعبيرات وجهه وتُطابقها مع اللغة الجديدة، ما يعني نهاية عصر الدبلجة غير المتزامنة كما كان الحال مع أفلام الكونغ فو في سبعينيات القرن الماضي.
من المتوقع أن تُستخدم هذه التقنية أولاً في الإعلانات، ولكن مع انتقالها إلى محتوى عالي الجودة، فإنها ستفتح الباب أمام فرص ومزالق محتملة لمواهب المشاهير.
يشير ستيلبيرغ إلى أنه "فيما يتعلق بالدبلجة ومرحلة ما بعد الإنتاج، ستصبح الأصوات الصناعية إمكانية سائدة، وسيأتي وقت نرى فيه ذلك الأمر منصوصاً عليه في عقود المواهب".
استغلال الأصوات
لن يكون هذا لضمان حصول نجوم هوليوود (ووكلائهم) على حصة ربحية من أي استخدام لأصواتهم وتركيبها فحسب، بل أيضاً لمنع استغلال هذه الأصوات لأغراض خبيثة مع تداول التكنولوجيا الجديدة وتيسُّر استخدامها.
من التطبيقات التي يُنتظر أن نراها لهذه التكنولوجيا استخدام الذكاء الاصطناعي لاستدعاء وتسخير الأصوات والسمات الإبداعية الأخرى للمشاهير المتوفين.
استُخدم التصوير المجسم (الهولوغرام) لموسيقيين متوفين، مثل فرانك زابا، بالفعل في عروض "مباشرة" جلبت عشرات الملايين من العائدات.
الخلاصة أنه يجب أن يهيئ العالم نفسه للأمر، لأنه لن يمر وقت طويل حتى يصبح بإمكان العالم الاستماع للمشاهير وهم يتحدثون بأي لغة تقريباً، وفي الوقت نفسه يجب أن يدقِّق هؤلاء المشاهير في عقودهم ووصاياهم؛ لأن أصواتهم وسماتهم ستصبح متاحة للاستخدام في أي شيء حتى بعد وفاتهم.