جنرال لواء

يمكن لتقنية تركيب الكلام الجديدة هذه أن تزيف صوت أي شخص


مع التطور السريع في بناء روبوتات شبيهة بالبشر ، فإن الخطوة التالية المتوقعة في عصر الذكاء الاصطناعي هذا هي مطابقتها بأصوات حقيقية. وهذا بالضبط ما فعلته هذه الشركة الناشئة التي تتخذ من مونتريال مقراً لها من خلال كشف النقاب عن أول تقنية لتخليق الكلام في العالم يمكنها تكرار صوت أي شخص. احترس من Siri و Alexa ، فقد يتم اعتبارك قديمًا قريبًا!

[مصدر الصورة: بيكساباي]

كيف يعمل؟

Lyrebird ، أسسها ثلاثة دكتوراه. طلاب من جامعة مونتريال ، طوروا حلاً لتركيب الكلام قادرًا على نسخ صوت شخص ما تمامًا بمشاعر معينة.

يقوم التوليف بذلك عن طريق تحليل بضع عشرات من الثواني فقط من التسجيل الصوتي. من خلال تسجيل دقيقة واحدة من صوت شخص ما ، يمكن لـ Lyrebird ضغط الحمض النووي لهذا الشخص في مفتاح فريد. يمكن لمولد الكلام بالذكاء الاصطناعي بعد ذلك إنتاج أي خطاب بنطاقه الصوتي المقابل. إذا كنت لا تريد تزييف صوت شخص تعرفه أو استخدام صوتك الخاص ، فيمكنك تصميم صوت فريد لاستخدامه في تطبيقك. هناك أيضًا مجموعة واسعة من الاختيارات من بين آلاف الأصوات المحددة مسبقًا التي يمكنك الاختيار من بينها. بالطبع ، لن يكون مولد الكلام بالذكاء الاصطناعي بالكامل مميزًا إذا كان رتيبًا مثل الأصوات الرقمية الحالية. يمكن لمولد الصوت الاصطناعي الخاص بـ Lyrebird التحكم في عاطفة الأصوات المولدة مما يمنحهم الغضب والتعاطف والتوتر والعديد من التعبيرات البشرية. لكن أهم ما يميز هذا المولد الصوتي الرقمي الجديد هو قدرته على إنتاج 1000 جملة في أقل من نصف ثانية! هذا يضع تقنية Lyrebird في طليعة تركيب الكلام بالذكاء الاصطناعي.

تحدث ألكسندر دي بريبيسون ، أحد مؤسسي Lyrebird ، عن كيف أن التكنولوجيا المطورة حديثًا لا تتطلب الكثير من المعلومات لتوليد أصوات متشابهة.

"تشارك الأصوات المختلفة الكثير من المعلومات. بعد تعلم أصوات العديد من المتحدثين ، أصبح تعلم صوت المتحدث الجديد بالكامل أسرع بكثير. لهذا السبب لا نحتاج إلى الكثير من البيانات لتعلم صوت جديد تمامًا. ستظل المزيد من البيانات مفيدة بالتأكيد ، لكن دقيقة واحدة كافية لالتقاط الكثير من الحمض النووي للصوت ".

واجهة برمجة التطبيقات التي يتم تطويرها ستكون قوية للتعلم حتى من التسجيلات الصاخبة. يستخدم الإصدار الحالي من التكنولوجيا نغمات مختلفة من صوت شخص واحد مثل هذه التسجيلات الصوتية لدونالد ترامب.

قضايا أخلاقية

تواجه العديد من الدراسات البحثية حتمًا نقادًا أخلاقيين وغالبًا ما يتم استجوابها حول الاستخدام المقصود لنتائجها. يواجه تركيب الكلام في Lyrebird بعض المشكلات الأخلاقية مثل سرقة الهوية حيث لا يلزم سوى مدة قصيرة جدًا من التسجيل الصوتي لتكرار صوت شخص ما. خاصة إذا تم إصدار منشئ الكلام للجمهور ، فسيكون من الصعب التحكم فيه بمجرد وصول ملايين الأشخاص إلى التكنولوجيا. علاوة على ذلك ، يمكن أيضًا اعتبار أدلة التسجيل الصوتي في القضايا الجنائية باطلة حيث يمكن القول إن الملف الصوتي مزور أو تم العبث به.

ومع ذلك ، ليس هذا هو الغرض المقصود من تركيب الكلام هذا. يتطلع مؤسسو Lyrebird إلى تطبيق التكنولوجيا بطريقة إيجابية كمساعدة شخصية مثل قراءة الكتب ذات الأصوات الشهيرة. كما أنه يستهدف الأشخاص ذوي الإعاقة الذين يمكنهم استخدام تركيب الكلام لمساعدتهم على التحدث. ومن الأمثلة الشهيرة على ذلك صوت الكمبيوتر الذي يستخدمه ستيفن هوكينج. علاوة على ذلك ، يمكن أيضًا استخدام التكنولوجيا على نطاق واسع في أفلام الرسوم المتحركة واستوديوهات ألعاب الفيديو.

لا تزال تقنية Lyrebird قيد التطوير ، ومع ذلك ، يمكن للأفراد المهتمين الاشتراك في موقع الويب الخاص بالشركة الناشئة ليصبحوا مختبرين تجريبيين أو إبلاغهم بالإطلاق.

عبرليريبيرد

راجع أيضًا: جهاز الدماغ والحاسوب هذا يعطي صوتًا لأولئك الذين لا يستطيعون التحدث


شاهد الفيديو: تغيير نبرة صوتك الى صوت شخص مختلف ادوبي اوديشن. How To Change Someones Voice In Adobe Audition (ديسمبر 2021).