phonandroid

كشفت Openai عن قدرة ثورية جديدة: إمكانية إنشاء أصوات اصطناعية واقعية للغاية من خلال التدريب على 15 ثانية فقط من التسجيل الصوتي.

Voix IA
الائتمان: 123RF

قام Openai برفع الحجاب للتومحرك الصوت ، AI جديد تمامًا يمكنه تقليد أي صوت بعد الاستماع إليه لمدة 15 ثانية فقط.نظام المحرك الصوتي ليس جديدًا تمامًا ، حيث تم تطويره لأول مرة من قبل Openai في نهاية عام 2022 ، وهو الإصدار الأول يتم استخدامه بالفعل لوظائف التوليف الصوتي في المساعد الشهير لـ IA chatgpt للشركة. ومع ذلك ، هذه هي المرة الأولى التي يتحدث فيها المفتوح عن ذلك علنًا.

كما هو موضح من قبل منشور مدونة Openai مؤخرًا ، يتيح Voice Engine للمستخدمين إنشاء أصوات اصطناعية من الواقعية المذهلة ، قادرة على قراءة أي نص يتم توفيره "بطريقة عاطفية وواقعية". شاركت الشركة بعض الأمثلة على استنساخ الأصوات ، والتي تظهر طبيعية مثيرة للإعجاب ، على الرغم من أنه لا يزال هناك جانب اصطناعي قليلاً في بعضها.

يريد Openai إحداث ثورة في السوق مع محرك الصوت

يستشهد Openai بالعديد من حالات المستخدمين الواعدة للتكنولوجيا في العالم الحقيقي ، مثلالأدوات التعليمية ، وترجمة المواد الصوتية بلغات جديدة ، والوصول إلى المجتمعات النائية وحتى مساعدة الاتصالات للأشخاص غير اللفظيين. أطلقت الشركة بالفعل "معاينة صغيرة الحجم" مع شركاء مختارين استفادوا من الوصول المبكر.

استخدمت Age of Learning ، وهي شركة متخصصة في التعليم ، محرك الصوت لإنشاء أصوات نصية ، في حين يوفر تطبيق السرد المرئي من قبل Heygen إمكانية إنشاء ترجمات صوتية سائلة مع صوت ولكنة المتحدث الأصلي.

مثال أكثر إثارة للدهشة هو بلا شك أن الباحثين الذين تمكنوا من ذلك"استعادة صوت" امرأة شابة فقدت استخدام الكلام بعد ورم في الدماغ، عن طريق رسم المحرك الصوتي على مدى 15 ثانية فقط من تسجيل قديم.

ينبه Openai بالفعل مخاطر هذه التكنولوجيا

ومع ذلك ، على الرغم من حالات الاستخدام هذه التي يمكن أن تكون ثورية ، فإن Openai يتبنى موقفًا حذرًا عن عمد فيما يتعلق بنشر أوسع لنظام الاستنساخ الصوتي. الشركة تستدعيالحاجة الملحة لحماية نفسك من أي استخدام مسيء للتكنولوجيا لأغراض ضارة، مثلنشر المعلومات الخاطئة واستنساخ الصوت دون موافقة المستخدم.

يمكنك أن تتخيل أن البعض يمكن أن يحصل بسرعة على بث رسائل خاطئة من الشخصيات الشهيرة على الشبكات الاجتماعية. لقد رأينا أيضايستخدم المحتالون الذكاء الاصطناعى لتقليد أحبائك ويطلبون منك المال عبر الهاتفو

الآثار المترتبة على استخدام الأصوات استنساخ الذكاء الاصطناعي لحملات التضليل مهمة بشكل خاصبالنظر إلى الانتخابات الرئيسية التي ستجري في الولايات المتحدةوفي المملكة المتحدة هذا العام. تصبح أدوات الذكاء الاصطناعى التوليدي أكثر وأكثر تطوراً في مجالات الصوت والنص والصور والفيديو ،من الصعب بشكل متزايد التمييز بين المحتوى الفعلي والمحتوى الاصطناعي. على سبيل المثال ، رأينا مؤخرًاسورا، آخر من Openaiمن يمكنه إنشاء مقاطع فيديو واقعية للغاية في أي وقت من الأوقات.

أدرك Openai أنه من الضروري البدء في تعزيز "المرونة المجتمعية" في مواجهة التحديات التي تطرحها هذه التقنيات. شجعت التدابير مثلالتخلي التدريجي للمصادقة الصوتية للحسابات الحساسةودعا إلى تنفيذ السياسات التي تهدف إلى حماية أصوات الأفراد ، وكذلكالتعليم العام على قدرات الذكاء الاصطناعي.

في الوقت الحالي ، يتم وضع علامة على جميع عينات المحركات الصوتية التي أنشأتها Openai Partners بعلامة مائية رقمية للسماح بأصلها بتتبع. كما أعلنت الشركة أنها طالبت بالموافقة الصريحة من المتحدث الأصلي وأنها لم تسمح بترفيه أصوات المرشحين السياسيين خلال الفترات الانتخابية.


اسألنا الأخير!

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.