PhoneAndroid

قدمت ميتا للتو Voicebox رسميًا، وهو ذكاء اصطناعي متخصص في تركيب الكلام. هذا النموذج قادر على تحويل النص إلى ملف صوتي وإنشاء خطابات بناءً على هذه العينات التي تبلغ مدتها ثانيتين فقط.

meta voicebox
الاعتمادات: 123RF

كما تعلمون، فإن اللاعبين الرئيسيين في مجال التكنولوجيا قد دخلوا السباق من أجل الذكاء الاصطناعي. بعد إطلاق ChatGPT في نهاية عام 2022 واستثمرت Microsoft 10 مليارات دولار في شركة OpenAI الناشئةسارع عمالقة الويب إلى تقديم ذكاءهم الاصطناعي.

برزت جوجل معبارد، الذكاء الاصطناعي للمحادثة، بينماأكدت Meta تطوير الذكاء الاصطناعي الخاص بها اعتبارًا من أبريل 2023. في الأشهر الأخيرة، نشرت شركة مينلو بارك عددًا كبيرًا من نماذج الذكاء الاصطناعي، بدءًا من LLaMA (نموذج اللغة الكبير Meta AI)،نموذج لغة مفتوح المصدر.

وقبل قليل، كشفت الشركة الواقعة في كاليفورنيا أيضًاجيباوهو نموذج يهدف إلى إعادة إنتاج الفكر الإنساني، وخاصة من خلال تحليل وفهم المفاهيم والمفاهيم المجردة. في منطقة مختلفة تماما، قدمت ميتا أيضاMusicGen، ذكاء اصطناعي قادر على إنشاء الموسيقى عبر وصف نصي أساسي.

meta voicebox
الاعتمادات: ميتا

ميتا تكشف النقاب عن Voicebox، وهو الذكاء الاصطناعي القادر على تقليد الصوت البشري

ومع ذلك، في 16 يونيو 2023، أعلنت ميتا "إنجازها الجديد في مجال الذكاء الاصطناعي التوليدي للكلام”.هذا الذكاء الاصطناعي هو Voicebox. لتلخيص ذلك، يتخصص نموذج الذكاء الاصطناعي المتطور هذا فيتركيب الكلام. وبعبارة أخرى، فهو قادر على ذلكإنشاء أو تحرير أو تصميم الملفات الصوتية.

أولاً، دعونا نتناول الميزة الأكثر إثارة للاهتمام (وربما الأكثر إشكالية) في Voicebox:تركيب النص إلى كلام في السياق. من خلال الاعتماد على مستخلص صوتي مدته ثانيتين فقط، يستطيع Voicebox إنشاء خطاب- محاكاة صوت وصياغة الشخص المسموع في المستخلص.

وبهذه الطريقة، سيكون Voicebox قادرًا على محاكاة صوت أحد أفراد أسرته أو المغني أو السياسي. في المستقبل، يقول ميتا إن Voicebox ونماذج الذكاء الاصطناعي التوليدية المماثلة الأخرى ستكون قادرة على القيام بذلكإعطاء أصوات طبيعية للمساعدين الصوتيينأو إلى الشخصيات غير القابلة للعب في Metaverse. بالإضافة إلى ذلك، يمكنهم أيضًا السماح لضعاف البصر بسماع الرسائل المكتوبة بأصوات أصدقائهم.

meta voicebox
الاعتمادات: ميتا

اقرأ أيضا:بعد Dall-E وMidjourney، يتيح لك الذكاء الاصطناعي الجديد إنشاء مقطع فيديو من نص

تحرير الملفات الصوتية والترجمة الفورية

ولكن هذا ليس كل شيء لأن Voicebox يقدم ميزات أخرى:

  • تحرير الصوت وتقليل الضوضاء: يمكن لـ Voicebox إعادة إنشاء جزء من الكلام الذي تمت مقاطعته بسبب الضوضاء أو استبدال الكلمات المخدوشة أو التي تم نطقها بشكل خاطئ دون الحاجة إلى تسجيل خطاب جديد بالكامل (نوع من الممحاة السحرية من Google للصوت)
  • ترجمة متعددة اللغات: يدعم Voicebox ست لغات في الوقت الحالي (الإنجليزية والفرنسية والإسبانية والألمانية والبولندية والبرتغالية)، مما يسمح له بنقل الكلام إلى لغة أخرى غير لغة الملف الأصلي (أثناء نقل النمط والظلال)

وللقيام بمهامها المختلفة، تم تحسين الذكاء الاصطناعي الخاص بـ Meta على مدار أكثر من50.000 ساعة من المستخلصات صوتيبشكل رئيسي من الكتب الصوتية والمحتوى الخالي من حقوق الملكية. في الوقت الراهن،يظل Voicebox غير متاح لعامة الناس، من أجل السلامة. ومن غير المستغرب أن تخشى ميتا من إساءة استخدام الذكاء الاصطناعي الخاص بها، خاصة لتقليد أصوات أناس حقيقيين.

مصدر :ميتا


اسأل عن أحدث لدينا!

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.