Sora هو نموذج ذكاء اصطناعي من OpenAI قادر على تحويل رسالة نصية إلى فيديو. يثير سورا، الذي يحتمل أن يكون ثورة في الإبداع الفني، العديد من الأسئلة التي نسعى جاهدين للإجابة عليها هنا.

بعد أن أثار حماسًا لا مثيل له باستخدام منشئ النصوص الخاص بهChatGPTومولد الصور DALL-E الخاص به،قدمت OpenAI سورا، مولد الفيديو الخاص به. كما هو الحال مع منصاتها الأخرى، فهي أداة تعتمد على الذكاء الاصطناعي، قادرة على إنشاء محتوى من موجه في شكل نص. يعد Sora بإحداث ثورة في العديد من الاستخدامات الإبداعية على الإنترنت والقطاعات الأخرى، إليك ما تحتاج إلى معرفته عنه.
كيف يعمل سورا؟
يعتمد Sora، مثل نماذج GPT، علىهندسة المحولات. في الشبكة العصبية، سيستخدم المحول مجال دراسته لإنشاء علاقات بين مكونات التسلسل، مما يسمح له بعد ذلك بتعديل تسلسل الإدخال إلى تسلسل الإخراج وإنشاء استجابة للموجه. يجعل هذا النظام يبدو أن الذكاء الاصطناعي يفهم السؤال ويفكر في إنشاء إجابة ذات صلة، ولكن لا توجد مهارات تفكير في الواقع. هذه خوارزميات تستخدم تمثيلات رياضية لربط المفاهيم ببعضها البعض.
عندما تستخدم نماذج اللغات الكبيرة (LLM) الرموز المميزة في عملها، يستخدم Sora ما يطلق عليه OpenAI الرموز المميزة."بقع"(إصلاحات بصرية). لقد أثبتت هذه التقنية نفسها بالفعل في مجال تصور البيانات. يتم تحويل مقاطع الفيديو إلى تصحيحات عن طريق الضغط، ثم تعمل هذه التصحيحات كرموز مميزة. يمكن استخدامها لإعادة بناء مقطع فيديو (أو صورة) باستخدام المحول.

"Sora هو نموذج دفق يقوم بإنشاء فيديو يبدأ بفيديو يبدو كضوضاء ثابتة ثم يقوم بتحويله تدريجيًا عن طريق إزالة الضوضاء في عدة خطوات""، يشرح OpenAI. من الممكن إنشاء مقطع فيديو دفعة واحدة من خلال مطالبة واحدة أو استخدام مطالبات متعددة لإطالة الفيديو أو تصحيحه أثناء التقدم.

يستخدم النموذج نفس الشيءتقنية التلخيصيستخدم بواسطة DALL-E 3. ويتكون هذا من إنشاء أساطير مفصلة ووصفية للغاية لتطوير قاعدة بيانات تدريبية مرئية غنية. وبالتالي يمكن للنموذج الاستفادة من قاعدة البيانات هذه للامتثال بشكل أكثر دقة لتعليمات المستخدم النصية في الفيديو الذي تم إنشاؤه.
بالإضافة إلى المطالبة النصية، يدعم Sora تعليمات المعالجة التي تحتوي على صورة ثابتة. ثم يقوم بإنشاء رسم متحرك بناءً على محتوى هذه الصورة. يمكن أن تقترح المطالبة أيضًا مقطع فيديو ستتمكن سورا من توسيعه أو يمكنها إضافة مشاهد مفقودة إليه.
في الوقت الحالي، يستطيع Sora إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة. يرجع هذا الحد إلى مقدار الموارد اللازمة لإنشاء مقطع فيديو يحترم بدقة تعليمات المستخدم والنمط المرئي المطلوب. لم تعلن OpenAI عن وقت المعالجة اللازم لإنشاء مقطع فيديو. يبدو أن عودة المستخدمين الأوائل تشير إلى ذلكيستغرق إنشاء مقطع فيديو مدته دقيقة واحدة مع Sora حوالي ساعة. يمثل هذا التأخير نقطة ضعف كبيرة في الخدمة، مما يمنع المستخدمين من تصحيح مقاطع الفيديو الخاصة بهم بشكل فعال من خلال مطالبات جديدة لتحسينها والحصول على نتائج أكثر صلة.
ما مدى جودة صورة سورا؟
يقوم Sora بإنشاء مقاطع فيديو بتنسيقدقة تصل إلى 1920 × 1080 بكسل، أي Full HD. ويمكنه أيضًا إنتاج مقاطع فيديو بتنسيق رأسي يصل إلى 1080 × 1920 بكسل، والتكيف مع أي نسبة. على عكس الخدمات الأخرى من هذا النوع، فإن عدد الإطارات في الثانية لمقاطع الفيديو غير معروف.
سورا قادر على الإبداعالاداءات واقعية للغاية، ولكن أيضًا مشاهد أكثر تجريدية، وفقًا للطلبات الموضحة في الموجه. قد تظهر خدع وانحرافات في الصورة، وقد نلاحظ ظاهرة الهلوسة، كما هو الحال مع توليد الصورة باستخدام DALL-E. يمكن أيضًا أن تحدث أخطاء في الحركات، وكذلك في التفاعلات بين الشخصيات أو مع الإعداد والكائنات. لكن الأمثلة الأولى التي نشرتها OpenAI مثيرة للإعجاب، ويمكننا أن نعتقد أن Sora قد يكون جاهزًا بالفعل لإنشاء إعلانات إعلانية يتم بثها على الإنترنت أو على التلفزيون.
باعتراف OpenAI نفسه، لا يزال Sora بحاجة إلى التحسين."قد يجد صعوبة في محاكاة فيزياء مشهد معقد بدقة وقد لا يفهم حالات محددة من السبب والنتيجة"، تعترف الشركة. على سبيل المثال، إذا قام شخص ما بقضم قطعة من الكعك، فقد لا يكون هناك علامة عض عليها. تعد إدارة الزجاج المكسور أيضًا من الصعوبات التي تواجهها OpenAI. يمكن أن يتم الخلط بين النمط في التعليمات المكانية للموجه، مثل الخلط بين اليسار واليمين على سبيل المثال. قد يكون من الصعب أيضًا اتباع تعليمات الاتجاه لمشهد ما، مثل مسار محدد أو زاوية الكاميرا.
ومن ناحية أخرى، فإن سورا قادر على إنشاء مشاهد بتفاصيل دقيقة للموضوع والخلفية، والتعبير عن المشاعر، واحترام الأسلوب البصري، وتغيير اللقطات عدة مرات في مقطع فيديو واحد أو حتى اعتماد تنسيق فيلم معين، مثل 35 ملم. لقد تم إتقان التناسق ثلاثي الأبعاد بالفعل. يمكن لـ Sora إنشاء مقاطع فيديو بحركة الكاميرا الديناميكية."بينما تتحرك الكاميرا وتدور، يتحرك الأشخاص والعناصر الموجودة في المشهد بشكل متماسك في مساحة ثلاثية الأبعاد"نتعلم.
مطالبة: "مقطع دعائي لفيلم يعرض مغامرات رجل الفضاء البالغ من العمر 30 عامًا والذي يرتدي خوذة دراجة نارية من الصوف الأحمر، والسماء الزرقاء، والصحراء المالحة، بأسلوب سينمائي، تم تصويره على فيلم مقاس 35 مم، بألوان زاهية."pic.twitter.com/0JzpwPUGPB
- أوبن إيه آي (@OpenAI)15 فبراير 2024
وبالمثل، فإن OpenAI سعيدة بأداء Sora من حيث التماسك الزمني عبر الفيديو ودوام الكائن."يمكن لنموذجنا الحفاظ على الأشخاص والحيوانات والأشياء حتى عندما تكون مخفية أو خارج الإطار. ويمكنه إنشاء لقطات متعددة لنفس الشخصية في عينة واحدة، مع الحفاظ على مظهرها طوال الفيديو.تقول الشركة.
كيف تجرب سورا؟
Sora متاح فقط لأعضاءشبكة OpenAI Red Teaming. هذه مجموعة مختارة بعناية من المستخدمين وتتمثل مهمتها في اختبار قدرات الأداة. الهدف هو الإبلاغ عن المشكلات الفنية أو القانونية أو الأخلاقية إلى OpenAI، حتى يمكن حلها قبل الإطلاق على نطاق أوسع. تثير مسألة التزييف العميق قلق ناشري حلول إنشاء الفيديو بشكل خاص. ويجب إقامة الحواجز في هذا الصدد. يعد احترام حقوق الطبع والنشر مسألة مهمة أخرى يجب أخذها بعين الاعتبار.
"نحن نمنح أيضًا إمكانية الوصول إلى عدد من الفنانين والمصممين وصانعي الأفلام للحصول على تعليقات حول كيفية تطوير النموذج، بحيث يكون مفيدًا قدر الإمكان للمحترفين المبدعين"، تقارير أيضًا OpenAI. تشارك الشركة تقدمها وتفتح الباب أمام Sora لعدد قليل من الأشخاص خارج OpenAI في الوقت الحالي للحصول على أكبر قدر ممكن من التعليقات وتحسين أدواتها. لا نعرف حتى الآن متى سيكون Sora متاحًا لعامة الناس، أو بأي شكل.
هل سيتم دمج Sora في ChatGPT؟
لا نعرف حاليًا كيف تنوي OpenAI توزيع Sora على عامة الناس. إذا اعتمدنا على القرارات الإستراتيجية الأخيرة التي اتخذتها الشركة، فليس من المؤكد أن الأداة لديها منصة مستخدم خاصة بها. لم يعد DALL-E 2 يقبل عملاء جدد على واجهته الخاصة، في حين يتعين عليك المرور عبر إصدار مدفوع أو إصدار مطور من ChatGPT للوصول إلى DALL-E 3. لذلك يمكننا أن نتخيل أنه عند إطلاقه، سيتم دمج Sora مباشرة فيشات جي بي تي بلس. ليس من المؤكد أنه سيتم توفير التوفر المجاني، حتى لو كان محدودًا، لـ Sora عند إصداره.

ما هي التدابير الأمنية المضمنة في سورا؟
قبل إتاحة Sora لعامة الناس، أعلنت OpenAI بالفعل عن سلسلة من الإجراءات للحد من مخاطر إساءة استخدام هذه الأداة القوية. وتقوم الشركة حاليا بتطوير الأدوات"للمساعدة في اكتشاف المحتوى المضلل"، مع الإشارة على وجه الخصوص إلى نظام التصنيف الذي يتيح اكتشاف مقطع فيديو تم إنشاؤه بواسطة Sora. تم أيضًا تحديد أنه إذا تم دمج النموذج في منتج OpenAI في المستقبل، فإن الفرق تخطط لتضمينهالبيانات التعريفية لـ C2PA. يتيح هذا المعيار المفتوح، المستخدم بالفعل للصور التي تم إنشاؤها بواسطة DALL-E 3، تتبع أصل المحتوى لمعرفة ما إذا كان قد تم إنشاؤه بواسطة الذكاء الاصطناعي أم لا.
ستستفيد Sora أيضًا من ميزات الأمان المطبقة بالفعل في خدماتها الأخرى. يتم التخطيط أمصنف النصيتمثل دوره في فحص ورفض المطالبات التي تنتهك سياسات استخدام OpenAI. يتم حظر المطالبات التي تطلب محتوى يعرض العنف الشديد أو المحتوى الجنسي أو الصور التي تحض على الكراهية أو التشابه مع أحد المشاهير أو عنوان IP لطرف ثالث. بالإضافة إلى ذلك، ستقوم مصنفات الصور بفحص صور كل فيديو تم إنشاؤه، للتأكد من عدم انتهاك أي فيديو لسياسات الاستخدام الشهيرة هذه.
من هم منافسو سورا؟
بعد نماذج توليد النصوص والصور، يعمل اللاعبون الرئيسيون في قطاع الذكاء الاصطناعي للأجيال بجدية على تطوير نماذج توليد الفيديو. تعد شركة جوجل أحد المنافسين الرئيسيين لـ ChatGPT وGPT-4 مع Gemini، كما أنها تضع نفسها كمنافس قوي في مجالتصميم فيديو باستخدام Lumiere. Google Lumiere، والذي لا يمكن لعامة الناس الوصول إليه، يقتصر حاليًا على مقاطع فيديو مدتها خمس ثوانٍ. يمكن أن تحتوي المطالبة على صورة، وليس نصًا فقط.
من بين الشركات الرقمية ذات الثقل، تهتم Meta أيضًا بالموضوع، ولا سيما معفيديو الايمو، والذي يسمح لك بإنشاء مقاطع فيديو من مطالبة نصية فقط، أو مطالبة صورة فقط، أو مزيج من الاثنين معًا. يمكننا أن نستشهد بـ Gen-2، من Runway، القادر على إنشاء مقاطع فيديو ليس فقط من النصوص أو الصور، ولكن أيضًا من فيديو آخر. يعد Stable Video Diffusion و Pika أيضًا من المنافسين الجديين في هذا السوق.
اسأل عن أحدث لدينا!
NordVPN: لم يتبق سوى ساعات قليلة للاستفادة من خصم بنسبة 74% و3 أشهر مجانية بسرعة!
تستفيد NordVPN من نسخة 2024 من الجمعة السوداء لخفض أسعارها! وتتيح الخدمة الشهيرة لعملائها الجدد الحصول على خصم 74% و3 أشهر مجانية على اشتراكهم. انقر هنا لرؤية العروض...
خطط بونس
تنشر Free تحديثًا على صناديقها، وتخضع سيارة R5 الكهربائية لاختبار التصادم، وهذه هي خلاصة الأسبوع
تستفيد مجموعة Freebox بأكملها من تحديث جديد للنظام، حيث حصلت R5 e-Tech على تصنيف 4 نجوم فقط خلال اختبارات الأعطال Euro NCAP، كما قامت Google بتجديد تطبيق الرسائل الخاص بها، وإليك ملخص الأسبوع. خلال…
أخبار
عبقري العملات المشفرة أم محتال أم انتهازي بسيط؟ قصة هذا الطفل الذي حصل على 50 ألف دولار في دقائق معدودة بفضل عملته الافتراضية الخاصة، تثير الجدل حول تنظيمها. إذا قيل لك أنك…
إنترنت
هل تعتقد أن أحد أفراد أسرتك يشكل خطورة أثناء القيادة؟ استنكرها، فهي مشجعة من قبل السلامة على الطرق
تطلق السلامة على الطرق حملة إعلامية لتذكيرك بأنه يمكنك الإبلاغ عن شخص عزيز عليك، في رأيك، لا ينبغي السماح له بالقيادة. البعض يراها ضرورة والبعض الآخر يعتبرها إدانة. إذا كان لديك سيارة، فأنت…
سيارة
سيتيح لك تطبيق Google Chat قريبًا تثبيت الرسائل المهمة في محادثاتك
تستعد Google لتحديث خدمة المراسلة الاحترافية الخاصة بها. يكشف أحدث إصدار من Gmail (الإصدار 2024.11.24.702067492) عن الوصول المرتقب لميزة "لوحة" جديدة لـ Google Chat، مما يسمح للمستخدمين بتثبيت الرسائل والموارد المهمة. هذه الجدة والاكتشاف…
التطبيقات
فكرة هدية لموسيقى الروك أند رول: مكبر صوت Marshall Kilburn II بسعر منخفض في Fnac!
قم بتغيير تجربتك الموسيقية مع مكبر الصوت الشهير Marshall Kilburn II، في عرض ترويجي استثنائي في Fnac! صوت قوي وتصميم روك أند رول وعمر بطارية قياسي بسعر منخفض. لا تفوت هذه الفرصة المثالية لعيد الميلاد! يكتشف…
خطط بونس
هواوي: يبلغ هذا الرجل من العمر 82 عامًا، ويمتلك أكثر من 200 هاتف ذكي من الشركة المصنعة الصينية
قام Song Maoxin، وهو جامع أعمال يبلغ من العمر 82 عامًا، بإضافة هاتف Huawei Mate 70 الجديد تمامًا إلى مجموعته الرائعة التي تضم ما يقرب من 200 هاتف من العلامة التجارية. في الأصل من مدينة لويانغ القديمة، الصين، سرعان ما ...
هواوي
إليكم Blackbird، التاكسي الطائر الذي أحدث ثورة في التنقل الجوي
كشفت شركة CycloTech، وهي شركة نمساوية مقرها في لينز، للتو عن خطط لإنشاء سيارة أجرة طائرة مبتكرة تسمى "Blackbird". يمكن أن يمثل هذا التقدم التكنولوجي نقطة تحول في تاريخ التنقل الحضري بفضل نظام الدفع الثوري….
أخبار
One UI 7: تتمتع الأدوات الذكية الموجودة على هواتف Samsung Galaxy الذكية بمظهر جديد!
أطلقت شركة سامسونج إصلاحًا شاملاً لواجهتها باستخدام One UI 7.0، مما يضفي حياة جديدة على عناصر واجهة المستخدم الشهيرة. ويعد هذا التحديث، المتوقع في إصدار مستقر لعام 2025، بتغيير تجربة المستخدم لأجهزة Galaxy. مثل…
سامسونج
إصدارات Netflix الجديدة في ديسمبر 2024: مسلسلات وأفلام تستحق المشاهدة
ندعوك كل شهر لتقييم المسلسلات والأفلام التي تقدمها Netflix. الإصدارات الجديدة والأفلام الوثائقية، كما نقدم لك أفضل 3 مسلسلات وأفلام يجب متابعتها. مستعد؟ الشراهة!
نيتفليكس