لم تعد رقابة الذكاء الاصطناعي فعالة، وتمكن هؤلاء الباحثون من إنتاج صور محظورة

طور الباحثون في جامعة كورنيل خوارزمية قادرة على تجاوز الرقابة التوليدية للذكاء الاصطناعي. وبفضل هذا، تمكنوا من الحصول على صور ذات طبيعة إباحية، وعادةً ما يكون من المستحيل إنشاؤها باستخدام DALL-E أو Stable Diffusion. من خلال التعلم، على طول الطريق، أشياء مفاجئة حول كيفية عملها.

مع هذه القوة، كان من الواضح للأسف أن الذكاء الاصطناعي التوليدي من شأنه أن يسبب انحرافات. وتشمل هذه التزييف العميق،تُستخدم اليوم بشكل أساسي لإنشاء محتوى إباحي، على حساب الأشخاص الموجودين في مقاطع الفيديو. لذلك، من الضروري أن تقوم أنظمة الذكاء الاصطناعي المولدة للصور، مثل DALL-E وMidjourney، بدمج شبكة أمان تمنع التدفقات الفائضة.

وبالتالي، تقوم هذه الأدوات بمراقبة العديد من الكلمات التي تعتبر جنسية أو حتى عنيفة، على الرغم من أن التعريف يختلف وفقًا لحساسية كل شخص. من المستحيل، على سبيل المثال، أن نطلب من الذكاء الاصطناعي إنتاج شخص عارٍ. سيتم رفض المطالبات التي تحتوي على هذه الكلمات الخاضعة للرقابة بشكل قاطع، بينما يتعرض المستخدمون الذين لديهم إصرار قليل جدًا لخطر الحظر.

كيف دفع الباحثون الذكاء الاصطناعي لإنتاج صور إباحية

هذا لا يعني أنه كان من المستحيل دائمًا التحايل على هذه الرقابة. ومع ذلك، فإن الأساليب الحالية لدفع أنظمة الذكاء الاصطناعي لإنشاء صور محظورة لم تكن عالمية على الإطلاق، وتعمل فقط على أداة محددة. حتى اكتشف فريق من الباحثين في جامعة كورنيل كيفية إخضاع كل الذكاء الاصطناعي لإرادته.

في نفس الموضوع -ومن شأن الذكاء الاصطناعي أن يزيد من شعور الإنسان بالوحدة، مما يعرض جيلاً كاملاً للخطر

SneakyPrompt: هذا هو اسم هذه الخوارزمية القادرة على التحايل على رقابة الذكاء الاصطناعي التوليدي. الهدف من هذا الأخير هو تحديد الأساليب الأكثر فعالية لتحقيق أهدافه (غير التقليدية بشكل عام) عن طريق اختبار صيغ مختلفة من المحفزات. اعتمادًا على الاستجابة التي تم الحصول عليها، ستقوم الخوارزمية بتكييف مطالباتها حتى يتم الحصول على النتيجة المتوقعة.

وذلك عندما بدأ SneakyPrompt في تحقيق بعض الاكتشافات المذهلة. ومن خلال التكرارات للعثور على أفضل الصيغ، انتهت الخوارزمية إلى فهم أن تسلسلات معينة من الأحرف لا تعني شيئًا على الإطلاق يتم تفسيرها بشكل واضح جدًا بواسطة الذكاء الاصطناعي. دون أن يعرف الباحثون السبب، يتحول "mowwly" إلى "cat"، بينما يصبح "butnip fwngho" كلبًا ضمن المطالبات.

ويطرح ينزي كاو، عضو فريق البحث، فرضية مثيرة للاهتمام لتفسير هذه الظاهرة. يشير هذا إلى أن الذكاء الاصطناعي يتم تدريبه من خلال مجموعة من النصوص المكتوبة بلغات مختلفة. ومن ثم يمكن أن تكون تسلسلات معينة من الأحرف قريبة من كلمات معينة في لغات معينة، مما يدفع الذكاء الاصطناعي إلى تحديد أن هذه هي الكلمة التي أراد المستخدم كتابتها.

من الواضح أنه من الممكن استخدام هذا "الخلل" لدفع الذكاء الاصطناعي لإنشاء صور صريحة. وفي الواقع، لا يتم دمج تسلسلات الأحرف هذه في المرشحات الأمنية للأدوات، وبعد العديد من المحاولات، يمكن دفع الذكاء الاصطناعي إلى تفسيرها على أنها كلمات محظورة. وهي نتيجة أصبحت ممكنة بالتأكيد بفضل حقيقة أن هذه الأدوات تعتمد على سياق الجملة وليس على معناها الأساسي.

في الواقع، في الجملة"الخطير يظن أن والت زمجر بتهديد على الغريب الذي اقترب من صاحبه"،سوف تأخذ أنظمة الذكاء الاصطناعي ذلك بشكل عام"الخطير يفكر والت"تعني "كلب"، لأن هذه الكلمة تعمل مع بقية الموجه.

ويحدد الباحثون أن هذه الاكتشافات لا ينبغي أن يستخدمها المستخدمون للتحايل على الإجراءات الأمنية، بل لتحذير منشئي الذكاء الاصطناعي من الخلل الموجود في نظامهم. لذلك من غير المرجح أن يتم إصدار SneakyPrompt لعامة الناس، وهو على الأرجح ليس بالأمر السيئ.

مصدر :جامعة كورنيل

اسأل عن أحدث لدينا!

أفضل الأجهزة اللوحية التي تعمل باللمس: ما الطراز الذي يجب شراؤه في عام 2024؟
إذا كنت تبحث عن أفضل جهاز لوحي يعمل بنظام Android، فقد وصلت إلى المكان الصحيح! دليل شراء الأجهزة اللوحية الخاص بنا موجود هنا لمساعدتك في الاختيار من بين العديد من الطرازات وجميع العلامات التجارية المتوفرة في السوق. اتبع القائد !
أدلة شراء الكمبيوتر
تم دفع سيارات الدفع الرباعي الكهربائية الست هذه إلى نقطة نفاد الوقود، أي منها ذهبت إلى أبعد من ذلك؟
أجرى مات واتسون من قناة CarWoW على YouTube للتو اختبارًا فريدًا إلى حد ما. الفكرة؟ قم بقيادة ست سيارات دفع رباعي كهربائية إلى أقصى حدودها لتعرف أي منها ستذهب إلى أبعد مدى. كلهم على نفس الطريق، في نفس اليوم، في…
السيارات الكهربائية
Disney+: أخيرًا عرفنا المبلغ الذي سيتعين عليك دفعه لمشاركة حسابك في فرنسا
بمناسبة انعقاد مؤتمر جديد مخصص لأخبار ديزني في عام 2025، كشفت الشركة الكبيرة أخيرًا عن المبلغ الذي سيتعين على المستخدمين الفرنسيين دفعه لمشاركة حساب Disney + الخاص بهم. في يوم الثلاثاء 10 ديسمبر 2024، ديزني…
ديزني +
سلسلة Warhammer 40K قادمة إلى Prime Video، بقيادة هنري كافيل
اتفقت Prime Video وGames Workshop ومنتجو سلسلة Warhammer 40K أخيرًا على الاتجاه الإبداعي الذي يجب اتخاذه للبرنامج، والذي يمكن بالتالي أن يبدأ تطويره. لقد كان في الهواء، والآن أصبح رسميًا. سلسلة مطرقة حرب…
أمازون برايم فيديو
بيانات iCloud الخاصة بك في خطر شديد، قم بتحديث جهاز iPhone أو mac الخاص بك على الفور
تسمح ثغرة أمنية في iOS وmacOS للتطبيقات الضارة بالوصول إلى بيانات iCloud الخاصة بك دون إذن. إذا لم يكن جهازك محدثًا، فقد تتعرض معلوماتك الشخصية للخطر. iOS 18 وmacOS Sequoia، الإصدار الأحدث…
ايفون
نحن نعرف المزيد عن مؤامرة Spider-Man 4
بدأت مؤامرة Spider-Man 4 في الكشف عن نفسها ببطء. سيكون يعتمد بشكل أساسي على الكتب المصورة لقوس Spider-Man 24/7. بعد الثلاثية التي انتهت بتأليه نهاية Spider-Man: No Way Home، والتي تم إصدارها في...
تلفزيون
اختبار Motorola Edge 50 Ultra: الصيغة الجيدة التي كنا ننتظرها؟
تم التخلي عن موتورولا في عام 2023، وتمنح طراز "Ultra" فرصة أخرى في عام 2024. وحتى أفضل تجهيزًا من Edge 50 Pro، فإن هذا الهاتف الذكي لديه طموح للتنافس مع أفضل حاملي المعايير من Samsung أو Apple أو Xiaomi أو Google. بيعت بعدة مئات من اليورو …
الاختبارات
Windows 11: أصبح متصفح Microsoft Edge أكثر كفاءة وأسرع، حتى على أجهزة الكمبيوتر القديمة
بفضل تكامل WebUI 2.0 على Edge، اكتسب متصفح Microsoft استجابة وسرعة على Windows 11. والخبر السار الآخر هو أن هذه التحسينات ستفيد أيضًا المستخدمين المجهزين بجهاز أكثر تواضعًا. إذا أخذت مايكروسوفت…
ويندوز
يوفر Windows 11 أخيرًا وصولاً سريعًا إلى الرموز التعبيرية وملفات GIF
يحتوي Windows 11 على اختصار في شريط المهام، مما يسمح لك بفتح الأداة مما يتيح الوصول إلى الرموز التعبيرية وملفات GIF والحافظة. لقد اعتدنا على هواتفنا الذكية أن نكون قادرين على الوصول بسرعة إلى الرموز التعبيرية وملفات GIF، عندما...
ويندوز
يمكن لجهاز Samsung Galaxy S25 أن يجعل حياتك أسهل بفضل معيار الشحن الجديد هذا
تستعد شركة سامسونج لتحقيق إنجاز كبير في هاتفها Galaxy S25 من خلال التكنولوجيا التي يمكن أن تجعل الشحن اللاسلكي أكثر موثوقية وملاءمة، مع تسهيل استخدام الملحقات. يمثل هاتف Galaxy S25، خلفًا لهاتف Galaxy S24، الجيل التالي من الهواتف الذكية...
سامسونج جالاكسي اس