وداعا فوتوشوب؟ أطلقت Google للتو منظمة العفو الدولية الجديدة قادرة على تعديل صورك بناءً على طلب صوتي بسيط. لا توجد ساعات أخرى تقضيها في إتقان برنامج معقد ، تحتاج فقط إلى مطالبة الذكاء الاصطناعى بإضافة قبعة إلى جدتك أو تحويل غرفة المعيشة الخاصة بك إلى غابة استوائية.

لقد تحسنت Google للتوGemini 2.0 فلاش، نموذج قادر على توليد وتحرير الصور بسهولة كما ينشئ النص. تعد حداثة على Google AI ، والتي تتناسب مباشرة مع واجهة ChatBot ، لإضفاء الطابع الديمقراطي على طبعة الصور واضطراب علاقتنا مع إعادة ملمس التصوير الفوتوغرافي.
تم إطلاق Gemini 2.0 Flash في الأسبوع الماضي والآن في متناول الجميع عبر Google AI Studioقدرتها على معالجة كل من النص والصورة داخل نموذج الذكاء الاصطناعي نفسه.يمثل هذا النهج متعدد الوسائط استراحة مع الحلول الموجودة ، والتي دعت بشكل عام نماذج مميزة لتوليد النص والصور.
يقرأ-يمكن الآن قراءة Gemini مقاطع فيديو YouTube لك ، إليك كيفية عملها
يريد Gemini 2.0 Flash أن يكون أكثر تنوعًا من ذي قبل
إمكانات فلاش Gemini 2.0 من حيث تحرير الصور كبير ومتنوع:
- إضافة أو حذف الكائنات في صورة
- تعديل المجموعات والإضاءة
- زاوية الرؤية
- تكبير الأمامي أو الخلف
- إزالة filigranes (على الرغم من أن هذا يمكن أن يؤثر على جودة الصورة)
وفقًا لـ Google ، أصبح هذا التنوع ممكنًا بفضلالتدريب على مجموعة كبيرة من البيانات تجمع بين الصور والنصوص. يتضمن النموذج بالتالي فهمًا عميقًا للمفاهيم المرئية والنصية ، مما يسمح له بإنشاء الصور مباشرةً استجابة لطلبات المستخدمين.
يبرز نهج Google عن نهج عمالقة التكنولوجيا الآخرين مثل Openai ، والذي يستخدم نماذج مميزة للنص (ChatGPT) والصورة (Dall-E). من وجهة نظر فنية ، تتخيل أن المعالجة المتزامنة للنص والصورة هي جشع للغاية في موارد الحساب. هذا يفسر جزئيا لماذالا تصل جودة الصور التي تم إنشاؤها بواسطة Gemini 2.0 Flash إلى وجودة النماذج المتخصصة مثل Dall-E.
الأخبار السيئة هي أنه على المستوى الأخلاقي ، فإن السهولة التي يمكن من خلالها هذه النماذج متعددة الوسائط التعامل مع الصور تثير مخاوف مشروعة. قد يصبح إنشاء مقنعات Deepfakes أو التعامل مع الصور للأغراض الضارة أكثر بساطة ، مما يطرح تحديات جديدة من حيث التضليل وحماية الخصوصية.