يعد MGIE، نموذج الذكاء الاصطناعي الذي قدمته شركة Apple، بإحداث تحول في تحرير الصور من خلال تفسير التعليمات النصية، مما يمثل إنجازًا كبيرًا في مجال الإبداع بمساعدة الذكاء الاصطناعي للمؤسسة.

تطور الذكاء الاصطناعي في مجالخلق الصورةحققت إنجازات كبيرة،لا سيما مع Bing Image Creator من Microsoft، مما يوفر للمستخدمين القدرة على إنشاء الصور منأوصاف النص. هذا الابتكار، كذلكالتحسينات اللاحقة في السرعة والكفاءة، يشهد على التقدم السريع للشركة في استخدامالذكاء الاصطناعيلالتطبيقات الإبداعية.
مايكروسوفت تفوقت مؤخرا على شركة أبلمن حيث التقييم، وذلك بفضل التزامها والتقدم الكبير الذي حققته في مجال الذكاء الاصطناعي، كما يتضح مننجاح ChatGPT-4 وCopilot Pro. وفي هذا السياق،إم جي إي دابليبدو كاستجابة استراتيجية تهدف إلى الحفاظ على قدرتها التنافسية في مجال الذكاء الاصطناعي.
نتيجة التعاون بين شركة أبل والباحثين في جامعة كاليفورنيا في سانتا باربرا.مجيي(تحرير الصور الموجه بـ MLLM) يتميز بقدرته على الفهم والتنفيذأوامر نصيةلمعالجة دقيقة على مستوى البكسل. هذه القدرة على تحويل التعليمات النصيةبسيطة أو غامضةفي توجيهات واضحة ودقيقة يفتح إمكانيات جديدة لتحرير الصور بديهية. تم تقديم هذا النموذج في مؤتمر ICLR 2024كفاءة ملحوظة. ويقدم نتائج دقيقة تمت الموافقة عليها من قبل المستخدمين، في حينالعمل بسرعةودون إهدار الموارد.
تتميز MGIE بقدرتها على الإنجازمجموعة واسعة من التعديلاتالصور، بدءًا من تعديلات الألوان البسيطة وحتى تحويلات الكائنات المعقدة. يعمل القالب أيضًا على تحسين الصور على مستوى العالم ويسمح بذلكالتنقيح المستهدفعلى مناطق محددة. إنه يتفوق في قص الصور وتغيير حجمها وتدويرها، بالإضافة إلى ضبط السطوع والتباين وتوازن الألوان، كل ذلك منمطالبات نصية بسيطة. يتوفر هذا البرنامج كمصدر مفتوح، ومن السهل الوصول إليه عبر GitHub، مع موارد إضافية مثل دفتر ملاحظات تجريبي وعرض توضيحي على الويب علىمعانقة مساحات الوجهمما يجعلها ملائمة للاستخدام في تطبيقات التحرير المختلفة.
مصدر :arxiv