أعلنت شركة OpenAI عن إطلاق نموذجها الجديد GPT Image 2 ضمن منصة ChatGPT، في تحديث يمثل نقلة نوعية في عالم توليد الصور بالذكاء الاصطناعي، النموذج لا يكتفي بإنشاء صور جميلة، بل بات يفكر فيها ويحللها ويبحث عبر الإنترنت لإنتاجها، وهو ما يجعله أكثر من مجرد تحديث اعتيادي.
من DALL-E إلى GPT Image 2.. رحلة طويلة نحو التفكير البصري
لمن يتذكر الأيام الأولى لـ DALL-E، حين كانت الصور تخرج بأصابع مشوهة ونصوص غير مقروءة، يبدو GPT Image 2 وكأنه قادم من مستقبل مختلف تمامًا.
أعلنت OpenAI إطلاق تحديث جديد لآلية توليد الصور في ChatGPT، يُضيف ما تصفه الشركة بـ"قدرات التفكير"، مما يتيح البحث عبر الإنترنت وبناء مجموعة صور متكاملة انطلاقًا من أمر واحد فقط.
هذه الجملة الأخيرة "أمر واحد فقط" تختصر التحول الجوهري في طبيعة العلاقة بين المستخدم والنموذج، لم يعد الأمر مجرد وصف نصي يُترجَم إلى بكسلات، بل أصبح النموذج قادرًا على الاستنتاج والبحث والتخطيط قبل أن يرسم أول خط.
ثماني صور في آنٍ واحد
يمكن للمستخدمين الآن إنشاء ما يصل إلى 8 صور بشكل متزامن، مع الحفاظ على العناصر المشتركة مثل الشخصيات والأغراض والأسلوب عبر جميع المشاهد.
هذه الميزة تحديدًا تُحدث فرقًا حقيقيًا في سير عمل المصممين والمبدعين، إذ كانت الصور المتعددة تخرج في السابق متفاوتة الأسلوب وغير متسقة في التفاصيل، مما كان يستدعي جلسات تعديل مطولة.
تؤكد OpenAI أن النموذج قادر على إنتاج صفحات المانغا والتصاميم الخاصة بوسائل التواصل الاجتماعي، إلى جانب الاستخدامات الأخرى المتنوعة، وهو ما يعني عمليًا أن صانع محتوى يمكنه الآن إنتاج سلسلة قصصية متكاملة بأسلوب بصري موحد، دون الحاجة إلى التدخل اليدوي في كل إطار على حدة.
النصوص داخل الصور
ظل توليد النصوص داخل الصور بشكل صحيح أحد أكثر نقاط الضعف إزعاجًا في نماذج الصور السابقة، قدم النموذج الجديد تحسينات كبيرة في إنشاء الصور ودمج النصوص داخلها بشكل أكثر دقة وواقعية، مقارنة بالإصدارات السابقة التي كانت تعاني من أخطاء واضحة في كتابة الكلمات داخل الصور.
يوفر النموذج الجديد تقدمًا ملحوظًا في توليد النصوص باللغات غير اللاتينية، بالإضافة إلى تحسين عرض النصوص الإنجليزية بشكل خاص، وهذا يعني تحديدًا أن المستخدمين العرب باتوا أمام إمكانية حقيقية لإنتاج تصاميم احترافية تحتوي نصوصًا عربية سليمة، وهو ما كان شبه مستحيل في الإصدارات السابقة.
يتيح النموذج عند تفعيل وضع التفكير تحليل بنية الصورة، والاستفادة من المعلومات المتاحة عبر الإنترنت، وإنشاء شروحات بصرية "إنفوجرافيك" اعتمادًا على الملفات التي يرفعها المستخدم.
هذا الوضع هو الذي يُحوّل النموذج من أداة توليد إلى شريك إبداعي حقيقي، قادر على أخذ تقرير أو ملف بيانات وتحويله تلقائيًا إلى إنفوجرافيك قابل للنشر. جعلت OpenAI مزايا "التفكير" الجديدة متاحة لمشتركي الخطط المأجورة، مثل ChatGPT Plus وChatGPT Pro وChatGPT Business.
يدعم النموذج أنماط تصميم متعددة، بما في ذلك فن البكسل والمانغا، كما يقدم دقة تصل إلى 2K مع تنسيقات عرض متنوعة، كما تضمن التحديث تحسينات في التقاط الخصائص الأساسية للصور بدقة أعلى والاستجابة لتفاصيل يحددها المستخدم بشكل أفضل مما كان عليه في أي إصدار سابق.
أعلنت OpenAI أن جميع مستخدمي ChatGPT وCodex سيتمكنون من استخدام Images 2.0 بدءًا من يوم الثلاثاء 21 أبريل 2026، بينما سيحصل المشتركون في الخطط المدفوعة على إمكانيات أوسع وخيارات أكثر تقدمًا. كما ستتوفر واجهة برمجية API خاصة بالنموذج، مع تسعير يتفاوت بحسب جودة الصور ومستوى الدقة المطلوب.
المنافسة تشتعل.. وOpenAI تتقدم
يأتي هذا الإطلاق في ظل تصاعد المنافسة، مع ظهور أدوات متطورة مثل Nano Banana Pro من جوجل، وMAI-Image-2 من مايكروسوفت، غير أن GPT Image 2 يدخل هذه المنافسة بورقة رابحة واضحة، التكامل العميق مع منظومة ChatGPT الكاملة، مما يجعله أكثر سهولةً في الوصول لمئات الملايين من المستخدمين الحاليين الذين لن يحتاجوا إلى تعلم أداة جديدة من الصفر.

















0 تعليق