أعلنت شركة جوجل إطلاق “Imagen 4“، وهو أحدث إصدار من نماذج الذكاء الاصطناعي للشركة لتوليد الصور استنادًا إلى الأوامر النصية. وتطلق الشركة نموذجها مع وعد “بتحسن كبير في عرض النصوص داخل الصور” مقارنةً بالإصدار السابق Imagen 3. وإلى جانب ذلك، قدمت الشركة إصدارًا جديدًا أكثر تطورًا يُدعى Imagen 4 Ultra، وهو يستهدف المستخدمين الذين يحتاجون إلى نتائج دقيقة تتبع التعليمات النصية بنحو صارم، مقابل تكلفة إضافية. وتتيح جوجل النموذجين للتجربة الأولية مقابل رسوم عبر واجهة برمجة التطبيقات Gemini API، مع اختبار محدود مجاني عبر منصة Google AI Studio. وتصف جوجل الإصدار الأساسي من Imagen 4 بأنه “الخيار المناسب لمعظم المهام”، وتحدد تكلفة إنتاج الصورة الواحدة بـ 0.04 دولار. وأما إصدار Imagen 4 Ultra، فتبلغ تكلفة الصورة الواحدة فيه 0.06 دولار، أي أعلى بنسبة قدرها 50%. واستعرضت الشركة مجموعة من الصور التي أنشأها النموذج، منها قصة مصورة ثلاثية المشاهد تظهر مركبة فضائية صغيرة تتعرض لهجوم من كائن فضائي أزرق عملاق. وقد طابقت الصورة التعليمات النصية بدقة، وإن بدت وكأنها مستخرجة من تطبيق رسوم ثلاثية الأبعاد، ويمكن الإطلاع على عينات مُختارة من إنتاج نموذج جوجل الجديد عبر مدونة جوجل الرسمية. ومع أن Imagen 4 يُظهر تحسنًا طفيفًا مقارنةً بالنسخ السابقة، فإن الانطباع العام يشير إلى أن نماذج جوجل ما زالت خلف النماذج المنافسة، مثل DALL-E 3 من OpenAI و Midjourney 7، في مجال توليد الصور، وإن أظهر نموذجها الجديد Veo 3 تقدمًا كبيرًا في مجال توليد الفيديو. نسخ الرابط تم نسخ الرابط تابعنا