انتقل إلى المحتوى

نموذج توليد الصور من النص

هذه المقالة يتيمة. ساعد بإضافة وصلة إليها في مقالة متعلقة بها
يرجى إضافة قالب معلومات متعلّقة بموضوع المقالة.
من ويكيبيديا، الموسوعة الحرة
صورة مولدة من خلال الذكاء الاصطناعي من خلال الكلمات التالية:علامة توقف تحلق في سماء زرقاء

نموذج توليد الصور من النص هو نموذج للتعلم الآلي يأخذ وصفًا للغة الطبيعية وينتج صورة مطابقة لهذا الوصف.

ظهرت نماذج تحويل النص إلى صورة لأول مرة في منتصف عام 2010، تزامنًا مع بدايات ثورة الذكاء الاصطناعي. وفي عام 2022 نتيجة للتقدم في الشبكات العصبية العميقة. بدأ إنتاج أحدث نماذج تحويل النص إلى صورة، مثل DALL-E 2 من OpenAI، وGoogle Brain's Imagen ، و Stable Diffusion من StabilityAI، و Midjourney في الاقتراب من جودة الصور الفوتوغرافية الحقيقية والفن المرسوم بواسطة الإنسان.

قائمة نماذج توليد صورة من خلال النص[عدل]

اسم تاريخ الاصدار المطور الرخصة
DALL-E يناير 2021 OpenAI امتلاكي
دال-E 2 أبريل 2022
دال-E 3 سبتمبر 2023
إيماجين جوجل
إيماجين 2 ديسمبر 2023 [1]
Firefly يونيو 2023 أدوبي
ميدجورني يوليو 2022 ميدجورني

أنظر أيضا[عدل]

مراجع[عدل]

  1. ^ "Imagen 2 on Vertex AI is now generally available". Google Cloud Blog (بالإنجليزية الأمريكية). Archived from the original on 2024-02-21. Retrieved 2024-01-02.