مقدمة في Stable Diffusion XL
نسخة Stable Diffusion XL 1.0 (SDXL) هي الإصدار الأحدث من نظام توليد الصور الذكاء الصناعي Stable Diffusion، تم إنشاؤها بواسطة Stability AI وتم إصدارها في يوليو 2023. تقدم SDXL تحسينات كبيرة عن الإصدارات السابقة من خلال نظام نموذج مزدوج بـ 6 مليارات معلم، مما يتيح دقة 1024x1024 وتوليد صور واقعية للغاية، وإمكانيات نص قابل للقراءة، والتحفيز المبسط بكلمات أقل، وأنماط مُعدة مسبقًا مدمجة. تمثل Stable Diffusion XL قفزة كبيرة في جودة ومرونة وإمكانات إبداعية مقارنة بإصدارات Stable Diffusion السابقة.
تحسينات مفتاحية في SDXL
تشمل SDXL ترقيات رئيسية مثل هيكل UNet الأكبر، والتكييف متعدد الأحجام، ونموذج راينر منفصل. التحسينات الرئيسية هي
UNet أكبر 3 مرات مع مزيد من المعلمات لتعلم الميزات بشكل أفضل.
أنظمة التكييف الجديدة مثل التكييف حسب الحجم والقص للحفاظ على التفاصيل.
نموذج راينر يقلل من التشوهات ويعزز الدقة البصرية.
دعم توليد الصور بدقة 1024x1024 لمزيد من التفاصيل.
إمكانيات توليد النص المتقدمة لنص أحدث.
تتبع التجارب مع Weights & Biases
تساعد Weights & Biases (W&B) في تسجيل تجارب SDXL للتنظيم والإمكانية العالية لإعادة الإنتاج. الفوائد تشمل
مزامنة تكوينات النموذج والمعلمات الهامة تلقائيًا.
تسجيل الصور المولدة لتحليل التجارب.
مقارنة إصدارات النموذج المختلفة والمطالبات.
اختيار أفضل الصور عبر التجارب.
توليد الصور المثلى بواسطة SDXL
بعض النصائح للحصول على أقصى استفادة من SDXL
- 1
استخدم الأوامر السلبية لإزالة الميزات غير المرغوب فيها.
- 2
قم بضبط وزن الأوامر للمزيد من التحكم.
- 3
استفد من مصفاة الصور للحصول على أفضل جودة.
- 4
كرر الأوامر للحصول على نتائج مثالية.
- 5
قم بتوليد صور بدقة 768x768 أو 1024x1024.
استخدام Compel لوزن الأوامر
Compel هو مكتبة لوزن ودمج الأوامر النصية لأنظمة تضمين النصوص المحوّلة. يوفر بناء جمل مرن لإعادة وزن أجزاء مختلفة من سلسلة الأمر، وبالتالي إعادة وزن التضمين التنسوري. يتوافق Compel مع diffusers.DiffusionPipeline للتحكم الأفضل في توليد الصور.
بيانات التدريب لـ SDXL
تم تدريب SDXL مسبقًا على حوالي 18 مليون صورة من مجموعة بيانات ImageNet و12 مليون صورة من مجموعة بيانات OpenImages. تم تغيير حجم هذه الصور إلى 256x256 بكسل وزيادتها بواسطة قصاصات عشوائية، وانعكاسات وما إلى ذلك. كما تم استخدام مجموعة بيانات COCO كذلك للتقييم.
![](https://cdn.stablediffusionai.ai/_next/static/media/background-faqs.55d2e36a.jpg)
الأسئلة الشائعة
ما هو stable diffusion xl ؟
يعتبر Stable Diffusion XL (SDXL) هو الإصدار الأحدث من نموذج الذكاء الصناعي التوليدي الخاص بـ Stability AI لتوليد الصور عالية الوضوح من النصوص. بفضل حجم النموذج الأكبر والتحسينات المعمارية مثل مشفرات النص المزدوجة، ونظم التكييف ونموذج refiner منفصل، يحقق SDXL جودة صورة ودقة وتناسق كبيرة مقارنةً بإصدارات Stable Diffusion السابقة. ينتج صورًا واضحة بدقة 1024x1024 ويتفوق في تفاصيل مثل وجوه البشر الواقعية وتقديم النصوص بشكل حاد. يمثل SDXL تقدمًا كبيرًا في قدرات الذكاء الصناعي الإبداعية.
كيف يمكن تثبيت stable diffusion xl ؟
لتثبيت Stable Diffusion XL، تأكد أولاً من تثبيت Python وPyTorch. قم بنسخ مستودعات نموذج SDXL الأساسي ونموذج refiner من HuggingFace Hub باستخدام git-lfs. ثم قم بتثبيت الاعتمادات مثل Transformers، وDiffusers، وAccelerate. قم بتحميل خطوط الأنابيب الأساسية والمصفاة من DiffusionPipeline باستخدام نقاط التحقق للنموذج. قدّم الأوامر النصية لإنشاء latents باستخدام النموذج الأساسي، ثم حسنها باستخدام نموذج المصفاة للحصول على صور عالية الوضوح. يتطلب إعداد SDXL بعض المعرفة التقنية ولكن المكتبات مثل Diffusers تبسط العملية. بمجرد تثبيت النماذج والاعتمادات، يمكن استخدام SDXL برمجيًا لتوليد نص إلى صورة على مستوى الفن.
هل stable diffusion xl مفتوح المصدر؟
نعم، Stable Diffusion XL مفتوح المصدر. لقد أصدرت Stability AI أوزان النموذج والشيفرة المصدرية إلى المجال العام دون الحاجة إلى إذن أو رسوم. يمكن لأي شخص تحميل نماذج SDXL الأساسية والمصفاة من مستودعات مثل HuggingFace Hub بحرية. يتيح الطابع المفتوح المصدر الشفافية الكاملة في بنية النموذج وعملية التدريب. كما يتيح المساهمات المجتمعية مثل الضبط الدقيق لـ SDXL لتحسين الأداء في مهام وجماليات محددة. بينما النماذج المنافسة مثل DALL-E مغلقة المصدر، يتناسب توفر SDXL المفتوح المصدر مع رسالة Stability AI لتوفير الوصول إلى تكنولوجيا الذكاء الصناعي. هذا يتيح اعتمادًا أوسع وابتكارًا مع نماذج التوليد المتقدمة.
ما هو sdxl ؟
SDXL هو اختصار لـ Stable Diffusion XL، وهو الإصدار الأحدث من نموذج الذكاء الصناعي التوليدي الرائد لـ Stability AI لتركيب النصوص إلى الصور. يقوم ببناء على هيكلية Stable Diffusion الأصلية مع تحسينات مثل حجم النموذج الأكبر، ومشفرات النص المزدوجة، ونموذج refiner إضافي. تجهز هذه التحسينات SDXL لتوليد صور أكثر تفصيلًا ودقة عالية من الأوامر النصية مقارنة بالإصدارات السابقة. تشمل القدرات الرئيسية توليد صور بدقة 1024x1024، ووجوه بشرية فوتوغرافية، ونصوص متناسقة وحادة. يمثل SDXL قفزة كبيرة في الجودة والقدرة الإبداعية للذكاء الصناعي التوليدي. كما يتيح توفره المفتوح المصدر الابتكار المدفوع من المجتمع لتقدم التكنولوجيا.
كيف يمكن ضبط sdxl بدقة؟
لضبط SDXL بدقة، قم أولاً بتثبيته جنبًا إلى جنب مع الاعتمادات مثل Diffusers. أعد مجموعة صغيرة من الصور الممثلة لمهمة الضبط الدقيق المرغوبة. ثم استخدم سكريبت Diffusers train_dreambooth_lora_sdxl لتدريب LoRA (تكيف منخفض الرتبة) فوق نموذج SDXL الأساسي باستخدام مجموعة البيانات. يعدّل هذا SDXL لتوليد نتائج متخصصة عندما يتم تكييفها على كلمة مفتاحية مختارة. يستخدم تدريب LoRA موارد أقل مقارنة بالضبط الدقيق الكامل، مع الحفاظ على تخصيص قدرات SDXL لمهام مثل أنماط الفن والمناظر الطبيعية، وما إلى ذلك. بمجرد التدريب، يمكن تحميل LoRA جنبًا إلى جنب مع SDXL وتنشيطه بكلمة المرور المختارة لتوجيه التوليد. يمكّن الضبط الدقيق المستخدمين من فتح إمكانيات SDXL الكاملة لاحتياجاتهم الفريدة.