
जर तुम्ही जनरेटिव्ह आर्टसह काम करत असाल आणि दृश्य प्रभावComfyUI हे एक नियंत्रण पॅनेल आहे जे तुम्हाला सर्जिकल अचूकतेसह प्रतिमा, अॅनिमेशन आणि अगदी व्हिडिओ देखील फाइन-ट्यून आणि तयार करण्याची परवानगी देते. नोड्स आणि साखळीबद्ध कार्यप्रवाह वापरून त्याचा दृष्टिकोन यामुळे स्टेबल डिफ्यूजनच्या प्रत्येक टप्प्यावर काय घडते हे समजून घेऊ इच्छिणाऱ्या आणि नियंत्रित करू इच्छिणाऱ्यांसाठी हे एक आदर्श साधन बनते.
पुढील विभागांमध्ये तुम्हाला प्रगत सर्जनशील प्रकल्पांमध्ये ComfyUI मध्ये प्रभुत्व मिळविण्यासाठी सखोल आणि व्यावहारिक मार्गदर्शक मिळेल: मजकुरापासून प्रतिमेपर्यंत, प्रतिमेपासून प्रतिमेपर्यंत, SDXL, इनपेंटिंग आणि आउटपेंटिंगस्केलिंग, कंट्रोलनेट, एम्बेडिंग्ज, LoRA, आवश्यक शॉर्टकट आणि स्टेबल व्हिडिओ डिफ्यूजन आणि अॅनिमेटडिफसह व्हिडिओ वर्कफ्लो. हे सर्व एका आकर्षक शैलीत सादर केले आहे, ज्यामध्ये अडथळे आणि सामान्य चुका टाळण्यासाठी ठोस उदाहरणे आणि टिप्स आहेत.
ComfyUI म्हणजे काय आणि ते इतर इंटरफेसपेक्षा वेगळे कसे दिसते?
ComfyUI हे स्टेबल डिफ्यूजनसाठी एक मॉड्यूलर, नोड-आधारित GUI आहे जे तुम्हाला लेगो ब्लॉक्ससारखे तुकडे जोडून कस्टम प्रक्रिया तयार करू देते. प्रत्येक नोड एक कार्य करतो (मॉडेल लोडिंग, मजकूर एन्कोडिंग, सॅम्पलिंग, डीकोडिंग इ.) आणि ते एका टप्प्यापासून दुसऱ्या टप्प्यात डेटा वाहून नेणाऱ्या "एज" द्वारे इतरांशी जोडते.
AUTOMATIC1111 च्या तुलनेत, ComfyUI अधिक पारदर्शकता आणि लवचिकता देते. तुम्ही अचूक डेटा प्रवाह पाहू आणि सुधारित करू शकताहे तुम्हाला कोडला स्पर्श न करता पुनरुत्पादित करण्यायोग्य कार्यप्रवाह आणि प्रोटोटाइप भिन्नता सामायिक करण्यास अनुमती देते. तोटा असा आहे की इंटरफेस प्रकल्पांमध्ये अधिक बदलू शकतो आणि "नोड्सच्या बाबतीत विचार करण्याची" सवय लावणे आवश्यक आहे.
जर तुमची पहिलीच वेळ असेल तर काळजी करू नका: आदर्शपणे, तुम्ही मूलभूत प्रवाहापासून सुरुवात करावी, ती कार्यान्वित करावी आणि नंतर नोड्स जोडावे किंवा बदलावे. प्रत्येक तुकड्याचे योगदान काय आहे हे समजून घेण्यासाठी. शेवटी, ती शिकण्याची वक्र सर्जनशील नियंत्रण आणि कामगिरीमध्ये लाभांश देते.
आवश्यक बिल्डिंग ब्लॉक्स: नोड्स, कनेक्शन आणि मूलभूत नियंत्रणे
ComfyUI कॅनव्हासमध्ये तुम्हाला इनपुट आणि आउटपुट पोर्टसह "बॉक्स" (नोड्स) दिसतील. आउटपुटवरून सुसंगत इनपुटवर ड्रॅग करा कनेक्शन तयार करण्यासाठी, बटण सोडा आणि पुढील शिफारस केलेला नोड निवडा. जर तुम्हाला काही हटवायचे असेल, तर ते निवडा आणि हटवा दाबा आणि जर तुम्हाला पुन्हा सुरुवात करायची असेल, तर साफ करा पर्याय वापरा.
नेव्हिगेट करणे खूप सोपे आहे: माउस व्हील किंवा पिंच जेश्चर वापरून झूम कराकॅनव्हासभोवती फिरण्यासाठी ड्रॅग करा आणि लिंक्स तयार करण्यासाठी पोर्टवर क्लिक करा आणि धरून ठेवा. जेव्हा तुम्हाला व्ह्यू साफ करायचा असेल तेव्हा वरच्या डाव्या कोपऱ्यात बिंदूसह नोड्स लहान करा.
एक उपयुक्त टीप: जेव्हा तुम्ही पॅरामीटर्सची चाचणी करत असाल, तेव्हा सेव्ह इमेजला प्रिव्ह्यू इमेजने बदला. अशा प्रकारे तुम्ही डिस्क तात्पुरत्या परिणामांनी भरत नाही. तुमच्या पाइपलाइनमध्ये पुनरावृत्ती करताना.
टेक्स्ट टू इमेज स्टेप बाय स्टेप: प्रॉम्प्ट ते पिक्सेल
क्लासिक टेक्स्ट-टू-इमेज फ्लो काही की नोड्ससह तयार केला आहे. तुम्ही चेकपॉईंट लोड करून सुरुवात करता, तुमचा प्रॉम्प्ट एन्कोड करता, KSampler सह लॅटेंट जनरेट करता आणि VAE सह डीकोड करता. अंतिम प्रतिमा मिळविण्यासाठी.
लोड चेकपॉईंटसह मॉडेल निवड
लोड चेकपॉइंट नोड तीन मुख्य आउटपुट देतो: MODEL (UNet), CLIP (टेक्स्ट एन्कोडर) आणि VAE. MODEL KSampler ला, CLIP ला टेक्स्ट नोड्स ला आणि VAE ला इमेज एन्कोडिंग/डिकोडिंग भागाला जोडते.जर तुम्हाला तुमचे मॉडेल यादीत दिसत नसेल, तर ते ComfyUI द्वारे कॉन्फिगर केलेल्या चेकपॉइंट्स फोल्डरमध्ये ठेवा.
CLIP टेक्स्ट एन्कोडसह सकारात्मक आणि नकारात्मक प्रॉम्प्ट
तुम्ही दोन CLIP टेक्स्ट एन्कोड नोड्स वापराल: एक "पॉझिटिव्ह" प्रॉम्प्टसाठी आणि एक KSampler च्या "नकारात्मक" प्रॉम्प्टसाठी. CLIP तुमच्या शब्दांना उच्च-आयामी एम्बेडिंगमध्ये रूपांतरित करते जे आवाज काढून टाकण्यास मार्गदर्शन करेल. तुम्ही (शब्द:१.२) सारख्या वाक्यरचना वापरून पदांना अधिक वजन देऊ शकता किंवा (शब्द:०.८) वजा करू शकता.
जर तुम्ही कस्टम एम्बेडिंग्जसह काम करत असाल, तर तुम्ही त्यांना नावाने देखील संदर्भित करू शकता. शिकलेल्या संकल्पना किंवा शैली आत्मसात करण्याचा हा एक मार्ग आहे. पिढीला मार्गदर्शन करणाऱ्या मजकुरात थेट.
गुप्त प्रतिमा आणि शिफारस केलेले आकार
जनरेशन एका गुप्त जागेत सुरू होते. रिकाम्या गुप्त प्रतिमा नोडसह, तुम्ही उंची, रुंदी आणि बॅच आकार परिभाषित करता. ते SD 1.5, 512×512 किंवा 768×768 साठी खूप चांगले काम करतात.SDXL साठी, 1024x1024 सहसा इष्टतम असते. लक्षात ठेवा की मॉडेलच्या आर्किटेक्चरमुळे रिझोल्यूशन 8 च्या पटीत असणे आवश्यक आहे.
VAE: सुप्त ते पिक्सेल पर्यंत (आणि उलट)
VAE संकुचित करते आणि पुनर्रचना करते, पिक्सेलच्या जगाला गुप्त जगाशी जोडते. दृश्यमान प्रतिमा मिळविण्यासाठी ते शेवटी डीकोड केले जाते.तथापि, इनपेंटिंग सारख्या कामांमध्ये तुम्ही इनपुट इमेजमधून देखील कोड करू शकता. कार्यक्षमतेच्या बदल्यात, थोडे नुकसान होते: आदर्श इमेजच्या तुलनेत लहान कलाकृती दिसू शकतात.
केसॅम्पलर: प्रसाराचे हृदय
हा नोड असा आहे जो तुमच्या प्रॉम्प्टद्वारे निर्देशित केलेल्या कंटेंटला प्रत्यक्षात येईपर्यंत पुनरावृत्ती होणारा आवाज काढून टाकतो. प्रमुख पॅरामीटर्स: बियाणे (पुनरावृत्ती), पायऱ्या (तपशील आणि साफसफाई), सॅम्पलर आणि शेड्यूलरडीनॉइज कंट्रोल किती पुनर्लेखन करायचे हे नियंत्रित करते; पूर्ण आवाजाच्या 1 भागावर, आणि कमी मूल्ये स्त्रोत सिग्नलचा अधिक भाग जतन करतात (पिक्चर-इन-पिक्चरमध्ये उपयुक्त).
एक उपयुक्त सेटिंग म्हणजे control_after_generation, जी प्रत्येक अंमलबजावणीनंतर सीड काय करते हे परिभाषित करते. तुम्ही ते स्थिर ठेवू शकता, वाढवू शकता, कमी करू शकता किंवा रँडमाइज करू शकता. इतर कोणत्याही गोष्टीला स्पर्श न करता सहलींमध्ये बदल करणे.
इमेज टू इमेज, SDXL, इनपेंटिंग आणि आउटपेंटिंग
चित्र-दर-चित्र वर्कफ्लोवर स्विच केल्याने प्रतिमा इनपुट जोडली जाते आणि निष्ठा आणि सर्जनशीलता संतुलित करण्यासाठी आवाज कमी करणे समायोजित केले जाते. कमी आवाज, मूळ फोटोबद्दल अधिक आदरसंख्या जितकी जास्त असेल तितके पुनर्अर्थ लावण्याचे स्वातंत्र्य जास्त.
SDXL देखील असेच काम करते, फक्त उच्च रिझोल्यूशन आणि समृद्ध एन्कोडिंग सिस्टमसह. जर तुमचा GPU परवानगी देत असेल, तर १०२४x१०२४ रिझोल्यूशन वापरा आणि VRAM वापराचे निरीक्षण करा.तुम्हाला तपशील, सुसंगतता आणि रंगसंगतीमध्ये सुधारणा दिसतील.
इनपेंटिंगसाठी, इमेज लोड करा आणि मास्कएडिटरमध्ये एडिट मास्क परिभाषित करा. VAE एन्कोड वापरा (इनपेंटसाठी) आणि डीनॉइज स्ट्रेंथ कॉन्फिगर करा. किती पुनर्जन्म करायचे हे ठरवण्यासाठी. लक्षात ठेवा की विशिष्ट इनपेंटिंग चेकपॉइंट्स आहेत, जरी तुम्ही योग्य नोड्स समायोजित करून मानकासह देखील काम करू शकता.
आउटपेंटिंगमध्ये आउटपेंटिंगसाठी पॅड इमेजसह कॅनव्हास विस्तृत केला जातो. पिक्सेल जोडण्यासाठी डावीकडे, वर, उजवीकडे, तळाशी नियंत्रण ठेवा, जोडणी गुळगुळीत करण्यासाठी फेदरिंग लावा आणि इनपेंट कोडिंगमध्ये grow_mask_by वापरा (१० पेक्षा जास्त मूल्ये सहसा अधिक नैसर्गिक संक्रमणे देतात).
स्केलिंग: पिक्सेल विरुद्ध गुप्त आणि प्रत्येक कधी निवडायचे
ComfyUI मध्ये स्केलिंग दोन प्रकारे करता येते. अपस्केल पिक्सेल दृश्यमान प्रतिमा मोठी करते (जलद आणि सोपे, बायक्यूबिक, बायलिनियर किंवा जवळचे-अचूक अशा अल्गोरिदमसह), तर अपस्केल लॅटंट लॅटंट स्पेसमध्ये पुनर्व्याख्या करतो (अधिक वेळ, परंतु तपशील आणि पोत जोडतो).
जर तुम्हाला रेंडरमधून जास्तीत जास्त फायदा घ्यायचा असेल, तर अपस्केल इमेज नोडसह (मॉडेल वापरून) लोड अपस्केल मॉडेल वापरून मॉडेलनुसार स्केलिंग करून पहा. विशेष मॉडेल्स (उदा. अॅनिमे किंवा वास्तववादी) आणि २x किंवा ४x घटक निवडा. अंतिम उद्दिष्टावर अवलंबून.
जेव्हा तुम्ही मूळ प्रति पूर्ण निष्ठा शोधत असता, तेव्हा पिक्सेल स्केलिंग हा तुमचा सहयोगी असतो. जर तुम्हाला अधिक माहिती आणि सूक्ष्म-तपशीलांसह प्रतिमा समृद्ध करण्यात रस असेल तर, नंतर सुप्त मार्ग चमकतो (ज्याला "हाय-रेस सुप्त निराकरण" असेही म्हणतात).
कंट्रोलनेट: सीमा, पोझ, खोली आणि विभाजनासह अचूक नियंत्रण.
कंट्रोलनेट स्ट्रक्चरल मॅप्ससह जनरेशनला कंडिशनिंग करण्यास अनुमती देते आणि विशेष प्रभाव जसे की रेषीय, खोली, ओपनपोज किंवा सेगमेंटेशन. फ्रेमिंग, पोझेस किंवा सिल्हूटची प्रतिकृती तयार करण्यासाठी हे आदर्श आहे. मजकुराची व्याख्या करणाऱ्या शैलीचा त्याग न करता. मार्गदर्शन आणि स्वातंत्र्य संतुलित करण्यासाठी नियंत्रण शक्ती समायोजित करा.
एका सामान्य वर्कफ्लोमध्ये प्रीप्रोसेसिंग (उदा., प्रतिमेतून एज किंवा पोझ काढणे) आणि संबंधित कंट्रोलनेट मॉडेल समाविष्ट असते. दोन किंवा अधिक कंट्रोलनेटसह तुम्ही पूरक नियम लागू करू शकता (उदा., मानवी पोझ + खोली) अतिशय सुसंगत परिणाम साध्य करणे.
ComfyUI व्यवस्थापक: इंटरफेसमधून नोड्स स्थापित करा, अपडेट करा आणि शोधा.
जेव्हा वर्कफ्लो तुमच्याकडे नसलेले कस्टम नोड्स मागतो तेव्हा ComfyUI मॅनेजर जीवन सोपे करते. मेनूमधूनच, गहाळ घटक स्थापित करा आणि ComfyUI रीस्टार्ट करा. जेणेकरून ते उपलब्ध होतील. तुम्ही एका क्लिकवर अपडेट्स तपासू शकता आणि बदल लागू करू शकता.
तुमच्या कॅनव्हासमध्ये नोड्स जोडण्यासाठी, रिकाम्या जागेवर डबल-क्लिक करा आणि फाइंडर उघडा. तुम्हाला आवश्यक असलेला अचूक ब्लॉक शोधण्याचा आणि तयार करण्याचा हा एक जलद मार्ग आहे. लांब मेनूमधून न जाता.
एम्बेडिंग्ज: तुमच्या प्रॉम्प्टमध्ये कस्टम संकल्पना आणि शैली
एम्बेडिंग्ज (ज्याला टेक्स्ट इन्व्हर्जन देखील म्हणतात) हे नवीन "शब्द" आहेत ज्यात शिकलेली शैली किंवा संकल्पना असते, जसे की फिल्टर किंवा भ्रामक परिणाम. तुम्हाला फक्त असे काहीतरी लिहावे लागेल embedding:NombreDelEmbedding प्रॉम्प्टमध्ये आणि ComfyUI एम्बेडिंग फोल्डरमध्ये संबंधित फाइल शोधेल.
जर तुम्ही त्यापैकी बरेच हाताळले तर ऑटोकंप्लीट सोनेरी आहे. ComfyUI-Custom-Scripts सारख्या नोड्ससह तुम्ही “एम्बेडिंग:” टाइप करता तेव्हा तुम्हाला सूचना मिळतात.यामुळे निवड प्रक्रिया वेगवान होते आणि टायपिंगच्या चुका कमी होतात.
तुम्ही एम्बेडिंगला सामान्य संज्ञेप्रमाणे वजन देऊ शकता. वाक्यरचना प्रकार (embedding:Nombre:1.2) त्याचा प्रभाव वाढवते किंवा कमी करतेशैली आणि आशय यांच्यात संतुलन साधण्यासाठी वजनांचा प्रयोग करणे महत्त्वाचे आहे.
LoRA: तुमचा चेकपॉईंट जुळवून घ्या आणि विविध शैली एकत्र करा
LoRA ही एक हलकी फाइन-ट्यूनिंग आहे जी VAE ला स्पर्श न करता चेकपॉईंटचे MODEL आणि CLIP सुधारते. हे विशिष्ट शैली, लोक किंवा वस्तू इंजेक्ट करण्यासाठी वापरले जाते. हलके आणि अत्यंत बहुमुखी. मूलभूत कार्यप्रवाह: बेस चेकपॉईंट लोड करा, LoRA जोडा, प्रॉम्प्ट परिभाषित करा आणि लाँच करा.
एकाच वेळी अनेक LoRA उदाहरणे? अगदी शक्य आहे. ते कॅस्केडमध्ये लावले जातात आणि प्रत्येक मागील एकावर बांधला जातो.जर तुम्हाला बारीक नियंत्रण हवे असेल, तर "स्टॅक" नोड्स वापरा जे तुम्हाला प्रत्येक LoRA साठी सक्रिय/निष्क्रिय आणि ताकद समायोजित करण्यास अनुमती देतात.
जलद काम करण्यासाठी शॉर्टकट आणि युक्त्या
जेव्हा तुम्ही ComfyUI च्या शॉर्टकटमध्ये प्रभुत्व मिळवता तेव्हा ComfyUI मधील उत्पादकता वाढते. कॉपी/पेस्ट करा (Ctrl+C / Ctrl+V), नोंदी जतन करून पेस्ट करा (Ctrl+Shift+V)Ctrl वापरून अनेक नोड्स निवडा, Shift वापरून त्यांना एका गटात हलवा किंवा Ctrl+M वापरून नोड तात्पुरते म्यूट करा जेणेकरून ते वगळता येईल.
तयार केलेले पीएनजी एम्बेडेड वर्कफ्लो मेटाडेटा म्हणून सेव्ह करतात. अचूक प्रवाह पुनर्संचयित करण्यासाठी ComfyUI कॅनव्हासवर PNG ड्रॅग करा. ज्यातून ते तयार झाले. आवृत्त्या संग्रहित करण्यासाठी किंवा इतरांसोबत शेअर करण्यासाठी ते उत्तम आहे.
आणखी एक महत्त्वाची टीप: जेव्हा तुम्ही लांब प्रक्रिया एकत्र करता तेव्हा बियाणे दुरुस्त करा. जर नोडचा इनपुट बदलला तरच ComfyUI पुन्हा कार्यान्वित करते.म्हणून बियाणे स्थिर ठेवल्याने तुमच्याकडे आधीच असलेल्या तुकड्यांची पुनर्गणना करण्यापासून तुम्ही वाचू शकता.
तृतीय-पक्ष वर्कफ्लो डाउनलोड आणि आयात करा
शिकण्याचा एक उत्तम मार्ग म्हणजे तृतीय-पक्ष वर्कफ्लो लोड करणे आणि प्रयोग करणे. JSON फाइल डाउनलोड करा, जर ती ZIP फाइलमध्ये असेल तर ती अनझिप करा आणि कॅनव्हासमध्ये आयात करा.जर तुम्हाला नोड्स गहाळ झाल्यामुळे एरर दिसल्या तर त्या मॅनेजर वापरून इन्स्टॉल करा आणि रीस्टार्ट करा.
अनेक वर्कफ्लोमध्ये दोन प्रकार असतात: एक "सामान्य" आणि एक अतिरिक्त स्केलिंगसह. झूम इन करून नोड्स तपासा आणि भिंगाच्या साहाय्याने पॅरामीटर्सचे पुनरावलोकन करा. त्याच्या निर्मात्याचे निर्णय समजून घेण्यासाठी, अवलंबित्वे सोडवल्यानंतर, क्यू प्रॉम्प्ट दाबा आणि निकाल पहा.
स्थिर व्हिडिओ प्रसार (SVD): स्थिर प्रतिमेपासून अॅनिमेटेड क्लिपपर्यंत
SVD प्रसारण प्रतिमान वेळेपर्यंत वाढवते, प्रतिमांमधून लहान क्लिप्स तयार करते. १४ आणि २५ फ्रेम्ससाठी पर्याय आहेत (SVD आणि SVD-XT) ५७६×१०२४ च्या सामान्य रिझोल्यूशनसह आणि ३ ते ३० दरम्यान कॉन्फिगर करण्यायोग्य fps सह. हे मोठ्या व्हिडिओ सेटवर प्रशिक्षित होते आणि उच्च-गुणवत्तेच्या सामग्रीसह परिष्कृत होते.
ComfyUI मध्ये तुम्ही तीन महत्त्वाचे पॅरामीटर्स समायोजित करू शकता. मोशन बकेटचा आयडी विस्थापनाची तीव्रता नियंत्रित करतोfps प्लेबॅक गती दर्शवते आणि "वाढ पातळी" बेस इमेजमधून किती रूपांतरण लागू करायचे हे ठरवते (अधिक आवाज म्हणजे अधिक सर्जनशील बदल).
यू-नेट फ्रेम्सच्या क्रमाला सुसंगत खंड म्हणून हाताळण्यासाठी ऐहिक लक्ष एकत्रित करते. यामुळे सर्व फ्रेम्समधून एकाच वेळी आवाज काढता येतो. आणि दृश्य सातत्य राखणे, प्रतिमांमधील झगमगाट कमी करणे.
ComfyUI मध्ये AnimateDiff: टेक्स्ट टू व्हिडिओ आणि व्हिडिओ टू व्हिडिओ
अॅनिमेटडिफ तुम्हाला टेक्स्ट (txt2vid) वरून अॅनिमेटेड सीक्वेन्स जनरेट करण्याची किंवा इमेज सीक्वेन्स (vid2vid) ट्रान्सफॉर्म करण्याची परवानगी देतो. दोन कंट्रोलनेटसह मध्यम रिझोल्यूशनवर आरामात काम करण्यासाठी१० जीबी व्हीआरएएम असलेला एनव्हीआयडीए जीपीयू वापरण्याची शिफारस केली जाते; ८ जीबीसह तुम्ही रिझोल्यूशन कमी करू शकता किंवा txt2vid प्लस कंटेंटवर चिकटून राहू शकता.
वातावरण सेट करण्यासाठी उपयुक्त साधने: नोड्स क्लोनिंगसाठी गिट, ComfyUI पोर्टेबल पॅकेज एक्सट्रॅक्ट करण्यासाठी 7-झिप आणि पर्यायीरित्या, कॉम्बाइनर नोड्समधून GIF किंवा MP4 एन्कोड करण्यासाठी FFmpeg (पहा कलात्मक प्रभाव तयार करण्यासाठी व्हिडिओ ट्यूटोरियल). जर FFmpeg PATH मध्ये नसेल, तर स्ट्रीम अजूनही प्रतिमा निर्माण करतील.तथापि, व्हिडिओ नोड्स पॅक करण्यात अयशस्वी होऊ शकतात.
ComfyUI पोर्टेबल स्थापित करा, योग्य स्क्रिप्ट चालवा (उदा., run_nvidia_gpu) आणि की कस्टम नोड्स जोडा: अॅनिमेटडिफ इव्हॉल्व्ह्ड, कॉम्फीयूआय-मॅनेजर, अॅडव्हान्स्ड कंट्रोलनेट आणि व्हिडिओहेल्परसुइटमॅनेजरकडून, ते प्रगत वेळापत्रकासाठी सहाय्यक कंट्रोलनेट आणि फिझनोड्स प्रीप्रोसेसर देखील स्थापित करते.
आवश्यक मॉडेल्स: सुसंगत SD 1.5 चेकपॉइंट्स, एक सॉलिड VAE, अॅनिमेटडिफसाठी मोशन मॉड्यूल्स (मूळ किंवा ऑप्टिमाइझ केलेले जसे की टेम्पोरलडिफ किंवा स्थिर आवृत्त्या) आणि कंट्रोलनेट मॉडेल्स जसे की लिनियर, डेप्थ किंवा ओपनपोज. प्रत्येक फाईल त्याच्या संबंधित फोल्डरमध्ये ठेवा. (चेकपॉइंट्स, व्हीएई, कंट्रोलनेट, मोशन) नोड सिलेक्टरमध्ये दिसण्यासाठी.
व्हिडिओ-विशिष्ट नोड्स आणि पॅरामीटर्स
vid2vid साठी, फ्रेम्सच्या फोल्डरकडे निर्देशित करणारा इमेज लोडर वापरा. image_load_cap किती फ्रेम लोड करायच्या हे मर्यादित करते.`skip_first_images` सुरुवातीच्या प्रतिमा वगळते आणि `select_every_nth` अनुक्रमाचे उपनमुने देते (उदा., प्रत्येक दोन पैकी एक फ्रेम घेण्यासाठी २).
जलद ओळखीसाठी प्रॉम्प्ट नोड्सचा रंग कस्टमाइझ केला जाऊ शकतो. सकारात्मक साठी हिरवा, नकारात्मक साठी लाल हा एक सामान्य पॅटर्न आहे, जरी तो कार्यक्षमतेवर परिणाम करत नाही. तुमचे मॉडेल लोडिंग नोड्स विद्यमान फायलींकडे निर्देशित करत आहेत का ते नेहमी तपासा.
एकसमान संदर्भ पर्याय अॅनिमेशनची "प्रभावी" लांबी वाढवतात. संदर्भ लांबी (उदा. १६), ओव्हरलॅप परिभाषित करतेआणि, लागू असल्यास, लूप मोड. कॉन्टेक्स्ट स्ट्राइड पॅरामीटर ग्लोबल पास तयार करण्याचा आणि इंटरमीडिएट्स भरण्याचा प्रयत्न करतो, परंतु गणना वेळ लक्षणीयरीत्या वाढवू शकतो.
फिझनोड्स एक अतिशय लवचिक बॅच प्रॉम्प्ट शेड्युलर प्रदान करते. उपसर्ग आणि प्रत्ययांसाठी pre_text आणि app_text वापरा. आणि फ्रेम_नंबर: प्रॉम्प्टच्या जोडीने प्रत्येक फ्रेममध्ये बदल परिभाषित करा. पार्सिंग त्रुटी टाळण्यासाठी शेवटी अतिरिक्त स्वल्पविराम जोडणे टाळा.
KSampler मध्ये, व्हिडिओसाठी पायऱ्या २० वरील वाढवा. CFG ला प्रतिमेत दाखवल्याप्रमाणे हाताळले आहे; वेगवेगळे सॅम्पलर वापरून पहा. (Euler_a सहसा चांगले काम करते). vid2vid मध्ये, जर तुम्हाला मूळ जेश्चर आणि रचना टिकवून ठेवायची असेल तर denoise कमी करा आणि अधिक मुक्त पुनर्व्याख्यानासाठी ते वाढवा.
अॅनिमेटडिफ पॅकेजेस सीक्वेन्सचा एकत्रित नोड. फॉरमॅट (gif/mp4), फ्रेम_रेट, लूप_काउंट आणि पिंगपॉन्ग निवडा. जर तुम्हाला ते पुढे-मागे प्ले करायचे असेल, तर वर्कफ्लो मेटाडेटासह किमान एक फ्रेम जतन करण्यासाठी "सेव्ह इमेज" सक्रिय करा.
कामाच्या सूचना आणि समस्या सोडवणे
अधिक नियंत्रणासाठी, शेवटी दुसरा रिफायनिंग KSampler जोडा. तसेच मोशन लोरा आणि स्मूदर कंट्रोल नेटवर्क वापरून पहा. स्थिर प्रतिमांमध्ये, जास्त शक्ती हालचालीला "कडक" करू शकते; व्हिडिओमध्ये, जास्त शक्ती हालचालीला कडक बनवू शकते. मानवी हावभाव जपण्यासाठी ओपनपोज उत्कृष्ट आहे.
जर "नल टाइप एरर्स" दिसल्या तर, प्रत्येक लोड नोडमध्ये निवडलेले मॉडेल आहे का ते तपासा. लक्षात ठेवा की काही नोड रिपॉझिटरीज एकमेकांशी संघर्ष करू शकतात. जर तुम्ही आधीच इतर कामांसाठी ComfyUI वापरत असाल, तर परस्परविरोधी काम बंद करा किंवा वेगळे वातावरण तयार करा.
जर तुम्हाला प्रक्रिया वेगवान करायची असेल तर vid2vid मध्ये, १२-१५ fps वर क्रम तयार करा. फ्रेम्स काढण्यासाठी तुम्ही ऑनलाइन टूल्स किंवा एडिटर वापरू शकता. आणि ComfyUI मध्ये लोड करण्यापूर्वी एकूण रक्कम कमी करा. नंतर तुमच्या इच्छित सौंदर्यशास्त्रानुसार पॅकेजचा अंतिम फ्रेम_रेट समायोजित करा.
चांगली कामगिरी आणि संघटनात्मक पद्धती
अनेक टप्प्यांची साखळी करताना बिया सेट करा आणि संबंधित ब्लॉक्स हलविण्यासाठी गट वापरा. प्रवाहाचा "कंकाल" पाहण्यासाठी दुय्यम नोड्स कमी करा. आणि तुम्ही चाचणी किंवा अंतिम प्रस्तुतीकरण टप्प्यात आहात यावर अवलंबून सेव्ह/प्रिव्ह्यू नोड्स दरम्यान पर्यायी.
मॅनेजरसह नोड्स अपडेट ठेवा आणि प्रत्येक संबंधित पुनरावृत्तीसाठी एक प्रतिमा जतन करून तुमचे व्हेरिएंट दस्तऐवजीकरण करा. ComfyUI PNG मध्ये वर्कफ्लो कसा एम्बेड करतेतुमच्याकडे प्रक्रियेचा परिपूर्ण रेकॉर्ड असेल आणि तुम्ही ट्रॅक गमावणार नाही.
आणि जर तुम्हाला काहीही इन्स्टॉल करायचे नसेल, तर क्लाउड-आधारित पर्याय आहेत जिथे तुम्ही काही सेकंदात पूर्व-निर्मित वर्कफ्लो आणि लोकप्रिय टेम्पलेट्स उघडू शकता. लहान संघांसोबत प्रोटोटाइपिंग किंवा काम करण्याचा हा एक जलद मार्ग आहे. प्रगत नोड्स न सोडता.
ComfyUI, ControlNet, LoRA, एम्बेडिंग्ज आणि व्हिडिओ मॉड्यूल्सचे संयोजन आज एक अतिशय शक्तिशाली परिसंस्था तयार करते. सरावाने, प्रत्येक सौंदर्यात्मक ध्येयासाठी कोणता तुकडा खेळायचा हे तुम्हाला शिकायला मिळेल.मग ते अतिवास्तववादी पोर्ट्रेट असो, स्वच्छ विस्तार असो, अचूक इनपेंट असो किंवा सुसंगत आणि शैलीबद्ध हालचाली असलेली क्लिप असो.
आपण पाहिलेली प्रत्येक गोष्ट एक स्पष्ट चित्र रंगवते: मूलभूत प्रवाहांपासून सुरुवात करा, चरण-दर-चरण नियंत्रण जोडा आणि पुनरावृत्ती परिणामांसाठी तुमचे टेम्पलेट्स एकत्रित करा. जेव्हा तुम्ही नोड्सचे लॉजिक आंतरिकीकृत करता आणि मुख्य पॅरामीटर्स जाणून घेताComfyUI हे इमेज आणि व्हिडिओ दोन्हीमध्ये, स्टेबल डिफ्यूजनसह कोणत्याही व्हिज्युअल इफेक्ट्स प्रोजेक्टसाठी तयार असलेले एक आयडिया मशीन बनते.





