
जर तुम्हाला उत्तम नियंत्रण न गमावता एआय-संचालित प्रतिमा आणि व्हिडिओ निर्मितीमध्ये प्रथम उतरायचे असेल, तर तुम्ही योग्य ठिकाणी आला आहात: ComfyUI हा एक नोड-आधारित इंटरफेस आहे जो तुम्हाला LEGO ब्रिक्स सारखी तुमची स्वतःची पाइपलाइन तयार करू देतो. या मार्गदर्शकामध्ये तुम्ही ComfyUI मध्ये व्हिज्युअल इफेक्ट्स (VFX) वर्कफ्लो कसे सेट करायचे ते अगदी सुरुवातीपासून आणि तपशीलवार शिकाल., प्रतिमा आणि व्हिडिओ दोन्हीसाठी, काहीही महत्त्वाचे न गमावता.
मूलभूत गोष्टींव्यतिरिक्त, आपण टेक्स्ट-टू-इमेज फ्लो, इमेज-टू-इमेज फ्लो, इनपेंटिंग, आउटपेंटिंग, स्केलिंग, कंट्रोलनेट, एसडीएक्सएल, लोरा आणि एम्बेडिंग्ज पाहू. आम्ही AnimateDiff, HunyuanVideo, LTX Video आणि Wan 2.1 सह व्हिडिओमध्ये झेप घेऊ.यामध्ये आवश्यकता, स्थापना, प्रमुख पॅरामीटर्स आणि शॉर्टकट आणि नोड व्यवस्थापकांसह उत्पादकता टिप्स समाविष्ट आहेत. जर तुम्हाला जटिल स्थापना टाळायची असेल तर आम्ही क्लाउड पर्याय देखील समाविष्ट करू.
ComfyUI म्हणजे काय आणि ते VFX साठी आदर्श का आहे?
ComfyUI हे स्टेबल डिफ्यूजनसाठी नोड-आधारित GUI आहे जे तुम्हाला सुरुवातीपासून शेवटपर्यंत डेटा प्रवाह पाहू आणि सुधारू देते. प्रत्येक नोड एक विशिष्ट कार्य करतो (मॉडेल लोड करणे, मजकूर एन्कोड करणे, नमुना घेणे, VAE डीकोड करणे इ.) आणि केबल्सने जोडलेले असते. जे इनपुट आणि आउटपुट दर्शवतात. हे तत्वज्ञान VFX साठी परिपूर्ण आहे: सिग्नल कुठे प्रवेश करतो, तो कुठे रूपांतरित होतो आणि निकालावर कसा परिणाम करायचा हे तुम्हाला अचूक माहिती असते.
मोनोलिथिक इंटरफेसच्या तुलनेत, ComfyUI त्याच्या पारदर्शकता आणि लवचिकतेसाठी वेगळे आहे. त्या स्वातंत्र्याची किंमत म्हणजे शिकण्याची तीव्रता आणि काही दृश्य विचलन. (प्रत्येक वर्कफ्लो वेगवेगळ्या प्रकारे मांडता येतो), परंतु बक्षीस म्हणजे जलद प्रोटोटाइप करणे, अचूकपणे डीबग करणे आणि पुनरुत्पादित पद्धतीने वर्कफ्लो सामायिक करणे.
ComfyUI विरुद्ध AUTOMATIC1111
बरेच वापरकर्ते AUTOMATIC1111 वरून येतात, जे स्टेबल डिफ्यूजनसाठी क्लासिक आहे. ComfyUI ला हलकेपणा, पारदर्शकता आणि प्रोटोटाइपिंग क्षमतांमध्ये वाढ झाली आहे.A1111 अधिक एकसमान आणि थेट वाटते, परंतु कमी बारीक वाटते. जर तुम्हाला आतील कामकाज समजून घ्यायचे असेल आणि VFX चा जास्तीत जास्त फायदा घ्यायचा असेल, तर ComfyUI हा एक सुरक्षित पर्याय आहे.
पहिले टप्पे आणि मूलभूत नियंत्रणे
कॅनव्हासशी संवाद साधणे सोपे आहे: व्हील किंवा पिंच जेश्चरने झूम करा, हलविण्यासाठी ड्रॅग करा आणि एका नोडच्या आउटपुटपासून दुसऱ्या नोडच्या इनपुटवर ड्रॅग करून कनेक्शन तयार करा. तुम्हाला लोड चेकपॉइंट, CLIP टेक्स्ट एन्कोड, KSampler किंवा VAE सारखे ब्लॉक्स (नोड्स) दिसतील., आणि डेटा मार्ग दर्शविणारे केबल्स.
टेक्स्ट टू इमेज: बेसलाइन फ्लो आणि आवश्यक नोड्स
मानक पाइपलाइनमध्ये चेकपॉईंट लोड करणे, प्रॉम्प्ट एन्कोड करणे, लॅटंटमध्ये सॅम्पलिंग करणे आणि पिक्सेलमध्ये डीकोड करणे समाविष्ट आहे. हा तो सांगाडा आहे ज्यावर ComfyUI मधील जवळजवळ प्रत्येक गोष्ट बांधली जाते..
लोड चेकपॉईंटसह मॉडेल निवड
लोड चेकपॉईंट नोड तीन भाग वितरीत करतो: MODEL (नॉइज प्रेडिक्शन नेटवर्क), CLIP (टेक्स्ट एन्कोडर) आणि VAE (पिक्सेलमधून लॅटंटमध्ये जाण्यासाठी आणि उलट). MODEL KSampler ला फीड करते, CLIP टेक्स्ट नोड्सवर जाते आणि अंतिम निकाल डीकोड करण्यासाठी VAE चा वापर केला जातो.चेकपॉईंटशिवाय कोणताही गेम नाही, म्हणून तुमच्या वर्कफ्लोशी सुसंगत असा गेम निवडा.
CLIP टेक्स्ट एन्कोडसह सकारात्मक आणि नकारात्मक प्रॉम्प्ट
दोन CLIP टेक्स्ट एन्कोड नोड्स वापरा: वरचा पॉझिटिव्हसाठी आणि खालचा निगेटिव्हसाठी. मजकूर उच्च-रिझोल्यूशन एम्बेडिंगमध्ये रूपांतरित केला जातो जो प्रसाराचे मार्गदर्शन करतोसंकल्पनांना कमी-अधिक महत्त्व देण्यासाठी तुम्ही वाक्यरचना (पद: १.२) वापरून शब्दांचे वजन करू शकता.
केसॅम्पलर जनरेशन आणि पॅरामीटर्स
तुम्ही ते रांगेत (रांगेतील सूचना) ठेवताच नमुना घेणे सुरू होईल. केसॅम्पलर सीड, स्टेप्स, सॅम्पलर, शेड्यूलर आणि डीनॉइज स्ट्रेंथ नियंत्रित करते.स्थिर बियाणे पुनरुत्पादनक्षमता प्रदान करते; अधिक पायऱ्या सहसा तपशील सुधारतात (वेळेच्या किंमतीवर); text2img मधील denoise=1 संपूर्ण आवाज काढून टाकण्याची प्रक्रिया लागू करते.
रिक्त गुप्त प्रतिमा: रिझोल्यूशन आणि बॅचेस
एम्प्टी लेटेंट इमेज नोड प्रारंभिक लेटेंट कॅनव्हास तयार करतो. उंची आणि रुंदी ८ च्या पटीत असणे आवश्यक आहे.ठराविक आकार: SD 1.5 साठी 512/768 आणि SDXL साठी 1024. जर तुम्हाला प्रति रन अनेक प्रतिमा हव्या असतील तर बॅच आकार समायोजित करा.
VAE: कॉम्प्रेशन आणि पुनर्बांधणी
VAE पिक्सेल आणि लॅटेंट दरम्यान एन्कोड आणि डीकोड करते. ते काही नुकसान किंवा कलाकृतींच्या बदल्यात कार्यक्षमता आणि हाताळण्यायोग्य गुप्त जागा प्रदान करते.text2img मध्ये, तुम्ही प्रतिमा पिक्सेलमध्ये मिळविण्यासाठी ते प्रामुख्याने शेवटी (VAE डिकोड) वापराल.
इमेज टू इमेज, SDXL आणि इनपेंटिंग/आउटपेंटिंग
प्रतिमेनुसार प्रतिमा
हे वर्कफ्लो एक प्रॉम्प्ट आणि एक बेस इमेज एकत्र करते. चेकपॉईंट निवडा, इमेज लोड करा, प्रॉम्प्टचे पुनरावलोकन करा आणि आवाज कमी करा KSampler मध्ये तुम्ही मूळपासून किती दूर जाता हे ठरवण्यासाठी (कमी denoise = स्त्रोतासारखे जास्त).
ComfyUI वर SDXL
ComfyUI त्याच्या मॉड्यूलरिटीमुळे SDXL ला लवकर आणि कार्यक्षमतेने समर्थन देते. सकारात्मक/नकारात्मक सूचना तयार करा आणि योग्य सॅम्पलरसह प्रक्रिया सुरू करा.; सुप्त (सहसा १०२४) चे इष्टतम रिझोल्यूशन लक्षात ठेवा.
चित्रकला
विशिष्ट क्षेत्रे सुधारित करण्यासाठी, प्रतिमा लोड करा, मास्क एडिटर उघडा आणि मास्क नोडमध्ये सेव्ह करा. हे वर्कफ्लो मानक मॉडेल्स वापरते; जर तुम्ही "इनपेंटिंग" चेकपॉईंट वापरत असाल तर VAE एन्कोड (इनपेंट) वापरा. मानक VAE एन्कोड आणि सेट नॉइज लेटेंट मास्क नोड्सऐवजी, ते बदल आणि ०.६ सारख्या सामान्य डीनॉइज स्ट्रेंथचे वर्णन करण्यासाठी प्रॉम्प्ट सेट करते.
आउटपेंटिंग
आउटपेंटिंगसाठी पॅड इमेजसह इमेज मर्यादेपलीकडे विस्तृत करा: गुळगुळीत संक्रमणांसाठी डावीकडे/वर/उजवीकडे/खाली आणि फेदरिंग नियंत्रित करा. VAE एन्कोडमध्ये (इनपेंटिंगसाठी) grow_mask_by समायोजित करा (चांगले >१०) अधिक नैसर्गिक आणि चांगल्या प्रकारे एकत्रित केलेले फिलिंग्ज मिळविण्यासाठी.
स्केलिंग: पिक्सेल विरुद्ध लेटेंट
पिक्सेल अपस्केल
दोन मार्ग: अल्गोरिथम (बायक्यूबिक, बायलिनियर, जवळचा-अचूक) द्वारे अपस्केल इमेजसह, किंवा लोड अपस्केल मॉडेल + अपस्केल इमेजसह मॉडेलद्वारे (मॉडेल वापरून). अल्गोरिदम जलद आहेत पण कमी परिष्कृत आहेत; मॉडेल्स जास्त वेळ घेतात आणि सहसा चांगले तपशील देतात.आणि तुम्ही सहली एकत्र करू शकता आफ्टर इफेक्ट्ससाठी ५० इफेक्ट्स पॅक करा.
सुप्ततेचे उच्च दर्जाचे
तथाकथित हाय-रेस लेटेंट फिक्स थेट लेटेंट जागेत स्केल करते, पुनर्बांधणी दरम्यान तपशील समृद्ध करते. ते मूळपेक्षा थोडेसे विचलित होऊ शकते आणि हळू असू शकते, परंतु ते माहिती जोडते फक्त पिक्सेल ताणण्याऐवजी.
जलद तुलना
पिक्सेल अपस्केलिंग: जलद, नवीन माहिती न जोडता, शक्यतो स्मूथिंग. गुप्त अपस्केलिंग: हळू, ते तपशील जोडते परंतु मूळ प्रतिमा बदलू शकते.संदर्भ आणि आवश्यक निष्ठेनुसार निवडा.
कंट्रोलनेट: संरचनेचे बारीक नियंत्रण
मॉडेल संरचनेचा आदर करते याची खात्री करण्यासाठी कंट्रोलनेट सीमा, पोझ, खोली किंवा विभाजन यासारख्या मार्गदर्शक तत्त्वे प्रदान करते. हे VFX साठी एक अत्यंत शक्तिशाली साधन आहे कारण ते सातत्याने रचना आणि गती निश्चित करते.लिनिअर्ट, डेप्थ किंवा ओपनपोज वापरून पहा आणि निष्ठा/सर्जनशीलता संतुलित करण्यासाठी ताकद समायोजित करा.
ComfyUI प्रशासक: कस्टम नोड्स अद्ययावत
गहाळ नोड्स स्थापित करा
जर वर्कफ्लो तुमच्याकडे नसलेल्या नोड्सची विनंती करत असेल, तर मॅनेजर: बटण मॅनेजर वापरा, "गहाळ कस्टम नोड्स स्थापित करा", ComfyUI रीस्टार्ट करा आणि ब्राउझर रीलोड करा. हे तुम्हाला सामायिक प्रवाहाची अचूक प्रतिकृती बनवण्याची खात्री देते..
नोड्स अपडेट करा
मॅनेजरमधून, अपडेट्स तपासा आणि "कस्टम नोड्स स्थापित करा" वर क्लिक करा. जर पॅकेजच्या पुढे "अपडेट" दिसत असेल, तर ते लागू करा, रीस्टार्ट करा आणि रिफ्रेश करा. नोड्स अद्ययावत ठेवल्याने त्रुटी टाळता येतात आणि कार्यक्षमता सुधारते..
कॅनव्हासवरील नोड्स शोधा.
नोड फाइंडर उघडण्यासाठी रिकाम्या कॅनव्हासवर डबल-क्लिक करा आणि त्यांना नावाने जोडा. हे जटिल साखळ्यांच्या असेंब्लीला गती देते. मेनू न पाहता.
एम्बेडिंग्ज (मजकूर उलटा)
एम्बेडिंग सक्रिय करण्यासाठी, पॉझिटिव्ह किंवा निगेटिव्ह प्रॉम्प्टवर एम्बेडिंग: नाव टाइप करा. फाइल ComfyUI/models/embeddings मध्ये ठेवा. जर ComfyUI ला जुळणारे पर्याय सापडले तर ते ते लागू करेल. विशिष्ट शैली किंवा संकल्पना समाविष्ट करण्याचा हा एक शक्तिशाली मार्ग आहे.
स्वयंपूर्णता एम्बेड करत आहे
ऑटोकंप्लीटसाठी ComfyUI-Custom-Scripts पॅकेज इंस्टॉल करा. एकदा सक्रिय झाल्यावर, "एम्बेडिंग:" टाइप करणे सुरू केल्याने तुमचे उपलब्ध एम्बेड प्रदर्शित होतील.मोठ्या संग्रहांसह कामाला गती देणे.
एम्बेडिंग वजन
तुम्ही शब्दांप्रमाणेच त्याचे वजन करू शकता: (एम्बेडिंग:नाव:१.२) प्रभाव वाढवते आणि (एम्बेडिंग:नाव:०.८) ते कमी करते. वजन समायोजित केल्याने तुम्हाला दृश्यमान परिणामावर चांगले नियंत्रण मिळते..
LoRA: VAE ला स्पर्श न करता शैली स्वीकारते
LoRA शैली, वर्ण किंवा वस्तू सादर करण्यासाठी बेस चेकपॉईंटच्या MODEL आणि CLIP मध्ये बदल करते, ज्यामुळे VAE अबाधित राहते. मूलभूत प्रवाह: चेकपॉईंट निवडा, एक किंवा अधिक LoRA जोडा, प्रॉम्प्टचे पुनरावलोकन करा आणि रांग सुरू करा..
अनेक कॅस्केडिंग LoRAs
तुम्ही एकाच प्रवाहात अनेक LoRA लागू करू शकता; ते अनुक्रमे एकत्र केले जातात. शैलींचे सर्जनशील मिश्रण करण्यासाठी क्रम आणि वजन वापरून प्रयोग करा. इच्छित संतुलन साध्य होईपर्यंत.
तास वाचवणारे शॉर्टकट आणि युक्त्या
कॉपी/पेस्ट: नोंदी ठेवताना पेस्ट करण्यासाठी Ctrl+C, Ctrl+V आणि Ctrl+Shift+V. Ctrl वापरून अनेक नोड्स निवडा, सिलेक्शन बॉक्स तयार करा आणि Shift वापरून त्यांना हलवा. जलद लेआउटसाठी.
Ctrl+M वापरून नोड म्यूट केल्याने तो तात्पुरता वगळला जातो; वरच्या डाव्या कोपऱ्यातील बिंदू दाबून नोड लहान करा. मोठ्या प्रकल्पांमध्ये कॅनव्हास साफ करण्यासाठी.
जनरेशन क्यू: Ctrl+Enter. इनपुट बदलले तरच ComfyUI नोड्स पुन्हा कार्यान्वित करते; लांब साखळ्यांचे पुनर्गणना टाळण्यासाठी आणि वेळ वाचवण्यासाठी बियाणे दुरुस्त करते.
पीएनजी एम्बेडेड फ्लो: जनरेट केलेली इमेज त्याच्या मेटाडेटामधून वर्कफ्लो पुनर्प्राप्त करण्यासाठी ComfyUI मध्ये ड्रॅग करा. पाइपलाइन शेअर करण्याचा आणि आवृत्ती करण्याचा हा एक उत्तम मार्ग आहे. तुकडे न गमावता. जर तुम्ही व्हिडिओ वापरून चांगले शिकलात तर पहा. १० अभूतपूर्व व्हिडिओ ट्युटोरियल्स.
व्हिडिओसाठी ComfyUI: अॅनिमेटडिफ स्टेप बाय स्टेप
अॅनिमेटडिफ तुम्हाला मजकूर, प्रतिमा किंवा व्हिडिओमधून अनुक्रम तयार करण्याची परवानगी देतो. NVIDIA असलेल्या विंडोजसाठी, १० GB VRAM इष्टतम आहे (कमी रिझोल्यूशनसह किमान ८ GB किंवा Txt2Vid); कठीण प्रकल्पांमध्ये तुम्ही २ कंट्रोलनेटसह सुमारे १० जीबीची अपेक्षा करू शकता.
स्थापना आणि अवलंबित्वे
क्लोन नोड्समध्ये Git आणि पोर्टेबल ComfyUI काढण्यासाठी 7-Zip स्थापित करा. FFmpeg पर्यायी आहे (कंबाइनर नोड्समधून GIF/MP4 पॅकेजिंगसाठी)जर ते PATH मध्ये नसेल, तर प्रवाह सैल फ्रेम्स निर्माण करत राहतात.
पोर्टेबल ComfyUI डाउनलोड करा आणि प्रथमच run_nvidia_gpu चालवा. कस्टम नोड्स फोल्डरमध्ये, क्लोन करा ComfyUI-AnimateDiff-Evolved, ComfyUI-Manager, ComfyUI-Advanced-ControlNet आणि ComfyUI-VideoHelperSuite.
मॅनेजर मधून, “कंट्रोलनेट ऑक्झिलरी प्रीप्रोसेसर” आणि “फिझनोड्स” स्थापित करा. सर्वकाही योग्यरित्या लोड करण्यासाठी ComfyUI रीस्टार्ट करा. आणि आयात चुका टाळा.
आवश्यक मॉडेल्स
योग्य फोल्डरमध्ये सुसंगत SD 1.5 चेकपॉइंट्स ठेवा आणि आवश्यक असल्यास जनरलिस्ट VAE ठेवा. मोशन मॉड्यूल्स डाउनलोड करा (उदा., अॅनिमेटडिफ, टेम्पोरलडिफ किंवा एडी स्टेबिलाइज्ड मोशन मधील मूळ) आणि त्यांना तुमच्या मार्गावर कॉपी करा. ControlNet साठी, Lineart, Depth आणि OpenPose (pth/yaml) जोडा.
प्रमुख कार्यप्रवाह: Vid2Vid आणि Txt2Vid
Vid2Vid: इमेज/व्हिडिओ इनपुट नोडसह फ्रेम्सची डायरेक्टरी लोड करते, कालावधी आणि सॅम्पलिंगसाठी इमेज_लोड_कॅप, स्किप_फर्स्ट_इमेजेस आणि सिलेक्ट_एव्हरी_नथ नियंत्रित करते. एकसमान संदर्भ पर्याय महत्त्वाचे आहेत: संदर्भ लांबी ~१६, सातत्यतेसाठी ओव्हरलॅप आणि फक्त Txt2Vid साठी बंद लूप.
Txt2Vid: प्राथमिक फ्रेम नोड वापरते (इमेज लोडरशिवाय) आणि थेट प्रॉम्प्टवरून जनरेट करते. KSampler मध्ये Denoise=1 सह तुमचा पूर्णपणे जनरेटिव्ह इफेक्ट असेल., कल्पनारम्य क्लिपसाठी आदर्श.
बॅच प्रॉम्प्ट शेड्युलिंग
FizzNodes चे BatchPromptSchedule तुम्हाला प्रत्येक फ्रेममध्ये प्रॉम्प्ट बदलण्याची परवानगी देते. ते सामान्य हेडर आणि क्लोजरसाठी pre_text आणि app_text वापरते आणि "frame: prompt" जोड्या परिभाषित करते. शेवटच्या घटकातील अंतिम स्वल्पविरामाबद्दल काळजी घ्या, त्यामुळे त्रुटी येईल.; जर तुम्हाला सूचना मध्यांतरांमध्ये ठेवायची असेल तर ती डुप्लिकेट करते.
सेटिंग्जचे नमुने घेणे आणि एकत्र करणे
व्हिडिओसाठी केसॅम्पलरला अधिक पायऱ्यांची आवश्यकता आहे (किमान २५ आणि वाढवणे चांगले). Euler_a सॅम्पलर वापरून पहा आणि तुमच्या आवडीनुसार CFG समायोजित करा.Vid2Vid मध्ये, सोर्स क्लिपच्या जवळ जाण्यासाठी डीनॉइज कमी करा. कम्बाइन नोड GIF/MP4 एक्सपोर्ट करतो: फ्रेम_रेट, लूप_काउंट, फॉरमॅट आणि तुम्हाला पिंग-पॉन्ग हवा आहे की नाही हे परिभाषित करतो.
व्यावहारिक टिप्स: स्थिर प्रतिमांसाठी कंट्रोलनेटची ताकद कमी करा, ओपनपोज वापरून पहा, "हायर्स" सुधारणांसाठी दुसरा केसॅम्पलर वापरा. विशिष्ट हालचाली समृद्ध करण्यासाठी Motion LoRA वापरून पहा. आणि कंट्रोलनेट्स कमी प्रमाणात एकत्र करते.
ComfyUI मधील इतर व्हिडिओ इंजिन
हुनयुआन व्हिडिओ (img2vid उपशीर्षकांद्वारे मार्गदर्शन केलेले)
तुमची प्रतिमा ५१२x५१२ मध्ये तयार करा आणि Florence2Run सह एक उपशीर्षक तयार करा. StringReplace वापरून "इमेज/फोटो/इलस्ट्रेशन" सारख्या संज्ञा "व्हिडिओ" ने बदला. मॉडेल प्रशिक्षणाशी जुळण्यासाठी. हुनयुआन व्हिडिओ सॅम्पलर + रॅपर्स वापरून लेटेंट स्पेसमध्ये रूपांतरित करा, लोरा सिलेक्ट लागू करा आणि कॉम्बाइनरसह एक्सपोर्ट करा.
LTX व्हिडिओ (LTX नोड पाइपलाइन)
ComfyUI-LTXVideo नोड्स आणि मॉडेल्स (PixArt-XL एन्कोडरसह) स्थापित करा. CLIP मध्ये प्रॉम्प्ट लिहा, EmptyLTXVLatentVideo वापरून लेटेंट व्हिडिओ तयार करा आणि LTXVScheduler समायोजित करा.पायऱ्यांची संख्या गुणवत्ता वाढवते आणि max_shift, base_shift, stretch आणि terminal सारखे पॅरामीटर्स क्लिपच्या गतिमानतेला आकार देतात. SaveAnimatedWEBP (लॉसलेस ट्रू, क्वालिटी १००) सह सेव्ह करा किंवा इतर फॉरमॅटमध्ये एक्सपोर्ट करा.
वॅन २.१ (मजकूर ते व्हिडिओ, प्रतिमा ते व्हिडिओ, व्हिडिओ ते व्हिडिओ)
ComfyUI Wan 2.1 साठी फ्लो देखील एकत्रित करते. त्याच्या वापरामध्ये Txt2Vid, Img2Vid आणि Vid2Vid यांचा समावेश आहे., मागील पाइपलाइनसारखेच पॅरामीटर नियंत्रण आणि वापराच्या परिस्थितीनुसार तात्पुरत्या सुसंगततेमध्ये फायदे.
मोशन ग्राफिक्स: सेगमेंटेशन, डेप्थ आणि ब्लेंडिंग
व्हिडिओमधील मोशन ग्राफिक्स अॅनिमेशनसाठी, LoadVideoInput ने सुरुवात करा, Skip First Frames नियंत्रित करा आणि Every Nth Frame निवडा आणि ImageScaleToMegapixels सह ~1MP पर्यंत स्केल करा. हे प्रीप्रोसेसिंग VRAM लोड आणि ऑपरेटिंग स्पीड समायोजित करते. पिढीमध्ये. तुम्ही कसे ते देखील तपासू शकता प्रीमियरमध्ये शीर्षके तयार करा ग्राफिक्स आणि क्रेडिट्स एकत्रित करण्यासाठी.
मजकुरातील GroundingDino आणि SAM वापरून विषयाचे विभाजन करा. GrowMaskWithBlur वापरून मास्क मोठा करा आणि MaskToImage वापरून तो इमेजमध्ये रूपांतरित करा. अधिक मजबूत बाह्यरेषेसाठी.
TimeFeatureNode वापरून टाइम सिग्नल तयार करा आणि FeatureScaler (रेषीय, लॉगरिदमिक, घातांकीय) वापरून तो मॉड्युलेट करा. हे तुम्हाला क्लिपच्या बाजूने खोली (Z) विस्थापन नियंत्रित करण्यास किंवा पोझिशन्स मास्क करण्यास अनुमती देईल. अधिक सिनेमॅटिक इफेक्ट्ससाठी.
FlexMaskDepthChamber वापरून विषय मास्क, वेळ सिग्नल आणि क्लिपचा खोली नकाशा एकत्रित करून खोलीवर अवलंबून असलेला रीपेंट मास्क तयार करा. कोणत्याही वेळी सक्रिय झोन परिभाषित करण्यासाठी Z फ्रंट/Z बॅक समायोजित करा. आणि एक खात्रीशीर 3D प्रभाव साध्य करा.
जनरेटिव्ह टप्प्यात, चेकपॉईंट लोड करा, LoRA लागू करा, प्रॉम्प्ट कॉन्फिगर करा आणि योग्य असल्यास कंट्रोलनेट जोडा. अॅनिमेटडिफ तुम्हाला फ्रेम्स देईल; नंतर स्मूथनेस दुप्पट करण्यासाठी RIFE VFI सह इंटरपोलेट करा. आणि गुळगुळीत संक्रमणे.
जर तुम्हाला पासेस मिक्स करायचे असतील तर: वेगवेगळ्या संकेतांसह अनेक आवृत्त्या तयार करा, ImageIntervalSelectPercentage सह सेगमेंट निवडा, ImageBlend सह ट्रान्झिशन्स मिक्स करा आणि ImageBatchMulti सह कॉन्कॅटनेट करा. RIFE VFI मधून शेवटचा पास दिल्याने अॅनिमेशन गुळगुळीत होते. आणि निर्यातीसाठी तयार.
ComfyUI ऑनलाइन आणि क्लाउड पर्याय

जर तुम्हाला काहीही इन्स्टॉल करायचे नसेल, तर ComfyUI पूर्व-कॉन्फिगर केलेल्या क्लाउड सेवा आहेत, ज्यामध्ये शेकडो नोड्स/मॉडेल्स आणि डझनभर रेडीमेड वर्कफ्लो आहेत. ते जलद चाचण्यांसाठी किंवा टेम्पलेट्स शेअर करणाऱ्या संघांसाठी उपयुक्त आहेत. स्थानिक एजन्सींशी व्यवहार न करता. जलद आणि सोपा पर्याय म्हणून, येथे संसाधने देखील आहेत कॅपकट मध्ये अॅनिमेशन आणि व्हिज्युअल इफेक्ट्स.
दुसरा पर्याय म्हणजे ड्रीमिना सारख्या क्लाउड-आधारित व्हिडिओ जनरेटरचा वापर करणे: साधा इंटरफेस, स्थानिक VRAM नाही आणि २०-६० सेकंदात निकाल मिळतो. हे एचडी अपस्केल, फ्रेम इंटरपोलेशन आणि साउंडट्रॅक जनरेशन सारख्या अतिरिक्त सुविधा देते.सुरुवात करण्यासाठी मोफत दैनिक क्रेडिट्ससह, जेव्हा गती ही बारीक नियंत्रणापेक्षा जास्त महत्त्वाची असते तेव्हा हा एक सुव्यवस्थित पर्याय आहे.
कामगिरी, आवश्यकता आणि वेळा
स्थानिक पातळीवर, इमेज टू व्हिडिओसाठी ComfyUI ला मॉडेल (AnimateDiff, HunyuanVideo, LTX Video) आणि रिझोल्यूशननुसार साधारणपणे ८ ते २४ GB VRAM ची आवश्यकता असते. शक्तिशाली GPU वर देखील, एका पिढीला १०-३० मिनिटे लागू शकतात जर क्लिप लांब असेल किंवा तुम्ही अनेक कंट्रोलनेट्स आणि हाय-पास फिल्टर्स वापरत असाल, तर लोड क्लाउडमधील प्रदात्याकडे हलवला जातो.
ComfyUI चे सॉफ्टवेअर मोफत आहे, परंतु जर तुम्ही बराच वेळ काम केले तर त्याची किंमत हार्डवेअर आणि विजेमध्ये असते. क्लाउड सेवेवर अवलंबून राहून आणि शुल्क किंवा क्रेडिटच्या बदल्यात तो खर्च टाळतो.तुमच्या कार्यप्रणालीला सर्वात जास्त काय फायदा होतो याचे मूल्यांकन करा.
सामान्य समस्यानिवारण
जर तुम्हाला शून्य त्रुटी किंवा "अस्तित्वात नसलेले" नोड्स दिसले, तर कदाचित तुमच्या फोल्डरमध्ये मॉडेल्स गहाळ आहेत किंवा अवलंबित्वे अनइंस्टॉल केलेली आहेत. प्रत्येक नोडमध्ये त्याचे संबंधित मॉडेल आहे का ते तपासा आणि कोणतेही गहाळ पॅकेजेस स्थापित करण्यासाठी मॅनेजर वापरा.जर तुम्ही आधीच इतर कामांसाठी ComfyUI वापरत असाल तर परस्परविरोधी रिपॉझिटरीज टाळा.
सातत्यपूर्ण VFX साठी सर्वोत्तम पद्धती
साखळीचे विभाग समायोजित करताना बियाणे पुनरुत्पादनक्षमतेसाठी लॉक करा. वर्कफ्लो मेटाडेटासह प्रतिमा जतन करा आणि नोड आणि मॉडेल आवृत्त्यांवर भाष्य करा.व्हिडिओमध्ये, संदर्भ लांबी आणि ओव्हरलॅप काळजीपूर्वक परिभाषित करा आणि कंट्रोलनेट्स आणि लोआरएचा स्पष्ट क्रम राखा.
शॉट प्रकार आणि तपशीलाच्या पातळीनुसार अपस्केल पिक्सेल आणि लेटेंट पिक्सेलमध्ये टॅक्टिकली स्विच करा. Vid2Vid मध्ये, बेस हालचालीचा आदर करण्यासाठी डीनॉइज कमी करा.Txt2Vid मध्ये, दृश्य स्थिरता मिळविण्यासाठी चरणे आणि सॅम्पलर दाबा.
तुमचा टूलबॉक्स विस्तृत करण्यासाठी मॅनेजरमधून कंट्रोलनेट प्रीप्रोसेसर (कॅनी, डेप्थ, ओपनपोज...) एकत्रित करा. आणि लक्षात ठेवा: कमी कंट्रोलनेट स्ट्रेंथ अनेकदा व्हिडिओमध्ये चांगले काम करते.फिल्टर केलेले स्वरूप टाळणे आणि नैसर्गिक स्वरूप राखणे.
जर तुमच्या केसला सबटायटल गाईड्स, वेगवेगळे टाइम डायनॅमिक्स कंट्रोल किंवा पर्यायी पाइपलाइनची आवश्यकता असेल तर HunyuanVideo आणि LTX Video नक्की एक्सप्लोर करा. वॅन २.१ मध्ये Txt2Vid, Img2Vid आणि Vid2Vid साठी ठोस पर्याय देखील समाविष्ट आहेत. सातत्यपूर्ण पॅरामीटर्स आणि स्पर्धात्मक निकालांसह.
ज्यांना वेग आणि शून्य घर्षण हवे आहे ते ऑनलाइन सेवांवर अवलंबून राहू शकतात, तर ज्यांना शस्त्रक्रिया नियंत्रण आणि संपूर्ण पुनरुत्पादनक्षमता आवश्यक आहे ते स्थानिक ComfyUI सह चमकतील. तुम्ही पाहिलेल्या वस्तूंसह - नोड्स, पॅरामीटर्स, शॉर्टकट आणि फ्लो - आता तुमच्याकडे उच्च-स्तरीय VFX तयार करण्याचा रोडमॅप आहे. स्थिर प्रतिमा आणि व्हिडिओ अनुक्रमांमध्ये, लवचिक आणि स्केलेबल पद्धतीने.




