Cover, který funguje, je svébytnou uměleckou interpretací cizí písně — jiný úhel, jiný emocionální důraz, možná zcela jiný žánr. Když se to podaří, slyšíte kostru originálu a zároveň něco nového. Cover, který nefunguje, je prostě ta samá píseň s mlžnějším mixem a hlasem, který zní nějak divně. Rozdíl mezi nimi téměř nikdy nespočívá v použitém nástroji. Spočívá ve volbách, které jste udělali předtím, než jste stiskli generovat.
AI generátory coverů výrazně usnadnily vzít kus hudby a znovu ho sestavit v jiném hlase, stylu nebo aranžmá. Ale jednodušší přístup k procesu automaticky nezlepšuje výstup. Stále potřebujete vědět, které písně stojí za to pokrýt, jak napsat zadání stylu, které dává modelu něco skutečného, s čím pracovat, a kdy přestat a prohlásit to za hotové. Tato příručka provádí vším tím, krok za krokem.
Před začátkem: otázka licencování
Toto je část, kterou většina tutoriálů přeskakuje, takže to pojďme z cesty. Pokud pokrýváte píseň, která vám nepatří, ta píseň je téměř jistě chráněna autorskými právy. Zveřejnění AI generovaného coveru chráněné stopy na streamovací platformě nebo jeho monetizace na YouTube je odvozeným dílem a dělat to bez licence nebo mechanického schválení vás umisťuje do šedé zóny, která může přejít v nárok na práva nebo stažení. Pravidla se liší podle země, ale „nesamploval jsem původní zvuk“ vás automaticky nezachraňuje — rozpoznatelná melodie nebo text je stále chráněna.
Nejbezpečnější půda: pokrývejte vlastní materiál, pokrývejte písně s licencí Creative Commons, která umožňuje odvozená díla, nebo pokrývejte kompozice, které přešly do veřejné domény (v USA to obecně znamená díla, jejichž copyright vypršel — vyhledejte to pro konkrétní dílo). Pokud chcete pokrýt něco současného a komerčně to vydat, podívejte se na služby, které zajišťují mechanické licencování. Pro osobní, nemonetizované použití je riziko nižší, ale stále stojí za to vědět, kde stojíte, než investujete hodiny do projektu.
Krok 1: vyberte referenci, která má prostor k dýchání
Ne každá píseň funguje jako cover. Ty, které procesem přežijí, jsou strukturálně jednoduché: jasná melodická linie, zvladatelný počet harmonických změn, minimální závislost na produkční textuře pro svůj emocionální dopad. Akustické balady, folky se třemi akordy a stripped-back soft pop jsou přirozené kandidáty. Dobrá melodie se může nést sama napříč velmi různou instrumentací. Skvělá píseň postavená kolem jednoduchosti bude obvykle znít zajímavě téměř v jakémkoli stylu.
Písně, které se brání pokrývání, jsou ty, kde původní produkce JE písní. Bohemian Rhapsody není opravdu melodie — je to zeď interagujících aranžmá, vokálních vrstev a dynamických posunů, které jsou neoddělitelné od zážitku. Stadionový mix rocku z 10. let (hustý reverb, vrstvené kytary, všechno komprimované) je stejný problém. Tyto písně na kosti stáhnout lze, ale to, co dostanete, often zní tak jinak od originálu, že spojení je ztraceno. To není vždy špatné — někdy je radikální dekonstrukce zajímavá — ale je to mnohem těžší kreativní problém, než většina lidí čeká, když začínají.
Zeptejte se sami sebe: pokud by někdo tuto píseň hrál akusticky na rohu ulice, byla by stále rozpoznatelná? Stále by vás dojala? Pokud ano, je pravděpodobně dobrým kandidátem. Pokud odpověď zní „jen pokud by dokonale napodobil studiovou verzi“, tato píseň možná ještě není připravena na cover.
Krok 2: napište zadání stylu, nikoli jen žánr
„Udělej to jazz“ říká modelu téměř nic užitečného. Jazz je Coltrane a je to také klavír v hotelové přijímací místnosti a je to také bossa nova a je to také bebop. Jednoslovné zadání žánru téměř vždy produkuje obecný výstup, protože model musí hádat vše: tempo, váhu nástrojování, vokální přístup, hustotu produkce. Odhad bývá technicky správný a esteticky zapomenutelný.
Dobré zadání stylu zužuje emocionální a zvukový svět na něco konkrétního. Namísto žánru popište místnost, čas v noci, pocit. Čím specifičtější a vizuálnější zadání je, tím pravděpodobnější je, že model bude dělat volby, které drží pohromadě do skutečné interpretace, nikoli průměrné kombinace všeho v daném žánru.
Noční pianový bar cover, 4 ráno, energie posledního kola. Vokál by měl působit téměř mluvně — nízký, nespěšný, jako by zpěvák jen přemýšlel nahlas. Kartáčový snare velmi vzadu v mixu, stěží slyšitelný. Žádné smyčce. Klavír by měl znít mírně rozladěně, druh, který najdete v starém hotelovém salónu. Udržujte pod 3 minuty.
Toto zadání říká modelu, co zdůraznit a co vynechat. Dává mu hledisko. Vaše zadání nemusí být tak dlouhé, ale musí mít hledisko.
Krok 3: nahrajte referenci a nastavte správné ovládací prvky
Jakmile máte svůj referenční zvuk a zadání stylu, je skutečný vykreslovací proces poměrně přímočarý — ale na několika nastaveních záleží více než na jiných. Generátor coverů Aisonggen přijímá referenční zvukový soubor a zadání stylu a umožňuje nastavit vokální charakter, váhu žánru a hustotu aranžmá před vykreslením. Stejný obecný pracovní postup platí ve většině současných nástrojů.
Jedna věc, kterou zkontrolovat před vykreslením: zda nástroj odděluje referenční VOKÁL od referenční PÍSNĚ. Některé generátory vám umožňují nahrát celou píseň jako strukturální referenci a zároveň nahrát izolovaný vokál (nebo vybrat vokální charakter) pro výstupní hlas. Toto je výrazná mezera schopností mezi nástroji — pokud můžete specifikovat hlas samostatně, můžete změnit, kdo zpívá, přičemž zachováte melodickou a harmonickou kostru originálu. Tato kombinace obvykle produkuje nejpřesvědčivější covery.
Pokud jste v tomto noví, začněte s generátorem coverů a napište zadání stylu před dotykem jiných nastavení. Zadání dělá více práce než jakýkoli posuvník.
Krok 4: vykreslete paralelní pokusy a poslouchejte na různých reproduktorech
Nevykreslovejte jednou a potvrzujte. Vykreslete tři nebo čtyři pokusy s malými variacemi v zadání nebo vokálním charakteru a pak je všechny poslouchejte před rozhodnutím. Generování AI coverů má dostatek náhodnosti ve výstupu, že dva výkyvy s identickými nastaveními mohou produkovat výrazně odlišné výsledky. Využijte toho.
Nejdůležitější test: jak to zní na vašem telefonu, přes sluchátko, v hlučné místnosti? AI covery often zní vyleštěně na studiových monitorech nebo dobrých sluchátkách a pak se na reproduktorech telefonu úplně rozpadají. To je proto, že většina AI generovaného zvuku je mixována pro klaritu na plném pásmu — basové frekvenece nesou velkou část bohatosti, a když ztratíte basové na malém reproduktoru, dutá nebo nepřirozená kvalita v hlase nebo nástrojích se stane zřejmou. Pokus, který přežije test telefonu, je téměř vždy správným pokusem, i když zněl mírně méně působivě na monitorech.
Zkuste to také na přenosném počítači bez pohledu na obrazovku. Vaše oči vás budou tlačit k pokusu, který vypadá, jako by měl znít lépe. Vaše uši na degradovaném přehrávacím systému vám řeknou pravdu.
Krok 5: najděte AI-indikátory a opravte je re-vykreslením nebo manuální editací
Současné AI covery mají konzistentní vzorce selhání. Jakmile víte, co hledat, můžete je zachytit před zveřejněním a rozhodnout, zda re-vykreslit nebo je ručně opravit v DAW.
- Přehnaně artikulované souhlásky. Hlas trefí každé T, D a P tvrději, než by lidský zpěvák. Skuteční vokalisté na koncích frází souhlásky rozmazávají; AI modely je often zostřují.
- Vibrato, které neústí. Lidské vibrato se přirozeně zrychluje a zpomaluje v závislosti na dechu a poloze fráze. AI generované vibrato se often uzamkne do konstantní rychlosti a zůstane tam, což na dlouhých notách zní mechanicky.
- Údery bicích, které jsou příliš čisté. Živé bicí mají malé časové nedůslednosti a ghost hity. Pokud bicí ve vašem coveru znějí, jako by byly naprogramovány na mřížce, pravděpodobně byly, a je to vidět.
- Konce frází, které se spíše ořezávají než uvolňují. Zpěváci přirozeně dohasínají. AI vokály někdy prostě zastaví nebo vyblédnou způsobem, který neodpovídá tomu, jak dech skutečně funguje.
- Korekce výšky, která je příliš těsná. Pokud každá nota přistane přesně na výšce, žádný posun, žádná mikro-inflexe, žádná blue nota nikde, hlas zní korigovaně, nikoli zazpívaně.
Většina z toho je opravitelná re-vykreslením s revidovaným zadáním (např. „uvolněnější souhlásky, nechte fráze dýchat na konci“) nebo lehkým manuálním zpracováním poté.
Poznámka k vokálům: nekanny valley zní hlasitěji než mix
Důvod, proč většina AI coverů zaostává, není nástrojování — je to hlas. Nástroje mohou být nedokonalé a stále se cítit správně. Mírně špatné ladění klavíru se čte jako charakter. Ale hlas, který je mírně špatný, se čte jako znepokojivý. Lidský sluchový systém je mimořádně citlivý na autentičnost hlasu; máme celou evoluovance sadu nástrojů pro rozpoznávání vzorců pro detekci skutečného versus simulovaného lidského řeči a zpěvu. Pokud hlas ve vašem coveru nepřistane, žádné množství produkčního lesku ho nezachraní. Netrávte tři iterace upravováním reverbu a EQ na vokálu, který nefunguje. Nejprve zkuste jiný vokální charakter, re-vykreslete a zjistěte, zda problém zmizí. Hlas je rozhodnutí.
Kdy přestat
Toto je nejtěžší část jakéhokoli iterativního kreativního procesu a AI nástroje to zhoršují tím, že next vykreslení vždy působí, jako by mohlo být tím, co věci opraví. Několik signálů, že jste hotovi:
- Poslouchali jste dva různé výkony a skutečně nemůžete říci, který je lepší. To je hod mincí, nikoli rozdíl kvality.
- Upravujete nastavení, která zněla dobře před třemi iteracemi a nyní se cítí špatně. To je únava posluchače, nikoli zlepšení.
- Někdo jiný to poslouchal a reagoval bez výhrad. Pokud první věc, kterou říká, je „ale...“, máte ještě práci. Pokud prostě říká „to je dobré“, je to dobré.
- Pokoušíte se to dostat k tomu, aby znělo jako originál. To už není cover.
- Věc, s níž jste nespokojeni, je něco, co nemůžete opravit ani dokonalým vykreslením — strukturální volba ve zdrojovém materiálu, nikoli problém s provedením ve vašem výstupu.
Zastavte se tam. Exportujte to.
Cover je milostný dopis písni, nikoli padělání. Ty nejlepší říkají něco o tom, proč na té písni záleží — proč se k ní vyplatí vracet, proč zní jinak přes jinou sadu zkušeností nebo jiný hudební kontext. Než vykreslit další pokus, zeptejte se, zda má vaše verze ještě hledisko. Pokud ano, jste pravděpodobně blíže hotovému, než si myslíte. Pokud ne, žádné nastavení nástroje ho za vás nepřidá. Tato část je stále vaše. Pro inspiraci, jak dokončený projekt může vypadat, podívejte se do AI hudební knihovny a uvidíte, jak k transformacím přistupují ostatní, nebo prozkoumejte stránku s cenami a zjistěte, který plán vám dává dostatek vykreslení pro správnou iteraci.