Koverok, ktorý funguje, je odlišná umelecká interpretácia cudzej piesne — iný uhol, iný emocionálny dôraz, možno úplne iný žáner. Keď sa to podarí, počujete kostru originálu a zároveň niečo nové. Koverok, ktorý nefunguje, je len tá istá pieseň s neúhľadnejším mixom a hlasom, ktorý znie nejasne posunutý. Rozdiel medzi týmito dvoma takmer nikdy nie je nástroj, ktorý ste použili. Sú to voľby, ktoré ste urobili pred stlačením renderovacieho tlačidla.
AI generátory koverov to skutočne uľahčili — vziať kus hudby a rekonštruovať ho v odlišnom hlase, štýle alebo aranžácii. Ale ľahší prístup k procesu automaticky nezlepšuje výstup. Stále potrebujete vedieť, ktoré piesne sa oplatí koverktsovať, ako napísať stručný popis štýlu, ktorý dá modelu niečo skutočné, s čím bude pracovať, a kedy prestať fiddlovať a nazývať to hotovým. Tento sprievodca prechádza všetkým tým, krok za krokom.
Pred začiatkom: otázka licencovania
Toto je časť, ktorú väčšina tutoriálov preskakuje, takže ju poďme najprv vyriešiť. Ak koverktsujete pieseň, ktorú nevlastníte, táto pieseň je takmer istotne chránená autorskými právami. Zverejnenie AI-generovaného koverku chránenej stopy na streamovacej platforme alebo monetizácia na YouTube je odvodené dielo, a robiť to bez licencie alebo mechanického práva vo vás stavia do sivej zóny, ktorá sa môže zmeniť na nárok na práva alebo odopretie. Pravidlá sa líšia podľa krajiny, ale „nesamploval som pôvodný zvuk“ vás automaticky nerobí bezpečným — rozoznateľná melódia alebo text je stále chránená.
Najistejší terén: koverktsujte vlastný materiál, koverktsujte piesne s licenciou Creative Commons, ktorá umožňuje deriváty alebo koverktsujte kompozície, ktoré sa dostali do verejnej domény (v USA to vo všeobecnosti znamená diela, ktorých autorské právo vypršalo — vyhľadajte konkrétnu skladbu). Ak chcete koverktsovať niečo súčasné a vydať to komerčne, pozrite sa na služby, ktoré sa starajú o mechanické licencovanie. Pre osobné, nemonetizované použitie je riziko nižšie, ale stále stojí za to vedieť, kde stojíte, pred investovaním hodín do projektu.
Krok 1: vyberte referenciu, ktorá má priestor na dýchanie
Nie každá pieseň funguje ako koverok. Tie, ktoré majú tendenciu prežiť tento proces, sú štrukturálne jednoduché: jasná melodická linka, zvládnuteľný počet akordových zmien, minimálna závislosť na produkčnej textúre pre ich emocionálny dopad. Akustické baladky, trojako-akordové folkové piesne a ostrihnutý mäkký pop sú prirodzenými kandidátmi. Dobrá melódia sa môže niesť sama naprieč veľmi odlišnou inštrumentáciou. Skvelá pieseň postavená okolo jednoduchosti bude zvyčajne znieť zaujímavo v takmer akomkoľvek štýle.
Piesne, ktoré odolávajú koverktsovaniu, sú tie, kde pôvodná produkcia JE pieseň. Bohemian Rhapsody nie je skutočne melódia — je to stena interagujúcich aranžácií, vokálnych vrstiev a dynamických posunov, ktoré sú neoddeliteľné od zážitku. Štadiónový-mix rock z 2010-tych rokov (hustý reverb, vrstvené gitary, komprimované všetko) je rovnaký problém. Tieto piesne môžete odostrať na ich kosti, ale to, čo dostanete, often znie tak odlišne od originálu, že sa spojenie stratí. To nie je vždy zlé — niekedy je radikálna dekontrakcia zaujímavá — ale je to oveľa ťažší kreatívny problém, ako väčšina ľudí očakáva pri začiatku.
Spýtajte sa seba: ak by niekto predviedol túto pieseň akusticky na rohu ulice, bola by stále rozoznateľná? Stále by vás pohla? Ak áno, je to pravdepodobne dobrý kandidát. Ak je odpoveď „len ak by dokonale napodobnil štúdiovú verziu,“ táto pieseň možno nie je pripravená na koverok.
Krok 2: napíšte stručný popis štýlu, nie len žáner
„Urob to jazzovo“ hovorí modelu takmer nič užitočné. Jazz je Coltrane a je to aj klavír v hotelovom bare a je to aj bossa nova a je to aj bebop. Jednoslová žánrová charakteristika takmer vždy produkuje generický výstup, pretože model musí hádať všetko: tempo, váhu inštrumentácie, vokálny prístup, produkčnú hustotu. Hádka je zvyčajne správna technicky správnym a esteticky zabudnuteľným spôsobom.
Dobrý stručný popis štýlu zužuje emocionálny a zvukový svet na niečo konkrétne. Namiesto žánru opíšte miestnosť, čas noci, pocit. Čím konkrétnejší a vizuálnejší je stručný popis, tým je pravdepodobnejšie, že model urobí voľby, ktoré si navzájom držia v skutočnej interpretácii namiesto zmiešaného priemeru všetkého v tom žánri.
Koverok nočného piano baru, 4 ráno, energia poslednej objednávky. Vokál by sa mal cítiť takmer hovorený — tichý, bez spěchu, akoby speváčka len premýšľa nahlas. Kefkovitá snare ďaleko vzadu v mixe, sotva počuteľná. Žiadne sláčiky. Klavír by mal znieť mierne rozladený, druh, aký nájdete v starom hotelovom vestibule. Udržte to pod 3 minúty.
Tento stručný popis hovorí modelu, čo zdôrazniť a čo vynechať. Dáva mu pohľad. Váš stručný popis nemusí byť tak dlhý, ale musí mať pohľad.
Krok 3: nahrajte referenciu a nastavte správne ovládacie prvky
Keď máte referenčný zvuk a stručný popis štýlu, samotný renderovací proces je pomerne priamočiary — ale niekoľko nastavení záleží viac ako iné. Generátor koverov Aisonggen berie referenčný zvukový súbor a stručný popis štýlu a umožňuje vám nastaviť charakter hlasu, váhu žánru a hustotu aranžácie pred renderovaním. Rovnaký všeobecný pracovný postup platí vo väčšine súčasných nástrojov.
Jedna vec na kontrolu pred renderovaním: či nástroj oddeľuje VOKÁL referencie od PIESNE referencie. Niektoré generátory vám umožňujú nahrať celú pieseň ako štrukturálnu referenciu, pričom nahráte samostatný izolovaný vokál (alebo vyberiete charakter hlasu) pre výstupný hlas. Toto je významná schopnostná medzera medzi nástrojmi — ak môžete oddeliť hlas, môžete zmeniť, kto spieva, pričom zachováte melodickú a harmonickú kostru originálu. Táto kombinácia zvyčajne produkuje najpresvedčivejšie koverkty.
Ak ste v tomto noví, začnite s generátorom koverov a napíšte stručný popis štýlu pred dotknutím sa akýchkoľvek iných nastavení. Stručný popis robí viac práce ako akýkoľvek posúvač.
Krok 4: renderujte paralelné snímky a počúvajte na rôznych reproduktoroch
Nerenderujte raz a nezaväzujte sa. Renderujte tri alebo štyri snímky s malými variáciami v stručnom popise alebo charaktere hlasu, potom ich všetky počúvajte pred rozhodnutím. Generovanie AI koverkov má dostatok náhodnosti vo výstupe, že dve renderovanie s identickými nastaveniami môžu produkovať výrazne odlišné výsledky. Využite to.
Najdôležitejší test: ako to znie vo vašom telefóne, cez reproduktor, v hlučnej miestnosti? AI koverkty often znejú vyleštene na štúdiových monitoroch alebo dobrých slúchadlách a potom sa úplne rozpadajú na reproduktoroch telefónu. Je to preto, že väčšina AI-generovaného zvuku je miešaná pre čistotu pri plnej šírke pásma — nízky koniec nesie veľkú časť bohatosti a keď stratíte nízky koniec na malom reproduktore, dutá alebo neprirodzená kvalita v hlase alebo nástrojoch sa stáva zrejmou. Snímka, ktorá prežije test telefónu, je takmer vždy správna snímka, aj keď na monitoroch znela mierne menej pôsobivo.
Skúste to tiež na reproduktoroch notebooku bez pozerania na obrazovku. Vaše oči vás budú tlačiť k snímke, ktorá vyzerá, akoby mala znieť lepšie. Vaše uši na degradovanom prehrávacom systéme vám povedia pravdu.
Krok 5: identifikujte AI-znaky a opravte ich re-renderovaním alebo manuálnou úpravou
Súčasné AI koverkty majú konzistentné vzory zlyhania. Keď viete, na čo počúvať, môžete ich zachytiť pred zverejnením a rozhodnúť, či re-renderovať alebo ich manuálne opraviť v DAW.
- Príliš artikulovaná spoluhlásky. Hlas stíha každé T, D a P tvrdšie, ako by ľudský spevák urobil. Skutočné vokály rozmazávajú spoluhlásky na koncoch fráz; AI modely ich often zostrovajú.
- Vibrato, ktoré neznižuje. Ľudské vibrato sa prirodzene zrýchľuje a spomaľuje v závislosti od dychu a polohy frázy. AI-generované vibrato sa often zamkne do stabilnej rýchlosti a tam zostane, čo znie mechanicky na predĺžených notách.
- Údery bicích, ktoré sú príliš čisté. Živé bubnovanie má malé časové nepresnosti a tieňové údery. Ak bicie vo vašom koverku znejú, akoby boli naprogramované na mriežke, pravdepodobne boli, a je to vidno.
- Koncepty fráz, ktoré sa zastavujú namiesto uvoľnenia. Speváci prirodzene ustupujú. AI vokály sa niekedy len zastavujú alebo vydychujú spôsobom, ktorý nezodpovedá tomu, ako dych skutočne funguje.
- Oprava výšky, ktorá je príliš tesná. Ak každá nota pristane presne na výšku, bez posunutia, bez mikro-inflexie, bez modrého nota kdekoľvek, hlas znie korigovaný namiesto spievaný.
Väčšina z toho je opraviteľná re-renderovaním s revidovaným stručným popisom (napr. „uvoľnenejšie spoluhlásky, nechajte frázy dýchať na konci“) alebo ľahkým manuálnym spracovaním následne.
Poznámka k vokálom: nekanny údol je hlasnejší ako mix
Dôvod, prečo väčšina AI koverktov zaostáva, nie je inštrumentácia — je to hlas. Nástroje môžu byť nedokonalé a stále sa cítiť správne. Mierne posunutý klavírny hlas sa číta ako charakter. Ale hlas, ktorý je mierne nesprávny, sa číta ako znepokojivý. Ľudský sluchový systém je mimoriadne citlivý na autentickosť vokálu; máme celú sadu evoluovaných nástrojov rozpoznávania vzorov na detekciu skutočného versus simulovaného ľudského spevu a reči. Ak hlas vo vašom koverku nepristane, žiadne množstvo produkčného lesku ho nespasí. Nestrávte tri iterácie úpravou reverbu a EQ na vokáli, ktorý nefunguje. Najprv vyskúšajte iný charakter hlasu, re-renderujte a zistite, či problém zmizne. Hlas je rozhodnutie.
Kedy zastaviť
Toto je najťažšia časť akéhokoľvek iteratívneho kreatívneho procesu a AI nástroje to zhoršujú tým, že ďalší render sa vždy javí, akoby mohol byť ten, ktorý veci napraví. Niekoľko signálov, že ste hotový:
- Počúvali ste dva rôzne rendery a skutočne nemôžete povedať, ktorý je lepší. To je hazard, nie rozdiel v kvalite.
- Nastavujete nastavenia, ktoré pred troma iteráciami zneli dobre a teraz sa javia nesprávne. To je únava z počúvania, nie zlepšenie.
- Niekto iný to počúval a reagoval bez kvalifikátorov. Ak prvá vec, ktorú povedia, je „ale...“ máte ešte prácu. Ak jednoducho povedia „to je dobré,“ je to dobré.
- Snažíte sa, aby to znelo ako originál. To viac nie je koverok.
- Vec, s ktorou nie ste spokojní, je niečo, čo nemôžete opraviť ani s dokonalým renderovaním — štrukturálna voľba v zdrojovom materiáli, nie problém s vykonaním vo vašom výstupe.
Zastavte sa tam. Exportujte.
Koverok je milostný list k piesni, nie falzifikát. Tie najlepšie hovoria niečo o tom, prečo na tej piesni záleží — prečo sa oplatí k nej vrátiť, prečo znie odlišne cez odlišný súbor skúseností alebo odlišný hudobný kontext. Pred renderovaním ďalšej snímky sa spýtajte, či má vaša verzia zatiaľ pohľad. Ak áno, ste pravdepodobne bližšie k dokončeniu, ako si myslíte. Ak nie, žiadne nastavenie nástroja ho za vás nepridá. Táto časť je stále vaša na prinesenie. Pre inšpiráciu, ako by mohol vyzerať dokončený projekt, prezrite si knižnicu AI hudby, aby ste videli, ako ostatní pristupovali k transformáciám, alebo preskúmajte stránku s cenami, aby ste zistili, ktorý plán vám dáva dostatok renderovaní na správnu iteráciu.