Sådan laver du AI-covers, der ikke bare lyder som en remix

Et cover, der virker, er en distinkt kunstnerisk fortolkning af en andens sang — en anden vinkel, en anden følelsesmæssig betoning, måske en helt anden genre. Når det lykkes, hører du knoglerne fra originalen og noget nyt på samme tid. Et cover, der ikke virker, er bare den samme sang med et uklarere mix og en stemme, der lyder lidt forkert. Forskellen mellem de to er næsten aldrig det værktøj, du brugte. Det er de valg, du traf, inden du trykkede på generer.

AI-cover-generatorer har gjort det genuint nemt at tage et stykke musik og rekonstruere det med en anden stemme, stil eller arrangement. Men lettere adgang til processen forbedrer ikke automatisk resultatet. Du skal stadig vide, hvilke sange det er værd at lave covers af, hvordan man skriver et stilbeskrivelse, der giver modellen noget reelt at arbejde med, og hvornår man skal stoppe med at pille og kalde det færdigt. Denne guide gennemgår alt det trin for trin.

Inden du starter: licensspørgsmålet

Dette er den del, de fleste vejledninger springer over, så lad os klare det først. Hvis du laver et cover af en sang, du ikke ejer, er den sang næsten helt sikkert ophavsretsbeskyttet. At offentliggøre et AI-genereret cover af et ophavsretsbeskyttet nummer på en streamingtjeneste eller tjene penge på det på YouTube er et afledt værk, og at gøre det uden en licens eller mekanisk rettigheder-godkendelse placerer dig i en gråzone, der kan ende med et rettighedskrav eller en nedtagning. Reglerne varierer efter land, men 'jeg samplet ikke den originale lyd' gør dig ikke automatisk sikker — en genkendelig melodi eller tekst er stadig beskyttet.

Det sikreste grundlag: lav covers af dit eget materiale, covers af sange med en Creative Commons-licens, der tillader afledte værker, eller covers af kompositioner, der er faldet i det offentlige domæne (i USA betyder dette generelt værker, hvis ophavsret er udløbet — undersøg det for det specifikke stykke). Hvis du vil lave et cover af noget samtidigt og udgive det kommercielt, kan du undersøge tjenester, der håndterer mekanisk licensering. Til personlig, ikke-monetiseret brug er risikoen lavere, men det er stadig værd at vide, hvor du står, inden du investerer timer i et projekt.

Trin 1: vælg en reference, der har plads til at trække vejret

Ikke alle sange fungerer som covers. Dem, der typisk overlever processen, er strukturelt enkle: en klar melodilinje, et håndterbart antal akkordskift, minimal afhængighed af produktionstekstur for deres følelsesmæssige effekt. Akustiske ballader, treklangs-folksange og stripped-back blødt pop er naturlige kandidater. En god melodi kan bære sig selv på tværs af meget forskellig instrumentering. En god sang bygget på enkelthed vil normalt lyde interessant i næsten enhver stil.

De sange, der modstår cover-behadlingen, er dem, hvor den originale produktion ER sangen. Bohemian Rhapsody er ikke rigtig en melodi — det er en mur af interagerende arrangementer, vokallag og dynamiske skift, der er uadskilleliga fra oplevelsen. Stadionmix-rock fra 2010'erne (tæt reverb, lagdelte guitarer, komprimeret alting) er det samme problem. Du kan strippe disse sange ned til skelettet, men det, du får, lyder ofte så anderledes fra originalen, at forbindelsen er tabt. Det er ikke altid dårligt — nogle gange er en radikal dekonstruktion interessant — men det er et meget sværere kreativt problem, end de fleste forventer, når de starter.

Spørg dig selv: hvis nogen fremførte denne sang akustisk på et gadehjørne, ville den stadig være genkendelig? Ville den stadig røre ved dig? Hvis ja, er den sandsynligvis en god kandidat. Hvis svaret er 'kun hvis de perfekt imiterede studioversionen', er den sang måske ikke klar til et cover.

Trin 2: skriv et stilbeskrivelse, ikke bare en genre

'Gør det jazz' fortæller modellen næsten ingenting nyttigt. Jazz er Coltrane, og det er også pianoet på hotellebaren, og det er også bossa nova, og det er også bebop. Et et-ords-genrebeskrivelse producerer næsten altid et generisk output, fordi modellen skal gætte på alt: tempo, instrumenteringsvægt, vokal-tilgang, produktionstæthed. Gættet er normalt korrekt på en teknisk korrekt og æstetisk glemsom måde.

Et godt stilbeskrivelse indsnævrer den følelsesmæssige og soniske verden til noget specifikt. I stedet for genren, beskriv rummet, tidspunktet på natten, følelsen. Jo mere specifikt og visuelt beskrivelsen er, jo mere sandsynligt er det, at modellen træffer valg, der hænger sammen til en faktisk fortolkning frem for et blandet gennemsnit af alt i den genre.

Sen-aften-pianobar-cover, kl. 4 om morgenen, sidst-på-aftenen-energi. Vokalen skal føles næsten talt — lav, uden hast, som om sangeren bare tænker højt. Børstet snare meget langt tilbage i mikset, næppe hørbar. Ingen strygere. Klaveret skal lyde lidt falsk, den slags du ville finde i en gammel hotel-lounge. Hold det under 3 minutter.

Det stilbeskrivelse fortæller modellen, hvad der skal vægtes, og hvad der skal udelades. Det giver det et synspunkt. Dit stilbeskrivelse behøver ikke at være så langt, men det skal have et synspunkt.

Trin 3: upload referencen og indstil de rigtige kontroller

Når du har din referencelyd og dit stilbeskrivelse, er den faktiske genereringsproces ret enkel — men et par indstillinger betyder mere end andre. Aisonggens cover-generator tager en referencelyd og et stilbeskrivelse og lader dig justere vokalkarakter, genrevægtning og arrangeringsdensitet, inden den genererer. Den samme generelle arbejdsproces gælder i de fleste nuværende værktøjer.

Én ting at tjekke, inden du genererer: om værktøjet adskiller reference-VOKAL fra reference-SANG. Nogle generatorer lader dig uploade den fulde sang som en strukturel reference, mens du uploader en separat isoleret vokal (eller vælger en vokalkarakter) til outputstemmen. Dette er en betydelig kapacitetsforskel mellem værktøjer — hvis du kan specificere stemmen separat, kan du ændre, hvem der synger, mens du bevarer melodiske og harmoniske knogler fra originalen intakt. Den kombination producerer normalt de mest overbevisende covers.

Hvis du er ny til dette, start med cover-generatoren og skriv dit stilbeskrivelse, inden du rører andre indstillinger. Beskrivelsen gør mere arbejde end nogen skyder.

Trin 4: generer parallelle takes og lyt på forskellige højttalere

Generer ikke én gang og forpligt dig. Generer tre eller fire takes med små variationer i beskrivelsen eller vokalkarakteren, lyt derefter til dem alle, inden du beslutter. AI-cover-generering har nok tilfældighed i outputtet til, at to genereringer med identiske indstillinger kan producere mærkbart forskellige resultater. Drag fordel af det.

Den test, der betyder mest: hvordan lyder det på din telefon, igennem højttaleren, i et støjende rum? AI-covers lyder ofte poleret på studiemonitorer eller gode høretelefoner og falder derefter fuldstændigt fra hinanden på telefonhøjttalere. Dette skyldes, at de fleste AI-genererede lyd er mikset for klarhed ved fuld båndbredde — bunden bærer meget af rigdommen, og når du mister bunden på en lille højtaler, bliver en hul eller unaturlig kvalitet i stemmen eller instrumenterne åbenbar. Det take, der overlever telefontesten, er næsten altid det rigtige take, selvom det lød lidt mindre imponerende på monitorer.

Prøv det også på bærbar-højttalere uden at se på skærmen. Dine øjne vil skubbe dig mod det take, der ser ud til at skulle lyde bedre. Dine ører på et forringet afspilningssystem vil fortælle dig sandheden.

Trin 5: spot AI-tegnene og fix dem med en omgenerering eller manuel redigering

Nuværende AI-covers har konsistente fejlmønstre. Når du ved, hvad du skal lytte efter, kan du fange dem, inden du offentliggør, og beslutte, om du vil omgenerere eller manuelt fikse dem i en DAW.

Overarticulerede konsonanter. Stemmen rammer hvert T, D og P hårdere, end en menneskelig sanger ville. Rigtige vokalister sløjer konsonanter ved fraseringsafslutninger; AI-modeller skærper dem ofte.
Vibrato, der ikke aftager. Menneskelig vibrato sætter fart op og ned naturligt afhængigt af vejrtrækning og fraseringsposition. AI-genereret vibrato låser sig ofte fast i en stabil hastighed og forbliver der, hvilket lyder mekanisk på vedvarende toner.
Trommeslag, der er for rene. Levende trommespil har små timinginkonsistenser og ghost-hits. Hvis trommerne i dit cover lyder som om de er programmeret på et gitter, er de det sandsynligvis, og det viser sig.
Fraseringsafslutninger, der afskæres frem for frigives. Sangere aftager naturligt. AI-vokaler stopper somme tider bare eller toner ud på en måde, der ikke matcher, hvordan vejrtrækning faktisk virker.
Tonehøjdekorrektioner, der er for stramme. Hvis enhver tone rammer præcis på tonehøjde, ingen glid, ingen mikroinfleksion, ingen blå tone nogen steder, lyder stemmen korrigeret frem for sunget.

De fleste af disse kan rettes med en omgenerering ved hjælp af et revideret beskrivelse (f.eks. 'mere afslappede konsonanter, lad fraser trække vejret ved afslutningen') eller med let manuel behandling bagefter.

En bemærkning om vokaler: the uncanny valley er højere end mikset

Grunden til, at de fleste AI-covers kommer til kort, er ikke instrumenteringen — det er stemmen. Instrumenter kan være ufuldkomne og stadig føles rigtige. En lidt skæv klavervoicing læses som karakter. Men en stemme, der er lidt forkert, læses som ubehagelig. Det menneskelige auditive system er ekstremt følsomt over for vokal autenticitet; vi har et helt evolutioneret sæt mønstergenkendelsesværktøjer til at opdage virkelig versus simuleret menneskelig tale og sang. Hvis stemmen i dit cover ikke lander, vil ingen mængde produktionspolish redde det. Brug ikke tre iterationer på at justere reverb og EQ på en vokal, der ikke virker. Prøv en anden vokalkarakter først, omgenerer og se, om problemet forsvinder. Stemmen er beslutningen.

Hvornår man stopper

Dette er den sværeste del af enhver iterativ kreativ proces, og AI-værktøjer gør det værre ved altid at lade det næste generer føles som om det måske er det, der fikser tingene. Et par signaler på, at du er færdig:

Du har lyttet til to forskellige takes og kan genuint ikke afgøre, hvilket der er bedre. Det er en møntfilip, ikke en kvalitetsforskel.
Du justerer indstillinger, der lød fine for tre iterationer siden og nu føles forkerte. Det er lyttertræthed, ikke forbedring.
En anden lyttede til det og reagerede uden forbehold. Hvis det første, de siger, er 'men...', har du mere arbejde at gøre. Hvis de bare siger 'det er godt', er det godt.
Du forsøger at få det til at lyde som originalen. Det er ikke et cover længere.
Det, du er utilfreds med, er noget, du ikke kunne fikse selv med et perfekt generer — et strukturelt valg i kildematerialet, ikke et udførelsesproblemi dit output.

Stop der. Eksporter det.

Et cover er et kærlighedsbrev til en sang, ikke en kopi. De bedste siger noget om, hvorfor den sang betyder noget — hvorfor det er værd at vende tilbage til, hvorfor det lyder anderledes igennem et andet sæt oplevelser eller en anden musikalsk kontekst. Inden du genererer endnu et take, spørg dig selv om din version endnu har et synspunkt. Hvis den har det, er du sandsynligvis tættere på at være færdig, end du tror. Hvis den ikke har det, vil ingen værktøjsindstilling tilføje det for dig. Den del er stadig din at bringe. For inspiration til, hvordan et færdigt projekt kan se ud, kan du tjekke AI-musikbiblioteket for at høre, hvordan andre har tilgået transformationer, eller udforske prissætningssiden for at se, hvilken plan der giver dig nok genereringer til at iterere ordentligt.

Sådan laver du AI-covers, der ikke bare lyder som en remix

Inden du starter: licensspørgsmålet

Trin 1: vælg en reference, der har plads til at trække vejret

Trin 2: skriv et stilbeskrivelse, ikke bare en genre

Trin 3: upload referencen og indstil de rigtige kontroller

Trin 4: generer parallelle takes og lyt på forskellige højttalere

Trin 5: spot AI-tegnene og fix dem med en omgenerering eller manuel redigering

En bemærkning om vokaler: the uncanny valley er højere end mikset

Hvornår man stopper

Læs videre

Sådan laver du AI-musik, der ikke lyder som AI-musik

Sådan bruger du tekst-til-tale, så det holder op med at lyde som en robot, der læser lektier op

AI-cover vs. AI-original — de ærlige afvejninger

Dit næste nummer er én gratis prompt væk