AISongGen logoAISongGen

Kako napraviti AI glazbu koja ne zvuči kao AI glazba

Praktičan vodič — od sjemena upita do numere koju možete staviti na playlist. Odluke, iteracije, način znanja kada stati.

9 min čitanja

Teški dio pravljenja AI glazbe nije pritiskanje gumba. Teški dio je znanje što staviti unutra prije pritiskanja, čitanje onoga što dođe natrag s diskernacijom, i odlučivanje treba li nastaviti ili stati. Većina ljudi koji nazivaju AI glazbu "generičnom" nisu u krivu — samo su stali prerано u procesu, ili su počeli bez dovoljno jasnoće o tome što su zapravo pokušavali napraviti.

Ovo je vodič kroz proces koji sam prošao nekoliko stotina puta. Tretira generiranje kao iteraciju, a ne kao transakciju automata. Kad funkcionira, izlaz ne zvuči kao da ga je napisao stroj. Kad ne uspijeva, točno ćete znati koju odluku treba revidirati.

Odlučite kakvu pjesmu zapravo želite

Prije otvaranja bilo kojeg alata, sjednite s jednim pitanjem: čije iskustvo živi unutar ove pjesme? Ne "koji žanr" i ne "kakav vibe" — to dolazi kasnije. Počnite s perspektivom, zatim mjestom, zatim emocionalnim centrom gravitacije.

Jednostavan okvir za ovo:

[TKO] radi [ŠTO], trenutak odmah prije [PREKRETNICE]. Emocija ispod je [OSJEĆAJ], ne [POVRŠINSKI OSJEĆAJ]. Zadržite to [JEDNA TONALNA RIJEČ].

Razlika između površinskog osjećaja i osjećaja ispod nije vježba pisanja — to je uputa generatoru. Pjesma o "žalosti" zvuči na jedan način; pjesma o specifičnoj iritaciji zbog nemogućnosti plakanja na pogrebu zvuči kao potpuno drugačija ploča. Specifičnost putuje u generiranje na načine koji oznake žanra enostavno ne mogu.

Dok još razmišljate na papiru, odlučite o duljini. Dvominutna numera i četverominutna numera pozivaju na različite strukturne izbore, i generator će lutati bez cilja. Odaberite jedan prije pomicanja.

Korak 1: napišite upit koji imenuje stav, a ne teksturu

Većina prvih upita opisuje zvuk: "lo-fi beat, topli ključevi, melankoličan." To opisuje kako bi numera trebala zvučati slušatelju tri koraka udaljena od emocije. Stav opisuje što izvođač radi svojim tijelom i pažnjom.

Usporedite ova dva:

  • Upit teksture: "Spori R&B, meki falsetto, kasna noć, čežnja."
  • Upit stava: "Netko čita stare poruke koje su si obećali brisati. Nastavljaju čitati. Vokal je tih kao da ne žele da ih itko čuje."

Oba ukazuju na slično emocionalno odredište. Upit stava daje modelu nešto za izvedbu. Upit teksture mu daje zvučnu referencu i ništa drugo. Rezultati nisu ekvivalentni.

Zadržite upite stava na tri ili četiri rečenice. Strop je niži nego što mislite — nakon otprilike pet rečenica model počinje prosjek ati između uputa umjesto da ih gradi.

Korak 2: odaberite generator koji vam dopušta uspoređivanje snimaka

Generatori s jednim snimkom usporavaju iteraciju na specifičan, dosadan način: dobilijete rezultat, gotovo je pravi, regenerirate s malim podešavanjem, i novi snimak slijeće u potpuno drugom smjeru jer nije bilo zajedničkog sidra. Na kraju jurišate za originalnim snimkom koji je bio "gotovo to" šest ciklusa.

Pokretanje paralelnih varijanti rješava to. aisonggen glazbeni generator renderira pet snimaka istovremeno iz istog upita, tako da možete uspoređivati ih jedne pored druge prije obvezivanja u smjeru. Ako su dva od pet u pravom teritoriju, već ste preskočili većinu petlje regeneriranja.

Pravična napomena: pet snimaka košta više kredita nego jedan. Ako imate vjeoma uski kreditni proračun, pokrenite dva snimka umjesto pet i tretira jte jedan kao svoju referencu. Poanta je imati barem jednu usporedbu, a ne pet.

Korak 3: napišite ili ko-napišite tekstove prvi

Polje za tekst generatora je malo tekstno polje, i model koji teče iza njega ima snažan prior prema zadržavanju onoga što mu date — original ni broj redaka, originalnu shemu rime, čak i originalni slogovni obrazac. Ako napišete tekstove unutar tog polja i odlučite da kasnije želite dodati most, borit ćete se s modelom na svakom regeneriranju.

Nacrtajte tekstove zasebno prije lijepljenja. Lyric Studio vam daje dovoljno prostora da zapravo vidite što pišete. Možete revidirati cijelu strofu, isprobati drugačiju kuku refrena, premjestiti pre-refren prije nego postane strukturalan — sve to prije predaje čega god generatoru.

Tekstovi-prvo vam también omogućuje provjeru jedne stvari koju generator ne može: ima li tekst prirodni govorni ritam koji pjevač zaista može sletjeti. Pročitajte refren naglas. Ako se spotiknete, i model hoće.

Ako gradite tekst interaktivno uz glazbu — upit prvi, refin irajte tekstove second — taj je radni tijek isto valjano. Ključ je da se uređivanje teksta događa negdje s pravim prostorom za uređivanje, a ne u tekstnom okviru generatora.

Korak 4: birajte stilske kontrole s namjerom

Oznake žanra su sjemena, a ne ugovori. "Indie folk" ne zaključuje izlaz u bilo koji specifičan produkcijski stil — pristranjuje model prema grozdu zvukova povezanih s tom oznakom, što je polazišna točka, ne garancija. Ako želite razumjeti kako model zapravo interpretira te oznake prije obvezivanja, vodič o oznakama žanra vrijedi deset minuta vašeg vremena.

Što zapravo ograničava izlaz pouzdanije:

  • Raspoloženje, nazvano precizno. "Gorko-slatko" i "rezignirano" slijeću drugačije čak unutar iste oznake žanra.
  • Scena ili okruženje. "Prazan parkirališta u ponoć" daje miks inženjeru (modelu, ovdje) vizualnu referencu za reverb i prostor.
  • Rodni i registralni vokal. Većina generatora prihvaća eksplicitne upute ovdje, i zadano nije uvijek pravo za vaš tekst.

Postavite BPM ako ga znate. Ne raspon — broj. "Oko 90" daje modelu previše prostora. "88 BPM" mu daje sat. Isto s duljinom numere: napišite ciljanu duljinu eksplicitno umjesto da je ostavite na zadano.

Korak 5: renderirajte, zatim slušajte na najgorem zvučniku koji posjedujete

AI generirane numere imaju poznati način propusta: zvuče bolje na slušalicama nego zaslužuju. Stereo polje je često široko, bas je kontroliran, miks je čist na način koji se tek otkriva kao artificijelan kad ga čujete na nečemu neoprostivom.

Nakon prvog renderiranja, prijeđite na zvučnik telefona. Ili ugrađeni laptop. Ili, ako imate pristup, auto stereo s otvorenim prozorima. Ovi zvučnici ruše stereo polje, izlažu mulj u niskosrednjim tonovima i izvode hrapavost u gornjem middle rangeu. Ako numera još uvijek zvuči kao numera — ne nužno dobro, ali koherentno — imate nešto vredno rada.

Ako se uruši u kašu, to nije uvijek znak za regeneriranje. Znak je da pogledate stilske kontrole. Oznaka žanra s niskim basom plus postavka tople sobe plus spori BPM često proizvede numeru koja ne putuje. Prilagodite jednu varijablu, ne sve tri.

Korak 6: naslovnica, ponovo renderirajte ili stanite

Znanje kada stati je vještina koja razdvaja ljude koji šalju od ljudi koji imaju četiristo spremljenih nacrta i ništa na playlistu.

Tri signala da je snimak gotov:

  • Refren zaista vuče. Osjećate dolazak prije razmišljanja o njemu. Ako se morate uvjeravati zašto refren funkcionira, ne funkcionira.
  • Vokal sjedi u džepu. Pjevač zvuči kao da pjeva ovu pjesmu, a ne demonstrira da može pogoditi ove note. AI vokali često prekomjerno artikuliraju suglasnike — dobar snimak ne.
  • Nema AI-znakova koje primjećujete pri trećem slušanju. Bubanj obrasci koji su premetrički čisti. Prijelazi akorda koji nema varijacije brzine. Zadržana nota koja nikad ne diše. To su znakovi. Jedan od njih je često prihvatljiv. Tri je previše.

Ako snimak prođe dva od tri, stanite i nazovite ga nacrtom. Ako prođete sva tri, stanite i nazovite ga gotovim.

Ponovo renderiranje ima smisla kada je jedan specifičan parametar pogrešan i možete ga imeniti. "Vokal je presvjetao za tekst" je uputa za ponovo renderiranje. "Nešto se čini pogrešnim" nije — to je problem slušanja, ne problem generiranja, i više snimaka ga neće popraviti.

Uobičajene greške

  • Upit prekratak. Jedna rečenica nije upit; to je oznaka žanra s omatarom rečenice. Tri rečenice su minimum za rezultat s bilo kakvim karakterom.
  • Upit predugačak. Osam rečenica detaljnog izgradnje svijeta daje modelu previše ograničenja za istovremeno zadovoljavanje. Procijenit će jima prosjek i producirati ništa posebno.
  • Zamjena alata usred iteracije. Svaki generator ima drugačiji unutarnji model, i "isti upit" producira strukturno različite rezultate kroz alate. Ako promijenite usred sesije, resetirate svoju usporednu osnovu i gubite povijest iteracije. Odaberite jedan alat po numeri i ostanite tamo.
  • Regeneriranje s istim ulazima i očekivanje drugačijeg rezultata. Varijacija u izlazima za identične upite je stvarna, ali ograničena. Ako su tri uzastopna snimka svi pogrešni na isti način, upit je problem, a ne nasumično sjeme.
  • Ignoriranje neskladnog vokala. Vokalni timbr, registar i energija implicirani vašim tekstom moraju se uskladiti s glasom koji model odabere. Tekst napisan za hrapav bariton isporučen od laganog tenora je greška kastinga, i nikakva količina ponovnog renderiranja ne popravlja kasting.

Nakon prve numere koja funkcionira

Preuzmite stabljike ako ih alat nudi. Čak i ako ne planirate miksati, razdvojeni vokal i instrumental znači da možete re-glasiti kasnije, ili predati instrumental pravom pjevaču bez početka od nule.

Spremi upit točno onako kako je bio kad je funkcionirao. Ne verziju kroz koju ste iterirali — konačnu verziju. Kopirajte je u datoteku bilješki, tablicu, bilo gdje koje nije unutar samog alata. Većina alata ne persistira upite kroz sesije u obliku koji možete lako pretraživati. aisonggen glazbena knjižnica automatski sprema vašu povijest generiranja i upite koji su producirali svaku numeru, što smanjuje koliko morate sami upravljati ovim, ali vrijedi i dalje zadržati vlastitu kopiju upita koji su producirali vaše beste rezultate.

Zabilježite dvije stvari za svaku numeru koja funkcionira: kombinaciju oznake žanra-raspoloženja koju ste koristili, i svaku frazu stava koja je bila generativna. Kroz deset ili petnaest numera, pojavljuju se obrasci — naći ćete kombinacije oznaka koje odgovaraju vašem kreativnom rasponu i fraze koje pouzdano produciraju nešto vrijedno čuvanja. Taj dnevnik je vredniji od bilo kojeg vodiča, uključujući ovaj.

Ako želite vidjeti kako drugi ljudi koriste generator prije obvezivanja na vlastiti radni tijek, stranica s recenzijama pokazuje kako pravi korisnici pristupaju različitim žanrovima i slučajevima.

Cilj nije generiranje glazbe. Generiranje glazbe je sada lak dio — svatko može pritisnuti gumb. Cilj je pisanje pjesama. Pjesama koje imaju perspektivu, specifičan emocionalni centar, strukturu koja zaslužuje završetak. AI je sloj produkcije: obrađuje aranžman, miks, glas. Vi još uvijek morate pisati. Što više toga donesete u upit, to manje čujete da nedostaje u izlazu.

Vaša sljedeća pjesma udaljena je samo jedan besplatan prompt

Otvorite studio, upišite raspoloženje, čujte gotovu pjesmu u 30 sekundi. Besplatno za početak, bez tantijema za isporuku, bez potrebe za karticom.