Tekoälymusiikin tekemisen vaikea osa ei ole napin painaminen. Vaikea osa on tietää, mitä laittaa ennen painamista, lukea mitä tulee takaisin millään erottavuudella, ja päättää, jatkaako vai pysähtykö. Useimmat ihmiset, jotka kutsuvat tekoälymusiikkia "yleiseksi", eivät ole väärässä — he vain lopettivat liian aikaisin prosessissa tai aloittivat ilman riittävää selvyyttä siitä, mitä he todella yrittivät tehdä.
Tämä on läpikäynti prosessista, jonka olen käynyt läpi useita satoja kertoja. Se kohtelee generointia iteraationa, ei automaattitransaktiona. Kun se toimii, tulos ei kuulosta koneen kirjoittamalta. Kun se epäonnistuu, tiedät tarkalleen, minkä päätöksen palata.
Päätä, minkälaisen kappaleen haluat
Ennen minkään työkalun avaamista istu yhden kysymyksen kanssa: kenen kokemus tämä kappale elää sisällä? Ei "mikä genre" eikä "mikä fiilis" — ne tulevat myöhemmin. Aloita perspektiivistä, sitten paikasta, sitten tunteen painopiste.
Yksinkertainen kehys tähän:
A [KUKA] tekee [MITÄ], hetki juuri ennen [KÄÄNNEKOHTAA]. Tunne alla on [TUNNE], ei [PINNALLINEN TUNNE]. Pidä se [YKSI SÄVYNÄINEN SANA].
Ero pintakokemuksen ja sen alla olevan tunteen välillä ei ole kirjoitusharjoitus — se on generaattoriohje. Kappale "surusta" kuulostaa yhdeltä tavalla; kappale tietystä ärsytyksestä kyvyttömyydestä itkeä hautajaisissa kuulostaa täysin erilaiselta levyltä. Spesifisyys siirtyy generointiin tavoilla, joita genretagit eivät yksinkertaisesti voi.
Samalla kun olet vielä paperiajattelussa, päätä pituus. Kahden minuutin raita ja neljän minuutin raita vaativat erilaisia rakenteellisia valintoja, ja generaattori ajautuu ilman kohdetta. Valitse yksi ennen siirtymistä.
Vaihe 1: kirjoita kehote, joka nimeää asennon, ei tekstuurin
Useimmat ensimmäiset kehotteet kuvailevat ääntä: "lo-fi-rytmi, lämmin näppäimistö, melankolinen." Se kuvaa, miltä raita pitäisi tuntua kuulijalle kolme askelta tunteesta etäällä. Asento kuvaa, mitä esiintyjä tekee kehollaan ja huomiollaan.
Vertaa näitä kahta:
- Tekstuurikehote: "Hidas R&B, pehmeä falsetti, myöhäisilta, kaipaus."
- Asento-kehote: "Joku lukee vanhoja viestejä, jotka he lupasivat poistavansa. He lukevat edelleen. Vokaali on hiljainen kuin he eivät haluaisi kenenkään kuulevan."
Molemmat osoittavat samankaltaiseen emotionaaliseen kohteeseen. Asento-kehote antaa mallille jotain esittää. Tekstuurikehote antaa sille soinnillisen viitteen eikä muuta. Tulokset eivät ole yhtäläiset.
Pidä asento-kehotteet kolmesta neljään lauseeseen. Katto on alhaisempi kuin luulet — noin viiden lauseen jälkeen malli alkaa keskiarvoistaa ohjeita eikä rakentaa niiden päälle.
Vaihe 2: valitse generaattori, joka antaa sinun vertailla ottoja
Yksittäisen oton generaattorit tekevät iteraatiosta hitaan tietyllä ärsyttävällä tavalla: saat tuloksen, se on melkein oikea, regeneroit pienellä muutoksella, ja uusi otto laskeutuu täysin eri suuntaan, koska ei ollut yhteistä ankkuria. Päädyt ajamaan alkuperäistä ottoa, joka oli "lähes se", kuuden syklin ajan.
Rinnakkaisten varianttien ajaminen ratkaisee tämän. aisonggenin musiikkigeneraattori renderöi viisi ottoa samanaikaisesti samasta kehotteesta, joten voit verrata niitä vierekkäin ennen suunnan sitoutumista. Jos kaksi viidestä on oikealla alueella, olet jo ohittanut suurimman osan regenerointisilmukasta.
Reilu huomio: viisi ottoa maksaa enemmän kredittiä kuin yksi. Jos budjettiisi on erittäin tiukka, aja kaksi ottoa viiden sijaan ja käsittele toinen viitteinäsi. Keskeinen seikka on, että sinulla on ainakin yksi vertailu, ei viisi.
Vaihe 3: kirjoita tai kirjoita yhdessä lyriikat ensin
Generaattorin lyriikka-alue on pieni tekstikenttä, ja sen takana toimivalla mallilla on vahva taipumus pitää kiinni antamastasi — alkuperäinen säemäärä, alkuperäinen riimijärjestelmä, jopa alkuperäinen tavumalli. Jos kirjoitat lyriikat tuon kentän sisälle ja päätät myöhemmin lisätä sillan, taistelet mallia vastaan jokaisen regeneroinnin yhteydessä.
Luonnosta lyriikat erikseen ennen liittämistä. Lyriikastudio antaa sinulle tarpeeksi tilaa todella nähdä, mitä kirjoitat. Voit muokata kokonaisen säkeistön, kokeilla eri kertosäekoukkua, siirtää esi-kertosäkeen ennen kuin se muuttuu rakenteelliseksi — kaikki ennen antamista generaattorille.
Lyriikat ensin antaa sinun myös tarkistaa yhden asian, johon generaattori ei pysty: onko lyriikoilla luonnollinen puherytmi, jonka laulaja todella voi laskeutua. Lue kertosäkeesi ääneen. Jos kompastut, malli myös.
Jos rakennat lyriikoita vuorovaikutteisesti musiikin rinnalla — kehote ensin, lyriikoiden tarkistus toiseksi — tuo työnkulku on myös pätevä. Avain on se, että lyriikan muokkaus tapahtuu jossakin, jossa on todellinen muokkaustila, ei generaattorin tekstikentässä.
Vaihe 4: valitse tyylin ohjaimet tarkoituksella
Genretagit ovat siemeniä, eivät sopimuksia. "Indie folk" ei lukitse tulosta mihinkään tiettyyn tuotantotyyliin — se kallistaa mallia kohti siihen liittyvien äänien ryhmää, mikä on lähtökohta, ei takuu. Jos haluat ymmärtää, miten malli tulkitsee nämä tagit ennen sitoutumista, genretageja koskeva opas on kymmenen minuutin aikaasi.
Mikä todella rajoittaa tulosta luotettavammin:
- Tunnelma, nimetty tarkasti. "Katkeransuloinen" ja "alistunut" laskeutuvat eri tavoin jopa saman genretagin sisällä.
- Kohtaus tai tapahtumapaikka. "Tyhjä parkkipaikka keskiyöllä" antaa miksausinsinöörille (mallille, tässä) visuaalisen viitteen kaiulle ja tilalle.
- Vokaalin sukupuoli ja rekisteri. Useimmat generaattorit hyväksyvät eksplisiittisiä ohjeita tässä, eikä oletus ole aina oikea lyriikkaasi varten.
Aseta BPM, jos tiedät sen. Ei vaihteluväliä — luku. "Noin 90" antaa mallille liikaa tilaa. "88 BPM" antaa sille kellon. Sama raidan pituuden kanssa: kirjoita tavoite-kesto eksplisiittisesti sen sijaan, että jättäisit sen oletukselle.
Vaihe 5: renderöi, sitten kuuntele huonoimmalla kaiuttimella, jonka omistat
Tekoälyn tuottamilla raidoilla on tunnettu vikamalli: ne kuulostavat kuulokkeilla paremmilta kuin ansaitsevat. Stereokenttä on usein laaja, matala pää on hallittu, miksaus on puhdas tavalla, joka paljastaa itsensä keinotekoisena vasta kun kuulet sen jollakin armottomalla.
Ensimmäisen renderöinnin jälkeen siirry puhelinkaiuttimeen. Tai kannettavan tietokoneen sisäiseen. Tai, jos sinulla on pääsy, auton stereoon ikkunat alas. Nämä kaiuttimet romahduttavat stereouttisen kentän, paljastavat matalan-keski-mutaa ja tuovat esiin kovuuden ylemmässä keskialueessa. Jos raita yhä kuulostaa raidalta — ei välttämättä hyvältä, mutta koherentilta — sinulla on jotain työn arvoista.
Jos se romahtaa mudaksi, se ei ole aina merkki regeneroida. Se on merkki katsoa tyylin ohjaimiasi. Matala-pää-raskas genretag plus lämmin huoneenasetus plus hidas BPM tuottavat usein raidan, joka ei matkusta. Säädä yksi muuttuja, ei kaikkia kolmea.
Vaihe 6: coveröi, renderöi uudelleen tai pysähdy
Tietäminen milloin pysähtyä on taito, joka erottaa ihmiset, jotka toimittavat, niistä, joilla on neljäsataa tallennettua luonnosta eikä mitään soittolistalla.
Kolme signaalia, että otto on valmis:
- Kertosäe todella vetää. Tunnet saapumisen ennen kuin ajattelet sitä. Jos sinun täytyy argumentoida itsellesi miksi kertosäe toimii, se ei toimi.
- Vokaali istuu taskussa. Laulaja kuulostaa siltä, että he laulavat tätä kappaletta, eivät osoittavat, että he voivat osua näihin nuotteihin. Tekoälyäänet usein liiaksi artikuloivat konsonantit — hyvä oto ei tee niin.
- Tekoälyjälkiä ei enää ole, jotka huomaat kolmannella kuuntelukeralla. Rumpumallit, jotka ovat liian rytmisesti puhtaita. Sointujen siirtymät ilman nopeusvaihtelua. Pidetty nuotti, joka ei koskaan hengitä. Nämä ovat jäljet. Yksi niistä on usein hyväksyttävä. Kolme on liikaa.
Jos otto läpäisee kaksi kolmesta, pysähdy ja kutsu sitä luonnokseksi. Jos läpäiset kaikki kolme, pysähdy ja kutsu sitä valmiiksi.
Renderöinnin uudelleen tekeminen on järkevää, kun yksi tietty parametri on väärä ja voit nimetä sen. "Vokaali on liian kirkas lyriikalle" on renderöintiohje. "Jokin tuntuu väärältä" ei ole — se on kuunteluongelma, ei generointiongelma, eivätkä lisää ottoja korjaa sitä.
Yleisiä virheitä
- Kehote on liian lyhyt. Yksi lause ei ole kehote; se on genretag lauseen kuoressa. Kolme lausetta on minimi tulokselle, jolla on mitään luonnetta.
- Kehote on liian pitkä. Kahdeksan lausetta yksityiskohtaista maailmanrakennusta antaa mallille liikaa rajoituksia täytettäväksi samanaikaisesti. Se keskiarvoistaa ne eikä tuota mitään erityistä.
- Työkalujen vaihtaminen iteraation keskellä. Jokaisella generaattorilla on erilainen sisäinen malli, ja "sama kehote" tuottaa rakenteellisesti erilaisia tuloksia eri työkaluissa. Jos vaihdat istunnon kesken, nollaat vertailuperustasi ja menetät iteraatiohistorian. Valitse yksi työkalu per raita ja pysy siinä.
- Regenerointi samoilla syötteillä ja odottaen erilaista tulosta. Identtisten kehotteiden tuloksissa oleva vaihtelu on todellista mutta rajattua. Jos kolme peräkkäistä ottoa ovat kaikki väärin samalla tavalla, kehote on ongelma, ei satunnaisluku.
- Vokaaliristiriidan sivuuttaminen. Lyriikkasi implisoimien vokaalitiimberin, rekisterin ja energian on vastattava ääntä, jonka malli valitsee. Karskealle baritonille kirjoitettu lyriikka, jonka toimittaa kevyt tenori, on casting-virhe, eikä mikään uudelleenrenderöinti korjaa castingia.
Ensimmäisen toimivan raidan jälkeen
Lataa stemmit, jos työkalu tarjoaa niitä. Vaikka et aio miksata, vokaali ja instrumentaalinen erikseen tarkoittaa, että voit ääni-uudelleen myöhemmin tai antaa instrumentaalin todelliselle laulajalle aloittamatta nollasta.
Tallenna kehote tarkalleen sellaisena kuin se oli, kun se toimi. Ei versio, jonka kautta iteroit — loppuversio. Kopioi se muistilappuun, taulukkolaskentaan, mihin tahansa, joka ei ole itse työkalussa. Useimmat työkalut eivät säilytä kehotteita istuntojen välillä muodossa, jonka voit helposti hakea. aisonggenin musiikkikirjasto tallentaa automaattisesti generointihistoriasi ja kehotteet, jotka tuottivat kunkin raidan, mikä vähentää sitä, kuinka paljon sinun on hallittava tätä itse, mutta oman kopion pitäminen kehotteista, jotka tuottivat parhaat tuloksesi, on silti kannattavaa.
Kirjaa kaksi asiaa jokaisesta toimivasta raidasta: käyttämäsi genre-tunnelmatagi-yhdistelmä ja kaikki asento-lauseet, jotka tuntuivat generoivalta. Kymmenen tai viidentoista raidan jälkeen mallit nousevat esille — löydät tagiyhdistelmät, jotka sopivat luovaan alueeseesi, ja ilmaisut, jotka tuottavat luotettavasti jotain pitämisen arvoista. Tuo kirjaus on arvokkaampi kuin mikään opas, mukaan lukien tämä.
Jos haluat nähdä, miten muut käyttävät generaattoria ennen omaan työnkulkuun sitoutumista, arvostelusivu näyttää, miten todelliset käyttäjät lähestyvät eri genrejä ja käyttötapauksia.
Tavoite ei ole luoda musiikkia. Musiikin luominen on nyt helppo osa — kuka tahansa voi painaa nappia. Tavoite on kirjoittaa kappaleita. Kappaleita, joilla on näkökulma, tietty emotionaalinen keskus, rakenne, joka ansaitsee loppunsa. Tekoäly on tuotantokerros: se käsittelee sovituksen, miksauksen, äänen. Kirjoittaminen on yhä sinun tehtäväsi. Mitä enemmän siitä tuot kehotteeseen, sitä vähemmän sitä kuulet puuttuvan tuloksessa.