AISongGen logoAISongGen

Genretaggar är inte genrer

När modellen säger "lo-fi hip-hop" pekar den inte på en genre — den pekar på en region i prompt-rymden.

5 min läsning

En genretagg är, så långt modellen är bekymrad, en koordinat. Den smalnar av territoriet den är villig att vandra inom. Den garanterar inte att det resulterande spåret låter som den specifika skiva som sitter i ditt huvud, och att behandla den som en garanti är det snabbaste sättet att bli besviken på varje generering du ber om.

Taggar är frön, inte kontrakt

När du väljer "synthwave" från dropdown-menyn säger du till modellen: territoriet jag vill ha är någonstans där det finns sågvågs- basgångar, gated trummor och en glittrande pad någonstans. Du säger inte till den vilken delregion av synthwave — Carpenter-spänd, Drive- soundtrack-ljus, vaporwave-smält — du bor i. För att komma dit måste prompten och stämningen göra arbete som genretaggen inte kan.

Para varje tagg med en mottagg

Ett förvånansvärt pålitligt knep: ge modellen en genretagg och en stämning som inte naturligt hör hemma där. "Synthwave + öm." "Trap + nostalgisk." "Folk + paranoid." Modellen måste förhandla mellan de två, och förhandlingen är där de intressanta genereringarna bor. Två taggar som håller med varandra producerar genomsnittet; två taggar i mild konflikt producerar en tagning.

När man ska släppa taggen helt

Om prompten redan är specifik nog — "en låt som låter som ögonblicket efter att ett brandlarm tystnar i ett tomt kontorshus" — kan genretaggen faktiskt motarbeta dig. Modellen kommer försöka pressa en genre ovanpå en bild som inte behöver någon. I de fallen, låt genre-dropdownen vara och låt prompten bära hela vikten.

Din nästa låt är en gratis prompt bort

Öppna studion, skriv vibben, hör en färdig låt på 30 sekunder. Gratis att börja, royaltyfri att släppa, inget kreditkort krävs.