AISongGen logoAISongGen

Varför den andra tagningen nästan alltid är bättre

Den första genereringen samplar genomsnittet av din prompt. Den andra genereringen samplar din reaktion på den första.

4 min läsning

Den första tagningen är modellens bästa gissning. Den andra tagningen är din.

När du trycker på regenerera ber du inte längre om "en låt om nattliga bilfärder." Du ber om "en låt om nattliga bilfärder, men långsammare än den förra, med en refräng som inte landar på nedslaget." Även om du inte ändrar något i prompten har ditt öra redan gjort redigeringen — och nästa generering ärver den redigeringen genom de små justeringar du gör av genre, tempo, stämning eller låttext-utkastet.

Den första tagningens bias

Modeller tycker om att ge dig genomsnittet av vad din prompt tillåter. Om din prompt tillåter tio tempon får du medianen. Om den tillåter tre stämningar får du den mest förutsägbara. Den första tagningen är sällan fel, men den är också sällan överraskande, för överraskningen sitter vid prompt-kanterna och modellen är tränad att gå mot mitten.

Använd tagning ett som en fråga

Behandla den första genereringen som en fråga, inte ett svar. Frågan är: "Är det här dit jag ville att låten skulle hamna?" Nästan alltid är svaret "nära, men —" och men:et är den mest användbara informationen i hela sessionen. Ändra en parameter som adresserar men:et, och regenerera.

Stanna vid tre

Tre tagningar är vanligtvis nog. Vid tagning fyra finslipar du inte längre låten; du chansar på att modellen ska räcka över något bättre än det du redan har. Det kommer den inte, för prompten har inte ändrats. Om tagning tre inte är där du vill ha den behöver prompten kirurgi, inte ett till tärningskast.

Din nästa låt är en gratis prompt bort

Öppna studion, skriv vibben, hör en färdig låt på 30 sekunder. Gratis att börja, royaltyfri att släppa, inget kreditkort krävs.