Varför den andra tagningen nästan alltid är bättre

Den första tagningen är modellens bästa gissning. Den andra tagningen är din.

När du trycker på regenerera ber du inte längre om "en låt om nattliga bilfärder." Du ber om "en låt om nattliga bilfärder, men långsammare än den förra, med en refräng som inte landar på nedslaget." Även om du inte ändrar något i prompten har ditt öra redan gjort redigeringen — och nästa generering ärver den redigeringen genom de små justeringar du gör av genre, tempo, stämning eller låttext-utkastet.

Den första tagningens bias

Modeller tycker om att ge dig genomsnittet av vad din prompt tillåter. Om din prompt tillåter tio tempon får du medianen. Om den tillåter tre stämningar får du den mest förutsägbara. Den första tagningen är sällan fel, men den är också sällan överraskande, för överraskningen sitter vid prompt-kanterna och modellen är tränad att gå mot mitten.

Använd tagning ett som en fråga

Behandla den första genereringen som en fråga, inte ett svar. Frågan är: "Är det här dit jag ville att låten skulle hamna?" Nästan alltid är svaret "nära, men —" och men:et är den mest användbara informationen i hela sessionen. Ändra en parameter som adresserar men:et, och regenerera.

Stanna vid tre

Tre tagningar är vanligtvis nog. Vid tagning fyra finslipar du inte längre låten; du chansar på att modellen ska räcka över något bättre än det du redan har. Det kommer den inte, för prompten har inte ändrats. Om tagning tre inte är där du vill ha den behöver prompten kirurgi, inte ett till tärningskast.

Varför den andra tagningen nästan alltid är bättre

Den första tagningens bias

Använd tagning ett som en fråga

Stanna vid tre

Fortsätt läsa

Så skapar du AI-musik som inte låter som AI-musik

Så skapar du AI-coversånger som inte bara låter som en remix

Så använder du text-till-tal så att det slutar låta som en robot som läser läxor

Din nästa låt är en gratis prompt bort