Den första tagningen är modellens bästa gissning. Den andra tagningen är din.
När du trycker på regenerera ber du inte längre om "en låt om nattliga bilfärder." Du ber om "en låt om nattliga bilfärder, men långsammare än den förra, med en refräng som inte landar på nedslaget." Även om du inte ändrar något i prompten har ditt öra redan gjort redigeringen — och nästa generering ärver den redigeringen genom de små justeringar du gör av genre, tempo, stämning eller låttext-utkastet.
Den första tagningens bias
Modeller tycker om att ge dig genomsnittet av vad din prompt tillåter. Om din prompt tillåter tio tempon får du medianen. Om den tillåter tre stämningar får du den mest förutsägbara. Den första tagningen är sällan fel, men den är också sällan överraskande, för överraskningen sitter vid prompt-kanterna och modellen är tränad att gå mot mitten.
Använd tagning ett som en fråga
Behandla den första genereringen som en fråga, inte ett svar. Frågan är: "Är det här dit jag ville att låten skulle hamna?" Nästan alltid är svaret "nära, men —" och men:et är den mest användbara informationen i hela sessionen. Ändra en parameter som adresserar men:et, och regenerera.
Stanna vid tre
Tre tagningar är vanligtvis nog. Vid tagning fyra finslipar du inte längre låten; du chansar på att modellen ska räcka över något bättre än det du redan har. Det kommer den inte, för prompten har inte ändrats. Om tagning tre inte är där du vill ha den behöver prompten kirurgi, inte ett till tärningskast.