De eerste take is de beste gok van het model. De tweede take is die van jou.
Wanneer je op regenereren drukt, vraag je niet langer om "een nummer over late-avondritten." Je vraagt om "een nummer over late-avond- ritten, maar langzamer dan de vorige, met een refrein dat niet landt op de eerste tel." Zelfs als je niets aan de prompt verandert, heeft je oor het bewerken al gedaan — en de volgende generatie erft die bewerking via de kleine aanpassingen die je maakt aan genre, tempo, sfeer of de songtekstconcept.
De bias van de eerste take
Modellen geven je graag het gemiddelde van wat je prompt toestaat. Als je prompt tien tempo's toestaat, krijg je de mediaan. Als het drie sferen toestaat, krijg je de meest voorspelbare. De eerste take is zelden fout, maar ook zelden verrassend, want verrassing zit aan de randen van de prompt en het model is getraind om naar het midden te gaan.
Gebruik take één als een vraag
Behandel de eerste generatie als een vraag, niet een antwoord. De vraag is: "Is dit waar ik wilde dat het nummer zou zijn?" Bijna altijd is het antwoord "dichtbij, maar —" en de maar is het nuttigste stukje informatie van de hele sessie. Bewerk één parameter die de maar aanpakt, en regenereer.
Stop bij drie
Drie takes is meestal genoeg. Bij take vier ben je niet langer het nummer aan het verfijnen; je gokt erop dat het model je iets beters zal geven dan wat je al hebt. Dat zal het niet, want de prompt is niet veranderd. Als take drie niet is waar je het wilt hebben, moet de prompt onder het mes, niet nog een worp van de dobbelsteen.