Az első felvétel a modell legjobb tippje. A második felvétel a tiéd.
Amikor megnyomod a regenerálást, már nem „egy dalt késő esti autózásokról" kérsz. „Egy dalt késő esti autózásokról kérsz, de lassabban, mint az előzőt, olyan refrénnel, ami nem az ütem első ütésén landol". Még ha semmit nem változtatsz a prompton, a füled már elvégezte a szerkesztést — és a következő generáció örökli ezt a szerkesztést azokon az apró kiigazításokon keresztül, amelyeket a műfajon, tempón, hangulaton vagy a dalszöveg-piszkozaton végzel.
Az első felvétel torzítása
A modellek szeretik az átlagát adni annak, amit a promptod megenged. Ha a promptod tíz tempót enged meg, a mediánt fogod kapni. Ha három hangulatot enged meg, a legkiszámíthatóbbat fogod kapni. Az első felvétel ritkán rossz, de ritkán is meglepő, mert a meglepetés a prompt szélein ül, és a modell arra van betanítva, hogy a közepe felé tartson.
Használd az első felvételt kérdésként
Kezeld az első generációt kérdésként, ne válaszként. A kérdés ez: „Itt akartam, hogy a dal legyen?" Szinte mindig a válasz az, hogy „közel, de —", és a de a leghasznosabb információ az egész munkamenetben. Szerkessz egy paramétert, ami megcímzi a de-t, és regenerálj.
Háromnál állj meg
Három felvétel általában elég. A negyedik felvételre már nem a dalt finomítod; arra fogadsz, hogy a modell jobbat ad neked, mint amid már van. Nem fog, mert a prompt nem változott. Ha a harmadik felvétel nem oda landol, ahova szeretnéd, a promptnak műtétre van szüksége, nem újabb kockadobásra.