AISongGen logoAISongGen

Hvorfor det andet take næsten altid er bedre

Den første generering sampler gennemsnittet af din prompt. Den anden generering sampler din reaktion på den første.

4 min læsetid

Det første take er modellens bedste gæt. Det andet take er dit.

Når du trykker på regenerér, beder du ikke længere om «en sang om sene aftenkørsler.» Du beder om «en sang om sene aftenkørsler, men langsommere end den sidste, med et omkvæd, der ikke lander på downbeatet.» Selv hvis du ikke ændrer noget i prompten, har dit øre allerede gjort redigeringen — og næste generering arver den redigering gennem de små justeringer, du laver til genre, tempo, stemning eller tekst-udkastet.

Det første takes bias

Modeller kan godt lide at give dig gennemsnittet af, hvad din prompt tillader. Hvis din prompt tillader ti tempi, får du medianen. Hvis den tillader tre stemninger, får du den mest forudsigelige. Det første take er sjældent forkert, men det er også sjældent overraskende, fordi overraskelsen sidder i kanten af prompten, og modellen er oplært i at sigte mod midten.

Brug take ét som et spørgsmål

Behandl den første generering som et spørgsmål, ikke et svar. Spørgsmålet er: «Er det her, hvor jeg ville have, sangen skulle være?» Næsten altid er svaret «tæt på, men —» og men'et er det mest brugbare stykke information i hele sessionen. Rediger én parameter, der adresserer men'et, og regenerér.

Stop ved tre

Tre takes er som regel nok. Ved take fire forfiner du ikke længere sangen; du gambler om, at modellen vil give dig noget bedre, end det du allerede har. Det vil den ikke, fordi prompten ikke har ændret sig. Hvis take tre ikke er der, hvor du vil have det, har prompten brug for kirurgi, ikke endnu et terningekast.

Dit næste nummer er én gratis prompt væk

Åbn studiet, skriv stemningen, hør en færdig sang på 30 sekunder. Gratis at starte, royaltyfri at sende ud, intet kreditkort påkrævet.