Hvorfor det andet take næsten altid er bedre

Det første take er modellens bedste gæt. Det andet take er dit.

Når du trykker på regenerér, beder du ikke længere om «en sang om sene aftenkørsler.» Du beder om «en sang om sene aftenkørsler, men langsommere end den sidste, med et omkvæd, der ikke lander på downbeatet.» Selv hvis du ikke ændrer noget i prompten, har dit øre allerede gjort redigeringen — og næste generering arver den redigering gennem de små justeringer, du laver til genre, tempo, stemning eller tekst-udkastet.

Det første takes bias

Modeller kan godt lide at give dig gennemsnittet af, hvad din prompt tillader. Hvis din prompt tillader ti tempi, får du medianen. Hvis den tillader tre stemninger, får du den mest forudsigelige. Det første take er sjældent forkert, men det er også sjældent overraskende, fordi overraskelsen sidder i kanten af prompten, og modellen er oplært i at sigte mod midten.

Brug take ét som et spørgsmål

Behandl den første generering som et spørgsmål, ikke et svar. Spørgsmålet er: «Er det her, hvor jeg ville have, sangen skulle være?» Næsten altid er svaret «tæt på, men —» og men'et er det mest brugbare stykke information i hele sessionen. Rediger én parameter, der adresserer men'et, og regenerér.

Stop ved tre

Tre takes er som regel nok. Ved take fire forfiner du ikke længere sangen; du gambler om, at modellen vil give dig noget bedre, end det du allerede har. Det vil den ikke, fordi prompten ikke har ændret sig. Hvis take tre ikke er der, hvor du vil have det, har prompten brug for kirurgi, ikke endnu et terningekast.

Hvorfor det andet take næsten altid er bedre

Det første takes bias

Brug take ét som et spørgsmål

Stop ved tre

Læs videre

Sådan laver du AI-musik, der ikke lyder som AI-musik

Sådan laver du AI-covers, der ikke bare lyder som en remix

Sådan bruger du tekst-til-tale, så det holder op med at lyde som en robot, der læser lektier op

Dit næste nummer er én gratis prompt væk