Un prompt corto chiede al modello di indovinare tutto. Un prompt lungo seppellisce l'unico verso che contava. La via di mezzo — sei o sette frasi che nominano una prospettiva, una scena e una sensazione — è dove le generazioni smettono di sembrare musica di sottofondo e iniziano a portare peso.
Ancora prima la prospettiva
Prima degli strumenti, prima del tempo, nomina chi sta cantando e a chi. "Un neo-genitore alle 3 di notte che parla a un bambino che dorme" dà al generatore di testi una postura in cui adagiarsi; "indie acustico caldo" gli dà una texture ma nessuna direzione. La texture segue la postura una volta che la postura esiste.
Poi piazza una scena
Una singola immagine — il piano della cucina, il finestrino del treno, un corridoio, il parcheggio di un hotel — tira un mood generico verso uno specifico. Non devi spiegare la scena; limitati a passargliela. Il modello riempirà gli angoli in modi a cui non avresti pensato, ed è quella la parte che fa sentire il risultato come trovato anziché ordinato.
Tieni le note di produzione per ultime
Genere, tempo e strumentazione vanno alla fine del prompt, dopo che il modello sa già di cosa parla la canzone. Se apri con "120 BPM, basso distorto, voce femminile", il livello del testo non ha da dove crescere. Apri con scena e postura, e le note di produzione affineranno ciò che è già lì invece di sostituirlo.
Un template di partenza
Un/Una [CHI] su [DOVE], pensa a [COSA]. Il ritornello cambia quando si rende conto di [SVOLTA]. Il mood è [DUE AGGETTIVI]. Produzione: [GENERE], [TEMPO], [UN DETTAGLIO DI PRODUZIONE].
Non è una formula da copiare alla lettera — è una checklist per le cinque decisioni che devono essere nel prompt prima che il modello possa fare il suo lavoro. Saltane una sola e il risultato sembrerà sotto-determinato in un modo che nessuna quantità di rigenerazioni può risolvere.