Un prompt corto le pide al modelo que adivine todo. Un prompt largo entierra la única línea que importaba. El término medio —seis o siete frases que nombran una perspectiva, una escena y una sensación— es donde las generaciones dejan de sonar a música de fondo y empiezan a sostener peso.
Ancla primero la perspectiva
Antes que los instrumentos, antes que el tempo, nombra quién canta y a quién. «Una madre o padre primerizo a las 3 de la madrugada hablándole a su bebé dormido» le da al generador de letras una postura en la que apoyarse; «indie acústico cálido» le da una textura pero sin objetivo. La textura sigue a la postura una vez que la postura existe.
Después coloca una escena
Una sola imagen —encimera de la cocina, ventanilla del tren, pasillo, parking de hotel— tira de un mood genérico hasta convertirlo en algo concreto. No hace falta explicar la escena; basta con entregarla. El modelo rellenará los rincones de formas que a ti no se te habrían ocurrido, y esa es la parte que hace que el resultado parezca encontrado en lugar de encargado.
Deja las notas de producción para el final
Género, tempo e instrumentación van al final del prompt, después de que el modelo ya sepa de qué va la canción. Si arrancas con «120 BPM, bajo distorsionado, voz femenina», la capa de letra no tiene de dónde crecer. Empieza por la escena y la postura, y las notas de producción afilan lo que ya está ahí en lugar de sustituirlo.
Una plantilla de partida
Un/a [QUIÉN] en [DÓNDE], pensando en [QUÉ]. El estribillo gira cuando se da cuenta de [GIRO]. El mood es [DOS ADJETIVOS]. Producción: [GÉNERO], [TEMPO], [UN DETALLE DE PRODUCCIÓN].
Esto no es una fórmula para copiar al pie de la letra: es una lista de comprobación de las cinco decisiones que tienen que estar en el prompt antes de que el modelo pueda hacer su trabajo. Sáltate cualquiera de ellas y el resultado se sentirá poco definido de una manera que ninguna cantidad de regeneraciones podrá arreglar.