Короткий промпт просит модель угадать всё. Длинный промпт хоронит ту единственную строчку, которая имела значение. Золотая середина — шесть-семь предложений, называющих перспективу, сцену и чувство, — это место, где генерации перестают звучать как фоновая музыка и начинают нести вес.
Сначала закрепите перспективу
До инструментов, до темпа назовите кто поёт и кому. «Молодой родитель в 3 часа ночи разговаривает со спящим младенцем» даёт лирик-генератору позу, в которую можно упасть; «warm acoustic indie» даёт ему текстуру, но не цель. Текстура следует за позой, когда поза уже существует.
Затем поместите сцену
Один образ — кухонная стойка, окно поезда, коридор, парковка отеля — вытягивает обобщённое настроение в конкретное. Объяснять сцену не нужно; просто передайте её. Модель достроит углы способами, которые Вам не пришли бы в голову, и именно эта часть делает результат ощущением найденного, а не заказанного.
Продакшн-заметки оставьте на конец
Жанр, темп и инструментовка относятся к концу промпта, после того как модель уже знает, о чём песня. Если Вы начнёте с «120 BPM, искажённый бас, женский вокал», у лирического слоя не будет того, от чего отталкиваться. Начните со сцены и позы, и продакшн-заметки заточат то, что уже есть, вместо того чтобы заменить его.
Стартовый шаблон
[КТО] на [ГДЕ], думающий о [ЧЁМ]. Припев поворачивается, когда он осознаёт [ПОВОРОТ]. Настроение — [ДВА ПРИЛАГАТЕЛЬНЫХ]. Продакшн: [ЖАНР], [ТЕМП], [ОДНА ДЕТАЛЬ ПРОДАКШНА].
Это не формула, чтобы копировать дословно, — это чек-лист пяти решений, которые должны быть в промпте до того, как модель сможет делать свою работу. Пропустите любое из них — и результат будет ощущаться недоопределённым так, что никаким количеством регенераций это не починить.