Krótki prompt każe modelowi zgadywać wszystko. Długi prompt zakopuje jedyną linijkę, która miała znaczenie. Złoty środek — sześć lub siedem zdań, które nazywają perspektywę, scenę i uczucie — to miejsce, w którym generacje przestają brzmieć jak muzyka tła i zaczynają nieść ciężar.
Najpierw zakotwicz perspektywę
Przed instrumentami, przed tempem, nazwij kto śpiewa i do kogo. „Świeżo upieczony rodzic o 3 nad ranem, mówiący do śpiącego dziecka" daje generatorowi tekstu postawę, w którą może wejść; „ciepłe akustyczne indie" daje mu teksturę, ale żadnego celu. Tekstura idzie za postawą, kiedy postawa już istnieje.
Następnie umieść scenę
Pojedynczy obraz — blat kuchenny, okno pociągu, korytarz, parking hotelowy — wciąga generyczny nastrój w konkretny. Nie musisz wyjaśniać sceny; po prostu ją podaj. Model zapełni rogi w sposób, o którym byś nie pomyślał, i to właśnie ta część sprawia, że rezultat wydaje się znaleziony, a nie zamówiony.
Notatki produkcyjne zostaw na koniec
Gatunek, tempo i instrumentacja należą na koniec promptu, po tym, jak model już wie, o czym jest utwór. Jeśli zaczniesz od „120 BPM, przesterowany bas, wokal kobiecy", warstwa tekstu nie ma z czego rosnąć. Zacznij od sceny i postawy, a notatki produkcyjne wyostrzą to, co już tam jest, zamiast to zastępować.
Szablon wyjściowy
[KTO] na [GDZIE], myśli o [O CZYM]. Refren skręca, kiedy uświadamia sobie [ZWROT]. Nastrój to [DWA PRZYMIOTNIKI]. Produkcja: [GATUNEK], [TEMPO], [JEDEN SZCZEGÓŁ PRODUKCYJNY].
To nie jest formuła do skopiowania słowo w słowo — to lista kontrolna pięciu decyzji, które muszą się znaleźć w prompcie, zanim model będzie mógł wykonać swoją pracę. Pomiń którąkolwiek z nich, a rezultat będzie czuć się niedookreślony w sposób, którego żadna ilość regeneracji nie naprawi.