Tag gatunkowy, z punktu widzenia modelu, to współrzędna. Zawęża terytorium, po którym model jest gotów się poruszać. Nie gwarantuje, że powstały utwór będzie brzmiał jak konkretna płyta siedząca Ci w głowie, a traktowanie tego jako gwarancji to najszybsza droga do rozczarowania każdą generacją, o którą prosisz.
Tagi to nasiona, nie kontrakty
Kiedy wybierasz „synthwave" z listy rozwijanej, mówisz modelowi: terytorium, którego chcę, to gdzieś, gdzie są basy z fali piłokształtnej, bramkowane bębny i gdzieś migoczący pad. Nie mówisz mu, w którym podregionie synthwave — Carpenter-napiętym, jasnym jak Drive-soundtrack, vaporwave-roztopionym — żyjesz. Żeby tam dotrzeć, prompt i nastrój muszą wykonać pracę, której tag gatunkowy nie wykona.
Sparuj każdy tag z kontr-tagiem
Zaskakująco niezawodny trik: daj modelowi jeden tag gatunkowy i jeden nastrój, który naturalnie do niego nie należy. „Synthwave + czuły". „Trap + nostalgiczny". „Folk + paranoiczny". Model musi negocjować między tymi dwoma, a w tej negocjacji żyją interesujące generacje. Dwa tagi, które się ze sobą zgadzają, dają średnią; dwa tagi w lekkim konflikcie dają interpretację.
Kiedy całkowicie zrezygnować z tagu
Jeśli prompt jest już wystarczająco konkretny — „utwór, który brzmi jak moment po tym, gdy alarm pożarowy umilknie w pustym biurowcu" — tag gatunkowy może wręcz z Tobą walczyć. Model będzie próbował dopasować gatunek do obrazu, który go nie potrzebuje. W takich przypadkach zostaw rozwijaną listę gatunków w spokoju i pozwól promptowi nieść cały ciężar.