Žánrový tag je pro model souřadnicí. Zužuje území, po kterém je model ochoten putovat. Nezaručuje, že výsledná skladba bude znít jako konkrétní nahrávka, kterou máte v hlavě, a brát to jako záruku je nejrychlejší způsob, jak se zklamat z každé generace, o kterou požádáte.
Tagy jsou semínka, ne smlouvy
Když si vyberete „synthwave“ z dropdownu, říkáte modelu: území, které chci, je někde, kde jsou saw-wave basové linky, gated bubny a někde shimmer pad. Neříkáte mu, ve které podoblasti synthwave žijete — Carpenterovsky napjaté, Drive-soundtrackově jasné, vaporwavově roztavené. Aby se tam dostal, prompt a nálada musí udělat práci, kterou žánrový tag nemůže.
Spárujte každý tag s protitagem
Překvapivě spolehlivý trik: dejte modelu jeden žánrový tag a jednu náladu, která k němu přirozeně nepatří. „Synthwave + něžné.“ „Trap + nostalgické.“ „Folk + paranoidní.“ Model musí mezi nimi vyjednávat a v tom vyjednávání žijí ty zajímavé generace. Dva tagy, které spolu souhlasí, produkují průměr; dva tagy v mírném konfliktu produkují pohled.
Kdy tag úplně vypustit
Pokud je prompt už dost konkrétní — „píseň, která zní jako moment poté, co v prázdné kancelářské budově přestane houkat požární alarm“ — žánrový tag s vámi může bojovat. Model se pokusí nasadit žánr na obraz, který ho nepotřebuje. V takových případech nechte žánrový dropdown na pokoji a nechte prompt, ať nese celou váhu.