Et genre-tag er, så vidt modellen er bekymret, en koordinat. Det indsnævrer det territorium, den er villig til at vandre i. Det garanterer ikke, at det resulterende nummer lyder som den specifikke plade, der sidder i dit hoved, og at behandle det som en garanti er den hurtigste vej til at blive skuffet over hver eneste generering, du beder om.
Tags er frø, ikke kontrakter
Når du vælger «synthwave» fra dropdown-menuen, fortæller du modellen: det territorium, jeg vil have, er et sted med save-wave baslinjer, gatede trommer og en shimmer-pad et sted. Du fortæller den ikke hvilken under-region af synthwave — Carpenter-spændt, Drive- soundtrack-lys, vaporwave-smeltet — du bor i. For at komme dertil må prompten og stemningen gøre arbejde, som genre-tagget ikke kan.
Par hvert tag med et mod-tag
Et overraskende pålideligt trick: giv modellen ét genre-tag og én stemning, der ikke naturligt hører til det. «Synthwave + øm.» «Trap + nostalgisk.» «Folk + paranoid.» Modellen er nødt til at forhandle mellem de to, og forhandlingen er, hvor de interessante genereringer bor. To tags, der er enige med hinanden, producerer gennemsnittet; to tags i mild konflikt producerer en fortolkning.
Hvornår man helt skal droppe tagget
Hvis prompten allerede er specifik nok — «en sang, der lyder som øjeblikket efter en brandalarm stopper i en tom kontorbygning» — kan genre-tagget faktisk modarbejde dig. Modellen vil prøve at klistre en genre oven på et billede, der ikke har brug for én. I de tilfælde lader du genre-dropdownen være og lader prompten bære hele vægten.