Uma tag de gênero, no que diz respeito ao modelo, é uma coordenada. Ela estreita o território em que ele está disposto a vagar. Ela não garante que a faixa resultante vá soar como o disco específico que está na sua cabeça, e tratar isso como garantia é o jeito mais rápido de se decepcionar com toda geração que você pedir.
Tags são sementes, não contratos
Quando você escolhe "synthwave" no dropdown, está dizendo para o modelo: o território que eu quero é algum lugar que tenha linhas de baixo em saw-wave, baterias com gate e um pad shimmer em algum canto. Você não está dizendo em qual sub-região do synthwave — tensa estilo Carpenter, brilhante estilo trilha de Drive, derretida estilo vaporwave — você mora. Para chegar lá, o prompt e o clima têm que fazer o trabalho que a tag de gênero não consegue.
Pareie cada tag com uma contra-tag
Um truque surpreendentemente confiável: dê ao modelo uma tag de gênero e um clima que naturalmente não pertence a ele. "Synthwave + delicado." "Trap + nostálgico." "Folk + paranoico." O modelo precisa negociar entre os dois, e a negociação é onde moram as gerações interessantes. Duas tags que concordam entre si produzem a média; duas tags em leve conflito produzem um take.
Quando largar a tag de vez
Se o prompt já é específico o suficiente — "uma música que soa como o momento depois que um alarme de incêndio para num prédio de escritórios vazio" — a tag de gênero pode até brigar com você. O modelo vai tentar encaixar um gênero em cima de uma imagem que não precisa de um. Nesses casos, deixe o dropdown de gênero em paz e deixe o prompt carregar todo o peso.