Với mô hình, một genre tag chỉ là một tọa độ. Nó thu hẹp lại vùng lãnh thổ mà mô hình sẵn sàng dạo bước. Nó không đảm bảo rằng bản nhạc kết quả sẽ nghe giống đúng đĩa nhạc đang nằm trong đầu bạn, và coi nó như một lời đảm bảo là cách nhanh nhất để bạn thất vọng với mọi lần generate.
Tag là hạt giống, không phải hợp đồng
Khi bạn chọn "synthwave" từ dropdown, bạn đang nói với mô hình: vùng đất tôi muốn ở đâu đó có saw-wave bassline, gated drum, và có một shimmer pad đâu đó. Bạn không nói cho nó biết bạn đang sống ở tiểu vùng nào của synthwave — căng thẳng kiểu Carpenter, rực rỡ kiểu nhạc phim Drive, hay tan chảy kiểu vaporwave. Để đến được đó, prompt và tâm trạng phải làm phần việc mà genre tag không thể làm.
Ghép mỗi tag với một counter-tag
Một mẹo đáng tin một cách đáng ngạc nhiên: cho mô hình một genre tag và một mood vốn không tự nhiên thuộc về nó. "Synthwave + dịu dàng." "Trap + hoài niệm." "Folk + hoang tưởng." Mô hình phải thương lượng giữa hai bên, và chính sự thương lượng đó là nơi những bản generate thú vị xuất hiện. Hai tag đồng tình với nhau cho ra giá trị trung bình; hai tag mâu thuẫn nhẹ với nhau cho ra một góc nhìn.
Khi nào nên bỏ luôn tag
Nếu prompt đã đủ cụ thể — "một bài hát nghe giống khoảnh khắc sau khi chuông báo cháy ngừng kêu trong một tòa văn phòng trống" — genre tag thực ra có thể chống lại bạn. Mô hình sẽ cố nhét một thể loại lên trên một hình ảnh không cần đến nó. Trong những trường hợp ấy, hãy để dropdown thể loại yên và để cho prompt gánh toàn bộ trọng lượng.