モデルにとって、ジャンルタグは座標です。彷徨っていい領域を絞り込むだけ。生成されるトラックがあなたの頭の中にある特定のレコードのように聴こえることを保証するわけではなく、それを保証だと扱うことが、生成のたびに失望する一番の近道です。
タグは契約ではなく、種
ドロップダウンから「synthwave」を選ぶとき、あなたはモデルにこう伝えています:欲しい領域は、ノコギリ波のベースライン、ゲートをかけたドラム、どこかにシマーパッドがある場所と。ただし、synthwave のどのサブ領域 — Carpenter のような緊張感、Drive サウンドトラックの明るさ、ヴェイパーウェイヴ風の溶けた質感 — に住んでいるかは伝えていません。そこに辿り着くには、プロンプトとムードがジャンルタグにできない仕事を引き受ける必要があります。
すべてのタグに反対のタグを組み合わせる
驚くほど信頼できるテクニック:モデルに 1 つのジャンルタグと、本来そこに属さない 1 つのムードを与えることです。「Synthwave + tender」。「Trap + nostalgic」。「Folk + paranoid」。モデルは 2 つの間で交渉せざるを得なくなり、その交渉の中にこそ面白い生成が宿ります。互いに同意する 2 つのタグは平均値を生む。穏やかに対立する 2 つのタグは解釈を生む。
タグを完全に外すべきとき
プロンプトがすでに十分具体的なとき — 「無人のオフィスビルで火災報知器が鳴り止んだ直後の瞬間のような曲」 — ジャンルタグはむしろ邪魔をします。モデルは、ジャンルを必要としないイメージの上にジャンルを当てはめようとしてしまう。そういう場合は、ジャンルのドロップダウンには触れず、プロンプトに全重量を担わせましょう。