AISongGen logoAISongGen

なぜ 2 回目のテイクのほうがほぼ常に良いのか

1 回目の生成はプロンプトの平均をサンプリングする。2 回目の生成は、1 回目に対するあなたの反応をサンプリングする。

4 分で読めます

1 回目のテイクはモデルの最善の推測。2 回目のテイクはあなたのテイクです。

再生成ボタンを押すとき、あなたはもう「深夜のドライブについての曲」を求めているのではありません。「深夜のドライブについての曲、ただし前回より遅く、コーラスがダウンビートに着地しないもの」を求めている。プロンプトを何も変えなくても、あなたの耳はすでに編集を済ませている — そして次の生成は、あなたがジャンル、テンポ、ムード、リリック草案に加える小さな調整を通じて、その編集を引き継ぎます。

1 回目のテイクのバイアス

モデルは、プロンプトが許容する範囲の平均を返したがります。プロンプトが 10 種類のテンポを許容するなら、中央値が返ってくる。3 種類のムードを許容するなら、最も予測しやすいものが返ってくる。1 回目のテイクが間違っていることは滅多にありませんが、驚きを伴うことも滅多にありません。なぜなら驚きはプロンプトの端に座っていて、モデルは中央へ向かうように訓練されているからです。

1 回目のテイクを問いとして使う

1 回目の生成を答えではなく問いとして扱ってください。問いはこうです:「これは曲があるべき場所か?」 ほぼ必ず答えは「近い、でも —」となり、そのでもこそが、セッション全体で最も有用な情報です。でもに対応するパラメータを 1 つ編集して、再生成しましょう。

3 回で止める

3 回のテイクで、たいていは十分です。4 回目になると、もう曲を磨いているのではなく、すでに手元にあるものより良いものをモデルが渡してくれることに賭けるギャンブルになります。プロンプトが変わっていないので、それは起こりません。3 回目のテイクが望む場所にないなら、必要なのはもう一度サイコロを振ることではなく、プロンプトの手術です。

次のトラックは、無料プロンプト 1 つの距離

スタジオを開き、ムードを言葉にして、30 秒で完成形を聴いてみてください。始めるのは無料、リリースもロイヤリティフリー、クレジットカード不要。