AISongGen logoAISongGen

為什麼第二次產生通常比第一次好

第一次產生抽樣的是你提示詞的平均值。第二次產生抽樣的是你對第一次的反應。

閱讀 4 分鐘

第一次是模型的最佳猜測。第二次是你的。

當你按下 regenerate,你已經不再是在要「一首關於 夜間開車的歌」。你是在要「一首關於夜間開車的歌, 但比上一次再慢一點,副歌不要落在強拍上」。即使 你提示詞一個字都沒改,你的耳朵其實已經做完了 編輯——而下一次產生會透過你在曲風、節奏、氛圍 或歌詞草稿上的小調整,繼承那次編輯。

第一次產生的偏差

模型喜歡給你的是你提示詞所允許範圍的平均值。 如果你的提示詞允許十種速度,你會拿到中位數。 如果允許三種氛圍,你會拿到最容易預測的那一個。 第一次產生很少出錯,但也很少令人驚喜,因為驚喜 住在提示詞的邊緣,模型卻被訓練成往中間走。

把第一次當作問題,不是答案

把第一次產生當作一個問句而不是一個答案。問題是: 「這就是我想讓這首歌待的位置嗎?」幾乎所有時候 答案都是「接近,但是——」而那個但是,是整段 工作流程裡最有用的一條資訊。修改一個對應到那個 但是的參數,再 regenerate。

停在第三次

三次通常就夠了。到第四次以後,你已經不是在打磨 這首歌,你是在賭模型會給你比現有版本更好的東西。 它不會,因為提示詞並沒有改。如果第三次還沒到 你要的位置,需要動的是提示詞本身,而不是再丟一次 骰子。

你的下一首歌,只差一個免費 prompt

打開工作室、輸入氛圍,30 秒後聽見一首完整的歌。免費開始、免授權上架,不需信用卡。