风格标签不是风格

对模型来说，一个风格标签其实是一个坐标。它把模型愿意游走的领地缩小了。但它并不能保证生成出来的歌听起来就是你脑子里那张特定的唱片，把它当成保证，是让你对每一次生成都失望的最快方式。

标签是种子，不是合同

当你从下拉菜单里选「synthwave」，你是在告诉模型：我要的领地是某个有锯齿波 bass、闸门式鼓组、还有一层闪烁 pad 的地方。但你没告诉它你住在 synthwave 的哪个分区——Carpenter 那种紧绷感、《Drive》原声那种明亮、还是 vaporwave 那种融化感。要走到那一步，需要靠 prompt 和情绪来做风格标签做不了的工作。

每一个标签都配一个反向标签

一个出乎意料地稳定的小窍门：给模型一个风格标签，再加一个本来不属于它的情绪。「Synthwave + 温柔」「Trap + 怀旧」「Folk + 偏执」。模型必须在两者之间协商，而协商正是有意思的生成所在的地方。两个互相同意的标签生成的是平均值；两个轻微冲突的标签生成的是态度。

什么时候彻底不用标签

如果 prompt 本身已经足够具体——「一首歌，听起来像消防警报在一栋空办公楼里停下来之后的那一刻」——风格标签反而可能跟你打架。模型会试图把一种风格强行套在一张本来不需要风格的画面上。这种时候，把风格下拉框留空，让 prompt 独自承担全部分量。

风格标签不是风格

标签是种子，不是合同

每一个标签都配一个反向标签

什么时候彻底不用标签

继续阅读

如何让 AI 音乐听起来不像 AI 音乐

如何制作不只是听起来像混音的 AI 翻唱歌曲

如何使用文字转语音，让它不再听起来像机器人在念作业

下一首作品，离一段免费提示词只差一步