AISongGen logoAISongGen

风格标签不是风格

当模型说「lo-fi hip-hop」时,它指的不是一个风格——它指的是 prompt 空间里的一片区域。

阅读 5 分钟

对模型来说,一个风格标签其实是一个坐标。它把模型愿意游走的领地缩小了。但它并不能保证生成出来的歌听起来就是你脑子里那张特定的唱片,把它当成保证,是让你对每一次生成都失望的最快方式。

标签是种子,不是合同

当你从下拉菜单里选「synthwave」,你是在告诉模型:我要的领地是某个有锯齿波 bass、闸门式鼓组、还有一层闪烁 pad 的地方。但你没告诉它你住在 synthwave 的哪个分区——Carpenter 那种紧绷感、《Drive》原声那种明亮、还是 vaporwave 那种融化感。要走到那一步,需要靠 prompt 和情绪来做风格标签做不了的工作。

每一个标签都配一个反向标签

一个出乎意料地稳定的小窍门:给模型一个风格标签,再加一个本来不属于它的情绪。「Synthwave + 温柔」「Trap + 怀旧」「Folk + 偏执」。模型必须在两者之间协商,而协商正是有意思的生成所在的地方。两个互相同意的标签生成的是平均值;两个轻微冲突的标签生成的是态度

什么时候彻底不用标签

如果 prompt 本身已经足够具体——「一首歌,听起来像消防警报在一栋空办公楼里停下来之后的那一刻」——风格标签反而可能跟你打架。模型会试图把一种风格强行套在一张本来不需要风格的画面上。这种时候,把风格下拉框留空,让 prompt 独自承担全部分量。

下一首作品,离一段免费提示词只差一步

打开工作室,输入氛围,30 秒后听到成品。免费起步、免版税出片、无需绑卡。