La première prise est la meilleure supposition du modèle. La deuxième est la vôtre.
Quand vous appuyez sur régénérer, vous ne demandez plus « une chanson sur les trajets de fin de soirée ». Vous demandez « une chanson sur les trajets de fin de soirée, mais plus lente que la précédente, avec un refrain qui ne tombe pas sur le temps fort ». Même si vous ne changez rien dans le prompt, votre oreille a déjà fait le montage — et la génération suivante hérite de ce montage à travers les petits ajustements que vous apportez au genre, au tempo, à l'ambiance ou au brouillon des paroles.
Le biais de la première prise
Les modèles aiment vous donner la moyenne de ce que votre prompt autorise. Si votre prompt autorise dix tempos, vous obtiendrez la médiane. S'il autorise trois ambiances, vous obtiendrez la plus prévisible. La première prise est rarement mauvaise, mais elle est rarement surprenante non plus, parce que la surprise se loge en bordure du prompt et que le modèle est entraîné à viser le centre.
Utilisez la prise un comme une question
Traitez la première génération comme une question, pas une réponse. La question est : « Est-ce que c'est là que je voulais que la chanson soit ? » Presque toujours, la réponse est « presque, mais — » et le mais est l'information la plus utile de toute la session. Modifiez un seul paramètre qui adresse ce mais, et régénérez.
Arrêtez-vous à trois
Trois prises suffisent généralement. À la quatrième, vous n'affinez plus la chanson ; vous pariez que le modèle va vous tendre quelque chose de mieux que ce que vous avez déjà. Il ne le fera pas, parce que le prompt n'a pas changé. Si la troisième prise n'est pas là où vous la voulez, c'est le prompt qui a besoin d'une opération, pas un nouveau coup de dés.