첫 번째 테이크는 모델의 최선의 추측입니다. 두 번째 테이크는 사용자의 것입니다.
재생성 버튼을 누르는 순간, 사용자는 더 이상 「심야 드라이브에 대한 곡」 을 요청하고 있지 않습니다. 「심야 드라이브에 대한 곡, 단 지난번보다 느리게, 그리고 코러스가 다운비트에 떨어지지 않게」 를 요청하고 있는 것입니다. 프롬프트에서 아무것도 바꾸지 않더라도, 사용자의 귀가 이미 편집을 마친 상태이며 — 다음 생성은 장르, 템포, 무드, 가사 초안에 대한 작은 조정들을 통해 그 편집을 상속받습니다.
첫 번째 테이크의 편향
모델은 사용자의 프롬프트가 허용하는 범위의 평균을 내놓는 것을 좋아합니다. 프롬프트가 10 개의 템포를 허용한다면 중앙값을 받게 됩니다. 3 개의 무드를 허용한다면 가장 예측 가능한 것을 받게 됩니다. 첫 번째 테이크가 틀린 경우는 드물지만, 놀라운 경우도 마찬가지로 드뭅니다. 놀라움은 프롬프트의 가장자리에 자리 잡고 있는데, 모델은 가운데로 향하도록 학습되어 있기 때문입니다.
테이크 1 을 질문으로 사용하기
첫 번째 생성을 답이 아니라 질문으로 다루시기 바랍니다. 그 질문은 이렇습니다. 「이게 내가 원했던 곡의 위치인가?」 거의 언제나 그 답은 「가깝긴 한데 — 」 이며, 그 한데 가 세션 전체에서 가장 쓸모 있는 정보입니다. 한데 를 다루는 파라미터 하나를 편집하고 다시 생성하시기 바랍니다.
셋에서 멈추기
보통 세 번의 테이크면 충분합니다. 네 번째 테이크에 이르면 사용자는 더 이상 곡을 다듬고 있는 것이 아니라, 모델이 이미 가지고 있는 것보다 더 나은 무언가를 건네 주리라는 데 도박을 걸고 있는 것입니다. 그렇게 되지는 않습니다. 프롬프트가 바뀌지 않았기 때문입니다. 테이크 3 이 원하는 곳에 와 있지 않다면, 필요한 것은 또 한 번의 주사위 굴림이 아니라 프롬프트에 대한 수술입니다.