왜 두 번째 테이크가 거의 항상 더 나은가

첫 번째 테이크는 모델의 최선의 추측입니다. 두 번째 테이크는 사용자의 것입니다.

재생성 버튼을 누르는 순간, 사용자는 더 이상 「심야 드라이브에 대한 곡」 을 요청하고 있지 않습니다. 「심야 드라이브에 대한 곡, 단 지난번보다 느리게, 그리고 코러스가 다운비트에 떨어지지 않게」 를 요청하고 있는 것입니다. 프롬프트에서 아무것도 바꾸지 않더라도, 사용자의 귀가 이미 편집을 마친 상태이며 — 다음 생성은 장르, 템포, 무드, 가사 초안에 대한 작은 조정들을 통해 그 편집을 상속받습니다.

첫 번째 테이크의 편향

모델은 사용자의 프롬프트가 허용하는 범위의 평균을 내놓는 것을 좋아합니다. 프롬프트가 10 개의 템포를 허용한다면 중앙값을 받게 됩니다. 3 개의 무드를 허용한다면 가장 예측 가능한 것을 받게 됩니다. 첫 번째 테이크가 틀린 경우는 드물지만, 놀라운 경우도 마찬가지로 드뭅니다. 놀라움은 프롬프트의 가장자리에 자리 잡고 있는데, 모델은 가운데로 향하도록 학습되어 있기 때문입니다.

테이크 1 을 질문으로 사용하기

첫 번째 생성을 답이 아니라 질문으로 다루시기 바랍니다. 그 질문은 이렇습니다. 「이게 내가 원했던 곡의 위치인가?」 거의 언제나 그 답은 「가깝긴 한데 — 」 이며, 그 한데 가 세션 전체에서 가장 쓸모 있는 정보입니다. 한데 를 다루는 파라미터 하나를 편집하고 다시 생성하시기 바랍니다.

셋에서 멈추기

보통 세 번의 테이크면 충분합니다. 네 번째 테이크에 이르면 사용자는 더 이상 곡을 다듬고 있는 것이 아니라, 모델이 이미 가지고 있는 것보다 더 나은 무언가를 건네 주리라는 데 도박을 걸고 있는 것입니다. 그렇게 되지는 않습니다. 프롬프트가 바뀌지 않았기 때문입니다. 테이크 3 이 원하는 곳에 와 있지 않다면, 필요한 것은 또 한 번의 주사위 굴림이 아니라 프롬프트에 대한 수술입니다.

왜 두 번째 테이크가 거의 항상 더 나은가

첫 번째 테이크의 편향

테이크 1 을 질문으로 사용하기

셋에서 멈추기

이어서 읽기

AI 음악처럼 들리지 않는 AI 음악 만드는 방법

리믹스처럼 들리지 않는 AI 커버송 만드는 법

텍스트 음성 변환이 로봇이 숙제를 읽는 것처럼 들리지 않게 하는 방법

다음 트랙은 무료 프롬프트 한 번 거리에 있습니다