AISongGen logoAISongGen

Vì sao bản thu thứ hai gần như luôn tốt hơn

Bản generate đầu tiên lấy mẫu từ giá trị trung bình của prompt. Bản thứ hai lấy mẫu từ phản ứng của bạn với bản đầu.

Đọc 4 phút

Bản đầu là phỏng đoán tốt nhất của mô hình. Bản thứ hai là của bạn.

Khi bạn bấm regenerate, bạn không còn yêu cầu "một bài hát về những chuyến lái xe đêm khuya" nữa. Bạn đang yêu cầu "một bài hát về những chuyến lái xe đêm khuya, nhưng chậm hơn lần trước, với một điệp khúc không đáp xuống ngay phách mạnh". Ngay cả khi bạn không thay đổi gì trong prompt, tai bạn đã làm việc biên tập rồi — và bản generate kế tiếp thừa hưởng việc biên tập đó qua những điều chỉnh nhỏ bạn đặt cho thể loại, tempo, mood, hoặc bản nháp lời.

Thiên kiến của bản đầu tiên

Mô hình thích đưa cho bạn giá trị trung bình của những gì prompt cho phép. Nếu prompt cho phép mười tempo, bạn sẽ nhận được trung vị. Nếu nó cho phép ba mood, bạn sẽ nhận được mood dễ đoán nhất. Bản đầu hiếm khi sai, nhưng cũng hiếm khi gây bất ngờ, bởi bất ngờ nằm ở rìa của prompt còn mô hình thì được huấn luyện để tiến về giữa.

Hãy coi bản một như một câu hỏi

Hãy đối xử với bản generate đầu tiên như một câu hỏi, không phải một câu trả lời. Câu hỏi là: "Đây có phải là nơi tôi muốn bài hát đến không?" Hầu như câu trả lời luôn là "gần đúng, nhưng —" và cái nhưng đó là mẩu thông tin hữu ích nhất trong cả phiên làm việc. Hãy chỉnh một tham số nhằm vào cái nhưng đó, rồi regenerate.

Dừng ở bản thứ ba

Ba bản thu thường là đủ. Đến bản thứ tư bạn không còn tinh chỉnh bài hát nữa; bạn đang đánh bạc rằng mô hình sẽ trao cho bạn thứ tốt hơn cái bạn đã có. Nó sẽ không, vì prompt chưa thay đổi. Nếu bản thứ ba chưa đến đúng nơi bạn muốn, prompt cần phải mổ xẻ, không phải lăn xúc xắc thêm một lần nữa.

Bản nhạc tiếp theo của bạn chỉ cách một câu lệnh miễn phí

Hãy mở phòng thu, gõ vibe, nghe một bài hát hoàn chỉnh trong 30 giây. Miễn phí khởi đầu, miễn phí bản quyền để phát hành, không cần thẻ tín dụng.