AISongGen logoAISongGen

Cách làm bài hát bìa AI không chỉ nghe như bản remix

Chọn đúng tham chiếu, đúng tóm tắt phong cách, và đúng nơi để dừng lại. Hướng dẫn thực tế để làm bản bìa có giá trị.

Đọc 8 phút

Một bản bìa có tác dụng là một cách diễn giải nghệ thuật riêng biệt về bài hát của người khác — góc độ khác, nhấn mạnh cảm xúc khác, có thể là một thể loại hoàn toàn khác. Khi nó hạ cánh, bạn nghe xương của bản gốc và thứ gì đó mới cùng một lúc. Một bản bìa không có tác dụng chỉ là cùng một bài hát với mix mờ hơn và giọng nghe hơi lạ. Sự khác biệt giữa hai loại hầu như không bao giờ là công cụ bạn sử dụng. Đó là những lựa chọn bạn đã thực hiện trước khi nhấn kết xuất.

Các trình tạo bìa AI đã làm cho việc lấy một bản nhạc và tái cấu trúc nó với giọng, phong cách, hoặc dàn dựng khác trở nên thực sự dễ dàng. Nhưng tiếp cận dễ dàng hơn với quá trình không tự động cải thiện đầu ra. Bạn vẫn cần biết bài hát nào đáng bìa, cách viết tóm tắt phong cách cung cấp cho mô hình thứ gì đó thực để làm việc, và khi nào dừng lại và gọi nó là xong. Hướng dẫn này đi qua tất cả điều đó, từng bước.

Trước khi bắt đầu: câu hỏi cấp phép

Đây là phần mà hầu hết các hướng dẫn bỏ qua, vì vậy hãy xử lý nó trước. Nếu bạn đang bìa một bài hát bạn không sở hữu, bài hát đó gần như chắc chắn nằm dưới bản quyền. Đăng bản bìa được tạo bởi AI của bản nhạc có bản quyền lên nền tảng phát trực tiếp hoặc kiếm tiền từ nó trên YouTube là tác phẩm phái sinh, và làm điều đó mà không có giấy phép hoặc thủ tục cấp phép cơ học đặt bạn vào vùng xám có thể biến thành yêu cầu quyền hoặc thông báo gỡ xuống. Các quy tắc thay đổi theo quốc gia, nhưng "tôi không lấy mẫu âm thanh gốc" không tự động làm bạn an toàn — một giai điệu hoặc ca từ có thể nhận biết vẫn được bảo vệ.

Mảnh đất an toàn nhất: bìa tài liệu của riêng bạn, bìa các bài hát với giấy phép Creative Commons cho phép các tác phẩm phái sinh, hoặc bìa các tác phẩm đã vào phạm vi công cộng (tại Mỹ, điều này thường có nghĩa là các tác phẩm có bản quyền đã hết hạn — tra cứu cho tác phẩm cụ thể). Nếu bạn muốn bìa thứ gì đó đương đại và phát hành thương mại, hãy tìm hiểu các dịch vụ xử lý cấp phép cơ học. Để sử dụng cá nhân, không kiếm tiền, rủi ro thấp hơn, nhưng vẫn đáng biết bạn đứng ở đâu trước khi đầu tư hàng giờ vào một dự án.

Bước 1: chọn tham chiếu có chỗ để thở

Không phải mọi bài hát đều hoạt động như bản bìa. Những bài thường tồn tại qua quá trình đó đơn giản về mặt cấu trúc: một đường giai điệu rõ ràng, một số thay đổi hợp âm có thể quản lý, ít phụ thuộc vào kết cấu sản xuất cho tác động cảm xúc của chúng. Các bản ballad acoustic, bài hát folk ba hợp âm, và pop nhẹ stripped-back là các ứng cử viên tự nhiên. Một giai điệu tốt có thể tự nó dẫn dắt qua nhạc cụ rất khác nhau. Một bài hát hay được xây dựng xung quanh sự đơn giản thường sẽ nghe thú vị ở hầu hết mọi phong cách.

Những bài hát kháng cự bìa là những bài nơi sản xuất gốc LÀ bài hát. Bohemian Rhapsody không thực sự là giai điệu — đó là một bức tường của các dàn dựng tương tác, lớp giọng hát, và sự thay đổi động lực không thể tách rời khỏi trải nghiệm. Rock stadium-mix từ thập niên 2010 (reverb dày, guitar nhiều lớp, nén tất cả) là vấn đề tương tự. Bạn có thể strip những bài hát đó xuống xương, nhưng những gì bạn nhận được thường nghe quá khác so với bản gốc đến nỗi kết nối bị mất. Điều đó không phải lúc nào cũng tệ — đôi khi sự phá bỏ triệt để thú vị — nhưng đó là một vấn đề sáng tạo khó hơn nhiều so với hầu hết mọi người mong đợi khi họ bắt đầu.

Hỏi bản thân: nếu ai đó trình diễn bài hát này theo cách acoustic trên một góc phố, liệu nó có vẫn nhận ra được không? Liệu nó có vẫn lay động bạn không? Nếu có, nó có thể là một ứng cử viên tốt. Nếu câu trả lời là "chỉ khi họ hoàn hảo bắt chước phiên bản studio", bài hát đó có thể chưa sẵn sàng cho bản bìa.

Bước 2: viết tóm tắt phong cách, không chỉ là thể loại

"Làm nó jazz" gần như không nói gì hữu ích với mô hình. Jazz là Coltrane và nó cũng là piano tại quầy bar khách sạn và nó cũng là bossa nova và nó cũng là bebop. Một tóm tắt thể loại một từ hầu như luôn tạo ra đầu ra chung, vì mô hình phải đoán mọi thứ: tempo, trọng lượng nhạc cụ, cách tiếp cận giọng hát, mật độ sản xuất. Đoán thường đúng theo cách kỹ thuật đúng và thẩm mỹ đáng quên.

Một tóm tắt phong cách tốt thu hẹp thế giới cảm xúc và âm thanh xuống thứ gì đó cụ thể. Thay vì thể loại, mô tả căn phòng, thời gian trong đêm, cảm giác. Càng cụ thể và trực quan tóm tắt, mô hình càng có khả năng đưa ra những lựa chọn kết hợp với nhau thành một cách diễn giải thực sự hơn là trung bình cộng của mọi thứ trong thể loại đó.

Bản bìa quán bar piano đêm khuya, 4 giờ sáng, năng lượng cuối buổi. Giọng hát nên cảm thấy gần như được nói — thấp, không vội, như ca sĩ chỉ đang suy nghĩ to. Snare với bàn chải rất xa trong mix, hầu như không nghe được. Không có dây đàn. Piano nên nghe hơi lạc điệu, loại bạn sẽ tìm thấy trong sảnh khách sạn cũ. Giữ dưới 3 phút.

Tóm tắt đó nói với mô hình những gì cần nhấn mạnh và những gì cần bỏ qua. Nó cho nó một quan điểm. Tóm tắt của bạn không cần phải dài như vậy, nhưng nó cần có quan điểm.

Bước 3: tải lên tham chiếu và đặt các điều khiển đúng

Khi bạn có âm thanh tham chiếu và tóm tắt phong cách, quá trình kết xuất thực tế khá đơn giản — nhưng một số cài đặt quan trọng hơn những cài đặt khác. Trình tạo bìa của Aisonggen nhận tệp âm thanh tham chiếu và tóm tắt phong cách và cho phép bạn điều chỉnh đặc điểm giọng, trọng lượng thể loại, và mật độ dàn dựng trước khi kết xuất. Quy trình làm việc chung tương tự áp dụng trong hầu hết các công cụ hiện tại.

Một điều cần kiểm tra trước khi bạn kết xuất: liệu công cụ có tách GIỌNG HÁT tham chiếu khỏi BÀI HÁT tham chiếu không. Một số trình tạo cho phép bạn tải lên bài hát hoàn chỉnh như tham chiếu cấu trúc trong khi tải lên giọng hát được cô lập riêng biệt (hoặc chọn đặc điểm giọng) cho giọng hát đầu ra. Đây là khoảng cách khả năng đáng kể giữa các công cụ — nếu bạn có thể chỉ định giọng riêng biệt, bạn có thể thay đổi người hát trong khi giữ khung giai điệu và hòa âm của bản gốc nguyên vẹn. Sự kết hợp đó thường tạo ra các bản bìa thuyết phục nhất.

Nếu bạn mới với điều này, hãy bắt đầu với trình tạo bìa và viết tóm tắt phong cách của bạn trước khi chạm vào bất kỳ cài đặt nào khác. Tóm tắt làm nhiều việc hơn bất kỳ thanh trượt nào.

Bước 4: kết xuất nhiều lần thử song song và lắng nghe trên các loa khác nhau

Đừng kết xuất một lần và cam kết. Kết xuất ba hoặc bốn lần thử với các biến thể nhỏ trong tóm tắt hoặc đặc điểm giọng, sau đó lắng nghe tất cả chúng trước khi quyết định. Tạo bìa AI có đủ tính ngẫu nhiên trong đầu ra để hai lần kết xuất với cài đặt giống nhau có thể tạo ra kết quả khác nhau đáng chú ý. Tận dụng điều đó.

Bài kiểm tra quan trọng nhất: nó nghe như thế nào trên điện thoại của bạn, qua tai nghe, trong một căn phòng ồn ào? Bản bìa AI thường nghe bóng loáng trên loa studio hoặc tai nghe tốt và sau đó hoàn toàn sụp đổ trên loa điện thoại. Điều này là vì hầu hết âm thanh được tạo bởi AI được mix cho độ rõ nét ở toàn băng thông — phần âm thấp mang nhiều sự phong phú, và khi bạn mất âm thấp trên loa nhỏ, chất lượng rỗng hoặc không tự nhiên trong giọng hoặc nhạc cụ trở nên rõ ràng. Lần thử tồn tại qua bài kiểm tra điện thoại hầu như luôn là lần thử đúng, ngay cả khi nó nghe hơi kém ấn tượng hơn trên loa studio.

Cũng thử nghe trên loa máy tính xách tay mà không nhìn vào màn hình. Đôi mắt bạn sẽ đẩy bạn về phía lần thử có vẻ nên nghe hay hơn. Đôi tai của bạn trên hệ thống phát lại suy giảm sẽ nói với bạn sự thật.

Bước 5: phát hiện các dấu hiệu AI và sửa chúng bằng cách kết xuất lại hoặc chỉnh sửa thủ công

Các bản bìa AI hiện tại có các mô hình thất bại nhất quán. Khi bạn biết phải lắng nghe gì, bạn có thể bắt được chúng trước khi xuất bản và quyết định có kết xuất lại hay sửa thủ công trong DAW không.

  • Phụ âm được khớp quá mức. Giọng nhấn vào mỗi T, D, và P cứng hơn một ca sĩ người thật sẽ làm. Các ca sĩ thực sự làm mờ các phụ âm ở cuối cụm từ; các mô hình AI thường làm sắc chúng.
  • Vibrato không giảm dần. Vibrato người thật tăng tốc và chậm lại tự nhiên tùy thuộc vào hơi thở và vị trí cụm từ. Vibrato được tạo bởi AI thường khóa vào tốc độ ổn định và ở đó, nghe cơ học trên các nốt dài.
  • Tiếng trống quá sạch. Đánh trống trực tiếp có những sự không nhất quán nhỏ về nhịp và các ghost hit. Nếu trống trong bản bìa của bạn nghe như chúng được lập trình trên lưới, chúng có thể đã được làm như vậy, và nó cho thấy.
  • Cuối cụm từ cắt thay vì giải phóng. Các ca sĩ dần giảm tự nhiên. Giọng hát AI đôi khi chỉ dừng lại, hoặc fade theo cách không khớp với cách hơi thở thực sự hoạt động.
  • Sửa cao độ quá chặt. Nếu mỗi nốt hạ cánh chính xác trên cao độ, không có trượt, không có micro-inflection, không có nốt blue ở đâu, giọng nghe được sửa hơn là được hát.

Hầu hết những điều này có thể sửa được với kết xuất lại bằng cách sử dụng tóm tắt đã sửa (ví dụ: "phụ âm thoải mái hơn, để các cụm từ thở ở cuối") hoặc với xử lý thủ công nhẹ sau đó.

Ghi chú về giọng hát: uncanny valley to hơn mix

Lý do hầu hết các bản bìa AI còn thiếu không phải là nhạc cụ — đó là giọng hát. Nhạc cụ có thể không hoàn hảo và vẫn cảm thấy đúng. Một voicing piano hơi sai đọc như đặc điểm. Nhưng một giọng hơi sai đọc như đáng lo ngại. Hệ thống thính giác của con người cực kỳ nhạy cảm với tính xác thực giọng hát; chúng ta có cả một bộ công cụ nhận dạng mô hình đã tiến hóa để phát hiện giọng người thật so với giọng mô phỏng. Nếu giọng trong bản bìa của bạn không hạ cánh, không có lượng đánh bóng sản xuất nào sẽ cứu được nó. Đừng dành ba lần lặp điều chỉnh reverb và EQ trên giọng không hoạt động. Thử một đặc điểm giọng khác trước, kết xuất lại, và xem liệu vấn đề có biến mất không. Giọng là quyết định.

Khi nào dừng lại

Đây là phần khó nhất của bất kỳ quá trình sáng tạo lặp đi lặp lại nào, và các công cụ AI làm tồi tệ hơn bằng cách làm cho lần kết xuất tiếp theo luôn có vẻ có thể là cái sửa mọi thứ. Một số tín hiệu rằng bạn đã xong:

  • Bạn đã nghe hai lần kết xuất khác nhau và thực sự không thể nói cái nào tốt hơn. Đó là may rủi, không phải sự khác biệt chất lượng.
  • Bạn đang điều chỉnh các cài đặt nghe ổn ba lần lặp trước và bây giờ cảm thấy sai. Đó là mệt mỏi người nghe, không phải sự cải thiện.
  • Ai đó khác nghe nó và phản hồi mà không có điều kiện. Nếu điều đầu tiên họ nói là "nhưng..." bạn còn việc phải làm. Nếu họ chỉ nói "cái đó hay," nó hay.
  • Bạn đang cố gắng làm cho nó nghe như bản gốc. Đó không còn là bản bìa nữa.
  • Điều bạn không hài lòng là thứ bạn không thể sửa ngay cả với kết xuất hoàn hảo — lựa chọn cấu trúc trong tài liệu nguồn, không phải vấn đề thực thi trong đầu ra của bạn.

Dừng lại đó. Xuất nó.

Một bản bìa là thư tình gửi một bài hát, không phải hàng nhái. Những bản hay nhất nói điều gì đó về lý do bài hát đó quan trọng — tại sao đáng quay trở lại, tại sao nó nghe khác qua một bộ trải nghiệm khác hoặc một bối cảnh âm nhạc khác. Trước khi bạn kết xuất thêm một lần nữa, hãy hỏi liệu phiên bản của bạn đã có quan điểm chưa. Nếu có, bạn có thể gần xong hơn bạn nghĩ. Nếu chưa, không có cài đặt công cụ nào sẽ thêm một quan điểm cho bạn. Phần đó vẫn là của bạn để mang lại. Để lấy cảm hứng về dự án hoàn chỉnh có thể trông như thế nào, hãy xem thư viện nhạc AI để nghe cách người khác tiếp cận các biến đổi, hoặc khám phá trang định giá để xem gói nào cho bạn đủ lần kết xuất để lặp đi lặp lại đúng cách.

Bản nhạc tiếp theo của bạn chỉ cách một câu lệnh miễn phí

Hãy mở phòng thu, gõ vibe, nghe một bài hát hoàn chỉnh trong 30 giây. Miễn phí khởi đầu, miễn phí bản quyền để phát hành, không cần thẻ tín dụng.