AISongGen logoAISongGen

วิธีทำเพลง cover ด้วย AI ที่ไม่ฟังดูเหมือนแค่รีมิกซ์

เลือกอ้างอิงที่ถูกต้อง บรีฟสไตล์ที่ถูกต้อง และจุดที่ถูกต้องที่จะหยุด คำแนะนำเชิงปฏิบัติในการทำ cover ที่ยังคงอยู่

อ่าน 8 นาที

cover ที่ใช้งานได้คือการตีความทางศิลปะที่แตกต่างของเพลงคนอื่น มุมที่ต่างกัน การเน้นทางอารมณ์ที่ต่างกัน บางทีถึงขนาดแนวเพลงที่ต่างกันโดยสิ้นเชิง เมื่อมันลงจอดได้ คุณได้ยินกระดูกของต้นฉบับและบางอย่างใหม่ในเวลาเดียวกัน cover ที่ใช้ไม่ได้คือแค่เพลงเดิมที่มีมิกซ์ที่ขุ่นกว่าและเสียงที่ดูเหมือนไม่ค่อยถูก ความแตกต่างระหว่างทั้งสองแทบไม่เคยเป็นเรื่องของเครื่องมือที่คุณใช้ แต่เป็นตัวเลือกที่คุณทำก่อนที่คุณจะกดเรนเดอร์

เครื่องมือสร้าง cover ด้วย AI ทำให้ง่ายจริงๆ ที่จะนำชิ้นดนตรีไปสร้างใหม่ในเสียงอื่น สไตล์ หรือการจัดเรียงที่ต่างกัน แต่การเข้าถึงกระบวนการที่ง่ายขึ้นไม่ได้ปรับปรุงเอาต์พุตโดยอัตโนมัติ คุณยังต้องรู้ว่าเพลงใดคุ้มค่าทำ cover วิธีเขียนบรีฟสไตล์ที่ให้โมเดลมีบางอย่างจริงๆ ที่ทำงานด้วย และเมื่อไหรที่จะหยุดแก้ไขและเรียกว่าเสร็จ คู่มือนี้จะอธิบายทั้งหมดนั้นทีละขั้นตอน

ก่อนเริ่ม: คำถามเรื่องการออกใบอนุญาต

นี่คือส่วนที่บทแนะนำส่วนใหญ่ข้าม ดังนั้นมาชี้แจงให้ชัดก่อน หากคุณทำ cover เพลงที่คุณไม่ได้เป็นเจ้าของ เพลงนั้นเกือบแน่นอนอยู่ภายใต้ลิขสิทธิ์ การโพสต์ cover ที่สร้างโดย AI ของแทร็กที่มีลิขสิทธิ์บนแพลตฟอร์มสตรีมหรือสร้างรายได้บน YouTube เป็นงานดัดแปลง และการทำโดยไม่มีใบอนุญาตหรือการอนุมัติสิทธิ์ mechanical จะทำให้คุณอยู่ในพื้นที่สีเทาที่อาจนำไปสู่การอ้างสิทธิ์หรือการลบ กฎแตกต่างกันตามประเทศ แต่ "ฉันไม่ได้ sample เสียงต้นฉบับ" ไม่ได้ทำให้คุณปลอดภัยโดยอัตโนมัติ ท่วงทำนองหรือเนื้อเพลงที่จดจำได้ยังคงได้รับการคุ้มครอง

พื้นที่ที่ปลอดภัยที่สุด: ทำ cover เนื้อหาของตัวเอง ทำ cover เพลงที่มีใบอนุญาต Creative Commons ที่อนุญาตให้ดัดแปลง หรือทำ cover บทประพันธ์ที่เข้าสู่สาธารณสมบัติแล้ว (ในสหรัฐ โดยทั่วไปหมายถึงผลงานที่ลิขสิทธิ์หมดอายุ ตรวจสอบสำหรับชิ้นเฉพาะ) หากต้องการทำ cover บางอย่างร่วมสมัยและนำออกสู่เชิงพาณิชย์ ดูที่บริการที่จัดการการออกใบอนุญาต mechanical สำหรับการใช้ส่วนตัวที่ไม่ได้สร้างรายได้ ความเสี่ยงต่ำกว่า แต่ยังคุ้มค่าที่จะรู้ว่าคุณยืนอยู่ที่ไหนก่อนที่คุณจะลงทุนชั่วโมงในโครงการ

ขั้นตอนที่ 1: เลือกอ้างอิงที่มีพื้นที่ให้หายใจ

ไม่ใช่ทุกเพลงที่เหมาะกับการทำ cover เพลงที่มักจะรอดผ่านกระบวนการคือเพลงที่โครงสร้างเรียบง่าย: เส้นท่วงทำนองที่ชัดเจน จำนวนการเปลี่ยนคอร์ดที่จัดการได้ การพึ่งพาน้อยต่อเนื้อสัมผัสการผลิตสำหรับผลกระทบทางอารมณ์ บัลลาดอะคูสติก เพลงโฟล์กสามคอร์ด และซอฟท์ป็อปที่เปลือยเปล่าเป็นผู้สมัครโดยธรรมชาติ ท่วงทำนองที่ดีสามารถพาตัวเองผ่านเครื่องดนตรีที่แตกต่างกันมาก เพลงที่ดีที่สร้างรอบความเรียบง่ายมักจะฟังดูน่าสนใจในสไตล์เกือบทุกอย่าง

เพลงที่ต่อต้านการทำ cover คือเพลงที่การผลิตต้นฉบับ IS เพลง Bohemian Rhapsody ไม่ใช่ท่วงทำนองจริงๆ มันคือผนังของการจัดเรียงที่โต้ตอบกัน ชั้นเสียงร้อง และการเปลี่ยนไดนามิกที่แยกไม่ออกจากประสบการณ์ rock สนาม stadium จากยุค 2010 (reverb หนาแน่น กีตาร์หลายชั้น ทุกอย่างถูกคอมเพรส) คือปัญหาเดียวกัน คุณสามารถลดเพลงเหล่านั้นเหลือแค่กระดูกได้ แต่สิ่งที่คุณได้มักจะฟังดูต่างจากต้นฉบับมากจนการเชื่อมต่อหาย ไม่ได้เลวร้ายเสมอ บางครั้งการกระจายตัวแบบรุนแรงนั้นน่าสนใจ แต่มันเป็นปัญหาสร้างสรรค์ที่ยากกว่าที่คนส่วนใหญ่คาดหวังเมื่อพวกเขาเริ่ม

ถามตัวเอง: ถ้าใครแสดงเพลงนี้แบบอะคูสติกที่หัวมุมถนน มันยังจำได้ไหม? มันยังทำให้คุณรู้สึกได้ไหม? ถ้าใช่ มันน่าจะเป็นผู้สมัครที่ดี ถ้าคำตอบคือ "เฉพาะเมื่อพวกเขาเลียนแบบเวอร์ชัน studio ได้อย่างสมบูรณ์แบบ" เพลงนั้นอาจไม่พร้อมสำหรับการทำ cover

ขั้นตอนที่ 2: เขียนบรีฟสไตล์ ไม่ใช่แค่แนวเพลง

"ทำให้เป็นแจ๊ซ" บอกโมเดลน้อยมากที่มีประโยชน์ แจ๊ซคือ Coltrane และมันก็คือเปียโนที่บาร์ในโรงแรมและมันก็คือบอสซาโนวาและมันก็คือบีบ๊อป บรีฟแนวเพลงคำเดียวมักผลิตเอาต์พุตที่ทั่วไป เพราะโมเดลต้องเดาทุกอย่าง: tempo เครื่องดนตรีน้ำหนัก แนวทางเสียงร้อง ความหนาแน่นการผลิต การเดาปกติถูกต้องในแบบที่ถูกต้องทางเทคนิคและน่าลืมทางสุนทรียะ

บรีฟสไตล์ที่ดีจะแคบโลกทางอารมณ์และเสียงลงสู่บางอย่างที่เฉพาะเจาะจง แทนที่จะเป็นแนวเพลง อธิบายห้อง เวลา ความรู้สึก ยิ่งบรีฟเฉพาะและมีภาพมากเท่าไหร่ โมเดลก็ยิ่งมีแนวโน้มที่จะตัดสินใจที่แขวนรวมกันเป็นการตีความจริงแทนที่จะเป็นค่าเฉลี่ยผสมของทุกอย่างในแนวเพลงนั้น

cover บาร์เปียโนดึก 4 โมงเช้า พลังงาน last call เสียงร้องควรรู้สึกเหมือนพูดเกือบๆ ต่ำ ไม่รีบ เหมือนนักร้องแค่คิดออกเสียง สแนร์ที่ brushed ลึกมากในมิกซ์ แทบได้ยิน ไม่มีสตริง เปียโนควรฟังดูเกือบจะไม่ในคีย์ ประเภทที่คุณจะพบในห้องโถงโรงแรมเก่า เก็บไว้ภายใน 3 นาที

บรีฟนั้นบอกโมเดลว่าต้องเน้นอะไรและต้องละเว้นอะไร มันให้มุมมอง บรีฟของคุณไม่จำเป็นต้องยาวแบบนั้น แต่ต้องมีมุมมอง

ขั้นตอนที่ 3: อัปโหลดอ้างอิงและตั้งการควบคุมที่ถูกต้อง

เมื่อคุณมีเสียงอ้างอิงและบรีฟสไตล์แล้ว กระบวนการเรนเดอร์จริงค่อนข้างตรงไปตรงมา แต่การตั้งค่าบางอย่างสำคัญกว่าอย่างอื่น เครื่องมือสร้าง cover ของ aisonggen รับไฟล์เสียงอ้างอิงและบรีฟสไตล์ และให้คุณปรับตัวละครเสียงร้อง น้ำหนักแนวเพลง และความหนาแน่นการจัดเรียงก่อนเรนเดอร์ เวิร์กโฟลว์ทั่วไปเดียวกันใช้กับเครื่องมือส่วนใหญ่ในปัจจุบัน

สิ่งหนึ่งที่ต้องตรวจสอบก่อนเรนเดอร์: ว่าเครื่องมือแยก vocal อ้างอิงจาก SONG อ้างอิงหรือไม่ เครื่องมือสร้างบางตัวให้คุณอัปโหลดเพลงเต็มเป็นอ้างอิงโครงสร้างขณะที่อัปโหลด vocal ที่แยกออกมา (หรือเลือกตัวละครเสียง) สำหรับเสียงเอาต์พุตแยกต่างหาก นี่เป็นช่องว่างความสามารถที่สำคัญระหว่างเครื่องมือ ถ้าคุณสามารถระบุเสียงแยกต่างหากได้ คุณสามารถเปลี่ยนใครที่ร้องขณะรักษาโครงร่างท่วงทำนองและฮาร์โมนิกของต้นฉบับ การผสมผสานนั้นมักผลิต cover ที่น่าเชื่อที่สุด

ถ้าคุณใหม่กับเรื่องนี้ เริ่มด้วยเครื่องมือสร้าง cover และเขียนบรีฟสไตล์ก่อนแตะการตั้งค่าอื่น บรีฟทำงานมากกว่า slider ใดๆ

ขั้นตอนที่ 4: เรนเดอร์หลาย take แบบขนานและฟังบนลำโพงต่างๆ

อย่าเรนเดอร์ครั้งเดียวแล้วยืนยัน เรนเดอร์สาม take หรือสี่ take ด้วยการเปลี่ยนแปลงเล็กน้อยในบรีฟหรือตัวละครเสียงร้อง แล้วฟังทั้งหมดก่อนตัดสินใจ การสร้าง cover ด้วย AI มีความสุ่มในเอาต์พุตเพียงพอที่สอง take ที่มีการตั้งค่าเหมือนกันสามารถผลิตผลลัพธ์ที่แตกต่างกันอย่างเห็นได้ชัด ใช้ประโยชน์จากนั้น

การทดสอบที่สำคัญที่สุด: มันฟังดูอย่างไรบนโทรศัพท์ ผ่าน earpiece ในห้องที่มีเสียงดัง? Cover ด้วย AI มักฟังดูขัดเกลาบนลำโพงสตูดิโอหรือหูฟังที่ดี แล้วพังทลายอย่างสมบูรณ์บนลำโพงโทรศัพท์ นี่เพราะเสียงที่สร้างโดย AI ส่วนใหญ่ถูกมิกซ์เพื่อความชัดเจนที่แบนด์วิดท์เต็ม ความต่ำแน่นถือส่วนมากของความสมบูรณ์ และเมื่อคุณเสียความต่ำแน่นบนลำโพงเล็ก คุณภาพที่กลวงหรือไม่เป็นธรรมชาติในเสียงหรือเครื่องดนตรีจะชัดเจน take ที่รอดจากการทดสอบโทรศัพท์มักเป็น take ที่ถูกต้อง แม้ว่ามันจะฟังดูน่าประทับใจน้อยกว่าเล็กน้อยบนลำโพง

ลองบนลำโพงแล็ปท็อปโดยไม่มองหน้าจอด้วย ตาของคุณจะผลักดันคุณไปสู่ take ที่ดูเหมือนว่าควรจะฟังดูดีกว่า หูของคุณบนระบบเล่นที่เสื่อมลงจะบอกความจริง

ขั้นตอนที่ 5: สังเกต AI-tells และแก้ไขด้วยการเรนเดอร์ใหม่หรือการแก้ไขด้วยมือ

Cover ด้วย AI ในปัจจุบันมีรูปแบบความล้มเหลวที่สม่ำเสมอ เมื่อคุณรู้ว่าต้องฟังอะไร คุณสามารถจับพวกมันก่อนที่คุณจะเผยแพร่และตัดสินใจว่าจะเรนเดอร์ใหม่หรือแก้ไขด้วยมือใน DAW

  • พยัญชนะที่เปล่งเสียงมากเกินไป เสียงกด T, D และ P แต่ละตัวหนักกว่าที่นักร้องมนุษย์จะทำ นักร้องจริงมักเบลอพยัญชนะที่ท้ายวลี โมเดล AI มักทำให้มันคม
  • วิบราโตที่ไม่ decay เสียงวิบราโตมนุษย์เร็วขึ้นและช้าลงตามธรรมชาติขึ้นอยู่กับลมหายใจและตำแหน่งวลี วิบราโตที่สร้างโดย AI มักล็อคเข้าอัตราที่คงที่และอยู่ที่นั่น ซึ่งฟังดูเหมือนกลไกบนโน้ตที่ยาว
  • การตีกลองที่สะอาดเกินไป การตีกลองสดมีความไม่สม่ำเสมอของจังหวะเล็กน้อยและ ghost hit ถ้ากลองใน cover ของคุณฟังดูเหมือนถูกโปรแกรมบนกริด พวกมันน่าจะเป็นแบบนั้น และมันแสดงออกมา
  • ท้ายวลีที่ตัดออกแทนที่จะปล่อย นักร้อง trail off ตามธรรมชาติ เสียงร้อง AI บางครั้งแค่หยุด หรือ fade ในแบบที่ไม่ตรงกับวิธีที่ลมหายใจทำงานจริงๆ
  • การแก้ไข pitch ที่แน่นเกินไป ถ้าทุกโน้ตลงจอดตรงบน pitch อย่างแม่นยำ ไม่มี slide ไม่มี micro-inflection ไม่มี blue note ที่ไหนเลย เสียงฟังดูถูกแก้ไขแทนที่จะร้อง

ส่วนใหญ่เหล่านี้สามารถแก้ไขได้ด้วยการเรนเดอร์ใหม่โดยใช้บรีฟที่แก้ไข (เช่น "พยัญชนะที่ผ่อนคลายมากขึ้น ให้วลีหายใจที่ท้าย") หรือด้วยการประมวลผลด้วยมือเบาๆ หลังจากนั้น

หมายเหตุเกี่ยวกับเสียงร้อง: uncanny valley ดังกว่ามิกซ์

เหตุผลที่ cover ด้วย AI ส่วนใหญ่ล้มเหลวไม่ใช่เครื่องดนตรี แต่เป็นเสียง เครื่องดนตรีสามารถไม่สมบูรณ์แบบและยังรู้สึกถูกต้อง การวอยซ์เปียโนที่ไม่ค่อยถูกอ่านว่าเป็นลักษณะเฉพาะตัว แต่เสียงที่ไม่ค่อยถูกอ่านว่าน่าหวาดกลัว ระบบการได้ยินของมนุษย์ไวต่อความถูกต้องของเสียงร้องอย่างมาก เรามีชุดเครื่องมือรู้จำรูปแบบที่วิวัฒนาการมาสำหรับการตรวจจับเสียงพูดมนุษย์และการร้องจริงเทียบกับการจำลอง ถ้าเสียงใน cover ของคุณไม่ลงจอด ปริมาณการขัดเกลาการผลิตไม่สามารถช่วยได้ อย่าใช้เวลาสามครั้งในการปรับ reverb และ EQ บนเสียงร้องที่ไม่ทำงาน ลองตัวละครเสียงต่างกันก่อน เรนเดอร์ใหม่ และดูว่าปัญหาหายไปหรือไม่ เสียงคือการตัดสินใจ

เมื่อไหรที่จะหยุด

นี่คือส่วนที่ยากที่สุดของกระบวนการสร้างสรรค์แบบ iterative ใดๆ และเครื่องมือ AI ทำให้มันแย่ลงโดยทำให้การเรนเดอร์ถัดไปรู้สึกเหมือนอาจจะเป็นตัวที่แก้ไขสิ่งต่างๆ ได้เสมอ สัญญาณบางอย่างที่คุณเสร็จแล้ว:

  • คุณได้ฟัง two take ที่แตกต่างกันและจริงๆ แยกไม่ออกว่าตัวไหนดีกว่า นั่นคือการโยนเหรียญ ไม่ใช่ความแตกต่างของคุณภาพ
  • คุณกำลังปรับการตั้งค่าที่ฟังดูดีสามครั้งก่อนหน้าและตอนนี้รู้สึกผิด นั่นคือความเหนื่อยล้าของผู้ฟัง ไม่ใช่การปรับปรุง
  • คนอื่นฟังมันและตอบสนองโดยไม่มีตัวแบ่ง ถ้าสิ่งแรกที่พวกเขาพูดคือ "แต่..." คุณยังมีงานต้องทำ ถ้าพวกเขาแค่พูดว่า "นั่นดี" ก็ดี
  • คุณพยายามทำให้มันฟังดูเหมือนต้นฉบับ นั่นไม่ใช่ cover อีกต่อไป
  • สิ่งที่คุณไม่พอใจคือบางอย่างที่คุณไม่สามารถแก้ไขได้แม้แต่ด้วยการเรนเดอร์ที่สมบูรณ์แบบ การตัดสินใจโครงสร้างในเนื้อหาต้นฉบับ ไม่ใช่ปัญหาการดำเนินการในเอาต์พุตของคุณ

หยุดที่นั่น Export มัน

cover คือจดหมายรักถึงเพลง ไม่ใช่ของปลอม ที่ดีที่สุดพูดถึงสาเหตุที่เพลงนั้นสำคัญ ทำไมถึงคุ้มค่าที่จะกลับมา ทำไมมันฟังดูต่างผ่านชุดประสบการณ์ต่างหรือบริบทดนตรีต่าง ก่อนที่คุณจะเรนเดอร์ take อีกครั้ง ถามว่าเวอร์ชันของคุณมีมุมมองแล้วหรือยัง ถ้ามี คุณน่าจะใกล้เสร็จมากกว่าที่คิด ถ้าไม่มี ไม่มีการตั้งค่าเครื่องมือใดที่จะเพิ่มมุมมองนั้นให้คุณ ส่วนนั้นยังเป็นของคุณที่ต้องนำมา สำหรับแรงบันดาลใจว่าโครงการที่เสร็จสมบูรณ์อาจมีลักษณะอย่างไร ตรวจสอบ ไลบรารีเพลง AI เพื่อดูว่าคนอื่นๆ เข้าถึงการเปลี่ยนแปลงอย่างไร หรือสำรวจ หน้าราคา เพื่อดูว่าแผนใดให้การเรนเดอร์เพียงพอที่จะ iterate ได้อย่างถูกต้อง

แทร็กถัดไปของคุณห่างเพียง prompt ฟรีเดียว

เปิดสตูดิโอ พิมพ์อารมณ์ ฟังเพลงสำเร็จรูปใน 30 วินาที เริ่มฟรี ส่งงานปลอดค่าลิขสิทธิ์ ไม่ต้องใช้บัตรเครดิต