วิธีทำเพลง cover ด้วย AI ที่ไม่ฟังดูเหมือนแค่รีมิกซ์

cover ที่ใช้งานได้คือการตีความทางศิลปะที่แตกต่างของเพลงคนอื่น มุมที่ต่างกัน การเน้นทางอารมณ์ที่ต่างกัน บางทีถึงขนาดแนวเพลงที่ต่างกันโดยสิ้นเชิง เมื่อมันลงจอดได้ คุณได้ยินกระดูกของต้นฉบับและบางอย่างใหม่ในเวลาเดียวกัน cover ที่ใช้ไม่ได้คือแค่เพลงเดิมที่มีมิกซ์ที่ขุ่นกว่าและเสียงที่ดูเหมือนไม่ค่อยถูก ความแตกต่างระหว่างทั้งสองแทบไม่เคยเป็นเรื่องของเครื่องมือที่คุณใช้ แต่เป็นตัวเลือกที่คุณทำก่อนที่คุณจะกดเรนเดอร์

เครื่องมือสร้าง cover ด้วย AI ทำให้ง่ายจริงๆ ที่จะนำชิ้นดนตรีไปสร้างใหม่ในเสียงอื่น สไตล์ หรือการจัดเรียงที่ต่างกัน แต่การเข้าถึงกระบวนการที่ง่ายขึ้นไม่ได้ปรับปรุงเอาต์พุตโดยอัตโนมัติ คุณยังต้องรู้ว่าเพลงใดคุ้มค่าทำ cover วิธีเขียนบรีฟสไตล์ที่ให้โมเดลมีบางอย่างจริงๆ ที่ทำงานด้วย และเมื่อไหรที่จะหยุดแก้ไขและเรียกว่าเสร็จ คู่มือนี้จะอธิบายทั้งหมดนั้นทีละขั้นตอน

ก่อนเริ่ม: คำถามเรื่องการออกใบอนุญาต

นี่คือส่วนที่บทแนะนำส่วนใหญ่ข้าม ดังนั้นมาชี้แจงให้ชัดก่อน หากคุณทำ cover เพลงที่คุณไม่ได้เป็นเจ้าของ เพลงนั้นเกือบแน่นอนอยู่ภายใต้ลิขสิทธิ์ การโพสต์ cover ที่สร้างโดย AI ของแทร็กที่มีลิขสิทธิ์บนแพลตฟอร์มสตรีมหรือสร้างรายได้บน YouTube เป็นงานดัดแปลง และการทำโดยไม่มีใบอนุญาตหรือการอนุมัติสิทธิ์ mechanical จะทำให้คุณอยู่ในพื้นที่สีเทาที่อาจนำไปสู่การอ้างสิทธิ์หรือการลบ กฎแตกต่างกันตามประเทศ แต่ "ฉันไม่ได้ sample เสียงต้นฉบับ" ไม่ได้ทำให้คุณปลอดภัยโดยอัตโนมัติ ท่วงทำนองหรือเนื้อเพลงที่จดจำได้ยังคงได้รับการคุ้มครอง

พื้นที่ที่ปลอดภัยที่สุด: ทำ cover เนื้อหาของตัวเอง ทำ cover เพลงที่มีใบอนุญาต Creative Commons ที่อนุญาตให้ดัดแปลง หรือทำ cover บทประพันธ์ที่เข้าสู่สาธารณสมบัติแล้ว (ในสหรัฐ โดยทั่วไปหมายถึงผลงานที่ลิขสิทธิ์หมดอายุ ตรวจสอบสำหรับชิ้นเฉพาะ) หากต้องการทำ cover บางอย่างร่วมสมัยและนำออกสู่เชิงพาณิชย์ ดูที่บริการที่จัดการการออกใบอนุญาต mechanical สำหรับการใช้ส่วนตัวที่ไม่ได้สร้างรายได้ ความเสี่ยงต่ำกว่า แต่ยังคุ้มค่าที่จะรู้ว่าคุณยืนอยู่ที่ไหนก่อนที่คุณจะลงทุนชั่วโมงในโครงการ

ขั้นตอนที่ 1: เลือกอ้างอิงที่มีพื้นที่ให้หายใจ

ไม่ใช่ทุกเพลงที่เหมาะกับการทำ cover เพลงที่มักจะรอดผ่านกระบวนการคือเพลงที่โครงสร้างเรียบง่าย: เส้นท่วงทำนองที่ชัดเจน จำนวนการเปลี่ยนคอร์ดที่จัดการได้ การพึ่งพาน้อยต่อเนื้อสัมผัสการผลิตสำหรับผลกระทบทางอารมณ์ บัลลาดอะคูสติก เพลงโฟล์กสามคอร์ด และซอฟท์ป็อปที่เปลือยเปล่าเป็นผู้สมัครโดยธรรมชาติ ท่วงทำนองที่ดีสามารถพาตัวเองผ่านเครื่องดนตรีที่แตกต่างกันมาก เพลงที่ดีที่สร้างรอบความเรียบง่ายมักจะฟังดูน่าสนใจในสไตล์เกือบทุกอย่าง

เพลงที่ต่อต้านการทำ cover คือเพลงที่การผลิตต้นฉบับ IS เพลง Bohemian Rhapsody ไม่ใช่ท่วงทำนองจริงๆ มันคือผนังของการจัดเรียงที่โต้ตอบกัน ชั้นเสียงร้อง และการเปลี่ยนไดนามิกที่แยกไม่ออกจากประสบการณ์ rock สนาม stadium จากยุค 2010 (reverb หนาแน่น กีตาร์หลายชั้น ทุกอย่างถูกคอมเพรส) คือปัญหาเดียวกัน คุณสามารถลดเพลงเหล่านั้นเหลือแค่กระดูกได้ แต่สิ่งที่คุณได้มักจะฟังดูต่างจากต้นฉบับมากจนการเชื่อมต่อหาย ไม่ได้เลวร้ายเสมอ บางครั้งการกระจายตัวแบบรุนแรงนั้นน่าสนใจ แต่มันเป็นปัญหาสร้างสรรค์ที่ยากกว่าที่คนส่วนใหญ่คาดหวังเมื่อพวกเขาเริ่ม

ถามตัวเอง: ถ้าใครแสดงเพลงนี้แบบอะคูสติกที่หัวมุมถนน มันยังจำได้ไหม? มันยังทำให้คุณรู้สึกได้ไหม? ถ้าใช่ มันน่าจะเป็นผู้สมัครที่ดี ถ้าคำตอบคือ "เฉพาะเมื่อพวกเขาเลียนแบบเวอร์ชัน studio ได้อย่างสมบูรณ์แบบ" เพลงนั้นอาจไม่พร้อมสำหรับการทำ cover

ขั้นตอนที่ 2: เขียนบรีฟสไตล์ ไม่ใช่แค่แนวเพลง

"ทำให้เป็นแจ๊ซ" บอกโมเดลน้อยมากที่มีประโยชน์ แจ๊ซคือ Coltrane และมันก็คือเปียโนที่บาร์ในโรงแรมและมันก็คือบอสซาโนวาและมันก็คือบีบ๊อป บรีฟแนวเพลงคำเดียวมักผลิตเอาต์พุตที่ทั่วไป เพราะโมเดลต้องเดาทุกอย่าง: tempo เครื่องดนตรีน้ำหนัก แนวทางเสียงร้อง ความหนาแน่นการผลิต การเดาปกติถูกต้องในแบบที่ถูกต้องทางเทคนิคและน่าลืมทางสุนทรียะ

บรีฟสไตล์ที่ดีจะแคบโลกทางอารมณ์และเสียงลงสู่บางอย่างที่เฉพาะเจาะจง แทนที่จะเป็นแนวเพลง อธิบายห้อง เวลา ความรู้สึก ยิ่งบรีฟเฉพาะและมีภาพมากเท่าไหร่ โมเดลก็ยิ่งมีแนวโน้มที่จะตัดสินใจที่แขวนรวมกันเป็นการตีความจริงแทนที่จะเป็นค่าเฉลี่ยผสมของทุกอย่างในแนวเพลงนั้น

cover บาร์เปียโนดึก 4 โมงเช้า พลังงาน last call เสียงร้องควรรู้สึกเหมือนพูดเกือบๆ ต่ำ ไม่รีบ เหมือนนักร้องแค่คิดออกเสียง สแนร์ที่ brushed ลึกมากในมิกซ์ แทบได้ยิน ไม่มีสตริง เปียโนควรฟังดูเกือบจะไม่ในคีย์ ประเภทที่คุณจะพบในห้องโถงโรงแรมเก่า เก็บไว้ภายใน 3 นาที

บรีฟนั้นบอกโมเดลว่าต้องเน้นอะไรและต้องละเว้นอะไร มันให้มุมมอง บรีฟของคุณไม่จำเป็นต้องยาวแบบนั้น แต่ต้องมีมุมมอง

ขั้นตอนที่ 3: อัปโหลดอ้างอิงและตั้งการควบคุมที่ถูกต้อง

เมื่อคุณมีเสียงอ้างอิงและบรีฟสไตล์แล้ว กระบวนการเรนเดอร์จริงค่อนข้างตรงไปตรงมา แต่การตั้งค่าบางอย่างสำคัญกว่าอย่างอื่น เครื่องมือสร้าง cover ของ aisonggen รับไฟล์เสียงอ้างอิงและบรีฟสไตล์ และให้คุณปรับตัวละครเสียงร้อง น้ำหนักแนวเพลง และความหนาแน่นการจัดเรียงก่อนเรนเดอร์ เวิร์กโฟลว์ทั่วไปเดียวกันใช้กับเครื่องมือส่วนใหญ่ในปัจจุบัน

สิ่งหนึ่งที่ต้องตรวจสอบก่อนเรนเดอร์: ว่าเครื่องมือแยก vocal อ้างอิงจาก SONG อ้างอิงหรือไม่ เครื่องมือสร้างบางตัวให้คุณอัปโหลดเพลงเต็มเป็นอ้างอิงโครงสร้างขณะที่อัปโหลด vocal ที่แยกออกมา (หรือเลือกตัวละครเสียง) สำหรับเสียงเอาต์พุตแยกต่างหาก นี่เป็นช่องว่างความสามารถที่สำคัญระหว่างเครื่องมือ ถ้าคุณสามารถระบุเสียงแยกต่างหากได้ คุณสามารถเปลี่ยนใครที่ร้องขณะรักษาโครงร่างท่วงทำนองและฮาร์โมนิกของต้นฉบับ การผสมผสานนั้นมักผลิต cover ที่น่าเชื่อที่สุด

ถ้าคุณใหม่กับเรื่องนี้ เริ่มด้วยเครื่องมือสร้าง cover และเขียนบรีฟสไตล์ก่อนแตะการตั้งค่าอื่น บรีฟทำงานมากกว่า slider ใดๆ

ขั้นตอนที่ 4: เรนเดอร์หลาย take แบบขนานและฟังบนลำโพงต่างๆ

อย่าเรนเดอร์ครั้งเดียวแล้วยืนยัน เรนเดอร์สาม take หรือสี่ take ด้วยการเปลี่ยนแปลงเล็กน้อยในบรีฟหรือตัวละครเสียงร้อง แล้วฟังทั้งหมดก่อนตัดสินใจ การสร้าง cover ด้วย AI มีความสุ่มในเอาต์พุตเพียงพอที่สอง take ที่มีการตั้งค่าเหมือนกันสามารถผลิตผลลัพธ์ที่แตกต่างกันอย่างเห็นได้ชัด ใช้ประโยชน์จากนั้น

การทดสอบที่สำคัญที่สุด: มันฟังดูอย่างไรบนโทรศัพท์ ผ่าน earpiece ในห้องที่มีเสียงดัง? Cover ด้วย AI มักฟังดูขัดเกลาบนลำโพงสตูดิโอหรือหูฟังที่ดี แล้วพังทลายอย่างสมบูรณ์บนลำโพงโทรศัพท์ นี่เพราะเสียงที่สร้างโดย AI ส่วนใหญ่ถูกมิกซ์เพื่อความชัดเจนที่แบนด์วิดท์เต็ม ความต่ำแน่นถือส่วนมากของความสมบูรณ์ และเมื่อคุณเสียความต่ำแน่นบนลำโพงเล็ก คุณภาพที่กลวงหรือไม่เป็นธรรมชาติในเสียงหรือเครื่องดนตรีจะชัดเจน take ที่รอดจากการทดสอบโทรศัพท์มักเป็น take ที่ถูกต้อง แม้ว่ามันจะฟังดูน่าประทับใจน้อยกว่าเล็กน้อยบนลำโพง

ลองบนลำโพงแล็ปท็อปโดยไม่มองหน้าจอด้วย ตาของคุณจะผลักดันคุณไปสู่ take ที่ดูเหมือนว่าควรจะฟังดูดีกว่า หูของคุณบนระบบเล่นที่เสื่อมลงจะบอกความจริง

ขั้นตอนที่ 5: สังเกต AI-tells และแก้ไขด้วยการเรนเดอร์ใหม่หรือการแก้ไขด้วยมือ

Cover ด้วย AI ในปัจจุบันมีรูปแบบความล้มเหลวที่สม่ำเสมอ เมื่อคุณรู้ว่าต้องฟังอะไร คุณสามารถจับพวกมันก่อนที่คุณจะเผยแพร่และตัดสินใจว่าจะเรนเดอร์ใหม่หรือแก้ไขด้วยมือใน DAW

พยัญชนะที่เปล่งเสียงมากเกินไป เสียงกด T, D และ P แต่ละตัวหนักกว่าที่นักร้องมนุษย์จะทำ นักร้องจริงมักเบลอพยัญชนะที่ท้ายวลี โมเดล AI มักทำให้มันคม
วิบราโตที่ไม่ decay เสียงวิบราโตมนุษย์เร็วขึ้นและช้าลงตามธรรมชาติขึ้นอยู่กับลมหายใจและตำแหน่งวลี วิบราโตที่สร้างโดย AI มักล็อคเข้าอัตราที่คงที่และอยู่ที่นั่น ซึ่งฟังดูเหมือนกลไกบนโน้ตที่ยาว
การตีกลองที่สะอาดเกินไป การตีกลองสดมีความไม่สม่ำเสมอของจังหวะเล็กน้อยและ ghost hit ถ้ากลองใน cover ของคุณฟังดูเหมือนถูกโปรแกรมบนกริด พวกมันน่าจะเป็นแบบนั้น และมันแสดงออกมา
ท้ายวลีที่ตัดออกแทนที่จะปล่อย นักร้อง trail off ตามธรรมชาติ เสียงร้อง AI บางครั้งแค่หยุด หรือ fade ในแบบที่ไม่ตรงกับวิธีที่ลมหายใจทำงานจริงๆ
การแก้ไข pitch ที่แน่นเกินไป ถ้าทุกโน้ตลงจอดตรงบน pitch อย่างแม่นยำ ไม่มี slide ไม่มี micro-inflection ไม่มี blue note ที่ไหนเลย เสียงฟังดูถูกแก้ไขแทนที่จะร้อง

ส่วนใหญ่เหล่านี้สามารถแก้ไขได้ด้วยการเรนเดอร์ใหม่โดยใช้บรีฟที่แก้ไข (เช่น "พยัญชนะที่ผ่อนคลายมากขึ้น ให้วลีหายใจที่ท้าย") หรือด้วยการประมวลผลด้วยมือเบาๆ หลังจากนั้น

หมายเหตุเกี่ยวกับเสียงร้อง: uncanny valley ดังกว่ามิกซ์

เหตุผลที่ cover ด้วย AI ส่วนใหญ่ล้มเหลวไม่ใช่เครื่องดนตรี แต่เป็นเสียง เครื่องดนตรีสามารถไม่สมบูรณ์แบบและยังรู้สึกถูกต้อง การวอยซ์เปียโนที่ไม่ค่อยถูกอ่านว่าเป็นลักษณะเฉพาะตัว แต่เสียงที่ไม่ค่อยถูกอ่านว่าน่าหวาดกลัว ระบบการได้ยินของมนุษย์ไวต่อความถูกต้องของเสียงร้องอย่างมาก เรามีชุดเครื่องมือรู้จำรูปแบบที่วิวัฒนาการมาสำหรับการตรวจจับเสียงพูดมนุษย์และการร้องจริงเทียบกับการจำลอง ถ้าเสียงใน cover ของคุณไม่ลงจอด ปริมาณการขัดเกลาการผลิตไม่สามารถช่วยได้ อย่าใช้เวลาสามครั้งในการปรับ reverb และ EQ บนเสียงร้องที่ไม่ทำงาน ลองตัวละครเสียงต่างกันก่อน เรนเดอร์ใหม่ และดูว่าปัญหาหายไปหรือไม่ เสียงคือการตัดสินใจ

เมื่อไหรที่จะหยุด

นี่คือส่วนที่ยากที่สุดของกระบวนการสร้างสรรค์แบบ iterative ใดๆ และเครื่องมือ AI ทำให้มันแย่ลงโดยทำให้การเรนเดอร์ถัดไปรู้สึกเหมือนอาจจะเป็นตัวที่แก้ไขสิ่งต่างๆ ได้เสมอ สัญญาณบางอย่างที่คุณเสร็จแล้ว:

คุณได้ฟัง two take ที่แตกต่างกันและจริงๆ แยกไม่ออกว่าตัวไหนดีกว่า นั่นคือการโยนเหรียญ ไม่ใช่ความแตกต่างของคุณภาพ
คุณกำลังปรับการตั้งค่าที่ฟังดูดีสามครั้งก่อนหน้าและตอนนี้รู้สึกผิด นั่นคือความเหนื่อยล้าของผู้ฟัง ไม่ใช่การปรับปรุง
คนอื่นฟังมันและตอบสนองโดยไม่มีตัวแบ่ง ถ้าสิ่งแรกที่พวกเขาพูดคือ "แต่..." คุณยังมีงานต้องทำ ถ้าพวกเขาแค่พูดว่า "นั่นดี" ก็ดี
คุณพยายามทำให้มันฟังดูเหมือนต้นฉบับ นั่นไม่ใช่ cover อีกต่อไป
สิ่งที่คุณไม่พอใจคือบางอย่างที่คุณไม่สามารถแก้ไขได้แม้แต่ด้วยการเรนเดอร์ที่สมบูรณ์แบบ การตัดสินใจโครงสร้างในเนื้อหาต้นฉบับ ไม่ใช่ปัญหาการดำเนินการในเอาต์พุตของคุณ

หยุดที่นั่น Export มัน

cover คือจดหมายรักถึงเพลง ไม่ใช่ของปลอม ที่ดีที่สุดพูดถึงสาเหตุที่เพลงนั้นสำคัญ ทำไมถึงคุ้มค่าที่จะกลับมา ทำไมมันฟังดูต่างผ่านชุดประสบการณ์ต่างหรือบริบทดนตรีต่าง ก่อนที่คุณจะเรนเดอร์ take อีกครั้ง ถามว่าเวอร์ชันของคุณมีมุมมองแล้วหรือยัง ถ้ามี คุณน่าจะใกล้เสร็จมากกว่าที่คิด ถ้าไม่มี ไม่มีการตั้งค่าเครื่องมือใดที่จะเพิ่มมุมมองนั้นให้คุณ ส่วนนั้นยังเป็นของคุณที่ต้องนำมา สำหรับแรงบันดาลใจว่าโครงการที่เสร็จสมบูรณ์อาจมีลักษณะอย่างไร ตรวจสอบ ไลบรารีเพลง AI เพื่อดูว่าคนอื่นๆ เข้าถึงการเปลี่ยนแปลงอย่างไร หรือสำรวจ หน้าราคา เพื่อดูว่าแผนใดให้การเรนเดอร์เพียงพอที่จะ iterate ได้อย่างถูกต้อง

วิธีทำเพลง cover ด้วย AI ที่ไม่ฟังดูเหมือนแค่รีมิกซ์

ก่อนเริ่ม: คำถามเรื่องการออกใบอนุญาต

ขั้นตอนที่ 1: เลือกอ้างอิงที่มีพื้นที่ให้หายใจ

ขั้นตอนที่ 2: เขียนบรีฟสไตล์ ไม่ใช่แค่แนวเพลง

ขั้นตอนที่ 3: อัปโหลดอ้างอิงและตั้งการควบคุมที่ถูกต้อง

ขั้นตอนที่ 4: เรนเดอร์หลาย take แบบขนานและฟังบนลำโพงต่างๆ

ขั้นตอนที่ 5: สังเกต AI-tells และแก้ไขด้วยการเรนเดอร์ใหม่หรือการแก้ไขด้วยมือ

หมายเหตุเกี่ยวกับเสียงร้อง: uncanny valley ดังกว่ามิกซ์

เมื่อไหรที่จะหยุด

อ่านต่อ

วิธีทำเพลง AI ที่ไม่ฟังดูเหมือนเพลง AI

วิธีใช้ text-to-speech เพื่อให้มันหยุดฟังดูเหมือนหุ่นยนต์อ่านการบ้าน

AICoverเทียบกับAIOriginal—การแลกเปลี่ยนที่ตรงไปตรงมา

แทร็กถัดไปของคุณห่างเพียง prompt ฟรีเดียว