AISongGen logoAISongGen

Remix gibi duyulmayan yapay zeka cover şarkıları nasıl yapılır

Doğru referansı, doğru stil özetini ve durulacak doğru noktayı seçin. Tutarlı bir cover yapmanın pratik bir rehberi.

8 dk okuma

İşe yarayan bir cover, başkasının şarkısının özgün bir sanatsal yorumudur — farklı bir açı, farklı bir duygusal vurgu, belki tamamen farklı bir tür. İsabet ettiğinde, orijinalin iskeletini ve aynı anda yeni bir şeyi duyarsınız. İşe yaramayan bir cover, daha bulanık bir karışım ve belirsiz biçimde yanlış gelen bir sesle aynı şarkıdır. İkisi arasındaki fark neredeyse hiçbir zaman kullandığınız araç değildir. Oluştur'a basmadan önce verdiğiniz kararlardır.

Yapay zeka cover üreticileri, bir müzik parçasını alıp farklı bir ses, stil veya düzenlemede yeniden inşa etmeyi gerçekten kolaylaştırdı. Ancak sürece daha kolay erişim, çıktıyı otomatik olarak iyileştirmez. Hangi şarkıların cover yapmaya değer olduğunu, modele çalışmak için gerçek bir şey verecek bir stil özeti yazmayı ve kurcalamayı bırakıp tamamlandı demeyi hâlâ bilmeniz gerekiyor. Bu kılavuz tüm bunları adım adım ele alıyor.

Başlamadan önce: lisans meselesi

Bu, çoğu eğitimin atladığı kısımdır, bu yüzden önce bunu halledeyim. Sahip olmadığınız bir şarkının coverını yapıyorsanız, o şarkı neredeyse kesinlikle telif hakkı altındadır. Telif hakkıyla korunan bir parçanın yapay zeka tarafından oluşturulan coverını bir yayın platformuna yüklemek veya YouTube'da para kazanmak türev bir eserdir ve bunu lisans veya mekanik haklar izni olmadan yapmak sizi hak talebi veya kaldırmaya dönüşebilecek gri bir bölgeye sokar. Kurallar ülkeye göre değişir, ancak "orijinal sesi örneklemedim" demek sizi otomatik olarak güvenli kılmaz — tanınabilir bir melodi veya söz hâlâ korunmaktadır.

En güvenli zemin: kendi materyalinizin coverını yapın, türev çalışmalara izin veren Creative Commons lisanslı şarkıların coverını yapın veya kamu malına geçmiş bestelerin coverını yapın (ABD'de bu genellikle telif hakkı süresi dolmuş eserler anlamına gelir — belirli parça için araştırın). Çağdaş bir şeyin coverını yapıp ticari olarak yayınlamak istiyorsanız, mekanik lisanslama işleyen hizmetlere bakın. Kişisel, para kazanılmayan kullanım için risk daha düşüktür, ancak bir projeye saatler yatırmadan önce nerede durduğunuzu bilmeye değer.

1. Adım: nefes alacak yer bırakacak bir referans seçin

Her şarkı cover olarak işe yaramaz. Süreçten sağ çıkma eğiliminde olanlar yapısal olarak basittir: net bir melodik çizgi, yönetilebilir sayıda akor değişikliği, duygusal etkisi için prodüksiyon dokusuna minimal bağımlılık. Akustik baladlar, üç akarlı folk şarkıları ve soyulmuş yumuşak pop doğal adaylardır. İyi bir melodi kendini çok farklı enstrümantasyon genelinde taşıyabilir. Sadelik üzerine kurulu güzel bir şarkı genellikle hemen her stilde ilginç gelecektir.

Cover yapmaya direnç gösteren şarkılar, orijinal prodüksiyonun şarkının kendisi olduğu şarkılardır. Bohemian Rhapsody gerçekten bir melodi değildir — deneyimden ayrılamaz olan birbiriyle etkileşen düzenlemeler, vokal katmanlar ve dinamik değişimlerden oluşan bir duvardır. 2010'lardan stadyum karışımı rock (yoğun reverb, katmanlı gitarlar, her şey sıkıştırılmış) aynı problemdir. Bu şarkıları iskeletin çizimlerine indirgeyebilirsiniz, ancak çoğu zaman aldığınız şey orijinalden o kadar farklı görünür ki bağlantı kaybolur. Bu her zaman kötü değildir — bazen radikal bir deconstruction ilginçtir — ancak başlarken çoğu insanın beklediğinden çok daha zor bir yaratıcı problemdir.

Kendinize şunu sorun: biri bu şarkıyı akustik olarak bir sokak köşesinde seslendirirse, hâlâ tanınabilir olur mu? Hâlâ sizi etkiler mi? Cevap evet ise, muhtemelen iyi bir adaydır. Cevap "yalnızca stüdyo versiyonunu mükemmel biçimde taklit ederlerse" ise, o şarkı belki bir cover için hazır değildir.

2. Adım: sadece bir tür değil, bir stil özeti yazın

"Caz yap" ifadesi modele neredeyse hiçbir işe yarar şey söylemez. Caz Coltrane'dir ve aynı zamanda otel barındaki piyano ve aynı zamanda bossa nova ve aynı zamanda bebop'tur. Tek kelimelik tür özeti neredeyse her zaman genel bir çıktı üretir, çünkü modelin her şeyi tahmin etmesi gerekir: tempo, enstrümantasyon ağırlığı, vokal yaklaşımı, prodüksiyon yoğunluğu. Tahmin genellikle teknik olarak doğru ve estetik olarak unutulabilir bir şekilde çıkar.

İyi bir stil özeti, duygusal ve sonik dünyayı spesifik bir şeye daraltır. Türü değil, odayı, gecenin saatini, hissi anlatın. Özet ne kadar spesifik ve görsel olursa, modelin gerçek bir yoruma değil, o türdeki her şeyin karıştırılmış bir ortalamasına dönüşmek yerine bir araya gelen seçimler yapma ihtimali o kadar artar.

Gece barı coveri, sabah 4, son sipariş enerjisi. Vokal neredeyse konuşuluyor gibi hissetmeli — alçak, acelesi yok, sanki şarkıcı yüksek sesle düşünüyor gibi. Karışımın çok gerisinde fırçalı snare, neredeyse duyulmaz. Yaylı enstrüman yok. Piyano hafif akort dışı olmalı, eski bir otel lobisinde bulacağınız türden. 3 dakikanın altında tutun.

Bu özet, modele neyi vurgulayacağını ve neyi dışarıda bırakacağını söyler. Ona bir bakış açısı verir. Özetinizin o kadar uzun olması gerekmez, ancak bir bakış açısı taşıması gerekir.

3. Adım: referansı yükleyin ve doğru kontrolleri ayarlayın

Referans sesiniz ve stil özetiniz olduğunda, gerçek render süreci oldukça basittir — ancak bazı ayarlar diğerlerinden daha önemlidir. Aisonggen'in cover üreteci, bir referans ses dosyası ve stil özeti alır ve render etmeden önce ses karakterini, tür ağırlığını ve düzenleme yoğunluğunu ayarlamanıza izin verir. Aynı genel iş akışı mevcut çoğu araçta geçerlidir.

Render etmeden önce kontrol edilmesi gereken bir şey: aracın referans VOKAL'i referans ŞARKI'dan ayırıp ayırmadığıdır. Bazı üreticiler, çıktı sesi için ayrı bir izole vokal (veya bir ses karakteri seçerken) yüklerken yapısal referans olarak tam şarkıyı yüklemenize izin verir. Bu, araçlar arasında önemli bir yetenek farkıdır — sesi ayrıca belirtebilirseniz, orijinalin melodik ve harmonik iskeletini korurken kimin söylediğini değiştirebilirsiniz. Bu kombinasyon genellikle en ikna edici coverları üretir.

Buna yeniyseniz, cover üreticisiyle başlayın ve diğer ayarlara dokunmadan önce stil özetinizi yazın. Özet, herhangi bir kaydırıcıdan daha fazla iş yapar.

4. Adım: paralel kayıtlar render edin ve farklı hoparlörlerde dinleyin

Bir kez render edip taahhütte bulunmayın. Özette veya ses karakterinde küçük değişikliklerle üç veya dört kayıt render edin, ardından karar vermeden önce hepsini dinleyin. Yapay zeka cover üretiminin çıktıda yeterince rastgelelik vardır ki aynı ayarlarla iki render kayda değer biçimde farklı sonuçlar üretebilir. Bunun avantajını kullanın.

En önemli test: telefonunuzda, ahize üzerinden, gürültülü bir odada nasıl duyuluyor? Yapay zeka coverları genellikle stüdyo monitörlerinde veya iyi kulaklıklarda cilalı duyulur, ancak telefon hoparlörlerinde tamamen çöker. Bunun nedeni, yapay zeka tarafından üretilen seslerin çoğunun tam bant genişliğinde netlik için karıştırılmış olmasıdır — düşük frekanslar zenginliğin büyük bir kısmını taşır ve küçük bir hoparlörde düşük frekansı kaybettiğinizde, seste veya enstrümanlarda içi boş veya doğal olmayan bir kalite belirginleşir. Telefon testini geçen kayıt neredeyse her zaman doğru kayıttır, monitörlerde biraz daha az etkileyici gözükse bile.

Ayrıca ekrana bakmadan laptop hoparlörlerinde deneyin. Gözleriniz sizi daha iyi duyulması gereken gibi görünen kayda yönlendirecektir. Bozulmuş bir oynatma sistemindeki kulaklarınız size gerçeği söyleyecektir.

5. Adım: yapay zeka izlerini bulun ve bir yeniden render ya da manuel düzenlemeyle giderin

Mevcut yapay zeka coverları tutarlı başarısızlık kalıplarına sahiptir. Neye kulak vereceğinizi öğrendikten sonra, yayınlamadan önce onları yakalayabilir ve yeniden render mi etmek yoksa bir DAW'da manuel olarak düzeltmek mi gerektiğine karar verebilirsiniz.

  • Aşırı artiküle edilmiş ünsüzler. Ses, insan şarkıcının yapacağından daha sert bir şekilde her T, D ve P'ye basar. Gerçek vokalistler cümle sonlarında ünsüzleri bulanıklaştırır; yapay zeka modelleri çoğu zaman onları keskinleştirir.
  • Sönmeyen vibrato. İnsan vibratosunun hız ve yavaşlaması, nefes ve cümle konumuna bağlı olarak doğal biçimde değişir. Yapay zeka tarafından üretilen vibrato genellikle sabit bir hıza kilitlenir ve orada kalır; bu da uzun notlarda mekanik duyulur.
  • Çok temiz davul vuruşları. Canlı davulda küçük zamanlama tutarsızlıkları ve hayalet vuruşlar vardır. Coverınızdaki davullar ızgara üzerine programlanmış gibi duyuluyorsa, muhtemelen öyledirler ve bu belli olur.
  • Serbest bırakmak yerine kesilen cümle sonları. Şarkıcılar doğal biçimde söner. Yapay zeka vokalleri bazen durur ya da nefesin gerçekte nasıl işlediğiyle uyuşmayan bir şekilde solar.
  • Çok sıkı akort düzeltmesi. Her nota tam akorda oturuyorsa, kayma yok, mikro-infleksiyon yok, hiçbir yerde mavi nota yok, ses söylenmiş değil düzeltilmiş gibi duyulur.

Bunların çoğu, revize edilmiş bir özet kullanarak yeniden render ile (örneğin, "daha rahat ünsüzler, cümlelerin sonunda nefes almasına izin ver") veya sonradan hafif manuel işlemle düzeltilebilir.

Vokaller hakkında bir not: tekinsizlik vadisi karışımdan daha gürültülü

Çoğu yapay zeka coverının yetersiz kaldığı neden enstrümantasyon değil — sestir. Enstrümanlar kusurlu olabilir ve hâlâ doğru hissettirebilir. Hafifçe yanlış bir piyano sesi karakter olarak okunur. Ancak hafifçe yanlış gelen bir ses rahatsız edici olarak okunur. İnsan işitme sistemi, vokal özgünlüğüne son derece duyarlıdır; gerçek ile simüle edilmiş insan konuşması ve şarkısını algılamak için evrimleşmiş bir dizi örüntü tanıma aracımız vardır. Coverınızdaki ses tutmazsa, hiçbir prodüksiyon cilası onu kurtaramaz. Çalışmayan bir vokal üzerinde reverb ve EQ ayarına üç iterasyon harcamayın. Önce farklı bir ses karakteri deneyin, yeniden render edin ve sorunun ortadan kalkıp kalkmadığına bakın. Ses karardır.

Ne zaman durulur

Bu, herhangi bir yinelemeli yaratıcı sürecin en zor parçasıdır ve yapay zeka araçları, bir sonraki renderin her zaman sorunları çözebilecek gibi görünmesini sağlayarak bunu daha da zorlaştırır. Bittiğinize dair birkaç işaret:

  • İki farklı renderi dinlediniz ve hangisinin daha iyi olduğunu gerçekten söyleyemiyorsunuz. Bu bir kalite farkı değil, yazı tura.
  • Üç iterasyon önce iyi duyulan ayarları değiştiriyorsunuz ve şimdi yanlış hissettiriyorlar. Bu iyileştirme değil, dinleyici yorgunluğudur.
  • Başka biri dinledi ve nitelendirmesiz yanıt verdi. İlk söyledikleri şey "ama..." ise daha fazla çalışmanız var. Sadece "bu iyi" derlerse, iyidir.
  • Orijinale benzetmeye çalışıyorsunuz. Bu artık bir cover değil.
  • Memnun olmadığınız şey mükemmel bir renderla bile düzeltemeyeceğiniz bir şey — çıktınızdaki bir yürütme problemi değil, kaynak materyaldeki yapısal bir tercih.

Orada durdurun. Dışa aktarın.

Bir cover, bir şarkıya yazılmış bir aşk mektubudur, taklit değil. En iyileri, o şarkının neden önemli olduğunu söyler — neden geri dönmeye değer olduğunu, farklı bir deneyim kümesi veya farklı bir müzikal bağlam aracılığıyla neden farklı duyulduğunu. Başka bir kayıt render etmeden önce, versiyonunuzun henüz bir bakış açısı olup olmadığını sorun. Varsa, muhtemelen sandığınızdan daha yakınsınızdır tamamlanmaya. Yoksa, hiçbir araç ayarı sizin için bir tane ekleyemez. Bu kısım hâlâ sizin getireceğiniz bir şey. Bitmiş bir projenin nasıl görünebileceği konusunda ilham almak için, başkalarının dönüşümlere nasıl yaklaştığını görmek üzere yapay zeka müzik kütüphanesine bakın veya hangi planın düzgün iterasyon yapmak için yeterince render verdiğini görmek üzere fiyatlandırma sayfasını keşfedin.

Bir sonraki parçanız bir ücretsiz prompt uzakta

Stüdyoyu açın, atmosferi yazın, 30 saniyede bitmiş bir şarkı duyun. Başlamak ücretsiz, yayınlamak telifsiz, kart gerekmez.