AISongGen logoAISongGen

Πώς να φτιάξετε cover τεχνητής νοημοσύνης που δεν μοιάζουν απλώς με remix

Επιλέξτε τη σωστή αναφορά, τη σωστή περιγραφή ύφους και το σωστό σημείο διακοπής. Μια πρακτική οδηγία για να φτιάξετε ένα cover που αντέχει.

Χρόνος ανάγνωσης 8 λεπτά

Ένα cover που λειτουργεί είναι μια διακριτή καλλιτεχνική ερμηνεία του τραγουδιού κάποιου άλλου — διαφορετική γωνία, διαφορετική συναισθηματική έμφαση, ίσως εντελώς διαφορετικό είδος. Όταν προσγειώνεται, ακούτε τον σκελετό του πρωτοτύπου και κάτι νέο ταυτόχρονα. Ένα cover που δεν λειτουργεί είναι απλώς το ίδιο τραγούδι με μια θολή μίξη και μια φωνή που ακούγεται ασαφώς λανθασμένη. Η διαφορά μεταξύ των δύο σχεδόν ποτέ δεν είναι το εργαλείο που χρησιμοποιήσατε. Είναι οι επιλογές που κάνατε πριν πατήσετε render.

Οι δημιουργοί cover τεχνητής νοημοσύνης έχουν κάνει πραγματικά εύκολο να πάρετε ένα μουσικό κομμάτι και να το ανακατασκευάσετε σε διαφορετική φωνή, ύφος ή διάταξη. Αλλά η ευκολότερη πρόσβαση στη διαδικασία δεν βελτιώνει αυτόματα την έξοδο. Εξακολουθείτε να χρειάζεστε να γνωρίζετε ποια τραγούδια αξίζει να καλύψετε, πώς να γράψετε μια περιγραφή ύφους που να δίνει στο μοντέλο κάτι πραγματικό να δουλέψει και πότε να σταματήσετε να τρυπώνετε.

Πριν ξεκινήσετε: το ζήτημα αδειοδότησης

Αυτό είναι το μέρος που παραλείπουν τα περισσότερα εκπαιδευτικά, οπότε ας το τελειώσουμε πρώτα. Αν καλύπτετε ένα τραγούδι που δεν σας ανήκει, αυτό το τραγούδι είναι σχεδόν βέβαια υπό πνευματικά δικαιώματα. Η δημοσίευση ενός cover που δημιουργήθηκε από τεχνητή νοημοσύνη ενός τραγουδιού που προστατεύεται από πνευματικά δικαιώματα σε μια πλατφόρμα streaming ή η δημιουργία χρημάτων από αυτό στο YouTube είναι παράγωγο έργο, και η πράξη αυτή χωρίς άδεια ή εκκαθάριση μηχανικών δικαιωμάτων σας τοποθετεί σε μια γκρίζα ζώνη.

Το ασφαλέστερο έδαφος: καλύψτε το δικό σας υλικό, καλύψτε τραγούδια με άδεια Creative Commons που επιτρέπει παράγωγα ή καλύψτε συνθέσεις που έχουν περάσει στον δημόσιο τομέα. Αν θέλετε να καλύψετε κάτι σύγχρονο και να το κυκλοφορήσετε εμπορικά, εξετάστε υπηρεσίες που χειρίζονται μηχανικές άδειες.

Βήμα 1: επιλέξτε μια αναφορά που έχει χώρο να αναπνέει

Δεν λειτουργεί κάθε τραγούδι ως cover. Αυτά που τείνουν να επιβιώσουν στη διαδικασία είναι δομικά απλά: μια σαφής μελωδική γραμμή, διαχειρίσιμος αριθμός αλλαγών συγχορδιών, ελάχιστη εξάρτηση από την παραγωγή για τον συναισθηματικό αντίκτυπό τους. Ακουστικές μπαλάντες, folk τραγούδια τριών συγχορδιών και ελαφρά soft pop είναι φυσικοί υποψήφιοι.

Τα τραγούδια που αντιστέκονται σε cover είναι αυτά όπου η αρχική παραγωγή ΕΙΝΑΙ το τραγούδι. Το Bohemian Rhapsody δεν είναι πραγματικά μια μελωδία — είναι ένας τοίχος αλληλεπιδρουσών διατάξεων, φωνητικών στρωμάτων και δυναμικών αλλαγών που είναι αδιαχώριστες από την εμπειρία.

Ρωτήστε τον εαυτό σας: αν κάποιος εκτελούσε αυτό το τραγούδι ακουστικά σε μια γωνία δρόμου, θα ήταν ακόμα αναγνωρίσιμο; Θα σας συγκινούσε ακόμα; Αν ναι, είναι πιθανώς καλός υποψήφιος.

Βήμα 2: γράψτε μια περιγραφή ύφους, όχι απλώς ένα είδος

«Κάν' το jazz» δεν λέει σχεδόν τίποτα χρήσιμο στο μοντέλο. Το jazz είναι Coltrane και είναι επίσης το πιάνο στο μπαρ του ξενοδοχείου και είναι επίσης bossa nova και είναι επίσης bebop. Μια περιγραφή ενός μόνο είδους σχεδόν πάντα παράγει μια γενική έξοδο.

Μια καλή περιγραφή ύφους στενεύει τον συναισθηματικό και ηχητικό κόσμο σε κάτι συγκεκριμένο. Αντί για το είδος, περιγράψτε τον χώρο, την ώρα της νύχτας, το συναίσθημα. Όσο πιο συγκεκριμένη και οπτική είναι η περιγραφή, τόσο πιο πιθανό είναι το μοντέλο να κάνει επιλογές που συνδέονται σε μια πραγματική ερμηνεία.

Cover για μπαρ πιάνου αργά τη νύχτα, 4 π.μ., ενέργεια τελευταίας κλήσης. Η φωνή πρέπει να νιώθεται σχεδόν ομιλητή — χαμηλή, αδυσώπητη, σαν ο τραγουδιστής να σκέφτεται απλώς δυνατά. Βουρτσισμένη παγίδα πολύ μακριά στη μίξη, μόλις ακουστή. Χωρίς έγχορδα. Το πιάνο πρέπει να ακούγεται ελαφρώς άρτυρο, τέτοιο που θα βρεθεί σε ένα παλιό αίθριο ξενοδοχείου. Κρατήστε το κάτω από 3 λεπτά.

Αυτή η περιγραφή λέει στο μοντέλο τι να τονίσει και τι να αφήσει έξω. Του δίνει μια άποψη. Η περιγραφή σας δεν χρειάζεται να είναι τόσο μεγάλη, αλλά χρειάζεται να έχει άποψη.

Βήμα 3: ανεβάστε την αναφορά και ορίστε τα σωστά χειριστήρια

Μόλις έχετε τον ήχο αναφοράς και την περιγραφή ύφους, η πραγματική διαδικασία απόδοσης είναι αρκετά απλή — αλλά μερικές ρυθμίσεις έχουν σημασία περισσότερο από άλλες. Ο δημιουργός cover του aisonggen παίρνει ένα αρχείο ήχου αναφοράς και μια περιγραφή ύφους και σας επιτρέπει να ρυθμίσετε τον χαρακτήρα φωνής, τη βαρύτητα είδους και την πυκνότητα διάταξης πριν την απόδοση.

Ένα πράγμα που πρέπει να ελέγξετε πριν αποδώσετε: αν το εργαλείο χωρίζει τα φωνητικά αναφοράς από το τραγούδι αναφοράς. Ορισμένοι δημιουργοί σάς επιτρέπουν να ανεβάσετε το πλήρες τραγούδι ως δομική αναφορά ενώ ανεβάζετε ξεχωριστά απομονωμένα φωνητικά (ή επιλέγετε έναν χαρακτήρα φωνής) για τη φωνή εξόδου.

Αν είστε νέοι στο θέμα, ξεκινήστε με τον δημιουργό cover και γράψτε την περιγραφή ύφους πριν αγγίξετε οποιαδήποτε άλλη ρύθμιση. Η περιγραφή κάνει περισσότερη δουλειά από οποιοδήποτε ρυτίδι.

Βήμα 4: αποδώστε παράλληλες λήψεις και ακούστε σε διαφορετικά ηχεία

Μην αποδώσετε μια φορά και δεσμευτείτε. Αποδώστε τρεις ή τέσσερις λήψεις με μικρές παραλλαγές στην περιγραφή ή τον χαρακτήρα φωνής, και στη συνέχεια ακούστε όλες πριν αποφασίσετε. Η γένεση cover με τεχνητή νοημοσύνη έχει αρκετή τυχαιότητα στην έξοδο ώστε δύο αποδόσεις με πανομοιότυπες ρυθμίσεις να μπορούν να παράγουν αξιοσημείωτα διαφορετικά αποτελέσματα.

Η δοκιμή που έχει μεγαλύτερη σημασία: πώς ακούγεται στο τηλέφωνό σας, μέσω του ακουστικού, σε θορυβώδη δωμάτιο; Τα cover τεχνητής νοημοσύνης συχνά ακούγονται λαμπερά σε ηχεία στούντιο ή καλά ακουστικά και στη συνέχεια καταρρέουν εντελώς σε ηχεία τηλεφώνου.

Δοκιμάστε το επίσης σε ηχεία laptop χωρίς να κοιτάτε την οθόνη. Τα μάτια σας θα σας σπρώξουν προς τη λήψη που φαίνεται ότι θα πρέπει να ακούγεται καλύτερη. Τα αυτιά σας σε ένα υποβαθμισμένο σύστημα αναπαραγωγής θα σάς πουν την αλήθεια.

Βήμα 5: εντοπίστε τα σημάδια τεχνητής νοημοσύνης και διορθώστε τα με επανα-απόδοση ή μη αυτόματη επεξεργασία

Τα τρέχοντα cover τεχνητής νοημοσύνης έχουν συνεπή μοτίβα αποτυχίας. Μόλις μάθετε τι να ακούτε, μπορείτε να τα πιάσετε πριν δημοσιεύσετε και να αποφασίσετε αν θα επαναποδώσετε ή θα τα διορθώσετε χειροκίνητα σε ένα DAW.

  • Υπερ-αρθρωτά σύμφωνα. Η φωνή χτυπά κάθε T, D και P πιο σκληρά από ό,τι θα έκανε ένας ανθρώπινος τραγουδιστής.
  • Vibrato που δεν φθίνει. Το ανθρώπινο vibrato επιταχύνεται και επιβραδύνεται φυσικά ανάλογα με την αναπνοή και τη θέση φράσης. Το vibrato που δημιουργείται από τεχνητή νοημοσύνη συχνά κλειδώνεται σε σταθερό ρυθμό.
  • Χτυπήματα τυμπάνων που είναι πολύ καθαρά. Το ζωντανό κρουστό χαλαρό τύπος έχει μικρές ανακρίβειες χρονισμού και ghost hits.
  • Τέλη φράσεων που κόβονται αντί να απελευθερώνονται. Οι τραγουδιστές εξασθενίζουν φυσικά. Τα φωνητικά τεχνητής νοημοσύνης μερικές φορές απλώς σταματούν.
  • Διόρθωση τόνου που είναι πολύ σφιχτή. Αν κάθε νότα προσγειώνεται ακριβώς στον σωστό τόνο, χωρίς γλίστρημα, χωρίς micro-inflection, χωρίς μπλε νότα πουθενά, η φωνή ακούγεται διορθωμένη αντί για τραγουδιστή.

Τα περισσότερα από αυτά είναι επιδιορθώσιμα με επανα-απόδοση χρησιμοποιώντας μια αναθεωρημένη περιγραφή (π.χ., «πιο χαλαρά σύμφωνα, αφήστε τις φράσεις να αναπνέουν στο τέλος») ή με ελαφριά μη αυτόματη επεξεργασία.

Μια σημείωση για τα φωνητικά: η κοιλάδα του παράξενου είναι πιο δυνατή από τη μίξη

Ο λόγος που τα περισσότερα cover τεχνητής νοημοσύνης υπολείπονται δεν είναι η ενορχήστρωση — είναι η φωνή. Τα όργανα μπορούν να είναι ατελή και να εξακολουθούν να νιώθουν σωστά. Μια ελαφρώς λανθασμένη φωνή πιάνου διαβάζεται ως χαρακτήρας. Αλλά μια φωνή που είναι ελαφρώς λανθασμένη διαβάζεται ως ανησυχητική. Το ανθρώπινο ακουστικό σύστημα είναι εξαιρετικά ευαίσθητο στη φωνητική αυθεντικότητα. Αν η φωνή στο cover σας δεν προσγειώνεται, καμία ποσότητα παραγωγικής λαμπρότητας δεν θα το σώσει.

Πότε να σταματήσετε

Αυτό είναι το δυσκολότερο κομμάτι οποιασδήποτε επαναληπτικής δημιουργικής διαδικασίας, και τα εργαλεία τεχνητής νοημοσύνης το κάνουν χειρότερο κάνοντας την επόμενη απόδοση να φαίνεται πάντα ότι μπορεί να είναι αυτή που διορθώνει τα πράγματα. Μερικά σήματα ότι έχετε τελειώσει:

  • Έχετε ακούσει δύο διαφορετικές αποδόσεις και πραγματικά δεν μπορείτε να πείτε ποια είναι καλύτερη. Αυτό είναι ρίψη κέρματος, όχι ποιοτική διαφορά.
  • Ρυθμίζετε ρυθμίσεις που ακούγονταν καλά τρεις επαναλήψεις πριν και τώρα αισθάνονται λάθος. Αυτή είναι κόπωση ακροατή, όχι βελτίωση.
  • Κάποιος άλλος το άκουσε και ανταποκρίθηκε χωρίς προϋποθέσεις. Αν το πρώτο πράγμα που λένε είναι «αλλά...» έχετε περισσότερη δουλειά να κάνετε. Αν απλώς λένε «είναι καλό», είναι καλό.
  • Προσπαθείτε να το κάνετε να ακούγεται σαν το πρωτότυπο. Αυτό δεν είναι πια cover.
  • Αυτό που σας δυσαρεστεί είναι κάτι που δεν θα μπορούσατε να διορθώσετε ακόμα και με μια τέλεια απόδοση — μια δομική επιλογή στο πηγαίο υλικό, όχι ένα πρόβλημα εκτέλεσης στην έξοδό σας.

Σταματήστε εκεί. Εξαγάγετε.

Ένα cover είναι μια ερωτική επιστολή προς ένα τραγούδι, όχι μια απομίμηση. Τα καλύτερα λένε κάτι για το γιατί έχει σημασία αυτό το τραγούδι — γιατί αξίζει να επιστρέψει κανείς σε αυτό. Πριν αποδώσετε μια άλλη λήψη, ρωτήστε αν η έκδοσή σας έχει ήδη άποψη. Αν ναι, είστε πιθανώς πιο κοντά στο να τελειώσετε από ό,τι νομίζετε. Αν όχι, καμία ρύθμιση εργαλείου δεν θα σας την προσθέσει. Αυτό το κομμάτι εξακολουθεί να είναι δικό σας. Για έμπνευση για το πώς μπορεί να μοιάζει ένα τελικό έργο, δείτε τη βιβλιοθήκη μουσικής τεχνητής νοημοσύνης για να ακούσετε πώς άλλοι προσέγγισαν μεταμορφώσεις, ή εξερευνήστε τη σελίδα τιμολόγησης για να δείτε ποιο πλάνο σάς δίνει αρκετές αποδόσεις για να επαναλάβετε σωστά.

Το επόμενό σας κομμάτι είναι ένα δωρεάν prompt μακριά

Ανοίξτε το studio, πληκτρολογήστε το vibe, ακούστε ολοκληρωμένο τραγούδι σε 30 δευτερόλεπτα. Δωρεάν για να ξεκινήσετε, χωρίς δικαιώματα για να παραδώσετε, καμία πιστωτική κάρτα δεν απαιτείται.