AISongGen logoAISongGen

כיצד לעשות קאברים עם AI שלא נשמעים רק כמו ריקוד

בחרו את ההפניה הנכונה, את הבריפינג הסגנוני הנכון, ואת המקום הנכון לעצור. מדריך מעשי לעשיית קאבר שעומד בו.

8 דקות קריאה

קאבר שעובד הוא פרשנות אמנותית ייחודית של שיר של מישהו אחר — זווית שונה, דגש רגשי שונה, אולי ז'אנר שונה לגמרי. כשהוא נוחת, שומעים את העצמות של המקור ומשהו חדש בו-זמנית. קאבר שלא עובד הוא רק אותו שיר עם מיקס עכור וקול שנשמע קצת לא-במקום. ההבדל ביניהם כמעט אף פעם אינו הכלי שבו השתמשתם. זה הבחירות שעשיתם לפני שלחצתם על Render.

גנרטורי קאבר עם AI הפכו אותה לקלה באמת לקחת יצירת מוזיקה ולבנות אותה מחדש בקול, סגנון, או סידור שונים. אבל גישה קלה יותר לתהליך לא משפרת אוטומטית את הפלט. אתם עדיין צריכים לדעת אילו שירים ראויים לקאבר, כיצד לכתוב בריפינג סגנוני שנותן למודל משהו אמיתי לעבוד איתו, ומתי להפסיק להתעסק ולהגיד שגמרנו. מדריך זה מכסה את כל זה, צעד אחר צעד.

לפני שמתחילים: שאלת הרישיון

זהו החלק שרוב המדריכים מדלגים עליו, אז בואו נסיים אותו קודם. אם אתם מכסים שיר שאינו בבעלותכם, אותו שיר כמעט בוודאי מוגן זכויות יוצרים. פרסום קאבר שנוצר על ידי AI של טראק מוגן זכויות יוצרים על פלטפורמת הזרמה או ייצור כסף ממנו ביוטיוב הוא יצירה נגזרת, ועשיית זאת ללא רישיון או אישור מכאני מעמידה אתכם באזור אפור שיכול להפוך לתביעת זכויות או הסרה. הכללים משתנים לפי מדינה, אבל "לא דגמתי את האודיו המקורי" לא הופך אתכם אוטומטית לבטוחים — מלודיה מזוהה או מילים עדיין מוגנות.

הקרקע הבטוחה ביותר: כסו את החומר שלכם, כסו שירים ברישיון Creative Commons המאפשר נגזרות, או כסו קומפוזיציות שעברו לנחלת הכלל (בארה"ב, זה בדרך כלל אומר יצירות שזכויות היוצרים שלהן פגו — בדקו לפיסה הספציפית). אם רוצים לכסות משהו עכשווי ולהוציא אותו מסחרית, בדקו שירותים שמטפלים ברישוי מכאני. לשימוש אישי ולא-מייצר-כסף, הסיכון נמוך יותר, אבל עדיין כדאי לדעת איפה אתם עומדים לפני שמשקיעים שעות בפרויקט.

שלב 1: בחרו הפניה שיש לה מקום לנשום

לא כל שיר עובד כקאבר. אלה שנוטים לשרוד את התהליך הם פשוטים מבנית: קו מלודי ברור, מספר ניתן לניהול של שינויי אקורד, תלות מינימלית במרקם הפקה לפני אפקט רגשי. בלדות אקוסטיות, שירי פולק שלושת-אקורדים, ופופ רך מוקלף הם מועמדים טבעיים. מלודיה טובה יכולה לשאת את עצמה על פני אינסטרומנטציה שונה מאוד. שיר נהדר שנבנה סביב פשטות ישמע בדרך כלל מעניין כמעט בכל סגנון.

השירים שמתנגדים לקאבר הם אלה שבהם ההפקה המקורית היא השיר. Bohemian Rhapsody אינה בעצם מלודיה — היא קיר של סידורים מקיימי-יחסים, שכבות ווקאל, ושינויים דינמיים הבלתי-נפרדים מהחוויה. ר-&-בי של ספורט-מן-אצטדיון מהשנות ה-2010 (reverb צפוף, גיטרות משוכבות, הכל דחוס) היא אותה בעיה. ניתן לפשט את השירים האלה לעצמות, אבל מה שמקבלים לעיתים קרובות נשמע כל כך שונה מהמקור שהקשר אבד. זה לא תמיד רע — לפעמים פירוק רדיקלי מעניין — אבל זו בעיה יצירתית הרבה יותר קשה ממה שרוב האנשים מצפים כשמתחילים.

שאלו את עצמכם: אם מישהו היה מבצע את השיר הזה אקוסטית בפינת רחוב, האם הוא עדיין היה מזוהה? האם הוא עדיין היה מרגש אתכם? אם כן, כנראה שזה מועמד טוב. אם התשובה היא "רק אם הם מחקו בדיוק את גרסת הסטודיו," אולי השיר הזה לא מוכן לקאבר.

שלב 2: כתבו בריפינג סגנוני, לא רק ז'אנר

"הפכו את זה לג'אז" לא אומר למודל כמעט כלום שימושי. ג'אז הוא Coltrane והוא גם הפסנתר בבר הוטל וגם בוסה נובה וגם ביבופ. בריפינג ז'אנר של מילה אחת כמעט תמיד מייצר פלט גנרי, כי המודל צריך לנחש הכל: טמפו, משקל אינסטרומנטציה, גישת ווקאל, צפיפות הפקה. הניחוש בדרך כלל נכון בצורה נכונה טכנית ונשכחת אסתטית.

בריפינג סגנוני טוב מצמצם את העולם הרגשי והצלילי למשהו ספציפי. במקום הז'אנר, תארו את החדר, שעת הלילה, התחושה. ככל שהבריפינג ספציפי ויזואלי יותר, כך סביר יותר שהמודל יעשה בחירות שמתחברות לפרשנות אמיתית ולא לממוצע מטושטש של כל מה שבאותו ז'אנר.

קאבר בר-פסנתר מאוחר-לילה, 4 לפנות בוקר, אנרגיה של שיחת אחרונה. הווקאל צריך להרגיש כמעט מדובר — נמוך, ללא מהירות, כאילו הזמר רק חושב בקול. סנר מוברש רחוק מאוד במיקס, בקושי שמיע. ללא כינורות. פסנתר צריך להישמע מעט לא-מכוון, מהסוג שמוצאים בלאונג' מלון ישן. שמרו פחות מ-3 דקות.

הבריפינג הזה אומר למודל מה להדגיש ומה להשאיר בחוץ. הוא נותן לו נקודת מבט. הבריפינג שלכם לא צריך להיות כל כך ארוך, אבל הוא צריך להיות עם נקודת מבט.

שלב 3: העלו את ההפניה והגדירו את הפקדים הנכונים

ברגע שיש לכם אודיו הפניה ובריפינג סגנוני, תהליך הרנדור בפועל הוא פשוט למדי — אבל כמה הגדרות חשובות יותר מאחרות. גנרטור הקאברים של aisonggen מקבל קובץ אודיו הפניה ובריפינג סגנוני ומאפשר לכוון אופי קול, משקל ז'אנר וצפיפות סידור לפני הרנדור. אותו תהליך עבודה כללי חל ברוב הכלים הנוכחיים.

דבר אחד שכדאי לבדוק לפני שמרנדרים: האם הכלי מפריד בין ווקאל ההפניה לבין שיר ההפניה. חלק מהגנרטורים מאפשרים להעלות את השיר השלם כהפניה מבנית בזמן שמעלים ווקאל מבודד נפרד (או בוחרים אופי קול) לקול הפלט. זהו פער יכולת משמעותי בין כלים — אם ניתן לציין את הקול בנפרד, ניתן לשנות מי שר תוך שמירה על השלד המלודי וההרמוני של המקור שלם. השילוב הזה בדרך כלל מייצר את הקאברים המשכנעים ביותר.

אם אתם חדשים לזה, התחילו עם גנרטור הקאברים וכתבו את הבריפינג הסגנוני לפני שנוגעים בהגדרה אחרת. הבריפינג עושה יותר עבודה מכל מחוון.

שלב 4: רנדרו לקאפים מקבילים והאזינו בצגים שונים

אל תרנדרו פעם אחת ותתחייבו. רנדרו שלושה או ארבעה לקאפים עם וריאציות קטנות בבריפינג או באופי הקול, ואז האזינו לכולם לפני שמחליטים. לגנרציית קאבר עם AI יש מספיק אקראיות בפלט ששני רנדורים עם הגדרות זהות יכולים לייצר תוצאות שונות ניכרות. נצלו את זה.

הבדיקה שהכי חשובה: איך זה נשמע בטלפון, דרך הרמקול, בחדר רועש? קאברים עם AI לעיתים קרובות נשמעים מלוטשים על צגים אוליינים או אוזניות טובות ואז מתפרקים לחלוטין ברמקולי טלפון. זה בגלל שרוב האודיו שנוצר על ידי AI ממוקס לבהירות ברוחב פס מלא — החלק התחתון נושא הרבה מהעושר, וכשמאבדים את החלק התחתון בצג קטן, איכות חלולה או לא-טבעית בקול או בכלים הופכת לברורה. הלקאפ ששורד את בדיקת הטלפון הוא כמעט תמיד הלקאפ הנכון, גם אם נשמע מעט פחות מרשים בצגים.

נסו גם בצגי מחשב נייד ללא הסתכלות על המסך. העיניים שלכם ידחפו אתכם לכיוון הלקאפ שנראה כאילו אמור להישמע טוב יותר. האוזניים שלכם על מערכת השמעה גרועה יגידו לכם את האמת.

שלב 5: זהו את סממני ה-AI ותקנו אותם עם רנדור מחדש או עריכה ידנית

לקאברים עם AI הנוכחיים יש דפוסי כשל עקביים. ברגע שיודעים מה לשמוע, ניתן לתפוס אותם לפני פרסום ולהחליט האם לרנדר מחדש או לתקן ידנית ב-DAW.

  • עיצוריות מוגזמות. הקול פוגע בכל T, D, ו-P חזק יותר ממה שזמר אנושי היה עושה. זמרים אמיתיים מטשטשים עיצוריות בקצות ביטויים; מודלי AI לעיתים קרובות מחדדים אותם.
  • ויברטו שלא מתדעך. ויברטו אנושי מאיץ ומאט באופן טבעי בהתאם לנשימה ומיקום הביטוי. ויברטו שנוצר על ידי AI לעיתים קרובות נועל בקצב קבוע ונשאר שם, מה שנשמע מכני על תווים ממושכים.
  • מכות תוף שנקיות מדי. תיפוף חי כולל אי-עקביויות תזמון קטנות ומכות פנטום. אם התופים בקאבר שלכם נשמעים כאילו תוכנתו על גריד, הם כנראה כן, וזה ניכר.
  • סיומי ביטויים שנחתכים במקום משתחררים. זמרים מתגוונים באופן טבעי. ווקאל AI לפעמים פשוט עוצר, או מתגוון בצורה שלא מתאימה לאופן שבו הנשימה עובדת בפועל.
  • תיקון גובה-צליל שדוק מדי. אם כל תו נוחת בדיוק על גובה-צליל, ללא גלישה, ללא מיקרו-אינפלקציה, ללא תו כחול בשום מקום, הקול נשמע מתוקן ולא שרוי.

רוב הדברים האלה ניתנים לתיקון עם רנדור מחדש באמצעות בריפינג מתוקן (למשל, "עיצוריות רגועות יותר, תנו לביטויים לנשום בסוף") או עם עיבוד ידני קל לאחר מכן.

הערה על ווקאל: עמק המדאיג רועש יותר מהמיקס

הסיבה שרוב הקאברים עם AI נופלים אינה האינסטרומנטציה — זה הקול. כלים יכולים להיות לא-מושלמים ועדיין להרגיש נכון. חלוקת פסנתר קצת לא-במקום נקראת כאופי. אבל קול שקצת לא-נכון נקרא מטריד. מערכת השמיעה האנושית רגישה מאוד לאותנטיות ווקאלית; יש לנו סט שלם של כלי זיהוי-דפוס שהתפתחו לזיהוי דיבור ושירה אנושי אמיתי לעומת מדומה. אם הקול בקאבר שלכם לא נוחת, אין כמות של ברק הפקה שתציל אותו. אל תבלו שלוש איטרציות בכוונון ה-reverb וה-EQ על ווקאל שלא עובד. נסו קודם אופי קול שונה, רנדרו מחדש, ובדקו אם הבעיה נעלמת. הקול הוא ההחלטה.

מתי לעצור

זה החלק הקשה ביותר בכל תהליך יצירתי איטרטיבי, וכלי AI מחמירים אותו על ידי כך שתמיד נראה שהרנדור הבא עשוי להיות זה שיתקן את הכל. כמה אותות שגמרתם:

  • האזנתם לשני לקאפים שונים ובאמת לא ניתן לדעת מי טוב יותר. זה הטלת מטבע, לא הבדל איכות.
  • אתם מכווננים הגדרות שנשמעו בסדר לפני שלוש איטרציות ועכשיו מרגישות לא-נכונות. זה עייפות מאזין, לא שיפור.
  • מישהו אחר האזין לזה והגיב בלי כישורים. אם הדבר הראשון שהם אומרים הוא "אבל..." יש לכם עוד עבודה לעשות. אם הם פשוט אומרים "זה טוב," זה טוב.
  • אתם מנסים לגרום לזה להישמע כמו המקור. זה כבר לא קאבר.
  • הדבר שאתם לא מרוצים ממנו הוא משהו שלא הייתם יכולים לתקן גם ברנדור מושלם — בחירה מבנית בחומר המקורי, לא בעיית ביצוע בפלט שלכם.

עצרו שם. ייצאו.

קאבר הוא מכתב אהבה לשיר, לא זיוף. הטובים ביותר אומרים משהו על הסיבה שהשיר חשוב — מדוע כדאי לחזור אליו, מדוע הוא נשמע שונה דרך סט ניסיונות שונה או הקשר מוזיקלי שונה. לפני שמרנדרים עוד לקאפ, שאלו האם לגרסה שלכם כבר יש נקודת מבט. אם כן, כנראה שאתם קרובים יותר לסיום ממה שאתם חושבים. אם לא, אין הגדרת כלי שתוסיף אחת עבורכם. אותו חלק עדיין שלכם להביא. לנוכח השראה על מה שפרויקט גמור עשוי להיראות, בדקו את ספריית המוזיקה עם ה-AI כדי לשמוע כיצד אחרים ניגשו להמרות, או חקרו את דף התמחור כדי לראות איזו תוכנית נותנת לכם מספיק רנדורים לאטרה כראוי.

הטראק הבא שלך במרחק פרומפט חינמי אחד

פתח את הסטודיו, הקלד את התחושה, שמע שיר מוגמר תוך 30 שניות. חינם להתחלה, נטול תמלוגים לשליחה, אין צורך בכרטיס אשראי.