AISongGen logoAISongGen

כיצד לעשות מוזיקת AI שלא נשמעת כמו מוזיקת AI

מדריך מעשי — מזרע הפרומפט עד לטראק שניתן לשים בפלייליסט. ההחלטות, האיטרציות, הדרך לדעת מתי לעצור.

9 דקות קריאה

החלק הקשה בעשיית מוזיקת AI הוא לא לחיצת הכפתור. החלק הקשה הוא לדעת מה לשים לפני שלוחצים עליו, לקרוא את מה שמגיע בחזרה עם כל ביקורת, ולהחליט האם להמשיך או לעצור. רוב האנשים שקוראים למוזיקת AI "גנרית" אינם טועים — הם פשוט עצרו מוקדם מדי בתהליך, או שהם התחילו בלי מספיק בהירות לגבי מה שהם בפועל מנסים לעשות.

זהו מדריך של התהליך שהרצתי דרכו כמה מאות פעמים. הוא מתייחס לגנרציה כאיטרציה, לא כעסקת מכונת ממכר. כשהוא עובד, הפלט לא נשמע כאילו מכונה כתבה אותו. כשהוא נכשל, תדעו בדיוק איזו החלטה לחזור אליה.

החליטו איזה סוג שיר אתם רוצים בפועל

לפני פתיחת כל כלי, שבו עם שאלה אחת: בתוך איזה ניסיון חי השיר הזה? לא "איזה ז'אנר" ולא "איזה ווייב" — אלה מגיעים אחר כך. התחילו עם פרספקטיבה, ואז מקום, ואז המרכז הרגשי של הכובד.

מסגרת פשוטה לכך:

[מי] עושה [מה], הרגע ממש לפני [נקודת מפנה]. הרגש שמתחת הוא [תחושה], לא [תחושת פנים]. שמרו את זה [מילת טון אחת].

ההבחנה בין תחושת פנים לרגש שמתחת היא לא תרגיל כתיבה — היא הוראת גנרטור. שיר על "אבל" נשמע בצורה אחת; שיר על עצבנות ספציפית מחוסר-יכולת לבכות בלוויה נשמע כמו שיר שונה לחלוטין. הספציפיות נסעת לגנרציה בדרכים שתגיות ז'אנר פשוט לא יכולות.

בזמן שאתם עדיין חושבים על נייר, החליטו על אורך. טראק בן שתי דקות וטראק בן ארבע דקות קוראים לבחירות מבניות שונות, והגנרטור ינסח ללא יעד. בחרו אחד לפני שממשיכים.

שלב 1: כתבו פרומפט שמכנה עמדה, לא מרקם

רוב הפרומפטים הראשונים מתארים צליל: "ביט לו-פיי, קלידים חמים, מלנכולי." זה מתאר מה הטראק צריך להרגיש כלפי מאזין שלוש צעדים מהרגש. עמדה מתארת מה המבצע עושה עם גופו ותשומת לבו.

השוו את שניים אלה:

  • פרומפט מרקם: "R&B איטי, פאלסטו רך, שעת לילה, כמיהה."
  • פרומפט עמדה: "מישהו קורא הודעות ישנות שהבטיח לעצמו שימחק. הוא ממשיך לקרוא. הווקאל שקט כאילו הוא לא רוצה שאף אחד ישמע."

שניהם מצביעים על יעד רגשי דומה. פרומפט העמדה נותן למודל משהו לבצע. פרומפט המרקם נותן לו הפניה צלילית ולא יותר. התוצאות אינן שוות.

שמרו פרומפטים של עמדה לשלוש או ארבע משפטים. התקרה נמוכה ממה שחושבים — אחרי כחמש משפטים המודל מתחיל לממוצע על פני ההוראות ולא לבנות עליהן.

שלב 2: בחרו גנרטור שמאפשר לכם להשוות לקאפים

גנרטורים של לקאפ-יחיד עושים איטרציה איטית בצורה ספציפית ומעצבנת: מקבלים תוצאה, היא כמעט-נכונה, מייצרים מחדש עם שינוי קטן, והלקאפ החדש נוחת בכיוון שונה לחלוטין כי לא היה עוגן משותף. בסוף רודפים אחרי הלקאפ המקורי שהיה "כמעט-זה" עבור שישה מחזורים.

הרצת וריאנטים מקבילים פותרת את זה. גנרטור המוזיקה של aisonggen מרנדר חמישה לקאפים בו-זמנית מאותו פרומפט, כך שניתן להשוות אותם זה לצד זה לפני שמתחייבים לכיוון. אם שניים מתוך חמשת הם בטריטוריה הנכונה, כבר דילגתם על רוב לולאת-ה-regenerate.

הערה הוגנת: חמישה לקאפים עולים יותר קרדיטים מאחד. אם יש לכם תקציב קרדיטים הדוק מאוד, הריצו שניים במקום חמישה והתייחסו לאחד כהפניה. הנקודה היא שיהיה לכם לפחות השוואה אחת, לא חמשה.

שלב 3: כתבו או כתבו-ביחד את המילים שלכם קודם

שדה המילים של הגנרטור הוא שדה טקסט קטן, והמודל שרץ מאחוריו בעל הטיה חזקה לשמירת כל מה שנותנים לו — מספר השורות המקורי, תכנית החרוזים המקורית, אפילו דפוס ההברות המקורי. אם כותבים מילים בתוך שדה זה ומחליטים אחר כך שרוצים להוסיף גשר, תתמודדו עם המודל בכל regenerate.

טיוטו מילים בנפרד לפני שמדביקים אותן. Lyric Studio נותן לכם מספיק מקום לראות בפועל מה אתם כותבים. אפשר לתקן בית שלם, לנסות וואו פזמון שונה, להזיז את הפרה-פזמון לפני שהוא הופך מבני — הכל לפני שמוסרים כל דבר לגנרטור.

מילים-קודם גם מאפשרות לבדוק דבר אחד שהגנרטור לא יכול: האם למילות הפזמון יש ריתם דיבור טבעי שזמר יכול לנחות בפועל. קראו את הפזמון שלכם בקול. אם נתקלתם, המודל גם ייתקל.

אם אתם בונים את המילים באופן אינטראקטיבי לצד המוזיקה — פרומפט קודם, עידון מילים שני — תהליך העבודה הזה גם תקף. המפתח הוא שעריכת המילים קורה איפשהו עם שטח עריכה אמיתי, לא בתיבת הטקסט של הגנרטור.

שלב 4: בחרו פקדי סגנון בכוונה

תגיות ז'אנר הן זרעים, לא חוזים. "אינדי פולק" לא נועל את הפלט לאף סגנון הפקה ספציפי — הוא מטה את המודל לכיוון אשכול של צלילים הקשורים לתווית הזו, שהיא נקודת התחלה, לא ערובה. אם רוצים להבין כיצד המודל מפרש בפועל את התגיות האלה לפני שמתחייבים, המדריך על תגיות ז'אנר שווה עשר דקות מהזמן שלכם.

מה שבפועל מגביל את הפלט בצורה אמינה יותר:

  • מצב רוח, נקוב בדיוק. "מרגש-ועצוב" ו"מכור לסדר" נוחתים שונה גם בתוך אותה תגית ז'אנר.
  • סצנה או הגדרה. "חניון ריק בחצות" נותן למהנדס המיקס (המודל כאן) הפניה ויזואלית ל-reverb ומרחב.
  • מין ורגיסטר ווקאלי. רוב הגנרטורים מקבלים הוראות מפורשות כאן, ויברת המחדל אינה תמיד הנכונה עבור המילים שלכם.

הגדירו BPM אם אתם יודעים אותו. לא טווח — מספר. "סביב 90" נותן למודל יותר מדי מקום. "88 BPM" נותן לו שעון. אותו דבר עם אורך הטראק: כתבו את משך היעד במפורש במקום להשאיר אותו לברירת המחדל.

שלב 5: רנדרו, ואז האזינו ברמקול הגרוע ביותר שיש לכם

לטראקים שנוצרו על ידי AI יש מצב כשל ידוע: הם נשמעים טוב יותר באוזניות מכפי שהם מגיעים. שדה הסטראו לרוב רחב, החלק התחתון מבוקר, המיקס נקי בצורה שמתגלה כמלאכותית רק כשמשמעים אותו על משהו לא-סלחני.

אחרי הרנדור הראשון, עברו לרמקול הטלפון שלכם. או למחשב נייד מובנה. או, אם יש לכם גישה לאחד, לסטראו של מכונית עם חלונות פתוחים. הצגים האלה מכווצים את שדה הסטראו, חושפים את בוץ ה-low-mid, ומגלים את הקשיות בטווח ה-mid-high העליון. אם הטראק עדיין נשמע כטראק — לא בהכרח טוב, אבל קוהרנטי — אז יש לכם משהו שווה לעבוד עליו.

אם הוא מתמוטט לעיסה, זה לא תמיד סימן לרנדור מחדש. זה סימן להסתכל על פקדי הסגנון שלכם. תגית ז'אנר כבדה-בתחתון פלוס הגדרת חדר חמה פלוס BPM איטי לעיתים קרובות מייצרים טראק שלא נוסע. כווננו משתנה אחד, לא כל שלושה.

שלב 6: קאבר, רנדור מחדש, או עצירה

לדעת מתי לעצור הוא המיומנות שמפרידה את האנשים שמשחררים מאלה שיש להם ארבע מאות טיוטות שמורות ולא כלום בפלייליסט.

שלושה אותות שלקאפ גמור:

  • הפזמון מושך בפועל. אתם מרגישים את ההגעה לפני שחושבים עליה. אם אתם צריכים להסביר לעצמכם למה הפזמון עובד, הוא לא.
  • הווקאל יושב בכיס. הזמר נשמע כאילו הם שרים את השיר הזה, לא מדגים שהם יכולים לפגוע בתווים האלה. ווקאל AI לעיתים קרובות מבטא עיצוריות יתר על המידה — לקאפ טוב לא עושה זאת.
  • אין סממני AI שמבחינים בהם בהאזנה שלישית. דפוסי תוף נקיים מדי מטרונומית. מעברי אקורד שחסרת להם כל וריאציה ב-velocity. תו מוחזק שלא נושם אף פעם. אלה הסממנים. אחד מהם לרוב מקובל. שלושה הם יותר מדי.

אם הלקאפ עובר שניים מתוך שלושה, עצרו וקראו לו טיוטה. אם עובר את שלושתם, עצרו וקראו לו גמור.

רנדור מחדש הגיוני כשפרמטר ספציפי לא-נכון ואתם יכולים לנקוב בו. "הווקאל בהיר מדי לליריקה" הוא הוראת רנדור מחדש. "משהו מרגיש לא-נכון" הוא לא — זה בעיית האזנה, לא בעיית גנרציה, ועוד לקאפים לא יתקנו אותה.

טעויות נפוצות

  • פרומפט קצר מדי. משפט אחד הוא לא פרומפט; זו תגית ז'אנר עם עטיפת משפט. שלושה משפטים הם המינימום לתוצאה עם כל אופי.
  • פרומפט ארוך מדי. שמונה משפטים של בניית עולם מפורטת נותנים למודל יותר מדי אילוצים לספק בו-זמנית. הוא יממצע אותם ולא יייצר כלום במיוחד.
  • החלפת כלים באמצע איטרציה. לכל גנרטור יש מודל פנימי שונה, ו"אותו פרומפט" מייצר תוצאות שונות מבנית בין כלים. אם מחליפים באמצע סשן, מאפסים את הבסיס להשוואה ומאבדים היסטוריית האיטרציה. בחרו כלי אחד לכל טראק ונשארים שם.
  • רנדור מחדש עם אותם קלטים בציפייה לתוצאה שונה. הוריאציה בפלטים עבור פרומפטים זהים היא אמיתית אבל מוגבלת. אם שלושה לקאפים רצופים כולם לא-נכונים באותה הצורה, הפרומפט הוא הבעיה, לא ה-seed האקראי.
  • התעלמות מאי-התאמת ווקאל. הטמבר, הרגיסטר והאנרגיה הווקאלית המרומזת על ידי המילים שלכם חייבים להתאים לקול שהמודל בוחר. מילים שנכתבו לבריטון גרגרני המגושם על ידי טנור קל היא שגיאת קאסטינג, ואין כמות של רנדור מחדש שמתקנת קאסטינג.

אחרי הטראק הראשון שעובד

הורידו גבעולים אם הכלי מציע אותם. גם אם לא מתכוונים למקס, הפרדת הווקאל והאינסטרומנטלי אומרת שניתן לבצע קול מחדש מאוחר יותר, או למסור את האינסטרומנטלי לזמר אמיתי בלי להתחיל מאפס.

שמרו את הפרומפט בדיוק כפי שהיה כשעבד. לא הגרסה שעברתם דרכה — הגרסה הסופית. העתיקו אותה לקובץ הערות, גיליון אלקטרוני, לכל מקום שאינו בתוך הכלי עצמו. רוב הכלים לא שומרים פרומפטים על פני סשנים בצורה שניתן לחפש בקלות. ספריית המוזיקה עם ה-AI של aisonggen שומרת אוטומטית את היסטוריית הגנרציה שלכם ואת הפרומפטים שייצרו כל טראק, מה שמפחית כמה שצריך לנהל זאת בעצמכם, אבל עדיין כדאי לשמור עותק משלכם של הפרומפטים שייצרו את התוצאות הטובות ביותר שלכם.

תעדו שני דברים לכל טראק שעובד: השילוב של תגית-ז'אנר-מצב-רוח שהשתמשתם בו, וכל ביטוי-עמדה שהרגיש פורה. על פני עשרה או חמישה עשר טראקים, דפוסים צצים — תמצאו שילובי תגיות שמתאימים לטווח היצירתי שלכם ואת הניסוחים שמייצרים בצורה אמינה משהו שווה לשמור. היומן הזה שווה יותר מכל מדריך, כולל זה.

אם אתם רוצים לראות כיצד אנשים אחרים משתמשים בגנרטור לפני שמתחייבים לתהליך העבודה שלכם, דף הביקורות מראה כיצד משתמשים אמיתיים ניגשים לז'אנרים ושימושים שונים.

המטרה אינה לייצר מוזיקה. ייצור מוזיקה הוא החלק הקל עכשיו — כל אחד יכול ללחוץ על הכפתור. המטרה היא לכתוב שירים. שירים שיש להם פרספקטיבה, מרכז רגשי ספציפי, מבנה שמרוויח את הסיום שלו. AI הוא שכבת ההפקה: הוא מטפל בסידור, המיקס, הקול. עדיין אתם צריכים לעשות את הכתיבה. ככל שאתם מביאים יותר מזה לפרומפט, כך פחות ממנו שומעים חסר בפלט.

הטראק הבא שלך במרחק פרומפט חינמי אחד

פתח את הסטודיו, הקלד את התחושה, שמע שיר מוגמר תוך 30 שניות. חינם להתחלה, נטול תמלוגים לשליחה, אין צורך בכרטיס אשראי.