छोटा प्रॉम्प्ट मॉडल से सब कुछ अंदाज़ा लगाने को कहता है। लंबा प्रॉम्प्ट उसी एक लाइन को दबा देता है जो असल में मायने रखती थी। बीच का रास्ता — छह या सात वाक्य जो एक नज़रिया, एक दृश्य और एक फ़ीलिंग का नाम लें — वहीं जनरेशन बैकग्राउंड म्यूज़िक जैसी सुनाई देना बंद करती है और वज़न उठाने लगती है।
पहले नज़रिया तय करें
इंस्ट्रूमेंट से पहले, टेम्पो से पहले, यह तय करें कि गा कौन रहा है और किससे। «सुबह 3 बजे एक नया अभिभावक सोते हुए बच्चे से बात कर रहा है» लिरिक जनरेटर को एक मुद्रा देता है जिसमें वह बैठ सके; «गर्म ऐकूस्टिक इंडी» उसे एक बनावट देता है पर कोई निशाना नहीं। एक बार मुद्रा बन जाए, तो बनावट ख़ुद उसके पीछे आ जाती है।
फिर एक दृश्य रखें
एक अकेली इमेज — किचन काउंटर, ट्रेन की खिड़की, गलियारा, होटल पार्किंग लॉट — एक आम मूड को ख़ास मूड में खींच लाती है। आपको दृश्य समझाने की ज़रूरत नहीं; बस एक थमा दीजिए। मॉडल कोनों को इस तरह भर देगा जैसा आपने नहीं सोचा होगा, और यही वह हिस्सा है जो नतीजे को ऑर्डर किया हुआ नहीं, बल्कि ख़ुद से मिला हुआ महसूस कराता है।
प्रोडक्शन नोट्स आख़िर के लिए बचाएँ
जॉनर, टेम्पो और इंस्ट्रुमेंटेशन प्रॉम्प्ट के अंत में आते हैं, तब जब मॉडल को पहले से पता हो कि गाना किस बारे में है। अगर आप «120 BPM, distorted bass, female vocal» से शुरू करेंगे, तो लिरिक लेयर के पास उगने को कोई जगह नहीं होगी। दृश्य और मुद्रा से शुरुआत कीजिए, और प्रोडक्शन नोट्स जो पहले से वहाँ है उसे बदलने के बजाय धार देंगे।
एक शुरुआती टेम्प्लेट
[कौन], [कहाँ] पर, [क्या] के बारे में सोच रहा/रही है। कोरस तब घूमता है जब उसे एहसास होता है [ट्विस्ट]। मूड है [दो विशेषण]। प्रोडक्शन: [जॉनर], [टेम्पो], [एक प्रोडक्शन डिटेल]।
यह हू-ब-हू कॉपी करने का फ़ॉर्मूला नहीं है — यह उन पाँच फ़ैसलों का चेकलिस्ट है जो प्रॉम्प्ट में होने ही चाहिए, उससे पहले कि मॉडल अपना काम कर सके। इनमें से किसी एक को छोड़िए और नतीजा एक ऐसी कमी से ग्रस्त लगेगा जिसे कितनी भी बार रीजनरेट करने से ठीक नहीं किया जा सकता।