AISongGen logoAISongGen

Mureka 評測:一個模型能力遠超其產品知名度的 AI 音樂模型

Mureka 的深度實測——人聲優勢(尤其是普通話)、產品 UX 仍然落後的地方,以及它如何透過 API 被存取。

閱讀 7 分鐘

大多數 AI 音樂評論集中在相同的兩三個名字上。Mureka 很少出現在那些對話中——不是因為模型很弱,而是因為圍繞它建立的消費者產品沒有產生同樣的口耳相傳飛輪效應。這個差距值得直接審視,因為產品背後的模型在做幾個更知名競爭對手沒在做的事。

這是一篇關於 Mureka 實際產生什麼、它領先在哪裡,以及產品仍有哪些空間需要彌補的實際評測。

Mureka 是什麼

Mureka 是一個由中國研究團隊建立的 AI 音樂生成模型。像這個領域大多數模型一樣,它接受描述情緒、類型和歌詞內容的文字提示詞,並返回一首完整的歌曲——人聲、樂器、製作形式,一應俱全。

存取它有兩條路線。第一條是 Mureka 產品本身:你登入、輸入提示詞並接收生成音軌的網頁介面。第二條是透過合作夥伴 API——最值得注意的是 302.AI,它將 Mureka 模型作為可調用的端點暴露。這條 API 路線是 Mureka 在不一定出現在行銷材料中的情況下進入多種創作工具和音樂生成產品的方式。

這個區別很重要,因為模型的品質可以與其上面的消費者體驗的品質分開評估。公正地評測 Mureka 意味著同時評測兩者。

透明度說明

aisonggen 透過 302.AI 將部分音樂生成路由到 Mureka。當你使用 AI 音樂生成器AI 翻唱生成器以及本站幾個其他界面時,底層工作的就是這個模型。

這篇評測的存在,是因為這個模型值得一次適當的評估,而非因為我們有任何奉承供應商的利益。Mureka 強的地方,評測就這樣說。不足的地方,評測也這樣說。

實際使用體驗

第一次生成出人意料地好。即使是來自未充分說明的提示詞,預設輸出也傾向於具有一些模型只有在你花半小時調整提示詞後才能產生的凝聚力。編排選擇落在類型預期範圍內,混音不是在相互對抗,人聲相對於伴奏軌道坐在合理的水平。

當提示詞用普通話或粵語寫成時,差異變得尤其明顯。模型的普通話聲樂合成,明顯比大多數競爭工具產生的更自然。聲調落在它們應該在的地方。旋律短句尊重語言的音韻學,而非把它當作一系列音節強行填入明顯為英語優化的模式中。如果你曾聽過西方訓練的模型嘗試普通話,並聽到結果出來音韻混亂——詞語正確,聲調錯誤,節奏錯誤——你就會明白這個差異在實踐中有多重要。

英語輸出也具有競爭力。它不比領先的英語優化模型明顯更好,但足夠接近,以至於大多數聽者不會僅僅因為品質原因就立即尋找競爭對手。

樂器混音因類型而異。電子和流行製作一致地精緻。更多聲學編排——撥弦吉他、稀疏鋼琴——偶爾會顯示出合成感覺稍微不那麼自然主義的裂縫,儘管這是整個領域普遍存在的限制,並非特定於 Mureka。

優勢

CJK 語言的人聲品質。這是 Mureka 最清楚的競爭優勢。模型產生的普通話人聲,感覺像是在演唱而非合成,具有其他模型在可比較水平上無法匹敵的聲調準確性和旋律塑形。對於粵語、日語和韓語內容,優勢是真實的但稍微小一些——仍然明顯優於沒有以可比較關注度訓練這些語言的模型。

類型流暢性。流行、R&B 和饒舌都產生自信地坐在其類型慣例中的結果。模型顯然是在廣泛的製作風格範圍上訓練的,輸出反映了那個範圍,而非預設到單一的美學。

面向建構者的 API 可用性。302.AI 的 API 層意味著 Mureka 的能力對任何建立音樂產品的人都可以獲取,而無需協商直接合作夥伴關係。這對小團隊和獨立開發者來說是一個實際優勢,他們需要一個可以程式化調用的有能力模型。本站的 AI 饒舌生成器文字轉語音界面是當強大的底層模型可透過 API 獲取時成為可能的例子。

一致性。跨生成的變異比一些競爭模型低。你不太可能得到完全損壞的輸出,這在你生成多個版本並從中選擇時很重要。

Mureka 仍有成長空間的地方

消費者產品 UX。Mureka 產品介面很簡陋。它做了它需要做的事,但缺乏 Suno 介面的精緻和周到——生成過程中的視覺反饋、庫管理、分享音軌或分叉變體的便利。對於需要成品工具而非有能力模型的用戶,這個差距是真實的。模型品質可能超過產品品質,這是一個不尋常的處境。

提示詞控制深度。模型能很好地處理廣泛的類型和情緒提示詞。細粒度控制——特定的 BPM、調性、樂器限制、結構段落標記——比一些為這些參數建立了明確結構的工具更不可靠。如果你需要對輸出的精確控制,Mureka 的提示詞介面需要耐心。

生態系統和庫成熟度。圍繞一些競爭對手建立起來的可分享音軌庫、社區功能和發現界面,根本不以同等規模存在於 Mureka 周圍。這部分是時間問題——模型對消費者受眾的可用時間較短——但這意味著讓音樂工具感覺有活力的社區層仍然處於早期。

透過 API 層的定價複雜性。直接產品定價足夠直接。透過 302.AI 的 API 路線,定價涉及合作夥伴的模型和點數結構,疊加在底層模型成本之上。這為在大規模估計每次生成成本時需要考慮的建構者增加了一層複雜性。

定價與存取

Mureka 產品直接提供,有訂閱和基於點數的選項。透過 302.AI 的存取增加了合作夥伴 API 定價層,該層根據模型版本和輸出參數而變化。評估 API 路線的建構者在規劃每次生成成本時應考慮這個結構。對於偏好單一清晰定價界面的終端用戶,在內部處理 API 層的消費者工具——例如 aisonggen 的定價結構——通常是更簡單的選擇。

適合 Mureka 的人

普通話音樂創作者。如果製作普通話音樂是你的主要目標,Mureka 是目前獨立創作者可以獲取的最強大的模型。人聲自然度的差異足夠大,不是一個邊緣考量——它在物質上影響輸出是否可用。

尋找 API 的建構者。302.AI 路線使 Mureka 無需直接合作夥伴關係即可獲取。對於將音樂生成整合到產品中的開發者,這是透過標準 API 介面可獲取的較有能力的模型之一。

任何比起介面更關心人聲品質的人。如果你優先考慮輸出的聲音而非生成介面有多順暢,即使意味著忍受不那麼精緻的產品界面,Mureka 也值得直接測試。

對於使用 Mureka 作為其底層提供者之一的更完整的消費者界面——與其他模型一起,在所有生成類型之間具有一致的 UX——aisonggen 上的 AI 音樂生成器AI 翻唱生成器歌詞工作室在一個地方處理提示詞、生成、庫和分享層。

總結

Mureka 是一個強大的模型,攜帶著一個仍在趕上它的產品。聲樂合成——尤其是普通話——是它相對於大多數西方競爭對手持有的最清楚的技術領先,那個優勢不是微不足道的。英語輸出具有競爭力。類型流暢性廣泛。消費者產品 UX 和生態系統深度是誠實的弱點,如果你需要的是成品工具而非有能力的模型,它們是真實的弱點。

如果普通話人聲對你很重要,就測試 Mureka。如果你是一個需要透過 API 獲取強大模型的建構者,就測試 Mureka。如果你需要使用有能力模型但不需要自己管理 API 層的精緻消費者體驗,就看看在它之上構建了什麼。

你的下一首歌,只差一個免費 prompt

打開工作室、輸入氛圍,30 秒後聽見一首完整的歌。免費開始、免授權上架,不需信用卡。