您當前的位置:首頁 > 娛樂

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

作者:由 狗熊會 發表于 娛樂時間:2022-10-29

周杰倫的天王之路

周杰倫——幾代人共同的青春,伴隨著聽眾從孩童到青年,從中年走向老年…周杰倫出道近20年以來,流行樂壇的偶像已經換了一撥又一撥了,但是他依然穩坐在天王的寶座上。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

2000年周杰倫釋出第一張專輯《Jay》,此後至今已經將近

20

個年頭,期間周杰倫一共正式發行專輯

14

張,單曲

400

餘首,唱片銷量

4

次獲得世界音樂大獎

亞洲銷量之王

這些年,周杰倫從那個在鏡頭前要求少說話、多唱歌的羞怯少年,變身霸氣側漏的周董,也一度成為綜藝節目中行走的表情包和段子手,歌詞的風格似乎也越來越放飛自我……

02

土味歌詞瞭解一下

想必每個人心中都有一首印象深刻的周杰倫的歌詞:古典如《青花瓷》,溫情如《聽媽媽的話》,熱血如《龍拳》……土味如《不愛我就拉倒》……

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

《不愛我就拉倒》單曲發行當天,方文山老師的微博隨即被攻陷:

“文山老師,您開個價,給杰倫作詞多少錢,粉絲眾籌!”

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

但是其實不用方文山,AI也能拯救杰倫的土味歌詞!近日《中國好聲音》一位參賽者就用AI改編了周杰倫一首歌的歌詞。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

慢著!說杰倫歌詞土?粉絲不願意了,用AI作詞?杰倫看不下去了……

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

那麼杰倫的詞到底怎麼樣,杰倫的填詞團隊風格又有何不同,AI作詞效果如何?本案例將基於以下資料一探究竟:

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

03

誰來填詞更受歡迎?

數量上,在周杰倫所有歌曲中,方文山填詞的比例最大,其次是周杰倫本人,周杰倫早期和後期的作品中,徐若瑄和黃俊郎的填詞數量也不少。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

論熱度,周董看似與方文山不相上下,但是卻憑藉的是數量較少的作品脫穎而出,實則更甚一籌。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

04

填詞風格之整體比較

要說填詞風格,先從歌名看起,對每首歌的歌名結構進行詞性分析後發現,在所有歌曲中,歌名以名詞和名詞組合命名的歌曲最多,其中每個填詞人最喜歡用的都是以單個名詞來為歌曲命名,最突出的當屬周董了,單個名詞的歌名佔比奇高,幾乎不用動詞。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

將詞性分析推廣應用到全文的分析上可以發現,方文山還是一如既往地比其兩類填詞人更喜歡用名詞,而杰倫雖然在歌名上不喜歡用動詞,但是在歌詞中動詞的使用比例卻是最高的,代詞的使用比例也遠高於其他兩類填詞人。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

05

填詞風格之用詞細節對比

名詞細節對比·方文山的用詞之道

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

方文山用詞喜歡使用抽象詞,比如:感覺、世界、故事。擅長用意象營造,風、花、雨等字眼都是經常用來借物抒情的載體。

《七里香》

那溫暖的陽光 像剛摘的鮮豔草莓

你說你捨不得吃掉這一種

感覺

下整夜 我的愛溢位就像

《東風破》

誰在用琵琶彈奏 一曲東

名詞細節對比·這是酷酷的周杰倫嗎?

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

周杰倫的用詞更加具體和生活化,對親人的依戀更重, 多次寫到“媽媽”、“外婆”這些家人。“眼淚”、“藉口”這些詞表明其感情流露更直接,體現出有感而發的特徵。

《聽媽媽的話》

媽媽

的話別讓她受傷

想快快長大才能保護她

《彩虹》

再給我兩分鐘

讓我把記憶結成冰 別融化了

眼淚

名詞細節對比·其他人中相似的發現

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

其他填詞人的高頻詞如世界、眼淚、感覺,是前兩者的結合。結合詞性使用和高頻詞來看,周杰倫團隊的其他填詞人的用詞風格與方、週二人確實是謎之相似,彷彿二人的合體。

《退後》

缺氧過後的

愛情

粗心的

眼淚

是多餘

信誓旦旦給了承諾 卻被

時間

撲了空

形容詞細節對比·委婉與直白

形容詞是情感流露最直接的體現,但是不同的填詞人使用形容詞的方式仍有差別,有的含蓄委婉,千迴百轉,有的直抒胸臆,有啥說啥:

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

用詞區分度細節對比·以詞識人

每個填詞人都有自己慣用的字詞,有的填詞人用詞的區分度較高,因此透過觀察用詞習慣可能就能判斷作者。此處用TF-IDF來衡量用詞的區分度,對各填詞人用詞的TF-IDF值進行統計後得到下圖:

注:

TF-IDF:評估某字詞對某文件的重要程度,計算步驟是:

TF(詞頻)=某詞出現的次數/該文件中所有詞的數目

IDF(逆文件頻率)=log(語料庫文件總數/(包含該詞的文件數+1))

TF-IDF = TF*IDF

該值較高表示這個詞某填詞人愛用,其他人卻不愛用!因此用來表示區分度。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

方文山的詞中偶有區分度較高的詞,不過大部分詞的TF-IDF值都較低,說明其用詞更具有多樣性。

周杰倫用詞TF-IDF平均值非常高,區分度較高,一般出現食物、地名、親人的歌詞都是周所作。

其他填詞人的歌詞中因為混合了12位不同人的用詞,因此平均區分度也較高,一般出現“愛情”字眼較多的歌詞有可能是出自其他人之手。

06

填詞風格之用句習慣

在古代,詞的創作講究節奏、對仗工整、韻律,到了現代,單句長度、工整程度、句尾用韻限制較少,填詞人可以自由創作,不同的填詞人的用句風格特徵就體現出來了。

用句習慣·句子長度

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

方文山更喜歡寫短句,平均5個字成句,也有兩三字一句的,周杰倫和其他填詞人則更喜歡寫長句,平均長度都在6字以上。

用句習慣·工整程度

此處用單句長度連續一致的句子數佔比的最大值來衡量一首歌的工整程度,計算方式為max(單句長度連續一致的句數)/該首歌的總句數,該比例越大,句子長度連續相等的最大部分的佔比就越大,可視為越工整。

對三類填詞人詞作的工整程度進行統計後得到下圖:

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

方文山的歌詞平均工整程度較周和其他人高,喜歡在一段詞中長時間保持句子長度一致,類似詩詞的創作風格。

周杰倫與其他人的風格比較輕鬆,會出現小範圍的對仗、排比,但是不會刻意大篇幅地規整句子長度,整篇的句子長度屬於錯落有致的風格。

用句習慣·句尾用韻

歌曲的優美程度往往取決於歌詞的押韻程度,押韻次數多、長度長的歌詞朗朗上口,更易傳唱。此處只考慮連續押韻(中途中斷、換韻則視為此次押韻結束)對這三類填詞人的押韻次數和長度進行統計,有如下發現:

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

方文山素以擅長用韻著稱,更有廣受讚譽的素顏韻腳詩流傳,不管是從押韻次數還是押韻長度上都完勝其他兩類填詞人,周杰倫填詞的歌曲雖然押韻次數也比較多,但是長度就是2句或者3句一押的型別,大概可以歸類為隨緣押,不強求~其他人在押韻長度上的能力還是比較強的,但是押韻的次數較少。

當然不同的填詞人“寵愛”的韻腳也有差異,對不同填詞人的不同韻腳使用次數進行統計後有如下發現:

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

i韻喜提“最受寵愛的韻腳”,其他諸如 o,u,an 等都是最常用的韻腳,可能是用字的選擇更多。

i韻

天青色等煙雨

而我在等你

炊煙裊裊升起

隔江千萬裡

在瓶底書漢隸仿前朝的飄逸

就當我為遇見你伏筆

——青花瓷(方文山)

相對來講,方文山對每個韻腳使用比較均勻,此外,一些其他人都不愛用的長韻腳 ang,ing,eng 都是方文山所偏愛的。周杰倫則對 u、an、a 韻情有獨鍾。

ang韻

菊花殘

滿地

你的笑容已泛

花落人斷

我心事靜靜

北風亂夜未

——菊花臺(方文山)

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

07

深度學習生成歌詞

回到最初的目的,如何用AI作詞呢?

要實現自動作詞需要建立一個序列生成模型,因此使用基於LSTM的seq2seq序列模型,將周杰倫所有歌詞資料作為訓練材料對模型進行訓練。

模型訓練完成後,透過給定起始的句子或詞(稱為“種子”)就能得到不同的歌詞輸出結果,一起來看看!

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

讓我們寬容一點,可以看到模型學押韻學得不錯,幾乎每次試驗都能得到押韻的結果。用詞也有一定的瞎湊創新出現,驚喜的是原歌詞中大量的中國風古典韻味也有所體現。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

不過也要正視不足:

缺乏對字詞的理解

,很容易出現句意不通、沒有邏輯等問題。

僅僅是將字詞換一個序列輸出,

沒有承載感情與思想

文學和藝術手法

目前還無法習得,如修辭。

為周杰倫填詞哪家強?——用AI拯救杰倫土味歌詞

最後,獻上幾句歌詞:

手牽手 一步兩步三步四步 望著天 ——周杰倫《星晴》

愁 莫渡江 秋心拆兩半 ——方文山《菊花臺》

致敬杰倫和他的黃金搭檔們!