歌詞の感情分析シリーズ、第2回です。前回の記事では、「The Beatles」の歌詞に対する感情分析を行いましたが、今回は、「Queen」の歌詞についてです。
以下では、ボーカルのフレディ・マーキュリーが存命中の1973年から1991年のアルバムに収録された楽曲、138曲を分析対象としています。(歌詞がないインストルメンタルは除いています。)
感情分析のレポート(Sentiment Summary)
「The Beatles」のときと同様に、感情分析した結果のサマリーを参照しています。

オレンジっぽい色で塗られているものがポジティブを、青色っぽい色で塗られているものがネガティブを意味しています。右上にある感情スコアのヒストグラム(Score of Documents with New Sentiment)をみると、やはりポジティブな楽曲が多いことがわかります。
このレポートでは、かの有名な楽曲 ”Bohemian Rhapsody” の歌詞に対し、感情を示す単語を抽出し、スコア化しています。右下のDocument Sentimentsの欄をみると、"love(s)"、"easy" がポジティブな感情を示す単語として、"poor" がネガティブな感情を示す単語として抽出されていることがわかります。
歌詞の長さを考慮した感情スコアを算出
歌詞に関する感情スコアを考えるとき、歌詞の長さを考慮し、歌詞に含まれる単語あたりの感情スコアを算出するのが公平だと思います。そこで、以下の式のように、単語あたりの感情スコア(Overall Score by Word Count)を算出します。
Overall Score by Word Count = (Positive Sum(ポジティブな単語スコアの合計) + Negative Sum(ネガティブな単語スコアの合計) ) ÷ 単語数
この式で作成された楽曲の感情スコアについて、ヒストグラムと要約統計量を示します。
ここでは、何かしらポジティブかネガティブな感情があった楽曲のみを対象としているため、分析対象の138曲から30曲が対象外となり、N数は108となっています。

スコアが0未満(Negative)の楽曲は13曲で、全体の12%です。スコアの平均は1.22であり、中央値は0.72です。ヒストグラムをみても、0から2.5の階級に多くの楽曲が属していることがわかります。全体的にはポジティブな楽曲が多いと考えてよいでしょう。
メンバー4人で、感情の起伏が激しいのは?
本分析対象当時(1973~1991)のQueenのメンバーはフレディ・マーキュリー、ブライアン・メイ、ロジャー・テイラー、ジョン・ディーコンの4名ですが、全員が作詞、作曲に関わっており、それぞれヒット曲を世に送り出しています。
そこで、作詞者が明確に分かっている楽曲について、メンバー別に分けたときの分布をバイオリンプロットで表してみます。

※映画 "Bohemian Rhapsody" の一コマにもありましたが、後期のQueenの楽曲は、メンバー4名の連名でクレジットされています。そのため、明確な作詞者が分かっていないのが残念です。
このグラフをみると、フレディについては、他のメンバーに比べて値の範囲が大きいことが分かります。この結果だけみると、感情の起伏が激しいとでも言えるでしょうか。
ただし、この感情の高い、低いは、特定の感情表現を繰り返し用いていることによります。スコアが高く、グラフ上で凡例をつけた3つの楽曲は、"Love" が多用されています。最もスコアが高い "Get down, Make Love" は、歌詞を見るととても恥ずかしくて、私ではその感情を説明できません(笑)。
また、スコアが最も低い "Bring Back That Leroy Brown" は "Bad" が多用されています。
「The Beatles」の分析でもそうでしたが、感情的な単語を何度も用いたり、リフレインさせるものがスコアとして高くなったり、低くなったりする傾向が高くなります。
そのため、歌詞に対して感情分析して意味があるのか? という疑問も出てきますが、何度も感情的が単語を使っているのは、強い感情を示していると考えることもできるので、多少は意味があると思っています。
おもちゃ屋で、小さい子どもが親におもちゃをせがむとき、"買って"、"買って" と何度も連呼しているのをよく目撃していますので。
「The Beatles」と比較すると
では、「The Beatles」と「Queen」の感情スコアを比較してみましょう。そのために、JMPの「Fit Y by X」(二変量の関係)を実行して、バンドごとのスコアをプロットし、ノンパラメトリック検定(Wilcoxon検定)でスコアの分布を比較してみます。

先ほど、フレディの感情の起伏が激しいと言いましたが、スコアをみると、Beatlesのばらつきの方がはるかに大きいのです。ただ、Wilcoxon検定の結果をみると、有意水準5%で有意差はありません。
中央値をみるとBeatlesは1.04で、Queenは0.72です。どちらもバンドも、総じてポジティブな感情表現をしているが、Beatlesの方が感情の大小があるといえるでしょうか。
次回は、JMP Pro 16の新機能「Term Selection」(単語選択分析)を用いて、2つのバンドが良く使う単語を抽出し、2つのバンドを判別する予測モデルを作成してみます。
by Naohiro Masukawa, JMP Japan
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.