イギリスの有名ロックバンド「The Beatles」,「Queen」の楽曲は、今でもさまざまな場所で流れています。レストランで、テレビのコマーシャルで、スポーツの祭典で、、それを聞くたびに、口ずさんだり、歌ったりする方も多いのではないでしょうか。
彼らの楽曲はシンプルな歌詞ながら、生きていく中で発する感情が代弁されているのかもしれません。"愛は買えないんだ!" とか "俺らはチャンピオンだ!" なんてことを普段の会話では決して言えませんが、歌の歌詞であれば、チャッカリ引用できたりもします。
本ブログシリーズ(全3回を予定)では、「The Beatles」,「Queen」の歌詞に込められている感情や、各バンドで使用されている単語の違いなどを分析してみます。
今回のPart 1では、「The Beatles」の歌詞に関する感情分析を行います。
現時点での最新バージョンである「JMP Pro 16」では、テキスト分析をするプラットフォーム(Text Explorer) のオプションとして、感情分析(Sentiment Analysis)* ができますので、これを使って分析してみましょう。
分析対象として、「The Beatles」の楽曲で、カバー曲、英語以外の曲、解散後の曲などを除いた 171曲の歌詞とします。
* 感情分析は、JMP Proのみの機能です。JMPでは実行できません。さらに感情分析が使える言語は英語のみになります。日本語を分析することはできません。
感情分析のレポート(Sentiment Summary)
感情分析では、文書に含まれる単語に対して、肯定的(ポジティブ)なもの、否定的(ネガティブ)なものを探し、その文章にどれぐらい感情がこもっているかをスコアで表すことができます。例えばアンケートで、お客様が、ある商品の印象を自由回答としてコメントしたとき、それらのコメントがポジティブなのかネガティブなのかを分析する手法として用いられ、ポジネガ分析とも言われています。
下図は、対象となる歌詞について感情分析した結果のサマリーです。
まずは、レポートにある色を意識してください。オレンジっぽい色で塗られているものがポジティブを、青色っぽい色で塗られているものがネガティブを意味しています。
左上のレポートでは、楽曲ごとに感情のスコアが計算されています。ここでは Document = 56 が選択されていますが、私の作成したデータテーブルで56行目にある"Hey, Jude" の歌詞について見ていくことにします。
左下には、"Hey, Jude" の歌詞が示されていますが、ポジティブな単語とネガティブな単語に色が塗られています。さらに、それらの単語には単語ごとにスコアが付けられます*。スコア表は右上に示されます。
これにより"Hey, Jude" の感情スコアを計算すると 、Overall Score の列にある 38点になります。これは、次の式より算出されます。
Overall Score = (Positive Sum(ポジティブな単語スコアの合計) + Negative Sum(ネガティブな単語スコアの合計) ) ÷ 感情の単語と認定された単語の個数
"Hey, Jude" では、ポジティブな単語スコアの合計が520、ネガティブな単語スコアの合計が -100、感情の単語と認定された(色がついた)単語の個数は11個なので、 感情スコアは、(520 - 100) / 11 = 38 点と計算されます。
同様に、他の楽曲に対しても感情スコアが計算され、右上には、感情スコアの分布がヒストグラムで示されます。
* どのような単語がポジティブ/ネガティブかとみなすか、またはそれらのスコアは、JMP Proでデフォルトで決められているものを用いています。分析者が、単語を追加したりスコアを変更することも可能です。
歌詞はポジティブ?ネガティブ?
ただし、今回の歌詞の分析については、歌詞が短いもの(単語数の最小 = 17)から長いもの(単語数の最大 = 293)まであるため、以降では、感情スコアをその歌詞の単語数で割り算した、次のOverall Score by Word Count (単語数あたりの感情スコア) を用います。
Overall Score by Word Count = (Positive Sum(ポジティブな単語スコアの合計) + Negative Sum(ネガティブな単語スコアの合計) ) ÷ 単語数
このようにして計算されたOverall Score by Word Count のヒストグラム、要約統計量を以下に示します。ここでは、何かしらポジティブかネガティブな感情があった楽曲のみを対象としているため、N数は123となっています。
ヒストグラムを見ると、ネガティブ楽曲よりポジティブな楽曲が多く、スコアの平均値は1.67です。総じて、ネガティブな単語より、ポジティブな単語が使われていることがわかります。
レノンのとマッカートニーの詩に込められた感情は?
「The Beatles」の楽曲の多くは、ポール・マッカートニーとジョン・レノンの二人が作詞したと言われています。そこで、前節で計算した感情スコア "Overall Score by Word Count" を、お二人の作詞した楽曲別に比較してみます。
(楽曲の中には、Lennon and McCartney という連名になっているものもありますが、インターネット等の情報から、 どちらが作詞したか分かるものもあり、その場合は、Lennon または McCartney のカテゴリのいずれかに含めています。)
下図は、作詞者がレノン、マッカートニーで分けたときのスコアの分布をバイオリンプロットで表したものです。
図から、マッカートニーは、ネガティブな楽曲が少なく、レノンに比べてポジティブな楽曲がいくつかあることがわかります。一方レノンは、一つだけとてもネガティブな楽曲があることがわかります。
上の図中にラベルで示した、マッカートニーのスコアが高い楽曲の感情を調べてみます。betterやloveという単語を大きく寄与していますね。
一方、レノンのスコアが最も低い楽曲の感情を調べてみます。こんなネガティブ曲があったんですね。
いかがですか? ご存じの通り、一般的に歌詞では、同じ言葉を何度も用いたり、リフレインさせることによって、感情を表現しているものです。そのため、スコアが高い感情表現を何度も繰り返し用いている楽曲がスコアが高かったり、低かったりするのです。
ただ、何度も使っているというのは、それなりに強く感情を表現したいという表れでもあるかと思います。
日本の有名な曲のように、"リフレインが叫んでいる" のです。
次回のブログでは、「Queen」の感情分析と、2つのバンドの感情表現を比較してみます。
by Naohiro Masukawa, JMP Japan