Choose Language Hide Translation Bar
「信頼性成長」を用い、新型コロナウィルス(COVID-19)の感染者動向を示すモデルをあてはめてみる

本記事では、2020323日時点のデータを用いています。

データの出典:European Centre for Disease Prevention and ControlECDC

 

新型コロナウィルスの勢いが想像以上に猛威を振るっており、米国やヨーロッパでは感染者数が急激に増えていることが報道されています。日本でも日々感染者数は増えてはいますが、米国やヨーロッパのように急激に増えているといった感覚はあまりないかと思います。

 

本記事では各国の感染者数のデータに対しモデルをあてはめ、感染者数の増加度合いを調べてみますが、そのときに、JMPの「信頼性成長」プラットフォームを用いてみます。信頼性? 感染のデータとあまり関係ないのでは? と思われるかもしれませんが、使ってみるといろいろなことがわかりました。

 

「信頼性成長」プラットフォームとは

JMPでは、メニューバーで [分析] > [信頼性/生存時間分析] とたどっていくと、[信頼性成長] のメニューが見つかります。 おそらくJMPのコアユーザでも、あまり馴染みがない機能かもしれません。

 

「信頼性成長」は主にモノやシステムの故障の分析をするプラットフォームです。時間ごとに故障(イベント)がどれぐらい発生したかというデータを元に、ポアソン過程に基づくCrow-AMSAAというモデルをあてはめます。あてはめにより故障数は増加傾向なのか、減少傾向なのかをみることができ、システムの耐久性の指標である平均故障時間(故障から次の故障までの平均的な間隔)を求めることができます。

 

Crow-AMSAAモデルは、べき乗測にしたがいます。今回の新型コロナウィルスの例で考えると、時間のべき乗で感染者数が増えていくようなイメージになります。

 

実際の感染症のモデルはもっと複雑なはずですし、このプラットフォームが今回の感染者数の解析を意図したものではないですが、探索的な分析をすることも考慮し、世界の各国々について感染者数の発生状況を、この「信頼性成長」でモデル化してみます。

 

累積感染者数の可視化

先に感染者数が増大した中国を除き、日本より累積感染者数が多い国は22か国です。日本も含め23か国に対する、日ごとの累積感染者数をグラフビルダーでプロットしてみます。

 

グラフは地域別に分けており、横軸が日付、縦軸がその日付での累積感染者数を表しますが、縦軸は対数目盛にしています。

 

fig1.png

 

日本(左上のグラフ)の水色で、323日時点の累積感染者数は1089人です。日本は早い時期に感染者が見つかりましたが、他の国と比較しても、そんなに感染者が増えていないことがわかります。同じアジア地域のイラン(ピンク色)は、他のアジア地域の国より遅く最初の感染者が見つかっていますが、今ではアジア地域で最も多い累積感染者数になっています。

 

ヨーロッパ(右上のグラフ)は多くの国で3月初めから急激に感染者数が増加していますし、米国やカナダ(左下のグラフ)、ブラジル(右下のグラフ)も感染者数が急増していることがわかります。

 

「信頼性成長」でモデルをあてはめ

「信頼性成長」プラットフォームを使い、上記で可視化した国々に対し、Crow-AMSAAモデルをあてはめてみます。使用するデータは、各国(location)において、日(date)ごとの感染者数(Confirmed) が入力されているので、「日付形式」のタブをクリックし、次のように列を指定します。

 

fig2_dialog.png

 

その後、赤い三角ボタンをクリックし、[モデルのあてはめ] > [Crow AMSAA] を選択します。

 

緑色の曲線があてはめたものになります。あてはまりの良さを視覚的に確認してみると、良くあてはまっている国もあれば、あまりあてはまっていない国もあります。ここでは、日本を含めた4つの国について、あてはめ状況を考察してみます。

 

※以下のグラフの縦軸(累積感染者数)は、国ごとに値の範囲が異なることに注意してください。

 

米国

fig2(US).png

3月から急激に感染者数が増えていますが、モデルはこの現象をうまくとらえていると言って良いでしょう。

 

日本

fig2(Japan).png

今回使用したデータによると、日本で最初に感染者が記録されたのは115日です。その割には、ほかの国に比べ感染者数が抑えられています。モデルとしては、あまりあてはまっていない時期もありますが、概ね感染者数の特徴をとらえたモデルになっていると考えて良いでしょう。

 

イラン

fig2(Iran).png

イランで最初に感染者が記録されたのは220日です。ここから3月にかけて急激に感染者数が増大しています。37日からは、あてはめた曲線より上側に実際の感染者数が位置していますので、このときの感染者数の急増ぶりを表しています。

 

韓国

fig2(South Korea).png

このモデルでは、韓国の感染状況を全く説明できていないことがわかります。2月の後半から急激に増えて、3月の初旬から緩やかになってなっているといった現象を説明できていません。

 

感染頻度のトレンドが変化したときは?

上の例で、イランと韓国のあてはめはあまり良くありませんでした。その一因として、ある時期から感染頻度のトレンドが変化したことが考えられます。

 

「信頼性成長」には、[区分Weibull-NHPP 変化点検出] というあてはめ方法があり、データからトレンドが変化した時点(変化点)を検出し、変化点の前後で別々の形状パラメータ(β)をもつCrow-AMSSAモデルをあてはめることができます。今回のモデルのあてはまりが良くなかったイランと韓国について、この変化点で分けたモデルのあてはめを行ってみます。

 

青色の曲線が「区分Weibull-NHPP 変化点検出」のあてはめ線になります。またここでは示していませんが、パラメータ推定値と変化点のレポートも併せて表示されます。

 

イラン

fig3(Iran).png

変化点は38日です。そのため38日前後で形状パラメータが異なるモデルがあてはめられています。視覚的に見ても、この変化点で分けたモデル(青色の曲線)のあてはまりの方が良く見えます。レポート下側の「モデルリスト」には、あてはめの良さを示す指標であるAICcBICが表示されています。これらの指標は値が小さい方があてはまりが良いことを示しますので、指標で判断したときも変化点で分けたモデルのあてはめが良いことがわかります。

 

 

韓国

fig3(South Korea).png

変化点は37日です。この変化点で分けたモデルでも決して良くあてはまっているとはいえませんが、最初にあてはめたモデル(緑色)よりも、視覚的にも、指標AICcBICで見たときもあてはまりが良くなっていることがわかります。変化点で分けたモデル(青色)は37日以降、感染頻度が減少したことをある程度説明できています。

 

強度関数による考察

「信頼性成長」では、あてはめたモデルに対し、強度関数のグラフを表示するオプションがあります。

強度はその時点において感染する密度を示し、強度関数は、時間ごとの強度を示した関数です。ここではCrow-AMSSAモデルを時間で微分したものが強度関数となり、ごく短い時間で感染する確率を、時間間隔で割ったものの極限値となります。強度関数のグラフをみることにより、感染者数が急激に増加したか、減少したかを確認することができます。

 

以下は先で示した4つの国に対する強度関数となり、イランと韓国は、変化点ごとにあてはめたモデルに対しての強度関数になります。

 

※以降のグラフも、縦軸の値の範囲が異なることにご注意ください。

 

米国

fig4(US).png

 

日本

fig4(Japan).png

米国は、315日あたりから、強度関数が急激に大きくなっていることがわかります。ニュースでもこのあたりから感染者数が急増したことが伝えられていました。日本も増加傾向にあるので今後が心配ですが、強度の値自体(Y軸の値)は他の国に比べて小さいです。

 

イラン

fig4(Iran).png

 

韓国

fig4(South Korea).png

 

イランと韓国は、変化点の前後で強度関数の色を変えています。イランは31日あたりから感染者数が急激に増加し、変化点である38日以降は増加が若干抑えられましたが、依然増加していることがわかります。対照的に韓国は変化点の後では、急激な増加が抑えられているといって良いでしょう。まだ感染者数が出ていることは確かですが、収束に向かう可能性がある良い傾向です。

 

今後の感染者数の動向は

今回紹介した「信頼性成長」は、決して将来の予測を主眼としたプラットフォームではありません。現在のデータから、感染者数の増加傾向、増加の度合いなどを調べました。

 

現在、世界中で感染者数は急激に増えており、パンデミックになる可能性も指摘されています。強度関数の尺度パラメータβが1より小さくなると時間の経過とともに感染者数が少なくなることを示しますので、どの国についても、βの値が1より小さくなることを願うばかりです。私は今後もデータを収集し分析していく予定です。

Article Labels