インドで感染爆発というニュースが目をひきます。病院の写真や、コロナが蔓延する中でガンジス河で集団で水浴びをする宗教行事の写真などをみると、いかにも大変なことが起きてそうに感じるし、実際に感染者数もダントツです。でも、実際にデータをみてみるとどうなんでしょう。
下のテーブルは、May 06, 2021, 02:14 GMT時点での過去7日間の陽性者・死者数を、陽性者数が多い国順にまとめたものです。(出典:WorldOMeter)。一位はダントツでインド、2位がブラジル、3位がアメリカと続き、日本は20位です。
国名 | 陽性者数 | 死者数 | 陽性者数 /人口100万人 | 死者数 /人口100万人 | 人口 | |
World | 5,594,158 | 91,270 | ||||
1 | India | 2,702,756 | 25,339 | 1,942 | 18 | 1,391,419,959 |
2 | Brazil | 412,657 | 16,302 | 1,930 | 76 | 213,831,876 |
3 | USA | 335,620 | 4,777 | 1,009 | 14 | 332,637,917 |
4 | Turkey | 204,568 | 2,485 | 2,404 | 29 | 85,102,402 |
5 | Argentina | 142,606 | 2,918 | 3,131 | 64 | 45,544,796 |
6 | France | 140,526 | 1,706 | 2,149 | 26 | 65,395,336 |
7 | Iran | 131,703 | 2,602 | 1,551 | 31 | 84,896,558 |
8 | Germany | 117,974 | 1,575 | 1,404 | 19 | 84,009,837 |
9 | Colombia | 109,985 | 3,290 | 2,142 | 64 | 51,339,078 |
10 | Italy | 75,512 | 1,749 | 1,250 | 29 | 60,386,756 |
20 | Japan | 37,167 | 415 | 295 | 3 | 126,149,387 |
一方で、死者数を人口で調整してみると違った景色が見えてきます。ブラジル(76)がダントツ、アルゼンチン(64)とコロンビア(64)という南米諸国が続き、イラン(31)・トルコ(29)・フランス(26)・イタリア(29)の方が、インド(18)よりも状況は悪いことになります。ワクチンが普及し始め、経済をものすごい勢いで再開し始めているアメリカ(14)も実はそんなに大きな違いはない。
ちなみに現在のアメリカの死者数はピーク時(2021年1月中旬)の約1/5です。このころのアメリカと今の南米諸国がほぼ同じ水準の惨状で、これに比べれば今のインドはまだずっとまし、と言えるでしょう。確かに新たな変異種は怖い。けれど、インドにおける変異種が特に怖い理由が感染力や死亡率が高いということだとして、この観測がインドにいける陽性者・死者の絶対数からきているのだとすれば、この変異種以前だってもっとひどい状況があったことを認識しておく必要はあると思うのです。
これに比べて、日本(3)は極めて安全な国といえるでしょう。人口比の死者数でみると、日本は100番目まで順位が下がります。これで医療崩壊が起きているとすれば、高度な医療水準を誇り病床数も潤沢であったはずの日本が、世界で100番目の人口あたり感染者数で耐えられなくなっていることに焦点をあてるべき、との仮説もでてきます。
強力な感染対策で、100万人あたり3人の死者数からさらに下げることが理想的であることはいうまでもありません。一方で、リソースや経済資源が限られていることを考えると、まさしく「無限の理想と、有限の現実のすり合わせ」、すなわち戦略が求められるのではないでしょうか。
目を引く逸話や、少数だけれど極端な例を拾うことで人目をひくことが習いとなったマスコミ情報のバイアスを少しでも排除して、現実を俯瞰的に認識する上でデータほど役にたつものはありません。時間とともに徐々にデータも充実してきており、以下のようなサイトがあります。
- COVID Data Tracker:CDC(米国疾病対策予防センター)によるCovid-19に関する様々なデータを集めたサイト
- The COVID Tracking Project:民間のボランティアがデータを収集・整理したサイト(2021年3月7日に更新停止)
- 新型コロナウィルス感染症対策(各種データ):内閣官房のサイト
自分でモデルを作って分析をするのであれば、まずは時系列で
- 陽性者数
- 死亡者数
- テストの件数(あるいは陽性率)
- 1回目のワクチンを受けた人数
- 2回目のワクチンを受けた人数(ワクチン接種を完了した人数)
当たりのデータが欲しいところです。欲を出せば、年齢グループ別・性別にわかれてそれぞれの項目が取れると精度があがりそうな気がします。ここらへんは、条件付き確率分布と、時系列分析の組み合わせで比較的シンプルに扱えそう。
一方で、こうしたデータを用いてできるモデルでは、人の行動を直接的にモデル化することはできません。人の行動の影響は、陽性者数と陽性率の裏側に隠れているからです。ここからはビッグデータ・データサイエンス的な観点からは取り組みがいのあるテーマですね。こちらについてはおいおい考えてみたいと思います。
コメント