GoogleのコロナAI予測の予測制度は高い低いのか

Googleが公開している新型コロナウイルスの感染者数予測のサイトは知ってますか?これ実はかなりすごいもので、感染者数予測がありえない数値に思えても可能性を持っていることが良くわかるシステムです。

高度な予測システム

COVID-19 感染予測(日本版)
https://datastudio.google.com/u/0/reporting/8224d512-a76e-4d38-91c1-935ba119eb8f/page/ncZpB?s=nXbF2P6La2M

感染症の数理モデルとAIを組み合わせることで、対象期間である将来28日間に予測される死亡者数、感染確認者数、入院・療養等患者数などを都道府県別に表示する。

ということで、いわゆる統計学を用いたものなんです。最初は米国内の感染者数予測を出していて、日本の予測は後から追加になったものです。その頃はGOTOキャンペーンで感染者数が増えるんじゃないかとざわついていて、いざ予測が始まるととんでもない数字が出ていて驚いたものです。

色々と難しい仕組みがありますが、基本的には「感染は離れた場所よりも近隣の地域で広がりやすい」という前提のもと、厚生労働省が発表している新型コロナウイルス感染症陽性者数および死亡者数などのオープンデータ、Googleが特定の場所(食料品店、公園など)を訪れた人の数の変化を地域別にまとめた「コミュニティ モビリティ レポート」、平成27年国勢調査結果などが含まれています。

>予測結果には国内の感染状況や人々の反応、生活環境といった日本独自の状況
例えば緊急事態宣言が発令されて外出時間が減れば、その分予測に反映されて数値が減るし、GOTOトラベルやGOTOイートが再開されて人々の移動が増えれば数値が増えるし、そうした行動も数値を変化させる要因になっているということです。

このシステムはいわゆる機械学習、AIが予測するシステムです。よって長期間データを蓄積、大量の周辺データがあるほど高い精度が出ます。直近の数値は、予測される陽性者数が174,003。1日あたり約6200人と結構な数字がでてます。1/22現在1日あたり6,000人近く出ているのでだいたいあってる。精度もなかなかのものですね。

厚生労働省が公開しているオープンデータを活用しているので自分たちでも出そうと思えば出せそうな気がしますが、高度な予測データを出すためには高いハードルをクリアしなければなりません。兎にも角にもデータが必要。大量のデータ、大量のデータを処理できるサーバー、なのでやはり難しい。こういう時こそクラウドの活用が重要になってきます。

Internnectは世界中からフルリモートで、エンジニアをはじめとした優秀な人材を集め、難易度の高いプロジェクトにもスピーディーにチームを構築して対応するサービスを提供しています。

Head Office

Category