インフルエンザの流行予測

人々がネットでインフルエンザ情報を探すときは、「咳の薬」や「解熱剤」といったキーワードで検索するはず、とグーグルのチームは推測した。しかし、それが何かはわからないし、そんなことにいちいち注意を払うようなシステムに設計されているわけでもなかった。グーグルのシステムは、各検索語の使用頻度と、インフルエンザ感染の時間的・空間的な広がりとの間の相関関係を見ていただけだ。(中略)
そこで彼らは大変なことに気付く。特定の検索語45語と、ある数式モデルを組み合わせたとき、グーグルの予測と公式データの間に高い相関関係がみられたのだ。
これによりグーグルは、公的医療機関の発表よりもかなり早いタイミングでのインフルエンザの流行予測ができることを示したとされます。
ポイントとなるのは、「特定の検索語45語」が、必ずしも直接インフルエンザに関係するとは限らない点。もちろん科学的に検証していけば、45語とインフルエンザとの因果関係を突き止めることはできるかもしれません。でもビッグデータ解析においては、そうした因果関係を問題にはしないところが問題になるのです。