ビッグデータの正体

今、オックスフォード大学教授のビクター・マイヤー=ショーンベルガー氏とウォール・ストリート・ジャーナルの技術エディターのケネス・クキエ氏共著の『ビッグデータの正体 情報の産業革命が世界のすべてを変える』を読み始めました。なかなか面白い。

ただちょっと学校教育になじまない内容かもしれない。というのも、従来の学問や教養は、なんだかんだ言っても、因果関係に注目している性質がある。その因果関係というものが、ビッグデータ理論では今後はあまり重要視されなくなる。そう説いています。

例えば、膨大な電子カルテのデータから、「オレンジジュースとアスピリンの組み合わせで癌が治る」ことが言えるなら、正確な理由はどうであれ、この組み合わせが癌に効くという事実のほうがはるかに重要となる。航空運賃の決まり方など詳しく知らなくても、航空券の買い時さえわかれば財布にやさしい。それで十分だ。・・・

ビッグデータの正体 情報の産業革命が世界のすべてを変える、講談社、2013年、28頁

相関関係>因果関係?

つまり、表面的にデータAとデータBの相関関係さえあれば良く、その背後にある因果関係は(ざっくり言えば)不要だということ。本書の中では「因果関係ではなく相関関係が重要になる」(29頁)とも説いています。

ビッグデータ解析を通じ、「風が吹けば桶屋が儲かる」という相関関係(強風→桶の売上増)が見い出せれば、「土ぼこり→盲人→三味線→猫皮→猫の減少→ネズミの増加→桶の損壊」という途中経過(理由・因果関係)は不要だということです。

従来の科学的発想とは真逆ですが、分析できるデータが人類がかつて経験したこともないほど膨大であり、その全てのデータをほぼリアルタイムに高速化著しいコンピューターの処理能力で統計的に解析できてしまうため、もはやいちいち仮説を立ててじっくり検証しなくてもいいだろう・・・という考え方です。

ビッグデータ解析は実戦的だが・・・

このようにビッグデータ解析は実に様々な社会活動や経済行為に対し、実戦的かつ効率的であります。ですが同時に、今までの学問的発想と相容れない部分もあります。このあたりに負の問題点が、ビッグデータ解析には潜んでいそうです。

今後、教育の現場でも、ビッグデータ解析を視野に入れ、統計学などが脚光を浴びるでしょう。しかし同時に、統計学なら統計学の限界もしっかり教育していく必要があるかもしれませんね。

また、ネット塾系でも今秋に「受験サプリ」が東京大学と共同で、蓄積された生徒の学習情報をビッグデータ解析し、より効果的な学習方法などを提案・サポートしていくそうです。ただそれはあくまで統計的に導き出した結論であり、厳密な因果関係は不明である、という主旨の但し書きを入れたほうがいいかもしれません。

※参考資料:
風が吹けば桶屋が儲かる、Wikipedia、最終更新2015年07月12日
ムーアの法則、Wikipedia、最終更新2015年08月25日
受験サプリが東大と連携、ネット塾ジャーナル、2015年08月06日

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください