カタパルトスープレックス

興味がない人は無理して読まなくていいんだぜ。

書評|キャッチーなデータサイエンス本『誰もが嘘をついている』|"Everybody Lies" by Seth Stephens-Davidowitz【2018年夏休み読書週間】

f:id:kazuya_nakamura:20180817142356p:plain

自分が何をしているのか意外と意識できていないものです。自分で思ってるよりいい奴じゃないし、優れてもいない。昔は良かったということも実はあまりないですしね。多くの場合、悪かったことは忘れてしまってるだけです。

セス・スティーヴンズ=ダヴィドウィッツの『誰もが嘘をついている』は簡単に言ってしまえば記憶や直感はデータと違うんだよという本です。競走馬やセックスなどいろいろなキャッチーな例でデータサイエンスの世界を紹介しています。『ヤバい経済学』が好きな人にはオススメです。「ヤバい」という言葉で敬遠する人もいるかもしれませんが、データに関する面白い本です。ヤバい本ではありません。

Everybody Lies: The New York Times Bestseller

Everybody Lies: The New York Times Bestseller

 
誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

 
ヤバい経済学 [増補改訂版]

ヤバい経済学 [増補改訂版]

  • 作者: スティーヴン・D・レヴィット/スティーヴン・J・ダブナー,望月衛
  • 出版社/メーカー: 東洋経済新報社
  • 発売日: 2007/04/27
  • メディア: 単行本
  • 購入: 34人 クリック: 437回
  • この商品を含むブログ (246件) を見る
 

 

データを使って人間の行動を理解する行動経済学に最初にスポットライトを当てたのはスティーヴン・レヴィットの『ヤバい経済学』ですね。セス・スティーヴンズ=ダヴィドウィッツのアプローチも内容も『ヤバい経済学』の現時点でのアップデートという趣があります。

『ヤバい経済学』も「本当に犯罪は増えているの?」のようなキャッチーな題材をデータで検証しましたが、『誰もが嘘をついている』は同じトピックですがインターネットで入手できるビッグデータを使っています。

誰でもビッグデータが使えるツール

例えば、Google Trendは検索キーワードのトレンドを知ることができますが、Google Correlateを使えば検索データから相関関係を探すことができます。Webが誕生する以前のデータもビッグデータとして利用できます。Google Ngram Viewerを使えば1800年以降の書籍から頻出する単語などを調べることができます。

例えばアメリカ合衆国は英語ではUnited States of Americaです。略称のUnited StatesやStatesは今では単数ですが、昔は複数でした。例えば"United State is..."ではなく"United States are..."でした。南北戦争の後に単数("United State is...")になったというのが通説ですが、実際にはどうかをGoogle Ngram Viewerで調べることができます。

公共のデータもたくさん公開されています。日本でもITダッシュボードでDATA.GO.JPのデータカタログを簡単に参照することができます。すこしプログラミングができればAPIを通じてFacebookやWikipediaなどからももっといろいろなデータを取れます。

どんな人にオススメか?

ビッグデータやデータサイエンスに興味があるけど、難しそうだと敬遠してきた人にはオススメします。スティーヴン・レヴィットの『ヤバい経済学』が面白いと思ったら『誰もが嘘をついている』も面白いでしょう。これからデータサイエンスの世界を知りたいという人にとっては最適な入門書の一つだと思います。

デジタルマーケティングなど普段からWebのデータを取り扱っている人にとってはあまり新鮮味はないかもしれません。この本で言及されている手法は回帰分析やA/Bテストなどのランダム化比較テストです。手法に関して目新しさはあまりありません。データソースも普段使っている人にとっては新しい発見はないと思います。IoTなどのセンサーデータについても言及されていないので、行動データの分析としては物足りなさもあります。