カタパルトスープレックス

興味がない人は無理して読まなくていいんだぜ。

書評|データサイエンス時代のソフィストたちに騙されない方法|"Calling Bullshit" by Carl Bergstrom and Jevin West

f:id:kazuya_nakamura:20201008190901p:plain

英語でブルシット(Bullshit)は「バカらしい戯言」です。ウソ(Lie)とも言い切れない。嘘の場合もあれば、本当の場合もある。ブルシットは多くの場合はハッタリだったり、ごまかしたり、騙そうとする意図があります。ブルシットだとわかれば、トランプのゲーム『ダウト』みたいに「ブルシット!」とコールできます。

本書"Calling Bullshit"は難しい知識がなくてもブルシットを見破り、「ブルシット!」とコールできるようになるための指南書です。

ブルシットは昔からあります。古代ギリシャでもソフィストと呼ばれる弁論家たちがいました。プラトンの『国家』でソクラテスが散々やり込めるのがソフィストたちです。政治家もブルシットが得意です。本書ではビル・クリントン元大統領のモニカ・ルインスキーとの浮気について否定する発言が(過去まで遡る現在完了形ではなく)現在形であったことにツッコミを入れていました。

現代のソフィストたちはデータを使い、ソーシャルメディアでブルシットをばら撒きます。ブルシットはより早く、より広く伝わるようになりました。現代の代表的なブルシットがフェイクニュースです。

著者のカール・バーグストームとジェヴィン・ウェストは現代のブルシットに対抗するには三つの方法があると言います。1)ソーシャルメディアが自主的にフェイクニュースの広げない努力をする、2)政府が法律で規制する、3)教育でブルシットを誰でも見分けられるようにする。本書がとっているアプローチは三番目のアプローチである教育です。フェイスブックやツイッターが真面目にフェイクニュース撲滅に取り組むとは思えない。だって、彼らにとっても商売になりますからね。法律でフェイクニュースを規制するのも良し悪しです。フェイクニュースだとどういう基準で誰が決める?

本書でオススメするブルシットに対する教育とは、ズバリ、論理的思考です。マッキンゼーとかボスコンとかのアレです。イヤイヤイヤイヤ、それできたらみんなビジネスコンサルできるから。しょっぱなから怒涛のツッコミを入れたくなります。無理無理無理無理。そう思いながらも読み進めることにします。

まず、例に出しているのがAIネタにありがちなブルシット。いろんな人の顔を学習させて犯罪者をAIで見分ける研究。AIは学習データが大事です。犯罪者の顔は運転免許証など証明写真。普通の人たちはネットで見つけたスナップ写真。当然ながら笑顔。そんなデータを学習したら笑顔じゃない人は犯罪者ってことになってしまいますよね。AIで何かを判断するのであれば、その学習過程までちゃんと説明していないような記事は「ブルシット!」と叫んでいいと二人の著者は言います。

次に統計にありがちなブルシット。例えば、初キッスを済ませた人は、自分に自信を持っている説。初キッスをしたから、自信がつくのか?自信があるから、初キッスができるのか。その因果関係ってわからないですよね。ちゃんと統計をやった人ならわかってる。相関関係は見つけることができるけど、因果関係は簡単には見つからない。相関関係を見つけてから、そこから仮説を導き出し、因果関係を特定する実験を何回も行わないといけない。まあ、そんなことは統計をやったことのある人間ならみんな知ってる。

ボク自身も行動データの分析サービスをやってたことがあるので、よーくわかる。まずは二つのデータの相関係数を計算する。これは最近ならExcelでもできる。いろんなデータの組み合わせをあーでもない、こーでもないとひたすら計算する。そこでなんとなく相関関係がありそうだなーと思えるセットがいくつか見つかる。そこからストーリーを考えないといけないんですよ。相関係数なんて1から-1の間の単なる数字ですから。ストーリーを考えて上で、実験が可能な仮説を作らないといけない。すっごい大変なんですよ、この作業。

流石に著者の二人はそこまでできるようになれとは言いません。でも、記事の内容が因果関係がありそうな言い方をしていたら「ブルシット!」と叫んでいいと言います。相関関係に関する記事はつまらない。ファーストキスと自信には相関関係があるなんてつまらない。自信がつけばキスができる。だから自信をつけよう!の方が面白い記事になりますよね、確かに。でも、そんな面白そうな記事のほとんどは「ブルシット」なのだそうです。これ以外にもビッグデータや、データの可視化など様々な数字に関わる「ブルシット」を紹介していきます。

じゃあ、どうしたらいいのさ?著者の二人は六つのやり方を提示します。

  1. 情報のソースを疑え
  2. 単純な比較を疑え
  3. あまりにもできすぎた話は疑え
  4. 大きすぎる数字を疑え(フェルミ推定で調べられるよ!)
  5. 自分の確証バイアスを疑え(自分が正しいと思う情報が正しいと思う)
  6. 仮説は常に複数あると認識せよ

ボクも、マーケティングの仕事をやっている人や、企業の戦略を考える人であればフェルミ推定くらい自分で使えるようになった方がいいと思うし、ボクも会社でやり方を教えたりしています。でも、普通の人には無理ですよ。かなりのトレーニングが必要になります。確証バイアスも自分自身がバイアスがあることを意識しないといけません。これってすっごく難しいんですよ。保守な人は保守なことしか信じないし、リベラルの人はリベラルなことしか信じない。これがエコーチェンバーで拡張されるんだから。フィルターバブルを自ら破れる人って数えるほどしかいない。

ここまでは「ブルシット」の見つけ方です。

著者の二人は、さらに「ブルシット」を「コール」しようと勧めます。だから、この本のタイトル"Calling Bullshit"なんですね。ネットで「ブルシット」な情報を見つけるのは個人的な活動で、個人的なメリットです。しかし、ネットで「ブルシット」な情報を見つけた上で、「ブルシット」をコールするのは公共の活動で、公共のメリットにつながると主張します。でもさあ、実際にブルシットな情報でフェイスブックもツイッターも溢れていますよ。これは右も左も同じです。それを一つ一つ指摘するのも疲れますが、その指摘に対する反発に対応するのは更に疲れます。

ボクはこの本に書いてあることの一つ一つはとても納得できるし、論理的思考はとても大事だと思います。数字にも強くなった方がいい。一方で、そのスキルを手に入れるのはとても大変な努力が必要だと知っています。ボクも教える立場にありますが、自分自身が間違う可能性はいまだにあると思います。確かにフェイクニュースやフィルターバブルは問題だと思います。それはシステムによって生み出されたものなので、個人で戦っていくのは(無理とまでは言いませんが)かなり難しいのではないでしょうか。

ボクは通信品位法第230条が改定され、プラットフォームがコンテンツに対して責任を負うようになれば状況はだいぶ良くなるのではないかと(楽観的かもしれませんが)期待はしています。システムのエラーはシステムで直した方がいい。システムのエラーを人で直すのは、少なくともフェイスブックやツイッターのスケールではなかなか困難だと思います。著者も指摘する通り、「ブルシット」は基本的な人権の一つである表現の自由に関わる難しい課題です。だって、「ブルシット」だって表現のひとつですから。問題は「ブルシット」ではないとボクは思います。「ブルシット」は昔からあった。「ブルシット」を広げるエコーチェンバーの問題です。だから、フェイスブックやツイッターのようなエコーチェンバーのエラーを直した方がいい。ボクはそう思います。