今回紹介する法学者サラ・ラムダンによる書籍『Data Cartels』は特定企業が不当にデータを独占することに由来する様々な分野の問題点をあぶりだし、情報格差の問題提起と情報に関する法整備を訴えています。
一般的にデータの問題として想起されるのがスノーデンが暴いたNSAによる諜報プログラム「PRISM」ではないでしょうか。電話の通話記録やFacebookやGoolgeの各種サービスの利用履歴など。本書の焦点はそこではない。サラ・ラムダンはデータブローカーを二種類に分類している。ひとつは消費者にモノを売るための商業的データブローカリング。FacebookやGoogleのデータはここに分類される。もうひとつが市民が様々な判断をするための制度的データブローカリング。政府機関、福祉団体、銀行、雇用主等へのデータ提供であり、個人の権利や特権に直接的な影響するデータです。本書は後者の制度的データブローカリングを対象としています。
サラ・ラムダンは本来は市民に広く公開されなければいけない制度的データが二社に独占されていると指摘します。具体的にはRELX(旧Reed Elsevier)とThomson Reuters。この二社が学術、法律、金融、ニュースなどの重要情報を独占的に支配している。Facebookより10年も前からデータの囲い込みを行っている。このような独占構造が確立された背景には、米国における反トラスト法の執行不足があると指摘しています。ここでもいきすぎた新自由主義の弊害が……。例えば、Thomson Reutersは少なくとも512件、RELXは527件以上のアメリカ政府との契約を持ち、政府機関の70-80%が彼らの製品を使用しているそうです。
データカルテルの基礎を作ったのはデータフュージョンの父といわれるハンク・アッシャー。ハンク・アッシャーがDatabase Technologiesとしてビジネスをはじめた1992年には政府系のデータは価値があまり認められておらず、低価格で買うことができた。それを組み合わせて使いやすいデータ商品(MATRIX)としたのがはじまり。2000年代初頭にはオリジナルの政府よりも高性能のデータ商品としてサービスが利用されるようになった。RELXがアッシャーの会社を買収し、既存の政府系のクライアントにデータ商品を販売した。しかし、公正取引委員会から2009年に独占企業と認められ、Thomson Reutersに一部のデータ商品を売却することになった。これが二社独占になった背景。
このようにデータカルテルが扱うのは生データではなく、生データを加工したデータ商品となります。このデータ商品は政府のデータと違って監視も規制されていない。ECPA(電気通信プライバシー法)、FERPA(家族の教育の権利とプライバシーに関する法律 )、COPPA(児童オンラインプライバシー保護法)、RFPA(金融プライバシー権利法)、FCRA(公正信用報告法)など、プライバシーに関する様々な法律や規制をすり抜ける。たとえばFCRAでは誤った情報を修正する依頼ができる。データでも間違えはあるのだから。しかしLELXもThomson Reutersもその責任は負わない。生データじゃないからというのがそのロジック。公共サービスにそのデータが使われているのに。三大信用情報会社のEquifax、ExperianやTrustUnionですらこれらの法律に準拠する必要があるのだけど、データカルテルはその必要がないというのは恐ろしい。
本書では金融情報や法律の情報へのアクセスを有償化することで格差を広げているとデータカルテルを批判している。例えば、金融情報市場では、年間24,000ドル以上を支払える富裕層や機関投資家のみが、リアルタイムの高品質な市場データにアクセスできる。一方で一般の投資家は不完全または遅延した情報に基づいて投資判断をしなければいけない。
法律情報へのアクセスにおいても同様の格差がある。高額な法律データベースへのアクセスを持つ大手法律事務所と、そうでない公益法律事務所や刑事弁護人との間には、利用できる法的リソースに大きな差がある。ほぼ標準ツールとして使われているのがShepard's Citations(RLEXの商品)とKeyCite(Thomson Reuters配下のWestLawの商品)。なんと70%の法律事務所の予算はデータカルテルに支払う情報料なのだそうな。それが法律の情報は公共の情報なので、当然公共のツールであるPACERも公開されている。しかし、使いにくいし、情報も古いのであまり使われない。
当然ながらそれをビジネス機会だととらえるスタートアップも出てくる。法的調査AI企業のRoss Intelligenceは機械学習のトレーニングデータとしてWestLawの資料を使用した。それに対してThomson ReutersはWestLawの法的文書要約(headnotes)の著作権侵害でRoss Intelligenceを提訴した。法律には著作権がないはずなのだけれど、データカルテルは少し編集を加えて著作権化する。そのため独占的に情報を囲い込める。
これらのデータカルテルによる情報格差を解決するためにサラ・ラムダンは情報を公共財として再定義し、公共のデジタルインフラを整備すべきとしています。しかし、こうした改革の実現には大きな障壁が存在することも認めています。データカルテルは強力なロビー活動を展開し、政府との密接な関係を構築している。それでも少しづつ進めていくしかない。法令の例を取れば、法への自由なアクセス運動(Free Access to Law Movement, FALM)がある。FALMの主な目標は、法的情報への無料かつ容易なアクセスを促進し、法の透明性と市民の法的理解を向上させることです。
データカルテルによる情報独占という観点はあまりこれまで意識したことがありませんでした。でも、これを読むと確かにお金や生活にかかわる情報ってなかなかアクセスできないんだと思う。インターネットでだいぶ情報が入手しやすくなったとはいえ。情報のフェアユースはどこまで可能なのかの議論はAIも含めてこれからもっと重要になってきそう。
このような海外のニュースをほぼ毎日お送りするニュースレター「カタパルトスープレックスニュースレター」をSubstackではじめました。今は試運転中なのですべて無料です。