読んだ本をひたすら列挙。読書のペース配分とその後の読み直しのためのメモ。学而不思則罔、思而不学則殆。
本書がノイズと称しているのは、分散や偏差のこと。ノイズは計測値の標準偏差であり、これはノイズによる誤差の標準偏差と同じである(p.91)。同じような能力を持った訓練されたプロフェッショナルであっても、同じような事案に対する判断の結果は驚くほど異なる。ときに、一人の人が繰り返し判断したときの結果すら異なる。すなわち、こうした判断には分散が大きい。それは例えば裁判官による量刑の判断だとすると、不公平のもとになる。まったく同じような事件なのに、一方の人の量刑は軽く、もう一方の人の量刑は重い(それも年単位で)ということが起こっている。バイアスがある判断であれば分かりやすいが、分散のある判断では問題を指摘しにくい。しかも、プロフェッショナルたちには矜持があって、自分たちの判断がときに大きくぶれていることをそもそもなかなか気づかないし、認めない。プロフェッショナルたちは、自分たちが下す判断はほぼ同じであるはずだと信じ込んでいる。これは一致の錯覚と呼ばれている(p.46-48)。他人にも自分が見えているのと同じように見えるはずという素朴実在論による。
ノイズという言葉を分散や偏差の意味で用いるのは違和感が大きい。ノイズとは通常、真の値と観測された値の差として現れる。その差は単に分散を与えるものだけでなく、バイアスを与えてもよいはずだ。とはいえ、分散や偏差という言葉では一般に膾炙しないので、ノイズという言葉を選んだのだろう。
本書の道行きは、まずプロフェッショナルの判断の分散は実は大きいことを様々な分野から示す。そしてこれら分散を要因別に分類する。要因ごとに対応策を示す。対応策に向けられる疑念に応える、という構成になっている。本書のポイントは、簡潔に4点にまとめられる(p.33f)。(1)世界は複雑で不確実なので、判断はそもそも難しく不一致は避けられない。したがってノイズはつねに存在する。(2)不一致の度合いは一般に予想されるよりはるかに大きい。裁判官による量刑の判断、保険の査定人による保険査定額の判断などに明らか。(3)ノイズは減らせる。例えばルールやガイドラインの導入などがノイズ削減の手段となる。(4)ノイズを減らそうとする試みは、しばしば反対に会う。
プロフェッショナルが熟慮した上の判断(臨床的判断)と、ルールやアルゴリズムによる機械的判断を比較すると、いくつもの場合において、専門家による臨床的判断の精度は、単純な単回帰分析モデルによる機械的判断の精度を下回る。その重要な要因は、人間の判断にはノイズがあることだ(p.165-169, 180)。これは人間の判断を単純にルールやアルゴリズムに置き換えればいいという話ではない。モデルの方が総じて予測精度が高いのに人間の直感に頼るのは、確実性の感覚、「これでよし」という内なるシグナルを感じたいからである。だとすれば、モデルを使おうとするよりもむしろ、我々の意思決定プロセスを改善しなければならない(p.210f)。
そして実はノイズは、バイアスよりも改善しやすい。まずノイズはバイアスよりも測定が容易だ。バイアスを計測するには清の値を得て、それからの差を計算する必要がある。一方、ノイズは判断の正否についての検証を必要としない。いくつもの判断があれば、その標本平均からの差を計算するだけでよい。よってノイズはバイアスよりも計測でき、減らすことができる(p.79f)。
ノイズの分類に本書の独特の用語がいくつも導入される。まず本書が相手にするノイズは、理想的にはつねに同一であるべき判断に不可避的に入り込む好ましくないばらつきであり、これはシステムノイズと呼ばれる(p.33f)。このシステムノイズを要素分解していく。分散や偏差についての分析なので、これは分散分析(ANOVA)の話である。個々の判断者が持っている平均的な判断どうしの偏差をレベルノイズと呼ぶが、これは群間分散に対応する。群内分散に対応する用語はないが、群内分散はさらに二つに分解される。まず、それは判断対象の項目の性質に依存して系統的に現れるノイズであるパターンノイズ(p.102-110)。これは複数の因子による交互作用のこと。もう一つは本来は無関係である一過性の要素(気分など内的なもの、時刻や気温など外的なもの)による、同じ人が同じ判断を異なる時点で行った結果の分散であり、機会ノイズと呼ばれる(p.118-120)。通常、機会ノイズはレベルノイズよりも小さい\(p.131)。
こうしたシステムノイズはなぜ存在するのだろうか。一つの理由は、特に予測の場合、そもそも知りえない情報や調べきれていない情報のために、完全ではありえないからだ。これらは判断者のバイアスやノイズに依存するものではなく、客観的なものである。これを客観的無知と呼ぶ。客観的無知が大きな部分を占めるときには、専門家であれモデルであれ予測は難しい(p.202)。客観的無知はしばしば無視される(無知の否定)。これは自信過剰でもないし、ノイズやバイアスのリスクの過小評価でもない。実際には予測不可能な事柄を予測可能と信じて、現実の不確実性を無意識に否定しているのである(p.208f)。
さらなる理由は、システム1の心理的バイアスだ。個々人のシステム1の心理的バイアスがみな同じ方向に働けば統計的バイアスとして現れるが、個々人でバラバラな方向に働けばノイズとして現れる(p.238f, 252f)。この辺りの話はバイアスの話なのかノイズの話なのか見分けにくい。いくつもの心理的バイアスの例が挙げられる。判断の難しい問題を簡単な問題に置き換えるヒューリスティックスは、判断の誤りの原因となる(p.237-244)。まずシステム1が早急に結論を出し、その余談を裏付けるように証拠集めをする結論バイアス。自分の考えを裏付ける証拠ばかりを探す確証バイアスと、自分をよく見せかけるような社会的望ましさのバイアスがある(p.245f)。過剰な一貫性のバイアス(ハロー効果)。最初に思いついた結論にこだわり、容易に修正せず反証を無視する(p.249-252)。
ノイズへの対策はもちろんこうした心理的バイアスを踏まえる必要がある。それは詳しくは下巻の範囲。だが例えば、5段階評価などの反応尺度は、人によって解釈が違う。「まずまず」を3でつける人も4でつける人もいる。これはノイズの大きさに大きな影響を与えるので統一すべき(p.274f)。値を直接聞くなど絶対的な判断はそれぞれの人が持つアンカーに影響され、ばらつきが大きくなる。相対的な判断にしたほうがノイズを減らせる可能性が高い(p.283-286)。
そしてなぜノイズの存在が見過ごされるのかについては、統計的思考と因果論的思考の対比が挙げられている。起こった出来事に対して人間は、その原因となったであろう事項を遡行的に探し出してきて、因果のつながりとして理解しようとする。つまり後知恵で可能な因果的説明を生み出して物事を理解しようとする。説明に持ち出されるものは確定した過去の事項だから、そこにはなかなかノイズは見いだされない。ノイズを見出すには、統計的思考が必要だ。統計的思考では、因果論的思考のように出来事の個別の因果系列を考えるのではなく、出来事を一般化して平均的にどうであるのかを考える(p.224-226)。例えばあるCEOの2年以内の離職可能性を考える場合、因果論的思考ではそのCEOの資質や経験から考えるが、統計的思考ではそもそもCEOの2年以内の平均離職率から考える。
Author:坂間 毅 (Sakama Tsuyoshi)
コンサルティングファームに所属。数学の哲学を専攻して研究者を目指し、20代のほとんどを大学院で長々と過ごす。しかし博士号は取らず進路変更。以降IT業界に住んでいる。
別館:note
コメントの投稿