Rindrics Mumbles

確率論と可能性は全く別の話

「事実」と「意見」を区別せよ、とよく言われるように。

TL;DR

〇〇の可能性があるので検証する

その可能性は本当に「ある」のか?

可能性を「想定している」だけではないのか?

今日、これの区別ができていなかったことを自覚したのでメモしておく。

わかっていたつもりだが

「事実」と「意見」の区別は、科学的な文章を書くうえでの基本だ。 これらが混同されている文章は、どこも信じられなくなってしまう。

科学的な文章って実は指す対象がけっこう広くて、なにも学術論文だけに限らない。 課題解決型の仕事をしているなら、そこで書いているのは確実に科学的文章であり、またそれを自覚していないのならば意識的に科学的な文章を書くよう努める必要がある。

──とわかっているつもりになっていたのだけれど、きょう自分が「確率論」と「可能性」を混同していたことに気付いた。 仕事中の仮説検証でそれをやらかしたので、結果的に嘘を書いてしまっていた。 これらの概念も、みんな知ってる「事実」と「意見」と同じレベルで意識されたほうがいいと思った。

確率論と可能性の違い

確率とは、事象が起こる頻度や割合を数値化したもの。 一方で可能性とは、事象が原理的に起こり得るかどうかの二元的な概念だ。

具体例を出せばたぶんわかりやすい。くじ引きの例を考えてみる。

  • 1/10 の確率で当たるくじ: 当たる可能性がある
  • 1/100000 の確率で当たるくじ: 確率は低いものの当たる可能性が実際にある
  • 当たりが全く入っていないくじ: 当たる可能性は原理的に存在しない

当たる可能性が少しでもあるのか、そもそも全くないのか。これらは全然違う。

こうやって書けば間違えようがない気がするのだけど、私は今日、実際に気付けなかった。

対象領域の知見が乏しいと区別が甘くなりがちかも

本番環境で発生したエラーの根本原因を探していた。

仮説を立て、それを検証するための手順を書く、、、が、問題領域に対してスキルセットが不十分で、立てている仮説には根拠がない状態だった。

想像ベースの仮説しか立てられなかったこと自体はこの際仕方がないとして、問題は仮説の表現方法にあった。 「〇〇が関与している可能性があるので検証する」と書いてしまったのだ。 注目している箇所に根本原因がそもそも存在しなかった場合には、これはまったくの嘘になってしまう。 私がついそのように書いてしまった原因としては、おそらく仮説に対する自信のなさ──「〇〇が関与しているに違いない」と言えるほどの自信はない。なので「可能性がある」としておこう──を表現できると思ったのだろう。

しかし実際には、想像で仮説を立てているのだから、問題がそこにあるのかどうか(当たりくじが入っているかどうか)はわからない状態だった。 「可能性」という言葉自体を使っていけないわけではない。 単に「〇〇が関与している可能性を想定しているので検証する」と書けばよかったのだ。

もっとも、対象としている問題について根拠に基づいた仮説を立てられるレベルにあるならば、仮説に確率の概念を持ち込むこともできるだろう。 たとえば「根本原因は A, B, C のいずれかに存在していることが観測結果からわかっていて(可能性事実 として証明済)、なかでも A にある確率がもっとも高いと思われるので(これまでの経験から 確率 の高さを 意見 として表現) A から検証してみる」などのように。

課題に取り組む時点で、必要なスキルセットを持ち合わせていなくても、まぁそれは仕方がない。 というか実際問題、ソフトウェア開発の分野は広く深いので、課題解決は知識を現地調達しながらの取り組みになることが多い。 しかしこのような状況でも、仮説検証の記録に「嘘」を書いてしまうような事態はできるだけ避ける必要がある(とはいえ回避できないこともある)。 「事実」と「意見」に加えて「確率」と「可能性」の区別も意識することで、少しマシになるんじゃないだろうか。


comments powered by Disqus