未来を予測する確率 vs ルールを推理する統計 〜演繹と帰納の視点から〜

数学の部屋

確率は「未来」を予測し、統計は「過去」から推理する——。

似ているようで正反対の「確率」と「統計」。
この二つの学問は、データに溢れた現代を生き抜くための「最強の双眼鏡」だと私は思います。

とはいえ、「確率・統計は面白そうだけど、数学の他の知識も必要だろうし、計算も難しくて面倒なのでは」……と不安に感じる方も多いかもしれません。

そこで本シリーズ『Pythonを使いながら学ぶ確率・統計』では、難しい計算はすべてコンピュータ(Python)に任せます。(併せて考え方や計算方法もしっかりと解説するのでご安心ください)
数式を暗記するのではなく、シミュレーションを「動かして、見て、納得する」という、体験型学習のコンセプトにより、一石二鳥、三鳥の効果が得られるはずです。

記念すべきシリーズ第1回記事は、私たちがこれから学習を始める「確率・統計」の土台知識と、シリーズ完結までのロードマップを整理していきます。

第1章:本シリーズで得られる「一石三鳥」とは

本シリーズでは、Pythonという現代最高峰のプログラミング言語を味方につけることで、以下の3つの価値を同時に手に入れることを目指します。

  1. 【体系的な知識】確率・統計の基礎を「本質」から理解する:
    • 公式を丸暗記するのではなく、「情報の流れる向き」や「データの背後にあるルール」を体系的に学びます。土台を固めることで、どんな応用分野にも対応できる一生モノの知識を身につけます。
  2. 【実装スキル】Pythonをデータ分析の武器にする:
    • 計算をコンピュータに任せる過程で、NumPyやMatplotlibといったライブラリを使いこなし、データを自在に操り、可視化する「一生使える実務スキル」が自然と身についていきます。
  3. 【未来への展望】AI開発や量子プログラミングの「言語」を習得する:
    • 確率・統計、そして Python は、ともに現在のAI開発の機械学習や、次世代の量子コンピューティングを支える共通言語です。このシリーズを終える頃には、それら最先端技術のドキュメントを読み解くための「思考のノウハウ」があなたの手に残っているはずです。
Pythonで確率・統計を学ぶ一石三鳥の図

第2章:情報のベクトル(向き)を知る「演繹」と「帰納」

「確率」と「統計」の違いを一言で表現するなら、「情報の流れるベクトル(向き)」の違いです。
専門用語を使うと、確率は「演繹えんえき」的統計は「帰納きのう」的と言えますが、これをもっと身近な例で考えてみましょう。

2.1. 確率は「演繹的思考」:確定済のルールから未来を導き出す

「確率」は、いわば「ルール」からスタートする学問です。 ここで言う「ルール」とは、数学的、あるいは物理的に確定している公理や定理、法則などを指します。

対象となる世界の「ルール」が完全にあきらかになっている前提で、そこからどのような結果がどの程度の割合で発生するかを、論理的なステップで導き出すのが「確率」なのです。

  • ルール(前提条件):
    • 「立方体のサイコロがあり、1から6までの目がそれぞれ1つずつ配置されている。また、サイコロの物理的構造に偏りがない」という前提(ルール)を置きます。
  • 論理的な導出:
    • このルールが正しいならば、起こりうるすべてのケース(全事象)は6通り存在します。ここに「すべての事象の確率の和は1である」という確率の公理を適用することで、それぞれの目が出る割合は \(1/6\) である、という計算結果が導き出されます。

上記のとおり「確率」は、既に確定している絶対的なルール(前提)をもとに、そこから生じる未来の結果を計算によって導き出します。確率」が演繹的である所以です。

2.2. 統計は「帰納的思考」

一方で「統計」は、スタート地点がまったく異なります。
私たちが最初に出会うのは、ルール(前提)ではなく、蓄積された「過去の事実(データ)」です。
この不確かな事実の集まりから、その背後に隠されているであろう「正解のルール」や「未知の法則」を逆算して推理するのが「統計」なのです。

  • 事実(データ):
    • ある湖で、一か月間連続で網を投げ続けたところ、捕まった魚の8割が特定の種類だった。
  • 推理(ルール):
    • この結果から、「この湖全体には、その種類の魚が8割生息しているという法則(ルール)があるはずだ」と、湖全体の構造を逆算する。

このように、「統計」は、結果(過去の事実)」を観察し、そこから「正解のルールや未知の法則」を導き出そうとします。統計」が帰納的である所以です。

第3章:計算の土台 ~「同様に確からしい」という前提

ここまで、ルールから結果を導く「演繹(確率)」と、事実からルールを推理する「帰納(統計)」について見てきました。

では、私たちが演繹を使って「サイコロで1が出る確率は \(\displaystyle \frac{1}{6}\) だ」と計算するとき、その根底には何があるのでしょうか。

そこで重要になるのが、同様に確からしいという考え方です。

「同様に確からしい」とは、簡単に言えば「どの結果も、同じくらいの強さ(確率)で起こると期待できる」状態を指します。

この「同様に確からしい」という言葉は、自然な日本語に聞こえませんよね。

それもそのはず、語源は英語の “Equally Likely” です。
さらに、この言葉のルーツは、19世紀の数学者ラプラスが提唱した「同様に可能(également possibles)」にあり、これが英語で “Equally Likely” と訳されました。

近代日本が西洋数学を導入した際、「Likely(起こりそうであること)」にぴったりの日本語が存在しませんでした。
そこで、英語を忠実に直訳し、「同様に確からしい」という独自の用語が生み出されたのです。
この「何やらお堅く感じる」独特な表現には、西洋の新しい概念を正確に日本へ持ち込もうとした当時の人々の熱意・情熱が込められているのです。

3.1. 「平等」を信じるのが確率(演繹)

確率の世界では、まずこの「同様に確からしい」というルールを前提(スタート地点)として置きます。

  • 理想の世界: 「歪みのないサイコロなら、1から6までのどの目も平等に出るはずだ」というルールを定義する。
  • 計算の成立: この前提を置くからこそ、全6パターンのうち特定の1つが出る確率は \(\displaystyle \frac{1}{6}\) である、と数え上げによって論理的に正解を導き出せる。

3.2. 「平等か?」と疑うのが統計(帰納)

一方で、現実の世界で「同様に確からしい」という前提が正しいかどうかは、やってみなければ分かりません。

  • 熟練の職人が投げたコインは、わずかに表が出やすいのではないか?
  • 投資の世界で、株価が上がる確率と下がる確率は、本当に \(50\%\) ずつなのか?

こうした「前提そのものが正しいか不明なとき」に、大量のデータ(事実)を観察して、「実際はどういうルールで動いているのか?」を逆引きして推理するのが、帰納的なアプローチ、すなわち統計学の役割です。

第4章:AI・量子へと繋がる学習ロードマップ

本シリーズでは、今回の記事で学んだ「情報のベクトル」を意識しつつ、基礎から最先端の技術までを全 8 回に分けて駆け抜けます。
すべての回において、「数式で納得し、Pythonで実験する」というスタイルを貫きます。

  1. 本記事(情報のベクトル:演繹と帰納を掴む)👈いまココ
  2. 【確率①】【確率①】まずは「数え上げ」から!樹形図で全パターンを網羅する
    • itertoolsで全パターンを網羅。樹形図をコードで再現。
  3. 【確率②】理論値と実践値の交差点:Pythonで捉える「確率収束の瞬間」
    • 公理に基づき、シミュレーションで確率の収束を確認。
  4. 【確率③】期待値は「未来の平均値」。投資とギャンブルの境界線をシミュレート
    • 投資やギャンブルを例に、期待値の有利・不利を計算。
  5. 【統計①】平均だけでは不十分?Python、中央値・最頻値のコラボでデータの特徴を「見える化」
    • Pandasを使い、平均・中央値・最頻値の特性を比較。
  6. 【統計②】Pythonで作りながら理解する分散と標準偏差の数値化
    • 分散と標準偏差を可視化。データの「広がり」を制御する。
  7. 【架け橋】大数の法則:「偶然」が「必然」に変わるとき
    • 【重要回】 「事実」が「ルール」に近づく瞬間をグラフ化。
  8. 【確率・統計 完結】正規分布:カオスの中に潜む「神曲(神の曲線)」をPythonで描く
    • ベルカーブを描画。AI学習で重要な「データの規格化」を体験。

まとめ

このシリーズの出発点として、本記事では「一石三鳥」の価値と、情報のベクトルである「演繹(確率)」と「帰納(統計)」の違いについて学びました。

今回のポイントを振り返ってみましょう。

  • 確率は「演繹」のベクトル: 公理や法則といった「確定したルール」から、未来の結果を論理的に導き出す。
  • 統計は「帰納」のベクトル: 蓄積された「過去の事実(データ)」から、その背後にある正解のルールを推理する。
  • Pythonは最強の補助輪: 難解な計算はコンピュータに任せ、私たちは「情報の向き」や「意味の解釈」という本質に集中する。

確率・統計、そして Python は、ともに現在のAI開発や次世代の量子コンピューティングを支える共通言語です。
このシリーズを終える頃には、最先端技術のドキュメントを読み解くのに必要な「思考ノウハウ」の感触があなたの手に残っているはずです。

数学の公式をただ暗記するだけの時代は、もう終わりです。
次回からは、Pythonのコードを実際に動かしながら、広大な数学の世界を冒険していきましょう。

次回の目的地は、すべての確率の基礎となる「数え上げ」です。

コメント

タイトルとURLをコピーしました