1. 概要

このチュートリアルでは、確率論で最も重要な結果の1つである中心極限定理(CLT)を確認します。

最初に、定理の正式なステートメントを説明し、現実の世界での関連する意味について説明します。 次に、CLTをよりよく理解するために、GaltonBoardの例を示します。

2. CLTの正式な声明と重要性

平均、、および分散をもつ独立確率変数()を考えてみましょう。 CLTは、として、合計が平均と分散を持つガウス確率変数になると述べています。 これは、元の変数、が正規分布でない場合でも当てはまります。

より簡単に言えば、CLTは、かなり一般的な条件下で、多数の独立確率変数の合計が正規分布していると述べています

CLTの重要性は、いくつかの実際のアプリケーションでは、確率変数が多数の独立した確率変数の合計であるという事実に由来します。 したがって、CLTは、ガウス確率分布が自然界で非常に一般的に観察される理由を説明しています。

  • 実験物理学では、測定誤差は通常、通常の確率変数によってモデル化されます。
  • 信号処理では、ノイズはガウスノイズとしてモデル化されます。
  • レーザービームの断面強度は、ガウス分布に従います。

ランダムサンプリングを実行すると、CLTのもう1つの重要な結果が観察されます。母集団から十分に大きなサンプルをランダムに選択すると、元の母集団の分布に関係なく、サンプル平均は正規分布します[ X266X]。

3. CLTの背後にある仮定

CLTは、次の条件が満たされている場合に適用できます。

  • 確率変数は互いに独立している必要があります
  • 確率変数の数は十分に大きく、合計内の各寄与は小さくする必要があります。 どのくらいの大きさは、変数の分布に依存する必要があります。 一般に、確率変数の全体的な分布が対称の場合、サンプルサイズは30で十分であると見なされます。
  • ランダムサンプリングが置換なしで行われる場合、サンプルサイズは母集団の10% o以下でなければなりません。

4. 例:ゴルトンボード

ビーンマシンまたは五の目型としても知られるゴルトンボードは、英国の科学者フランシスガルトンがCLTを実証するために発明した装置です。

この装置は、等間隔の釘が千鳥状に配置され、板の上半分に配置された垂直板で構成されています。 下半分には、一定数の等間隔のスロット(ビン)が含まれています。 ガラスがデバイスの前面を覆い、釘やスロットを見ることができます。 じょうごは上端の中央に配置されます。

ゴルトンボードは、次の図に概略的に示されています。

じょうごにたくさんのボールが注がれ、それらは通り抜けます。 釘は対称的に配置されているため、ボールが釘に当たるたびに、同じ確率で右または左に跳ね返ることができます。 最後に、ボールは下部のスロットに集められます。 スロットの充填は、ベルカーブに非常に近いものです。

なぜこのベル分布が観察されるのですか? 各ボールの最終的な位置は、右または左へのランダムな変位の合計です。 したがって、最終的な位置は、離散確率変数の合計として表すことができます。許容値は1と-1のみで、それぞれ右または左へのバウンスを表します。

中央のビンの充填は、右端(または左端)のビンへのパスよりも中央のビンに到達するパスの方が多いため、端のビンの充填よりも大きくなります。

スロットの充填は二項分布に従うことを示すことができます。 行数とボール数の両方が十分に大きい場合、分布はCLTによるガウス分布に近似します。

5. 結論

この記事では、統計の基本定理である中心極限定理を確認しました。 正式な声明とその背後にある仮定について説明しました。 次に、CLTの重要性を強調するために、いくつかの実際のアプリケーションについて説明しました。 最後に、CLTを実証するためにアドホックを発明したデバイスであるGaltonボードを調べました。