記録帳

クラウド、データ分析、ウイスキーなど。

確率変数について超わかりやすく説明する

皆さんこんにちは。空には入道雲が広がり、暑さも続く昨今、いかがお過ごしでしょうか。

まえがき

私はというと、いつもの発作がおきまして、統計について勉強しなおしています。
いつも統計の勉強をしていて思いますが、最初に出てくる確率変数の概念がいまいちしっくりこない。
だから、そこから続く式も頭に入ってこない。とりあえず式の形や定義を覚えて、1か月後には忘れる。
それを何回も繰り返していました。

しかし、今回、確率変数のしっくりくる説明を見つけ、かつそこからつながる累積分布関数、確率関数、確率密度関数
ストーリーとしてわかるようになりました。ちょっと感動したので、それを忘れないためにもここに記載しておこうと思い立ったわけです。
今回は、一旦確率変数の説明のみをします。これがわかれば、それ以降の累積分布関数などは書籍の説明で理解できると思います。

ということで、さっそく始めます。

確率変数とは?

私が買った参考書には、以下のように説明されています。

一般に、Ωを全事象、ΒをΩの可測集合族、Pを(Ω, Β) 上の確率とするとき、ω∈Ωに対して実数値X(ω)∈Rを対応させる関数Xを確率変数という。

久保川達也『現代数理統計学の基礎』(共立出版、2020年7月5日初版7刷発行)p.11

ただ、これではさっぱりわかりません。
そのため、私が色々調べたり考えたりした結果、このように理解するのが一番わかりやすいという結論に至りました。

確率変数とは、事象を実数値に変換する関数である。

まず、確率変数とは関数です。一般的な関数は、f(x)=x+3のように、「ある値を入れると、なにか別の値が返ってくる」というものです。
しかし、確率変数は、「ある事象を入れると、なにか実数値が返ってくる」という関数なのです。
例を用いて説明します。

f:id:supa25:20210723105957p:plain
確率変数Xの具体例

例えば上図のさいころの例です。
さいころを振って5が出た」という事象に対して、5という実数値を返すのが確率変数Xです。
ここで、「さいころの目が5なんだからそれに対応するのは5で当たり前じゃないか」と思うかもしれませんが、
さいころの目が5であることとそれに対応する実数値が5であることは別物です。
例えば、ヘブライ語で5は ה です。さいころに ה と書いてある目が出たらどうでしょうか。
これが5に対応するか、知らないとわかりませんよね。
このように、
この現実世界で起きた事象を、計算できるように数値の世界に変換する
のが確率変数Xです。

また、右2つの身長の測定や時間の計測も同じように考えられます。
ただ、こちらはさいころやコインと違って、実数値が無限に存在します(163.0cm, 163.0000000000000001cm, 163.00022101031cm など)。
言い換えると、実数値が飛び飛びではなく連続して存在するので、この時の確率変数を連続型確率変数といいます。
そして、左2つのさいころとコインのように、実数値がとびとびの時の確率変数を、離散型確率変数といいます。

確率変数と確率の関係は?

確率変数についてわかったところで、この確率変数と確率Pの関係について考えます。
これも、まずは私の読んでいる参考書から引用します。

任意の実数xに対してX≦xである確率は

 P\left( X\leq x\right) =P\left( \left\{ w\in \Omega | X\left( w\right) \leq x\right\} \right)

として,(Ω,Β)上で定義された確率Pを用いて与えることができる.
久保川達也『現代数理統計学の基礎』(共立出版、2020年7月5日初版7刷発行)p.11

ぱっとみイカつい式ですが、先ほどの「確率変数とは、事象を実数値に変換する関数である。」ということが分かれば理解できます。
左辺は分かりやすいと思います。任意の実数xなので、例えばさいころを振った時のことを考えるとして、xを3としましょう。
そうすると、P(X≦x)は、「確率変数の値が3以下の時の確率」という意味になります。

次は右辺ですが、まずこの縦棒|は条件付き確率を示します。
例えば、A,B,Cという3つの袋があって、それぞれの袋に赤球と白球が入っていたとします。
その時、袋Bを選んだ前提で、赤球を引く確率を
P( 赤球 | 袋B )
と表せます。つまり、縦棒|の右側を前提として、左側の事象が起きた時の確率を示しています。

元の式の右辺に戻って、まずは縦棒|の右側である前提条件から見ていきます。
X(ω)≦xですが、まずωはある事象です。さいころで5の目が出る、コインを投げて表が出る、身長を測って163cmだった、時間を計って12.3秒だった、などです。
それを確率変数Xに入れたX(ω)は、先ほどの絵で言うところの下側、実数値になりますよね。
つまり、ここは「実数値がx以下になるとき」という前提条件になります。
さいころを振った時のことを考えて、xを3とした場合は、「実数値が3以下になるとき」となります。

さて、次は縦棒|の左側です。
ω∈Ω となっています。ここでΩは、全事象を示しています。さいころ振りで言えば、1~6の目が出る全てですね。
そのため、ここは「全事象に含まれるある事象」と言っているわけです。

これらを総合すると、
 P\left( X\leq x\right) =P\left( \left\{ w\in \Omega | X\left( w\right) \leq x\right\} \right)
この式の右辺は「実数値があるx以下になるという前提条件のときの、(全事象に含まれる)ある事象」と翻訳できます。
縦棒|の右側は実数値(絵の下半分の数値の世界)で前提条件を指定していて、左側はその前提条件における事象(絵の上半分の現実の世界)を言っているのです。
そう考えると、左辺と右辺は同じことを言っていることが分かりますよね。

このように、確率変数が絡んできている式の時は、現実の世界か、数値の世界どちらのことを言っているのか?と考えるとしっくりくると思います。

まとめ

  • 確率変数とは、事象を実数値に変換する関数である。
  • 実数値がとびとびの場合は「離散型確率変数」、連続の場合は「連続型確率変数」という。
  • 確率変数と確率の関係も、現実の世界での事象の話と数値の世界での実数値の話を踏まえると理解しやすい。

以上です。
素人が勢いで書いた記事のため、間違いなどあったらご指摘いただけるとありがたいです。
引き続き、この本は読んでいこうと思います。