今回は、期待値に関して学習します。
前回は、確率変数について学習しました。具体的に記載しませんでしたが、確率変数は実現値でもありました。
学習中の本は以下のものです。
|
サイコロの場合
目の数 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
1〜6が確率変数で下のように数式で表します。
1(実現値) x 1/6(確率)
そして一般化するとE[X] = xi pi
のように表現できる。
期待値
期待値=<確率変数の実現値> x <実現値の確率>の合計
つまり、サイコロの期待値は・・・
(1 x 1/6) + (2 x 1/6) + (3 x 1/6) + (4 x 1/6) + (5 x 1/6) + (6 x 1/6) = 3.5
となる。
傘を持ってくるこないの話では
始めにやった損失も同様に期待値を比較するものになります。
これの場合は下のような表を使いました。
傘を持ってくる | 持ってこない |
---|---|
Ⅰ 晴れ(0.4 : -2) | Ⅲ 晴れ(0.4 : 0) |
Ⅱ 雨(0.6 : -2) | Ⅳ 晴れ(0.6 : -10) |
なので上のケースに当てはめると
傘を持ってくる場合:(0.4 x -2) + (0.6 x -2) = - 0.2
傘を持ってこない場合:(0.4 x 0) + (0.6 x -10) = - 6
(A) 傘を持ってくるときの「期待値」は -2
(B) 傘を持ってこないときの「期待値」は -6
つまり、(A) > (B)
が成り立つので(A)の方が得という判断になる。
計算式
一般化して(変動する値を文字に置き換えて)式を書くと
期待値:E[X] =
xi pi
というような形になります。
分散
(実現値 - 期待値)^2(2乗)の平均
この文言では意味がわからないので、サイコロの場合で考えると
目の数 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
期待値=3.5
(1 x 1/6) + (2 x 1/6) + (3 x 1/6) + (4 x 1/6) + (5 x 1/6) + (6 x 1/6) = 3.5
上の定義に当てはめると ※「^」キャレットは〜乗の意味
(1 - 3.5)^2 + (1 - 3.5)^2 + (2 - 3.5)^2 + (3 - 3.5)^2 + (4 - 3.5)^2 + (5 - 3.5)^2 + (6 - 3.5)^2 = 2.9 ...
なので分散は2.9.119...となる
これを一般化すると下のようになる。期待値は「u
」とする
分散値:V[X] =
(xi - u)^2 pi
とりあえずはこんなものだというところの理解(思い出したい時にこの記事を見るレベル)で良いようです。(本にそう書いています)
ちなみに、プログラムを書いていないですが、用途が決まらないのでまだコードには落とせませんでした。。。
でわでわ。。。