数学への挑戦第3弾:数理モデルを理解する

イントロダクション

今まで、人工知能を理解したいと思色々と学習しましたが、どれも理解に至らず。。。

悩んだ挙句にたどり着いたのが、学習モデルを理解するというのがキーポイントになると思うに至りました。

では「学習モデルとは?」と悩んでいるとひょんなところに下のような本がありました。

早速学習開始です。本の内容は以下の通りです。

  1. 数理モデルとは
    • データ分析と数理モデル
    • 数理モデルの構成要素・種類
  2. 基礎的な数理モデル
    • 少数の微分方程式によるモデル
    • 確率モデル
    • 統計モデル
  3. 高度な数理モデル
    • 時系列モデル
    • 機械学習モデル
    • 強化学習モデル
    • タ体系モデル・エージョントベースモデル
  4. 数理モデルを作る
    • モデルを決めるための要素
    • モデルを設計する
    • パラメータを推定する
    • モデルを評価する

以上のような内容でこの本は記述されています。
※目次を参照しました。

Javaで数学的なことをやろうとしたときに使えるのがND4Jです。これに関してはこちらの記事にインストール方法などを記載しています。

ちなみに、今まで学習したものに関しては下のリンクです。カテゴリ分けしているので「数理モデルとJava」というカテゴリで検索した結果です。
数学への挑戦履歴

数理モデルの理解

3度目の正直、今度こそ数理モデルを理解して「学習モデルの理解」につなげたいところです。

今までに調べたことでわかっていることは以下の部分です。

  • 数理モデルの作り方を理解すれば、学習モデルも理解できそうだ。
  • 色んな本でロジスティック回帰とか、マルコフ過程とかあるが、そこら辺はTensorFlowなどのフレームワークライブラリのメソッドで定義されているので入力と出力を理解すればよい(全部は見ていません)

たいしたことではないですが、「数理モデル」を理解できればあとは、プログラミングの知識(技術)で何とかなりそうだと思いました。

注意事項

「システム」という言葉がアプリケーション・システムと何かしらのデータを生成するものと二つの意味を持っているので注意してください。記載する内容に関しては「アプリケーション」と「データを生成するもの」のように書き分けています。

データを分析するということ

普段から我々は、いろんな情報をもとに世の中を理解・制御しています。
しかし、単純なことは問題なく理解と制御ができますが、複雑なことになるとそうもいきません。

なので以下の方法でそれを解決しようという試みです。

  1. 理解したいもの事の情報(データ)を観測などをして取得する
  2. そのデータを分析する
  3. 分析の結果からそのメカニズム・ルールを客観的に理解する

対象をデータ生成システムとして見る

データの生成システムと書かれてもよくわかりませんでしたが、このシステムを観測することでデータを取得(生成)できるので「データ生成システム」というわけなのですね。。。

システムとデータが下のようなものです。

システム
  • A.生物現象
  • B.物理現象
  • C.社会現象
  • D.顧客の行動
データ
  • A -> イナゴの大量発生
  • B -> 交通渋滞
  • C -> 少子高齢化社会
  • D -> 売れ筋商品の予想

そして、これらの関係は下のようなものです。

システムを観測するとデータが取得できる
データを調べ、データの生成ルールを推測できる(できないものもある)

データ分析のアプローチ

アプローチその1: 要素還元

  • 分類可能な少ない種類の要素の集まりとして理解

ある物事(システム) -> 要素分解 -> 理解 -> 応用・制御

例:※とてもシンプルにしています。
システム=自転車に乗るための技術
要素={ バランスを取る, ペダルをこぐ}
理解1=自転車に乗ってバランスをとる練習をする
理解2=自転車に乗ってペダルをこぐ
応用・制御=自転車に乗れるようになる

アプローチその2: 深層学習(Deep Leaning)

  • 複雑なものは複雑なまま理解

この様な物事に関して理解をするためには「数理モデル」を使用して、以下の課題を解決する

  1. 現象のメカニズムを客観的な方法で明らかにする
  2. データから未来を予測する
  3. コンピュータに高度なデータ処理・データ生成をやらせる

そして、数理モデルとは?に対する答えは下のような記述がありました。

数理モデルとは数学的な手段を用いて記述された、対象のデータ生成ルールを模したもの

つまり疑似データ生成ルールということです。

数理モデルの役割

平均値、標準偏差などを算出してその結果を眺めて対象データを分析することも立派な分析ですが、

・現象のメカニズムを客観的な方法で明らかにする
・データから未来を予測する
・コンピュータに高度なデータ処理、データ生成をやらせる

などのように、眺めても分析できないことがあるので、それを解決します。

数理モデルは仮定である

推理小説に出てくるような「仮定」をたてて、それを使用して対象になるシステム(データを生成するもの事)と同じようなデータを出してくれるように調整します。

手順としては以下の通りです。

  1. 「仮定(数理モデル)」をたてる(つくる)
  2. 対象システムと同じようなデータを生成するように調整する
  3. できた数理モデルが、どれだけ対象(システム)を表現できているか検証する

つまりは、仮定がどれだけ現象のメカニズムに近いのか?ここが重要になり、数理モデルによって得られたデータが現実に近ければ近いほど数理モデルは生き生きと振る舞いを見せるということらしいです。
※本を読んで理解したところなので「らしい」と記載しています。

数理モデルの構成要素

  1. 変数
  2. 数理構造
  3. パラメータ

1.変数:変数で表す

数理モデルを作るための初めに一歩は「変数を作ること」です。

変数とは、対象となるシステムの「状態」「性質」「量」などを数字やラベルで表したもの

変数は3種類

  1. 値の性質による分類

      • 量的変数:たし算、引き算ができる変数のこと
    • (Ex)
    • 体重・身長など=人の特徴を示すときに使用する
      • 質的変数:行ってよい操作・ダメな操作を判別する場合に使用する
    • (Ex)
    • 性別・趣味・テストの順位など、またの名をカテゴリ変数
  2. 観測できるかどうかによる分類

      • 観測変数:直接観測(測定)可能な変数
    • (Ex)
    • ある顧客がコンビニで商品を購入したとき、「何をいくつ買ったのか?」
      • 潜在変数:直接観測(測定)できない変数
    • (Ex)
    • ある顧客がコンビニで商品を購入したとき、「なぜその商品を買ったのか?」
    1. 説明する/されるかによる分類
        • 目的変数:原因を受けて発生した結果を示す変数
      • (Ex)
      • バネに重りをつけ、バネの伸び率を見た場合には「原因にあたる『重りの重さ』」が目的変数になる
        • 説明変数:何かの原因となっている変数
      • (Ex)
      • バネに重りをつけ、バネの伸び率を見た場合には「原因にあたる『重りの重さ』」が説明変数になる

2. 数理構造=数理モデルの骨組

下のような説明がありました。はっきりとはしませんが、今後出てくる「方程式」や「アルゴリズム」のことと理解しています。※ニュートンの運動方程式、マクスウェルの方程式など。。。

数学的に表現する時に必要な数式、適切な数理構造を選ぶことが良い分析のかなめになります。

3. パラメータ=数理モデルを動かすもの

数理モデルの振る舞いをデータに沿わせるための「稼働域」を制御するもの
モデルをデータに合わせる「フィッティング」を行うことで数理モデルが完成します。

パラメータは、数が多くなると「可動領域が多く」なりますので、パラメータの数は適切な数にする必要がある。

このパラメータに関しては、学習を進めていく中で理解する必要があるみたいです。

微分は「何かの、何かに対する変化の割合を計算したもの」

つまるところは、微分をたくさん使いますというところです。別個に学習が必要かもしれない。。。

そして細かい計算は計算機を使用するようです。それならば、プログラムで計算したほうがより複雑で難解な計算でも行うことができます。

モデリング

モデリングの手法は大まかに2種類

  1. 理解志向型モデリング:データがどのようなメカニズムで生成されているか理解する、以下のような形にする
    • 変数やパラメータの数を最小限にする
    • 数理構造に使用する関数をできるだけ簡単にする
  2. 応用志向型モデリング:手元のデータをもとに、道のデータに対して予測・制御を行ったり、データの生成、利用を行う
    • 数理モデルから出てくるデータを使う。用途としては「予測」と「生成」
    • 画像解析(手書きの文字識別など)

次は「少数の方程式によるモデル」を学習します。(2021/02/21)

とりあえずはここまでです。

でわでわ。。。

数理モデル関連

第二弾

第三弾

アンケート調査アプリ3〜アンケート調査方法、理論編〜

前回は、アンケートの集計を行う方法を考えました。だいたい疑問に思うことは「どーやるか?」ということが多いです。。。

アンケート調査の式

前回やったことは下のようなことです。
集計時に使用する計算は下の4種類

1.平均値: 平均値は、回答結果の算術平均(全数値データを足しあげて、データ数で割ったもの)を指します。
2.中央値: 中央値とは、回答結果として得られた数値データを大きい(小さい)順に並べて、ちょうど真ん中の位置にくる数値です。
3.標準偏差: わからん
4.最小値・最大値: 最小値、最大値は、全数値データの中で最も小さい値、最も大きい値です。

そして「標準偏差」というのが「わからん」という内容でした。
しかしながら、「標準偏差」の計算方法までは理解しました。
早い話が以下のような数式で表現できます。

しかし、これだけみても「なんだこの楽が義は?」としか思えません。でも「数学」という世界ではこの落書きを1つの「言語」として使用するようです。
一般人の我々には「この言語」の意味を調べる必要があります。

数式の意味

以下のような内容です。

n = 全体の数
X = 各要素のうちの1つの値
i = 各要素の番号
Xi = 各要素の値
シグマの式は平均値

上記のようになっています。 細かいところは前回の記事を参照されたし。

プログラムで数式を表現する

上の式の場合は説明にあるn= ...の部分を「引数」として使用します。
そして、シグマは配列で表現できるので。。。

public double konosushiki(int n, int i, double[] X) {
// 平均値
double avg = 0.0;
double num = 0.0;
for (int i = 0; i < X.length; i++) {
num += X[i];
}
// 平均の算出
avg = num / X.length;
// 標準偏差
double hyojunHensa = Math.sqrt((X[i] - avg)^2 / X.length) / X.length;
return hyojunHensa;
}

こんな感じです。プログラムの方がわかりやすい!

算数になりますが、三角形の面積であれば下のようになります。

public double sankakei(int height, int width) {
   return height * width / 2;
}

このような形で「数式」をプログラムに置き換えるkとが可能です。

つまり「数学パズル」はプログラムで簡単なゲームにすることができる!ということです。

でわでわ。。。



アンケート調査アプリ2〜アンケート調査方法を調べる〜

今回はアンケートで集計した情報から欲しい情報を導き出す方法を考えます。

ちなみに、前回はアンケートプラグインで使用できる情報とその仕様を整理しました。

アンケート調査の基本

参考にしたアンケート調査はこちら
標準偏差についてはこちらです。

とりあえず基本としては、取得した回答(データ)の各割合を求めてやる(各質問/回答者)ことのようです。

集計方法一覧

1.平均値: 平均値は、回答結果の算術平均(全数値データを足しあげて、データ数で割ったもの)を指します。
2.中央値: 中央値とは、回答結果として得られた数値データを大きい(小さい)順に並べて、ちょうど真ん中の位置にくる数値です。
3.標準偏差: わからん
4.最小値・最大値: 最小値、最大値は、全数値データの中で最も小さい値、最も大きい値です。

統計に関して調べた時にも上記のようなキーワードが目に入りました。
そして、わかりづらいものが標準偏差です。
しかし、そんなものは一発です。ズバリ以下の通りです。

しかし、用途がわからん。。。

標準偏差の算出方法

Step1: 平均値を求める

皆さんご存知対象の値 / 全体の値が平均値です。
例を挙げると、クラスのテストの平均点などは以下のようになります。前提として対象のクラスは以下のような状態とします。

3-B組
人数: 30名(男15/女15)
クラス全体の取得した点数 / 30

これを一般化してやると。。。上の情報が下のように書き変わります。

X1組
人数: Y1人(男Y2 / 女Y3)
合計得点: Z1

Y1 / X1

そして、クラスから学校ないに変更してやると。。。

X1 ... Xn組
人数: Y1 ... Ynの合計
合計得点: Z1 ... Zn

表にすると下のようになります。

クラス名 人数 得点
X1 Y1 Z1
... ... ...
Xn Yn Zn

数式で表すと。。。

上のような式で表現できます。計算が面倒ですが、そこはプログラムにやらせましょう(笑)

Step2: 偏差を求める

まずは「偏差」ってなによ?というところから始まります。シグマのマークが出てきたところで自分は頭の中が全て「?」で埋め尽くされます(泣)

偏差とは、各データの値から平均値を引いた値のことです。

なるほど、テストの点数では以下のようになるわけだ。

・クラスの平均点50点
・自分の点数30点
→ 偏差値=-20

じゃ、これを一般化する(文字で置き換える)と下のようになります。ちなみに自分の点数=Aとした場合下のような式にな流のか?

上の式では、単純に「自分の点数の偏差値」なので役に立たない式ですが、これを合計したりなんだり。。。

Step3: 分散の平均を求める
分散=偏差を2乗を合計

なので
Aを要素(Xi)のうちの1つとしてみた時に上の式になりますが、これを一般化すると
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式2.png)
のようになります。

そして、これを2乗するので下のようになります。
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式3.png)

さらに、これの平均なので
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式4.png)

##### Step4: 分散の平均の平方根を求める
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式5.png)

最終的にはこの式が「標準偏差」となります。

## なにに使うのよ?
[こちらのサイトも見てみました](http://rplus.wb-nahce.info/statsemi_basic/stat_sanpudo.html)が、「ばらつき具合」がわかるということ以外はわかりませんでした。

しかし、ちょっと考えてみると「平均からどれだけ離れているか?」を示す値なのだから「〜が?%」のような答えは出ないのだと思いました。
「どのように分析するか?」という時に使用できそうな値です。

でわでわ。。。



数学への挑戦 第二弾〜まとめ1:数理モデルxプログラミング〜

前回は確率変数の足し算を行いました。しかし、イマイチな感じです。。。
なので、これらをまとめるために「樹形図」を使用して今までの学習したものをまとめようと思います。

今までのまとめ

  1. 傘を持っていくべきか、持っていかないべきか?
  2. 数理モデルをJavaで表現する
  3. 喫煙率を求めるモデル
  4. コインの表裏(確率変数)
  5. コインの表裏(期待値と分散)
  6. 卒業までに彼氏ができる確率
  7. 確率変数の足し算

使用する書籍は下のものです。

1.傘を持っていくべきか、持っていかないべきか?

ここでは、傘を持っていくことの嫌度(損失)を-2とし、雨に濡れることの嫌度(損失)を-10として計算式(数理モデル)を作成しました。
ポイントは「全てのケースに対する結果を数値化する」と言うところでした。
具体的には以下のようになります。

<前提>
行動の選択肢は「傘を持ってくる」 or 「持ってこない」の2つ
<嫌度>
雨に濡れることの嫌度 = -10(濡れないとき = 0)
傘を持ってくることの嫌度 = -2
<確率>
雨の確率: 60% = 0.6
晴れの確率: 40% = 0.4

上記のようになります。

平均的な損失を求める

上でまとめたものを表にすると下のようになります。
<天気(確率 : 嫌度)>

傘を持ってくる 持ってこない
Ⅰ 晴れ(0.4 : -2) Ⅲ 晴れ(0.4 : 0)
Ⅱ 雨(0.6 : -2) Ⅳ 晴れ(0.6 : -10)

これらの結果(Ⅰ -> Ⅳ)から平均を求めると

<傘を持ってきた場合の損失>
Ⅰ + Ⅱ + Ⅲ + Ⅳ = (0.4 - 2) + (0.6 - 2) = -0.8 - 1.2 = -2のようになります。
<傘を持ってこない場合>
Ⅰ + Ⅱ + Ⅲ + Ⅳ = (0.4 0) + (0.6 -10) = 0 - 6 = -6

2.数理モデルをJavaで表現する

そして、変数にできるものを変数化(一般化)してやるとしたのようになる。

降水確率60% = 0.6 = p : 晴れの確率40% = 1 - p
雨に濡れる嫌度 = -10 = -c : 傘を持ってくる嫌度 = -c/5

雨の場合
(0.4 x -2) + (0.6 x -2) = -2 => ((1-p) x -2) + (p x -2) = (-2 + 2p) + (-2p) => 平均は「-2」
晴れの場合
(0.4 x 0) + (0.6 x -10) = -6 => ((1-p) x 0) + (p x -10) = 0 + -10p = 平均は「-10p」

ここで「雨に濡れる嫌度が1/5」になっているのでこれも変数化します。変数名は「a」にします、そして割合なので0 < a < 1」になります。まとめると以下のようになります。

雨の確率 = p : 晴れの確率 = 1 - p
雨に濡れる嫌度 = -c : 傘を持ってくる嫌度 = -ac

これを式にすると。。。

傘を持って来た時
((1-p) x -ac) + (p x -ac) = (-ac + pac) + (-pac) = -ac
傘を持ってこなかった時
((1-p) x 0) + (p x -c) = (0 - pc) = -pc

結果として、

a > p

なので、「雨の確率がa(傘を持ってくる嫌度の割合)より大きい時」ということになります。

3. 喫煙率を求めるモデル

回答のランダム化で、出た結果のグループ分けを行う
1.Aグループ = コインで表が出た人
2.Bグループ = コインで裏が出た人
3.Cグループ = Aの中でタバコを吸った人
4.Dグループ = Bグループでタバコを吸った人

実際に行ってはいないけれど「仮に」喫煙者が400人いたとするのであれば、喫煙率は「400 / 1000 = 40%」になるので「コイントスでA, Bグループ(500人ずつ)にいる喫煙者社の割合(確率)も40%で200人ずついることになる。

求めるべき値の喫煙者数=400は下のようにして求めることができる。

|B U C| = |B| + |C|
|B U C| - |B|=  |C| 両辺から|B|を引く

下の値を使用して計算すると。。。
|B U C|=600, |A|=500, |B|=500
次のような計算式で求めることができる
|B U C| - |B| = |C| = 100
|C| / |A| = 100 / 500 = 0.2 = 40%
となる。。。つまり喫煙者の割合は「40%」になり「仮定」で示した「400」と言う数値も正しいものであると言える。

と言うような感じで、集合を使った時の考え方を学びました。

4. コインの表裏(確率変数)

確率変数

前回の話では、コインの表裏を使ったので下のような確率が存在します。

出来事 確率
裏が出る 0 0.5(1/2)
表が出る 1 0.5(1/2)

そして、出来事の集合をΩ={裏, 表}のように表現します。
さらに、(わかりやすいように)コインがちょっと曲がっていて上の確率が変わり下のようになったとします。(仮定)

出来事 確率
裏が出る 0 0.4
表が出る 1 0.6

ここでの「0」「1」が確率変数というものになります。

サイコロの場合
目の数 1 2 3 4 5 6
確率 1/6 1/6 1/6 1/6 1/6 1/6

1〜6が確率変数で下のように数式で表します。
1(実現値) x 1/6(確率)

そして一般化するとE[X] = xi pi
のように表現できる。

5. コインの表裏(期待値と分散)

目の数 1 2 3 4 5 6
確率 1/6 1/6 1/6 1/6 1/6 1/6

1〜6が確率変数で下のように数式で表します。
1(実現値) x 1/6(確率)

そして一般化するとE[X] = xi pi
のように表現できる。

期待値

期待値=<確率変数の実現値> x <実現値の確率>の合計

つまり、サイコロの期待値は・・・

(1 x 1/6) + (2 x 1/6) + (3 x 1/6) + (4 x 1/6) + (5 x 1/6) + (6 x 1/6) = 3.5となる。

6. 卒業までに彼氏ができる確率

「出会った男性が青葉のことを好きになる or ならない」で考えます。

好きになる 好きにならない
1 0

そして、確率変数の時と同じように表にすると下のようになります。

出来事 確率
好きにならない 0 1 - p
好きになる 1 p

P(X1 = 1) = p
P(X2 = 0) = 1-p

これが、ベルヌーイ分布というもだと書いてありました。

確率変数Xが、「確率pでX=1」となり、「確率1-pでX=0」となる時、確率変数Xはベルヌーイ分布に従う、という

男性1(X1) 男性2(X2) 男性3(X3) 合計
No No No 0
Yes No No 1
No Yes No 1
No No Yes 1
Yes Yes No 2
Yes No Yes 2
No Yes Yes 3
Yes Yes Yes 3

上の表が起こりうるパターンを一覧化したものです。
これらの期待値を算出するためにはどう考えたら良いかを学習しました。

7. 確率変数の足し算

上の表にあるもので実際に同時には起きない事象があります。

X1, X2の独立下確率変数を1つの塊としてみる

と言うことが「確率変数の足し算」と言う意味です。
これはどう言うことかと言うと

「男性1が好きになり、男性2が好きにならない」という事象と「男性2が好きになり、男性1が好きにならない」という事象は「同時に起きない」

と言うことなので、

パターン数が1のもの(合計が0 or 3)

① P(X1 + X2 + X3 = 0) = P(X1=0, X2=0, X3=0) = P(X1=0)P(X2=0)P(X3=0) = 1/2 x 1/2 x 1/2 = 1/8

②P(X1 + X2 + X3 = 3) = P(X1=1, X2=1, X3=1) = P(X1=1)P(X2=1)P(X3=1) = 1/2 x 1/2 x 1/2 = 1/8

パターン数が2のものは合計が(2になるもの)

③ P(X1 + X2 + X3 = 2) = P(X1=1, X2=1, X3=0) 
+ P(X1=0, X2=1, X3=1)
+ P(X1=1, X2=0, X3=1)

= P(X1=1)P(X2=1)P(X3=0) 
+ P(X1=0)P(X2=1)P(X3=1)
+ P(X1=1)P(X2=0)P(X3=1)
= 1/8 + 1/8 + 1/8 = 3/8

パターン数が3のもの(合計が1)

④P(X1 + X2 + X3 = 1) = P(X1=1, X2=0, X3=0) 
+ P(X1=0, X2=1, X3=0)
+ P(X1=0, X2=0, X3=1)

= P(X1=1)P(X2=0)P(X3=0)
+ P(X1=0)P(X2=1)P(X3=0)
+ P(X1=0)P(X2=0)P(X3=1)
= 1/8 + 1/8 + 1/8 = 3/8

これらを表にすると
<X1 + X2 + X3>

実現値 0 1 2 3
確率 1/8 3/8 3/8 1/8

とちょっと長くなりましたが、こんな感じで学習してきました。

これから、ちょいと学習レベルを上げていく感じです。
つまり、実際に数理モデルを扱うための学習になって行きます。

でわでわ。。。

関連ページ

Java版のNumpyのまとめ〜Deep Learningで使える〜



数理モデル関連

第二弾

第三弾

数学への挑戦 第二弾〜確率変数の足し算:数理モデルxプログラミング〜

今回は確率変数の足し算を学習します。
そして、学習に使用する本は下のような本です。

前回使用した表は下のようなものです。
この本に登場する、女子大生「青葉」の彼氏ができるか?を数理モデルで考えるために下のような表で考えました。

そして、男性1〜3までの「青葉」を好きになる結果は下のようになります。「Yesは好きになる」 「Noは好きにならない」です。
<表1>

男性1(X1) 男性2(X2) 男性3(X3) 合計
No No No 0
Yes No No 1
No Yes No 1
No No Yes 1
Yes Yes No 2
Yes No Yes 2
No Yes Yes 3
Yes Yes Yes 3

そして、確率変数(X1〜X3)に関して、X1とX2を抽出して1: 好きになる確率 0: 好きにならない確率を表にしたのが下のものです。

X1 X2
0 1 0 1 実験値
1/2 1/2 1/2 1/2 確率

これらをパターン分けして見ると下のようになります。

X1 X2 X1 + X2
0 0 0
1 0 1
0 1 1
1 1 2

独立した確率変数を足し算して見た結果もともと4パターンあったものが3パターンに減っています。

つまり、

X1, X2の独立下確率変数を1つの塊としてみる

と言うことが「確率変数の足し算」と言う意味です。
これはどう言うことかと言うと

「男性1が好きになり、男性2が好きにならない」という事象と「男性2が好きになり、男性1が好きにならない」という事象は「同時に起きない」

のでこのようなことを「排反事象」と呼ぶ。

そして上の<表1>を元に実験値と確率の表を作成すると。。。

パターン数が1のもの(合計が0 or 3)

① P(X1 + X2 + X3 = 0) = P(X1=0, X2=0, X3=0) = P(X1=0)P(X2=0)P(X3=0) = 1/2 x 1/2 x 1/2 = 1/8

②P(X1 + X2 + X3 = 3) = P(X1=1, X2=1, X3=1) = P(X1=1)P(X2=1)P(X3=1) = 1/2 x 1/2 x 1/2 = 1/8

パターン数が2のものは合計が(2になるもの)

③ P(X1 + X2 + X3 = 2) = P(X1=1, X2=1, X3=0) 
+ P(X1=0, X2=1, X3=1)
+ P(X1=1, X2=0, X3=1)

= P(X1=1)P(X2=1)P(X3=0) 
+ P(X1=0)P(X2=1)P(X3=1)
+ P(X1=1)P(X2=0)P(X3=1)
= 1/8 + 1/8 + 1/8 = 3/8

パターン数が3のもの(合計が1)

④P(X1 + X2 + X3 = 1) = P(X1=1, X2=0, X3=0) 
+ P(X1=0, X2=1, X3=0)
+ P(X1=0, X2=0, X3=1)

= P(X1=1)P(X2=0)P(X3=0)
+ P(X1=0)P(X2=1)P(X3=0)
+ P(X1=0)P(X2=0)P(X3=1)
= 1/8 + 1/8 + 1/8 = 3/8

これらを表にすると
<X1 + X2 + X3>

実現値 0 1 2 3
確率 1/8 3/8 3/8 1/8

ここまでの作業(計算)で「確率変数を作った」ことになります。

まとめ

こんな感じで物事に意味をもたせて「例」を作るというところが「確率変数の足し算」でキモになる内容でした。
しかし、プログラムに落とすところまでなかなか届きませんなぁ・・・
でわでわ。。。

数理モデル関連

第二弾

第三弾