今回はアンケートで集計した情報から欲しい情報を導き出す方法を考えます。
ちなみに、前回はアンケートプラグインで使用できる情報とその仕様を整理しました。
アンケート調査の基本
参考にしたアンケート調査はこちらと
標準偏差についてはこちらです。
とりあえず基本としては、取得した回答(データ)の各割合を求めてやる(各質問/回答者)ことのようです。
集計方法一覧
1.平均値: 平均値は、回答結果の算術平均(全数値データを足しあげて、データ数で割ったもの)を指します。
2.中央値: 中央値とは、回答結果として得られた数値データを大きい(小さい)順に並べて、ちょうど真ん中の位置にくる数値です。
3.標準偏差: わからん
4.最小値・最大値: 最小値、最大値は、全数値データの中で最も小さい値、最も大きい値です。
統計に関して調べた時にも上記のようなキーワードが目に入りました。
そして、わかりづらいものが標準偏差です。
しかし、そんなものは一発です。ズバリ以下の通りです。
しかし、用途がわからん。。。
標準偏差の算出方法
Step1: 平均値を求める
皆さんご存知対象の値 / 全体の値
が平均値です。
例を挙げると、クラスのテストの平均点などは以下のようになります。前提として対象のクラスは以下のような状態とします。
3-B組
人数: 30名(男15/女15)
クラス全体の取得した点数 / 30
これを一般化してやると。。。上の情報が下のように書き変わります。
X1組
人数: Y1人(男Y2 / 女Y3)
合計得点: Z1
Y1 / X1
そして、クラスから学校ないに変更してやると。。。
X1 ... Xn組
人数: Y1 ... Ynの合計
合計得点: Z1 ... Zn
表にすると下のようになります。
クラス名 | 人数 | 得点 |
---|---|---|
X1 | Y1 | Z1 |
... | ... | ... |
Xn | Yn | Zn |
数式で表すと。。。
上のような式で表現できます。計算が面倒ですが、そこはプログラムにやらせましょう(笑)
Step2: 偏差を求める
まずは「偏差」ってなによ?というところから始まります。シグマのマークが出てきたところで自分は頭の中が全て「?」で埋め尽くされます(泣)
偏差とは、各データの値から平均値を引いた値のことです。
なるほど、テストの点数では以下のようになるわけだ。
・クラスの平均点50点 ・自分の点数30点 → 偏差値=-20
じゃ、これを一般化する(文字で置き換える)と下のようになります。ちなみに自分の点数=A
とした場合下のような式にな流のか?
上の式では、単純に「自分の点数の偏差値」なので役に立たない式ですが、これを合計したりなんだり。。。
Step3: 分散の平均を求める
分散=偏差を2乗を合計
なので
Aを要素(Xi)のうちの1つとしてみた時に上の式になりますが、これを一般化すると
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式2.png)
のようになります。
そして、これを2乗するので下のようになります。
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式3.png)
さらに、これの平均なので
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式4.png)
##### Step4: 分散の平均の平方根を求める
![](http://zenryokuservice.com/wp/wp-content/uploads/2020/01/数式5.png)
最終的にはこの式が「標準偏差」となります。
## なにに使うのよ?
[こちらのサイトも見てみました](http://rplus.wb-nahce.info/statsemi_basic/stat_sanpudo.html)が、「ばらつき具合」がわかるということ以外はわかりませんでした。
しかし、ちょっと考えてみると「平均からどれだけ離れているか?」を示す値なのだから「〜が?%」のような答えは出ないのだと思いました。
「どのように分析するか?」という時に使用できそうな値です。
でわでわ。。。