統計量
数量的な値
基本統計量
基本的な統計量
正規分布
左右対称
中心付近の度数が多い
中心より離れるほど度数が少なくなる
富士山型の分布
平均値
データの総和÷データ数=平均値
メディアン(中央値)
得られたデータを大きさ順に並べ変えたときの中央の値
奇数個のときは中央の値
偶数個の時は中央2つの値の平均
偏差
データと平均との差
偏差をすべて合計すると0になる
以下の表は2022年のチョコレート消費額
チョコレート消費額の平均は
データの総和÷データ数=平均値なので
6655÷12=554.58
2022年1月の偏差は
データー平均=偏差なので
785-554.58=230.42
そのようにして1月から12月まで偏差を求めて
全てを足すと0になる
平方
平方=2乗
同じ数を掛け合わせること
偏差の合計を求めると0になるが
それだと都合が悪いので
0以上にするために2乗する
プラス×プラス=プラス
マイナス×マイナス=プラスの法則により
マイナスを含んでいても
結果はすべてプラスになる
↓
上の偏差のほうはマイナスがあるが
下の平方(2乗)のほうはすべてプラスになっている
平方和
平方を合計した数
上のデータだと平方和は814989
分散
平方和を(データ数-1)で割った数
平方和はデータ数が大きければ大きいほど大きな数になる
同じ母集団から取られたデータにもかかわらずデータの数によって
ばらつきの値が異なるのは不都合なので
データ数の影響を受けない尺度として分散を用いる
上のデータだと
平方和÷(データ数-1)=分散なので
814989÷(12-1)=74090
標準偏差
平方和も分散も元のデータの2乗となっている。
単位も2乗なので上の例では円の2乗という変な単位になる。
それではおかしいので円に戻すため平方根を求める
標準偏差は分散の正の平方根
上のデータだと
√74090=272
範囲
データの最大値と最小値の差
上のデータだと
最大値ー最小値=範囲なので
1224-275=949
変動係数
標準偏差と平均値の比
平均値に対するばらつきの相対的な大きさを表す
上のデータだと
(標準偏差÷平均値)×100(%)なので
(272÷554.58)×100=49%





コメント
コメントを投稿