基本統計量【QC検定3級19日目】

統計量

数量的な値

基本統計量

基本的な統計量

正規分布

左右対称
中心付近の度数が多い
中心より離れるほど度数が少なくなる
富士山型の分布







平均値

データの総和÷データ数=平均値

メディアン(中央値)

得られたデータを大きさ順に並べ変えたときの中央の値
奇数個のときは中央の値
偶数個の時は中央2つの値の平均

偏差

データと平均との差
偏差をすべて合計すると0になる

以下の表は2022年のチョコレート消費額







チョコレート消費額の平均
データの総和÷データ数=平均値なので
6655÷12=554.58

2022年1月の偏差
データー平均=偏差なので
785-554.58=230.42

そのようにして1月から12月まで偏差を求めて
全てを足すと0になる

平方

平方=2乗
同じ数を掛け合わせること

偏差の合計を求めると0になるが
それだと都合が悪いので
0以上にするために2乗する

プラス×プラス=プラス
マイナス×マイナス=プラスの法則により
マイナスを含んでいても
結果はすべてプラスになる
















上の偏差のほうはマイナスがあるが
下の平方(2乗)のほうはすべてプラスになっている

平方和

平方を合計した数










上のデータだと平方和は814989

分散

平方和を(データ数-1)で割った数

平方和はデータ数が大きければ大きいほど大きな数になる

同じ母集団から取られたデータにもかかわらずデータの数によって
ばらつきの値が異なるのは不都合なので
データ数の影響を受けない尺度として分散を用いる

上のデータだと
平方和÷(データ数-1)=分散なので
814989÷(12-1)=74090

標準偏差

平方和も分散も元のデータの2乗となっている。
単位も2乗なので上の例では円の2乗という変な単位になる。
それではおかしいので円に戻すため平方根を求める

標準偏差は分散の正の平方根

上のデータだと
√74090=272

範囲

データの最大値と最小値の差

上のデータだと
最大値ー最小値=範囲なので
1224-275=949

変動係数

標準偏差と平均値の比
平均値に対するばらつきの相対的な大きさを表す

上のデータだと
(標準偏差÷平均値)×100(%)なので
(272÷554.58)×100=49%

コメント