Abstract
本投稿では,不偏分散の定義とその解釈について説明する.
不偏分散 σ2uσ2u は,
1) 標本分散の期待値 E[σ2]=n−1nσ20E[σ2]=n−1nσ20 と,
2) 母分散 σ20σ20
の偏りを無くすため,標本分散 σ2 を nn−1 倍した値として定義される.
このように,不偏分散は,期待値について偏りの無い分散として定義される.
数式の解釈について,サンプル数が有限の場合 (特に,サンプル数が極端に少ない場合),母分散の範囲に当たりをつけるには,分散を広めに見積もる必要がある.nn−1 倍は,1) と 2) を比較して,どの程度範囲を広げれば母分散の範囲を指示できるか,を計算した値と考えられる.
※ n0 は 母数, n は 標本の数 (サンプル数), ¯x≡1n∑ni=1xi は 標本平均, σ2≡1n∑ni=1(xi−¯x)2 は 標本分散, ¯x0≡1n0∑n0i=1xi は 母平均, σ20≡1n0∑n0i=1(xi−¯x)2 は 母分散, σ2u≡1n−1∑ni=1(xi−¯x)2 は 不偏分散, をそれぞれ表す.
※ n0 は 母数, n は 標本の数 (サンプル数), ¯x≡1n∑ni=1xi は 標本平均, σ2≡1n∑ni=1(xi−¯x)2 は 標本分散, ¯x0≡1n0∑n0i=1xi は 母平均, σ20≡1n0∑n0i=1(xi−¯x)2 は 母分散, σ2u≡1n−1∑ni=1(xi−¯x)2 は 不偏分散, をそれぞれ表す.
定義
不偏分散 σ2u は,標本分散 σ2 の期待値 E[σ2]=E[1nn∑i=1(xi−¯x)2]=n−1nσ20 が,母分散 σ20 と一致するように,標本分散 σ2 を nn−1 倍した値 σ2u≡nn−1σ2=1n−1n∑i=1(xi−¯x)2 として定義される.(このとき,E[X] は,X の期待値を示す.また,n は標本数,n0 は母数,¯x は標本平均,¯x0 は母平均, をそれぞれ表す.) |
[証明]
E[σ2]=n−1nσ20 の導出
最終的に,標本分散を nn−1 倍した,不偏分散 σ2u の期待値は, E[σ2u]=E[nn−1⋅σ2]=E[nn−1⋅1nn∑p=1(xp−¯x)2]=nn−1⋅n−1nσ20=σ20 となり,母分散 σ20 と一致する.
補助計算 ※1. ※2. を用いると標本分散の期待値は,
E[σ2]=E[1nn∑p=1(xp−¯x)2]=E[1nn∑p=1(xp−1nn∑q=1xq)2]=1nn∑p=1E[(xp−1nn∑q=1xq)2]=1nn∑p=1E[x2p−2nxpn∑q=1xq+1n2n∑q=1xqn∑r=1xr]=1nn∑p=1{E[x2p]−2n(E[x2p]+n∑q≠pE[xpxq])+1n2(n∑q=1E[x2q]+n∑q=1n∑r≠qE[xrxq])}=1nn∑p=1{E[x2p]−2n(E[x2p]+(n−1)E[xpxq])+1n2(nE[x2q]+n(n−1)E[xrxq])}=1nn∑p=1(n−2nE[x2p]−2n−1nE[xpxq]+1nE[x2q]+n−1nE[xrxq])=1nn∑p=1(n−1nE[x2p]−n−1nE[xpxq])=1nn⋅n−1n(E[x2p]−E[xpxq])=n−1n(E[x2p]−E[xpxq])=n−1n{(σ20+¯x02)−¯x02}=n−1nσ20
となる[1][4].
補助計算
※1. E[x2i]=σ20+¯x02.
※2. E[xpxq]=¯x02
[証明1]
[証明2](別解)
[証明1] または [証明2] より,E[x2i]=σ20+¯x02 となる.
X の分散 Var(X) は,
Var(X)=E[(X−¯X)2]=E[(X−E[X])2]=E[X2−2XE[X]+E[X]2]=E[X2]−2E[X]E[X]+E[X]2=E[X2]−E[X]2
となる[2].これを用いて,求める値は,
Var(X)=E[X2]−E[X]2⇔ σ20=E[x2i]−¯x02
となる[4][5].
[証明2](別解)
分散と期待値の関係は,
1n0n0∑i=1(xi−¯x0)2=1n0n0∑i=1(x2i−2¯x0xi+¯x02)=(1n0n0∑i=1x2i)−2¯x0(1n0n0∑i=1xi)+1n0n0⋅¯x02=(1n0n0∑i=1x2i)−¯x02=E[x2i]−¯x02⇔ σ20=E[x2i]−¯x02
と表される[3].
[証明1] または [証明2] より,E[x2i]=σ20+¯x02 となる.
※2. E[xpxq]=¯x02
[証明]
共分散と期待値の関係は,
σXY=Cov(X,Y)=E[(X−¯X)(Y−¯Y)]=E[(X−E[X])(Y−E[Y])]=E[XY−XE[Y]−E[X]Y+E[X]E[Y]]=E[XY]−E[X]E[Y]−E[X]E[Y]+E[X]E[Y]=E[XY]−E[X]E[Y]
と表される[5].ここで,ランダムサンプリングのとき,X と Y は独立であるから,共分散 σXY=0 となる.したがって,
0=E[XY]−E[X]E[Y]⇔E[XY]=E[X]E[Y]
となる.これを用いて,求める関係式は,
E[XY]=E[X]E[Y]⇔E[xpxq]=E[xp]E[xq]=¯x02
と導出される.
最終的に,標本分散を nn−1 倍した,不偏分散 σ2u の期待値は, E[σ2u]=E[nn−1⋅σ2]=E[nn−1⋅1nn∑p=1(xp−¯x)2]=nn−1⋅n−1nσ20=σ20 となり,母分散 σ20 と一致する.
解釈
数式の解釈について,サンプル数が有限の場合 (特に,サンプル数が極端に少ない場合),母分散の範囲に当たりをつけるには,分散を広めに見積もる必要がある.nn−1 倍は,標本分散の期待値と母分散を比較して,どの程度範囲を広げれば母分散の範囲を指示できるか,を計算した値と考えられる.
References
[1] Variance#Sample_variance - Wikipedia - 2018年07月21日閲覧
[2] Variance#Definition - Wikipedia - 2018年07月21日閲覧
[3] Variance#Population_variance - Wikipedia - 2018年07月21日閲覧
[4] 不偏標本分散の意味とn-1で割ることの証明 - 高校数学の美しい物語 - 2018年07月21日閲覧
[5] 期待値と分散に関する公式一覧 - 高校数学の美しい物語 - 2018年07月21日閲覧
[2] Variance#Definition - Wikipedia - 2018年07月21日閲覧
[3] Variance#Population_variance - Wikipedia - 2018年07月21日閲覧
[4] 不偏標本分散の意味とn-1で割ることの証明 - 高校数学の美しい物語 - 2018年07月21日閲覧
[5] 期待値と分散に関する公式一覧 - 高校数学の美しい物語 - 2018年07月21日閲覧
0 件のコメント:
コメントを投稿