2018年7月21日

不偏分散の定義と証明,および n-1 の解釈

Abstract
  本投稿では,不偏分散の定義とその解釈について説明する. 不偏分散 σ2uσ2u は, 1) 標本分散の期待値 E[σ2]=n1nσ20E[σ2]=n1nσ20 と, 2) 母分散 σ20σ20 の偏りを無くすため,標本分散 σ2nn1 倍した値として定義される. このように,不偏分散は,期待値について偏りの無い分散として定義される. 数式の解釈について,サンプル数が有限の場合 (特に,サンプル数が極端に少ない場合),母分散の範囲に当たりをつけるには,分散を広めに見積もる必要がある.nn1 倍は,1) と 2) を比較して,どの程度範囲を広げれば母分散の範囲を指示できるか,を計算した値と考えられる.

n0 は 母数, n は 標本の数 (サンプル数), ¯x1nni=1xi は 標本平均, σ21nni=1(xi¯x)2 は 標本分散, ¯x01n0n0i=1xi は 母平均, σ201n0n0i=1(xi¯x)2 は 母分散, σ2u1n1ni=1(xi¯x)2 は 不偏分散, をそれぞれ表す.
定義

      不偏分散 σ2u は,標本分散 σ2 の期待値 E[σ2]=E[1nni=1(xi¯x)2]=n1nσ20     が,母分散 σ20 と一致するように,標本分散 σ2nn1 倍した値 σ2unn1σ2=1n1ni=1(xi¯x)2     として定義される.(このとき,E[X] は,X の期待値を示す.また,n は標本数,n0 は母数,¯x は標本平均,¯x0 は母平均,
    をそれぞれ表す.)


[証明]
E[σ2]=n1nσ20 の導出
  補助計算 ※1. ※2. を用いると標本分散の期待値は, E[σ2]=E[1nnp=1(xp¯x)2]=E[1nnp=1(xp1nnq=1xq)2]=1nnp=1E[(xp1nnq=1xq)2]=1nnp=1E[x2p2nxpnq=1xq+1n2nq=1xqnr=1xr]=1nnp=1{E[x2p]2n(E[x2p]+nqpE[xpxq])+1n2(nq=1E[x2q]+nq=1nrqE[xrxq])}=1nnp=1{E[x2p]2n(E[x2p]+(n1)E[xpxq])+1n2(nE[x2q]+n(n1)E[xrxq])}=1nnp=1(n2nE[x2p]2n1nE[xpxq]+1nE[x2q]+n1nE[xrxq])=1nnp=1(n1nE[x2p]n1nE[xpxq])=1nnn1n(E[x2p]E[xpxq])=n1n(E[x2p]E[xpxq])=n1n{(σ20+¯x02)¯x02}=n1nσ20 となる[1][4].

補助計算
※1. E[x2i]=σ20+¯x02
[証明1]
  X の分散 Var(X) は, Var(X)=E[(X¯X)2]=E[(XE[X])2]=E[X22XE[X]+E[X]2]=E[X2]2E[X]E[X]+E[X]2=E[X2]E[X]2 となる[2].これを用いて,求める値は, Var(X)=E[X2]E[X]2          σ20=E[x2i]¯x02 となる[4][5].

[証明2](別解)
  分散と期待値の関係は, 1n0n0i=1(xi¯x0)2=1n0n0i=1(x2i2¯x0xi+¯x02)=(1n0n0i=1x2i)2¯x0(1n0n0i=1xi)+1n0n0¯x02=(1n0n0i=1x2i)¯x02=E[x2i]¯x02                         σ20=E[x2i]¯x02 と表される[3].

[証明1] または [証明2] より,E[x2i]=σ20+¯x02 となる.

※2. E[xpxq]=¯x02
[証明]
  共分散と期待値の関係は, σXY=Cov(X,Y)=E[(X¯X)(Y¯Y)]=E[(XE[X])(YE[Y])]=E[XYXE[Y]E[X]Y+E[X]E[Y]]=E[XY]E[X]E[Y]E[X]E[Y]+E[X]E[Y]=E[XY]E[X]E[Y] と表される[5].ここで,ランダムサンプリングのとき,XY は独立であるから,共分散 σXY=0 となる.したがって, 0=E[XY]E[X]E[Y]E[XY]=E[X]E[Y] となる.これを用いて,求める関係式は, E[XY]=E[X]E[Y]E[xpxq]=E[xp]E[xq]=¯x02 と導出される.

最終的に,標本分散を nn1 倍した,不偏分散 σ2u の期待値は, E[σ2u]=E[nn1σ2]=E[nn11nnp=1(xp¯x)2]=nn1n1nσ20=σ20 となり,母分散 σ20 と一致する.
解釈
  数式の解釈について,サンプル数が有限の場合 (特に,サンプル数が極端に少ない場合),母分散の範囲に当たりをつけるには,分散を広めに見積もる必要がある.nn1 倍は,標本分散の期待値と母分散を比較して,どの程度範囲を広げれば母分散の範囲を指示できるか,を計算した値と考えられる.
References

0 件のコメント:

コメントを投稿