【過去問解答】2014年統計検定1級<統計数理4>

統計検定1級の過去問解答解説を行います。目次は以下をご覧ください。

不適切な内容があれば,記事下のコメント欄またはお問い合わせフォームよりご連絡下さい。

問題

統計検定1級の過去問からの出題になります。統計検定の問題の著作権は日本統計学会に帰属していますので,本稿にて記載することはできません。「演習問題を俯瞰する」で詳しく紹介している公式の過去問題集をご購入いただきますようお願い致します。

解答

F検定と測定法の比較検討に関する出題でした。

(1)

測定法(1)の計画行列をX(1),測定法(2)の計画行列をX(2)とおくと,

(1)X(1)=(10000100000100001000001000010000010000100000100001),X(2)=(11000101001001010001011000101001001001100010100011)

と表される。正規方程式XXθ=Xxであるため,θの最小二乗推定量はXXが正則のとき(XX)1Xxとなる。二つの測定法それぞれについて,この最小二乗推定量を計算する。測定法(1)については,

(2)X(1)X(1)=(11000000000011000000000011000000000011000000000011)(10000100000100001000001000010000010000100000100001)=2I5

となることに注意すると,

(3)θ^1=(2I5)1X(1)x=12(11000000000011000000000011000000000011000000000011)(x1x2x3x4x5x6x7x8x9x10)=12(x1+x2x3+x4x5+x6x7+x8x9+x10)

が得られる。測定法(2)については,

(4)X(2)X(2)=(11110000001000111000010010011000100101010001001011)(11000101001001010001011000101001001001100010100011)=(4111114111114111114111114)

となること,および与えられた公式にa=4,b=1,k=5を代入して得られる

(5)(4111114111114111114111114)1=124(7111117111117111117111117)

を利用すると,

(6)θ^2=124(7111117111117111117111117)(11110000001000111000010010011000100101010001001011)(x1x2x3x4x5x6x7x8x9x10)(7)=124(66662222226222666222262262266222622626262226226266)(x1x2x3x4x5x6x7x8x9x10)(8)=112(3(x1+x2+x3+x4)(x5+x6+x7+x8+x9+x10)3(x1+x5+x6+x7)(x2+x3+x4+x8+x9+x10)3(x2+x5+x8+x9)(x1+x3+x4+x6+x7+x10)3(x3+x6+x8+x10)(x1+x2+x4+x5+x7+x9)3(x4+x7+x9+x10)(x1+x2+x3+x5+x6+x8))

が得られる。

正規方程式の解は,

(9)ddθ(12xXθ2)=12ddθ(xXθ)(xXθ)=12ddθ(xx2θX+θXXθ)(10)=12(2Xx+2XXθ)=0

を解くことにより,XXが正則のときにθ^=(XX)1Xxが得られます。

(2)

最小二乗推定量θ^の標本分散V[θ^]σ2(XX)1と表される。小問(1)の結果より,

(11)V[θ^(1)]=σ22I5,V[θ^(2)]=σ224(7111117111117111117111117)

が得られるため,測定法(1)ではV[θ^j]=σ2/2,測定法(2)ではV[θ^j]=7σ2/24となる。

最小二乗推定量θ^の標本分散V[θ^]σ2(XX)1となることは,

(12)V[θ^]=V[(XX)1Xx]=V[(XX)1X(Xθ+ε)]=V[θ+(XX)1Xε]=V[(XX)1Xε](13)=E[{(XX)1Xε}{(XX)1Xε}]=E[(XX)1XεεX{(XX)1}](14)=E[(XX)1XεεX(XX)1]=(XX)1XE[εε]X(XX)1(15)=(XX)1X(σ2I10)X(XX)1=σ2(XX)1

のように示されます。また,小問(1)の結果をそのまま用いて,測定法(1)については

(16)V[θj]=V[x+x2]=2V[x]4=σ22

と求め,測定法(2)については

(17)V[θj]=V[3(x+x+x+x)(x+x+x+x+x+x)12]=94σ2+6σ2122=7σ224

と求めてもよいです。xは測定値ですが,x=Xθ+εよりV[x]は測定誤差の分散σ2となることに注意してください。

(3)

帰無仮説H0に対し,帰無仮説を制約条件として計算した最小二乗推定値のもとでの残差平方和をRSSR,何の制約条件も設けずに計算した最小二乗推定値のもとでの残差平方和をRSSURとおくと,以下で定義される

(18)F=(RSSRRSSUR)/qRSSUR/(nK)

は,F(q,nK)に従う。ただし,qは帰無仮説における等号の数,Kはパラメータ数を表している。これを本問題に適用すると,

(19)RSSR=xX0θ^02,RSSUR=xXθ^2,n=10,q=4,K=5

となる。ただし,は各成分の二乗和の平方根であるノルムを表し,θ0は帰無仮説H0の元での線形モデルx=Xθ0+εで定義する。なお,公式解答では帰無仮説の下での計画行列XX0として定義しているが,帰無仮説は母数に対する仮定であって測定方法に関する仮定ではないため,帰無仮説の有無に応じてXの形が変化することはない。ここで,

(20)RSSR=xXθ^02=(xXθ^0)(xXθ^0)(21)={(xXθ^)+(Xθ^Xθ^0)}{(xXθ^)+(Xθ^Xθ^0)}(22)=RSSUR+(xXθ^)(Xθ^Xθ^0)+(Xθ^Xθ^0)(xXθ^)+Xθ^Xθ^02

において,

(23)(xXθ^)(Xθ^Xθ^0)=xXθ^xXθ^0θ^XXθ^+θ^XXθ^0(24)=xXθ^xXθ^0(XXθ^)θ^+(XXθ^)θ^0(25)=xXθ^xXθ^0(XX(XX)1Xx)θ^+(XX(XX)1Xx)θ^0(26)=xXθ^xXθ^0(Xx)θ^+(Xx)θ^0(27)=xXθ^xXθ^0xXθ^+xXθ^0=0

および同様に

(28)(Xθ^Xθ^0)(xXθ^)=(Xθ^)x(Xθ^)Xθ^(Xθ^0)x+(Xθ^0)Xθ^(29)=(Xθ^)xθ^(XXθ^)(Xθ^0)x+θ0(X0Xθ^)(30)=(Xθ^)xθ^(Xx)(Xθ^0)x+θ0(X0x)(31)=θ^Xxθ^Xxθ^0Xxθ^0Xx=0

より

(32)RSSRRSSUR=Xθ^Xθ^02

となることに注意すると,F統計量は

(33)F=Xθ^Xθ^02/4xXθ^2/5

となる。

F統計量の詳しい解説は,どこかのタイミングで別記事で解説します。

(4)

問題文で与えられた非心度の定義より,F統計量の分子が従うカイ二乗分布の非心度を求めればよい。帰無仮説H0の下ではθ¯=θ1==θ5となるため,代表してθ1などを用いることもできるが,ここでは簡単のため

(34)θ^0=(θ¯θ¯θ¯θ¯θ¯)

と表すことにする。測定法(1)について,小問(1)で求めたX(1)を用いれば,

(35)X(1)θ^X(1)θ^0=(θ^1θ¯θ^1θ¯θ^2θ¯θ^2θ¯θ^3θ¯θ^3θ¯θ^4θ¯θ^4θ¯θ^5θ¯θ^5θ¯)

となるため,ノルムは

(36)X(1)θ^X(1)θ^02=(θ^1θ¯)2+(θ^1θ¯)2++(θ^5θ¯)2+(θ^5θ¯)2

となる。一方,F統計量の定義よりXθ^Xθ^02は自由度4の非心カイ二乗分布に従う。非心カイ二乗分布は正規分布に従う確率変数の二乗和が従う確率分布であるという非心カイ二乗分布の定義より,式(36)の各項の平方根が従っている正規分布の平均を求めればカイ二乗分布の非心度が求められることが分かる。各項の平方根について,最小二乗推定量は不偏性をもつため,

(37)E[θ^iθ¯]=E[θ^i]θ¯=θiθ¯

となることに注意すれば,問題文で与えられた非心度の定義より,F統計量の分子が従う非心度λ(1)

(38)λ(1)=(θ1θ¯)2+(θ1θ¯)2++(θ5θ¯)2+(θ5θ¯)2=2i=15(θiθ¯)2

となる。同様に,測定法(2)について,小問(1)で求めたX(2)を用いれば,

(39)X(2)θ^X(2)θ^0=((θ^1+θ^2)(θ¯+θ¯)(θ^1+θ^3)(θ¯+θ¯)(θ^1+θ^4)(θ¯+θ¯)(θ^1+θ^5)(θ¯+θ¯)(θ^2+θ^2)(θ¯+θ¯)(θ^2+θ^4)(θ¯+θ¯)(θ^2+θ^5)(θ¯+θ¯)(θ^3+θ^4)(θ¯+θ¯)(θ^3+θ^5)(θ¯+θ¯)(θ^4+θ^5)(θ¯+θ¯))=((θ^1θ¯)+(θ^2θ¯)(θ^1θ¯)+(θ^3θ¯)(θ^1θ¯)+(θ^4θ¯)(θ^1θ¯)+(θ^5θ¯)(θ^2θ¯)+(θ^3θ¯)(θ^2θ¯)+(θ^4θ¯)(θ^2θ¯)+(θ^5θ¯)(θ^3θ¯)+(θ^4θ¯)(θ^3θ¯)+(θ^5θ¯)(θ^4θ¯)+(θ^5θ¯))

となるため,ノルムは

(40)X(2)θ^X(2)θ^02=4i=15(θ^iθ¯)2+2i=14j=i+15(θ^iθ¯)(θ^jθ¯)(41)=4i=15(θ^iθ¯)2+{i=15(θ^iθ¯)j=15(θ^iθ¯)i=15(θ^iθ¯)2}(42)=4i=15(θ^iθ¯)2+{i=15(θ^iθ¯)(j=15θ^i5θ¯)i=15(θ^iθ¯)2}(43)=4i=15(θ^iθ¯)2+{i=15(θ^iθ¯)(5θ¯5θ¯)i=15(θ^iθ¯)2}(44)=4i=15(θ^iθ¯)2i=15(θ^iθ¯)2=3i=15(θ^iθ¯)2

となる。測定法(1)との対称性に注意すれば,F統計量の分子が従う非心度λ(2)

(45)λ(2)=3i=15(θiθ¯)2

となる。

非心分布の解説も併せてご参照ください。

(5)

小問(2)の結果より,測定法(2)の方が測定法(1)と比べて推定量の分散が小さいため有効であり,小問(4)の結果より,測定法(2)の方が測定法(1)と比べてF統計量の非心度が大きいため効率的である。なお,F統計量の非心度が大きいと,対立仮説が真の場合にF統計量の分子が大きくなるため検出力が大きくなることを利用した。

シェアはこちらからお願いします!

コメント

コメント一覧 (7件)

  • お世話になります。

    (37)でE[θi^θ¯]=θiθ¯とあります。なので、式(38)において(θi^θ¯)/σの期待値は(θiθ¯)/σだと思うのですが、それだと非心度にもσ2がスケーリングされてしまうので、解答とは異なってしまいます。なぜθi^θ¯/σの期待値はσでスケーリングされないのでしょうか。

    • たぶろー様

      ご指摘ありがとうございます。おっしゃる通り、標準化のような手続きをしており誤りでした。今回は定義よりF統計量の分子のY1について、各項の平均だけに着目すれば解ける問題であるため、本文の記述を改めました。

  • zuka 様

    ご返信ありがとうございます。
    非心カイ二乗分布の定義には、ZN(μi,1)のとき、ΣZi2の分布がそれで、Σμi2が非心度、項数nが自由度とあります。θ^iθ¯ の期待値の二乗和を今回の問題では非心度としていますが、 θ^iθ¯の分散が1かどうかはわからないと思います。ただ、たとえθ^iθ¯の分散が1だとしても、各i2組ずつの計10項の和の分布なので、定義から考えると自由度が10になってしまい、4でなくなってしまいます。一体、これは何を計算しているのかわからなくなってしまいました。zuka様の解釈を教えていただけますでしょうか。

    • たぶろー様

      ご指摘ありがとうございます。少し考えたく、お時間いただけますと幸いです。
      ※ もし統計検定1級を目指されているのであれば、当年度の問題は最近の問題と比べてかなり難易度が高いのでスルーしてもよいかと思います。モヤモヤするのは共感できますので、少々お待ちください。(解決できなければすみません><)

  • zuka 様

    お時間をとらせてしまい申し訳ございません。
    ありがとうございます!

    • たぶろー様

      お待たせしました。

      >θ^iθ¯の分散が1かどうかはわからないと思います
      仰る通りですが,次のように考えられると思います。まず今回は問題でF統計量の定義が与えられているため「F統計量の分子はカイ二乗分布に従う確率変数を自由度で除したものである」は既知であるものとできると考えます。すると,例えば測定法(1)では

      (46)X(1)θ^X(1)θ^02=(θ^1θ¯)2+(θ^1θ¯)2++(θ^5θ¯)2+(θ^5θ¯)2

      は「4つの項にグルーピングされてそれぞれの項が分散1の正規分布に従う」と考えることができます。分散1となることはF統計量の定義から逆算するイメージです。このとき,正規分布の再生性からカイ二乗分布の自由度はグルーピングする前の平均の和となります。

      >各i2組ずつの計10項の和の分布なので、定義から考えると自由度が10になってしまい、
      10項の確率変数が全て独立の場合は仰る通りです。しかし、今回の10項は独立ではないため自由度は10とはならないと考えています。

    • zuka 様

      ご回答ありがとうございます。大変感謝しております。ご回答内容をもとに、今一度じっくりと見直させていただきます。

たぶろー へ返信する コメントをキャンセル

※ Please enter your comments in Japanese to distinguish from spam.

目次
  1. 問題
  2. 解答
    1. (1)
    2. (2)
    3. (3)
    4. (4)
    5. (5)