次の論文を読んだ.
Olkin, I., & Pratt, J. W. (1958). Unbiased estimation of certain correlation coefficients. The Annals of Mathematical Statistics, 29(1), 201–211. DOI: doi.org/10.1214/aoms/1177706717
p 次元正規標本下で,(種々の)相関係数のUMV不偏推定量を与える,という内容である.
1.導入
二変量正規分布を観測した際の相関係数を不偏推定する問題(第2節)とその 変量への拡張(第3節)を考える.いずれの場合も,推定量は完備十分統計量の関数になるから,不偏推定量の中で分散が最小であることが結論として得られる.完備十分統計量の狭義単調増加関数で,そして元の統計量より のオーダーでしか変化しないため,漸近分布は変わらない.
第4節では不偏推定量が負の値を取り得て,推定したいパラメータである相関係数の値域よりも広くなっている点だけが違う.
しかしいずれの不偏推定量も,Laplace変換を逆に解くことで求まる.謝辞には William Kruskal と Leonard Jimmie Savage の名前がある.
2.相関係数
を観測し,これらの相関係数 を推定する問題を,(i) まずは のみを既知として, (ii) 続いて全ての母数が未知として,考える.
十分性と対称性から,標本相関係数 の奇関数 のみを候補として探せば良い. の密度関数を用いて, が含意する条件を探すと,実は が奇関数であることが含意されており,さらに
が必要であることが判る,ただし は超幾何関数.
ここの議論がすごすぎる,どうして計算が進められると気がついたんだ!素晴らしい.基本的に
- の係数比較をして積分等式を得る.
- 両側Laplace変換を逆に解くことで に関する等式に変換する(ここで超幾何関数が登場).
- 超幾何関数の公式を用いて を複数通りに表すことで, の性質を見る.例えば狭義単調増加である.
これを見れば,[Karch, J. 2020] に言う「計算が難しいから使われていなかった」も当然だろう.
ところで平均が未知の場合でも標本相関係数は完備十分なのか!
そして の漸近分布は,
がコンパクト一様に成り立つから, となり, は と漸近同等である.よって の漸近分布は .
超幾何関数の再帰公式を用いて, の数値表を作って添付してある.この際の数値計算の方法について紙面を割いて議論してある.
2.3 偏相関係数
偏相関係数の不偏推定量も前述の議論から直ちに得られる.
3.級間相関係数
とし, の 個の列ベクトルは多変量正規分布 の独立標本で,
と表せるとする.すなわち,成分 は
とする.
4.多重相関係数
平均 のみを未知とした のサイズ 独立標本から,多重相関係数
を不偏推定する問題を考える. , を の余因子とした.
コメント