今日はそこまで進捗がない.

 

LehmannのTheory of Point Estimationをだらだら読んでいただけ*1の一日だったが,いまいちよくわからないところが多い.統計学は初心者なのでしょうがないのだが,あんまりよくわかってないと院試で死にそうだし,何より色んな所で燃えそうなので嫌だ.

 

パラメトリックモデルでの点推定問題を考える.考えている統計多様体*2 \mathcal{P} = \{\, P_\theta \mid \theta \in \Theta \,\} とする.この時, T(X)が十分統計量とは,条件付き確率 P_\theta (X = x \mid T = t) \thetaに依存しないことだと書かれていた.これ自体は既に納得している.

 

ただ,具体的な問題にぶち当たった時に計算しづらいことに気づいた.重大な問題だと思う.p.34のExample6.3とかがそう. X_1, \cdots, X_n \sim U(0,\theta)がiidであるとしよう.この時, T(X) := {\rm max}\, X_iが十分統計量になる.直感的には明らかだと書いてあって*3,それはそうだろうなあと思うのだが,厳密に書き下そうとすると手が止まって苦労した.

 

定義にたちかえって条件付き確率P_\theta (X = x \mid T = t) = \frac{P(X = x \cap T = t)}{P(T = t)}を計算しようとするが,どうも見通しが立たない.連続分布では1点における確率は測度0だとかそういう話以前に, P(T=t)が書き下せない.つらい.

P_\theta (X_i = x_i \mid T = t) = \frac{P(X_i = x_i)}{P(X_i \leq t)}であることは直感的にわかるので,それを使えば結論は出てくるのだが,いかんせん直感的すぎて気持ち悪い.もう少し書き下したい.

これにかぎらず,私はなぜか確率・統計の特に具体的な問題に対して手が止まる.かなりきつく反省したほうが良い気がする.

 

また,統計量 T T'が同値であることを, \mathcal{P}-null set上で函数関係を持つことと定義しているが, \mathcal{P}-null set以外のところで函数関係を持つことではないのだろうか.いろいろわからない.

*1:百合漫画は黙ってても読んでる.以後一々断らない.

*2:これ以外の呼び名を咄嗟に思いつかなかっただけ.別に情報幾何の話をしたいわけじゃない.

*3:最大値が tであったとすると, t以外の値をとった n-1個の確率変数はさも U(0,t)から出てきたものだと見做せる.ここに \thetaの絡む余地はない,というのがLehmannの説明だ.まあわからんでもない.