■ - ehlfin’s blog

今日はそこまで進捗がない．

LehmannのTheory of Point Estimationをだらだら読んでいただけ*1の一日だったが，いまいちよくわからないところが多い．統計学は初心者なのでしょうがないのだが，あんまりよくわかってないと院試で死にそうだし，何より色んな所で燃えそうなので嫌だ．

パラメトリックモデルでの点推定問題を考える．考えている統計多様体 *2を $\mathcal{P} = \{\, P_\theta \mid \theta \in \Theta \,\}$ とする．この時， $T(X)$ が十分統計量とは，条件付き確率 $P_\theta (X = x \mid T = t)$ が $\theta$ に依存しないことだと書かれていた．これ自体は既に納得している．

ただ，具体的な問題にぶち当たった時に計算しづらいことに気づいた．重大な問題だと思う．p.34のExample6.3とかがそう． $X_1, \cdots, X_n \sim U(0,\theta)$ がiidであるとしよう．この時， $T(X) := {\rm max}\, X_i$ が十分統計量になる．直感的には明らかだと書いてあって*3，それはそうだろうなあと思うのだが，厳密に書き下そうとすると手が止まって苦労した．

定義にたちかえって条件付き確率 $P_\theta (X = x \mid T = t) = \frac{P(X = x \cap T = t)}{P(T = t)}$ を計算しようとするが，どうも見通しが立たない．連続分布では1点における確率は測度0だとかそういう話以前に， $P(T=t)$ が書き下せない．つらい．