正規分布の最尤推定量が標本平均・標本分散になることを示す。
はじめに
正規分布の確率密度関数は以下であった。
p(x;μ,σ2)=2πσ21exp(−2σ2(x−μ)2)
最尤推定では、尤度L(θ)が最大になるパラメータθを推定する。
θ^=θargmaxL(θ)
このままでは計算が面倒くさいので、対数をとっておく。
θ^=θargmaxlogL(θ)
対数尤度関数の整理もここでしておこう。
logL(θ)=logp(X;θ)=log(n=1∏Np(x(n);θ))=n=1∑Nlogp(x(n);θ)=n=1∑Nlog(2πσ21exp(−2σ2(x(n)−μ)2))=−n=1∑N(21log(2π)+logσ+2σ2(x(n)−μ)2)
では実際にμとσ2を求めていく。
平均を求める
対数尤度関数を平均μについて整理する。
logL(θ)=−n=1∑N(21log(2π)+logσ+2σ2(x(n)−μ)2)=−2σ21n=1∑N(x(n)−μ)2+const
μに関係のない項はconstとしてまとめた。結果的にμについて上に凸の二次関数になった。よって微分して傾きが0になる点を求めれば良い。
ということで微分して
∂μ∂logL(θ)=−2σ21n=1∑N∂μ∂(x(n)−μ)2=σ21n=1∑N(x(n)−μ)
=0で解くと
σ21n=1∑N(x(n)−μ)n=1∑N(x(n)−μ)n=1∑Nx(n)−Nμμμ=0=0=0=N1n=1∑Nx(n)=Xˉ
標本平均になった。
分散を求める
対数尤度関数を分散σ2について整理する。
logL(θ)=−n=1∑N(21log(2π)+logσ+2σ2(x(n)−μ)2)=−2Nlogσ2−2σ21(n=1∑N(x(n)−μ)2)+const=−2N(logσ2+σ2S2)+const
μと同様、σ2に関係ない項はconstとしてまとめた。
途中の変形にはN1∑n(x(n)−μ)2=S2を用いた。S2は標本分散。ここで、σ2を変数にするとごちゃごちゃするので、
F(x)=−2N(logx+xS2)
としておく。これの最大値を取るxを求める。
F(x)を微分し
F′(x)=−2N(x1−x2S2)
=0で解くと
x1−x2S2x=0=S2
標本分散となった。この方程式の解はこれだけなので、F(x)はx=S2で唯一の極値を取ることになる。そしてこの点における二階微分は
L′′(x)L′′(S2)=2N(x21−x32S2)=2N(x3x−2S2)=−2(S2)2N<0
と負になるため、この点は極大値である。よってF(x)はx=S2で唯一の極大値=最大値を取る。
まとめ
以上より、正規分布の最尤推定量は
μ^σ^2=Xˉ=S2
となる。