ベータ分布のガンマ近似

XBeta(α, β)βが大きくなるにつれて、βXの分布はGamma(α, 1)に近づく。」

 XBeta(α, β)の確率密度関数は (1)fX(x)=1B(α,β)xα1(1x)β1 である。

 また、Y=βXの確率密度関数は fY(y)=1βB(α,β)(yβ)α1(1yβ)β1(2)=1βαB(α,β)yα1(1yβ)β1 となる。

 ここで、ガンマ関数に対するStirlingの公式 Γ(x)2πx(xe)x を用いると式(2)は、 fY(y)=Γ(α+β)βαΓ(α)Γ(β)yα1(1yβ)β1(3)1Γ(α)βα+β(αβ+1)α+βeαyα1(1yβ)β1 のようになる。

 式(3)で、β+の極限をとると、 limβ+fY(y)=1Γ(α)eαeαyα1ey(4)=1Γ(α)yα1ey となり、これはガンマ分布の確率密度関数でβ=1としたものである。

 よって、β+の極限でY=βXの分布はGamma(α, 1)に収束する。□

〈補足〉分布収束(法則収束)とは、 limnFn(x)=F(x) が、F(x)が連続である任意のxに対して成り立つこと(不連続点以外で各点収束)と定義される。

 分布収束と確率密度関数の収束の関係がどうなっているか筆者にはよくわからない。調べたかぎりでは、Schefféの補題1,2,3というものが関連するようで、それを適用できれば確率密度関数の収束から分布収束がいえるらしい。

 ベータ分布は絶対連続確率分布だから(?)適用できるらしく、上の証明で分布収束の証明になっていると思う。(数学徒の方、アドバイスを是非。)

  1. "Scheffé's lemma". Wikipedia.
  2. Guy Lebanon. "Scheffe's Theorem". Probability: The Analysis of Data, Volume 1.
  3. "Schefféの補題とその簡単な証明". 数学の景色.

ベータ分布(対称)の正規近似

XBeta(α, α)αが大きくなるにつれて、8α(X12)の分布はN(0, 1)に近づく。」

 XBeta(α, α)の確率密度関数は (1)fX(x)=1B(α,α)xα1(1x)α1 である。

 また、Y=8α(X12)の確率密度関数は fY(y)=18αB(α,α)(y8α+12)α1(12y8α)α1(2)=18αB(α,α)(14y28α)α1 となる。

 ここで、ガンマ関数に対するStirlingの公式 Γ(x)2πx(xe)x を用いると式(2)は、 fY(y)=Γ(2α)8αΓ(α)Γ(α)(14y28α)α14α12π(14y28α)α1(3)=12π(1y22α)α1 のようになる。

 式(3)で、α+の極限をとると、 (4)limα+fY(y)=12πey2/2 となり、これは標準正規分布の確率密度関数である。

 よって、α+の極限でY=8α(X12)の分布はN(0, 1)に収束する。□

幾何分布の指数近似

 極限の場合§負の二項分布#ガンマ近似r=1の場合である。

 幾何分布についての証明を以下に示す。

XGeom(p)pが0に向かうにつれて、pXの分布はExp(1)に近づく。」

 XGeom(p)の累積分布関数は FX(x)=P(Xx)(1)=1(1p)x+1 である。また、Y=pXの累積分布関数は FY(y)=P(Yy)=P(pXy)(2)=1(1p)y/p+1 となる。

 ここで、床関数の性質 (3)x1<xx により、 (4)1(1p)y/p<FY(y)1(1p)y/p+1 の関係が成り立つ。

 式(4)の両辺について、p+0の極限をとると、 (5)limp+0(1(1p)y/p)=1ey (6)limp+0(1(1p)y/p+1)=1ey となり、はさみうちの原理から (7)limp+0FY(y)=1ey がいえる。これは標準指数分布の累積分布関数である。

 よって、p+0の極限でY=pXの分布はExp(1)に収束する。□