球面上の一様分布の周辺分布

〈本論の前に〉$\boldsymbol{X}$が単位球面上の一様分布にしたがうときの$X_i$の分布(周辺分布)がベータ型となることを証明する。

 やや長いため、全体のあらすじを示しておく。

  1. ${X_1}^2$の分布を導く。
  2. ${X_1}^2$の分布から$\lvert X_1 \rvert$の分布を導く。
  3. $X_1$の分布を導く。
  4. $X_1$の分布から$\frac{X_1 + 1}{2}$の分布を導く。

 その後の〈補足〉では、規格化定数の一見非自明な関係を確かめる。

 標準多変量正規確率変数を正規化した \begin{align} \boldsymbol{X} = \left(\frac{Z_1}{\lVert\boldsymbol{Z}\rVert}, \ldots, \frac{Z_m}{\lVert\boldsymbol{Z}\rVert}\right) \tag{1} \end{align} は、単位球面上の一様分布にしたがう。

 $X_1$(対称性を考慮すればどの成分でも同じ)に注目すると、 \begin{align} {X_1}^2 &= \frac{{Z_1}^2}{\lVert\boldsymbol{Z}\rVert^2} \\ &= \frac{{Z_1}^2}{{Z_1}^2 + ({Z_2}^2 + \cdots + {Z_m}^2)} \tag{2} \end{align} である。

 式(2)の右辺で、${Z_1}^2$は$\chi^2(1)$に、${Z_2}^2 + \cdots + {Z_m}^2$は$\chi^2(m - 1)$に独立にしたがうことから、${X_1}^2$は$\text{Beta}\!\left(\frac{1}{2},\ \beta = \frac{m - 1}{2}\right)$にしたがう。

 次に、$\lvert X_1 \rvert = \sqrt{{X_1}^2}$の分布について考える。まぎらわしくないよう、 \begin{align} \begin{cases} S &= {X_1}^2 \\ T &= \lvert X_1 \rvert \end{cases} \tag{3} \end{align} とおく。

 $S \sim \text{Beta}\!\left(\frac{1}{2},\ \beta = \frac{m - 1}{2}\right)$の確率密度関数は \begin{align} f_S(s) = \frac{1}{\mathrm{B}\!\left(\frac{1}{2}, \frac{m - 1}{2}\right)}\,s^{-1/2}\,(1 - s)^{(m - 3)/2} \tag{4} \end{align} である。ただし、$\mathrm{B}(x, y)$はベータ関数で、次のとおり定義される。 \begin{align} \mathrm{B}(x, y) = \frac{\Gamma(x)\,\Gamma(y)}{\Gamma(x + y)} \end{align}

 $S$から$T$への変換は \begin{align} T = \sqrt{S} \tag{5} \end{align} であり、この変換の逆変換は \begin{align} g^{-1}(t) = t^2 \tag{6} \end{align} である。また、$g^{-1}(t)$の導関数は \begin{align} \frac{dg^{-1}(t)}{dt} = 2t \tag{7} \end{align} となる。

 式(6)、式(7)を確率変数の変換公式に代入すると、$T$の確率密度関数は \begin{align} f_T(t) = f_S(t^2)\,\lvert 2t \rvert \tag{8} \end{align} となり、式(4)を適用したのち整理すると次のようになる。 \begin{align} f_T(t) = \frac{2}{\mathrm{B}\!\left(\frac{1}{2}, \frac{m - 1}{2}\right)}\,(1 - t^2)^{(m - 3)/2} \tag{9} \end{align}

 次に、$X_1$の分布について考える。

 $\boldsymbol{X}$の分布の対称性から$X_1$の分布は0を中心に対称型の分布で、その確率密度関数は偶関数である。

 $X_1$の確率密度関数は、正の範囲では$\lvert X_1 \rvert$の確率密度関数そのままで、負の範囲では$\lvert X_1 \rvert$の確率密度関数を裏返したものになると考えられる。式(9)の右辺は都合よく偶関数になっているので、$t$の定義域を[0, 1]から[−1, 1]に延長して、規格化定数を1/2倍すればよい。

 したがって、$X_1$の確率密度関数は次のようになる。 \begin{align} f_{X_1}(x_1) = \frac{1}{\mathrm{B}\!\left(\frac{1}{2}, \frac{m - 1}{2}\right)}\,(1 - {x_1}^2)^{(m - 3)/2} \tag{10} \end{align}

 さらに、 \begin{align} \frac{1}{\mathrm{B}\!\left(\frac{1}{2}, \frac{m - 1}{2}\right)} = \frac{1}{2^{m - 2}\,\mathrm{B}\!\left(\frac{m - 1}{2}, \frac{m - 1}{2}\right)} \tag{A} \end{align} の関係が成り立つので、 \begin{align} f_{X_1}(x_1) = \frac{1}{2^{m - 2}\,\mathrm{B}\!\left(\frac{m - 1}{2}, \frac{m - 1}{2}\right)}\,(x_1 + 1)^{(m - 3)/2}\,(1 - x_1)^{(m - 3)/2} \tag{11} \end{align} となり、これは[−1, 1]上のベータ分布の確率密度関数で$\alpha = \frac{m - 1}{2},\ \beta = \frac{m - 1}{2}$としたものである。

 よって、$X_1$は$\text{Beta}\!\left(\alpha = \frac{m - 1}{2},\ \beta = \frac{m - 1}{2},\ {-1},\ 1\right)$にしたがう。

 最後に、$U = \frac{X_1 + 1}{2}$の分布について考える。

 $U$の確率密度関数は、式(11)の右辺の$x_1$に$2u - 1$を代入、式全体を2倍した \begin{align} f_U(u) = \frac{1}{\mathrm{B}\!\left(\frac{m - 1}{2}, \frac{m - 1}{2}\right)}\,u^{(m - 3)/2}\,(1 - u)^{(m - 3)/2} \tag{12} \end{align} となり、これはベータ分布の確率密度関数で$\alpha = \frac{m - 1}{2},\ \beta = \frac{m - 1}{2}$としたものである。

 よって、$U = \frac{X_1 + 1}{2}$は$\text{Beta}\!\left(\alpha = \frac{m - 1}{2},\ \beta = \frac{m - 1}{2}\right)$にしたがう。

 以上の議論は任意の$X_i$に対しても同様である。□

〈補足〉規格化定数が一致するのは予定調和的に当然とはいえ、式(A)の関係はあまり明らかには見えない。

 以下に証明を示すが、やや遠回りしている証明かもしれない。

 階乗とガンマ関数の関係 \begin{align} n! = \Gamma(n + 1) \tag{i} \end{align} と、 \begin{align} \Gamma\!\left(\frac{1}{2}\right) = \sqrt{\pi} \tag{ii} \end{align} から、半整数の階乗を次のように定義できる。 \begin{align} \left(-\frac{1}{2}\right)! &= \sqrt{\pi} \\ \left(\frac{1}{2}\right)! &= \frac{1}{2} \cdot \sqrt{\pi} \\ \left(\frac{3}{2}\right)! &= \frac{3}{2} \cdot \frac{1}{2} \cdot \sqrt{\pi} \\ &\vdotswithin{=} \\ \left(\frac{2k - 1}{2}\right)! &= \frac{2k - 1}{2} \cdot \frac{2k - 3}{2} \cdots \frac{1}{2} \cdot \sqrt{\pi} \tag{iii} \end{align}

 次に、奇数の二重階乗は次のとおり定義される。 \begin{align} 1!! &= 1 \\ 3!! &= 3 \cdot 1 \\ &\vdotswithin{=} \\ (2k - 1)!! &= (2k - 1)\,(2k - 3) \cdots 1 \tag{iv} \end{align}

 奇数の二重階乗と整数の階乗には、 \begin{align} (2k - 1)!! = \frac{(2k)!}{2^k\,k!} \tag{v} \end{align} という関係がある。これは階乗を積の形で表せばわかる。 \begin{align} \frac{(2k)!}{2^k\,k!} &= \frac{(2k)\,(2k - 1)\,(2k - 2) \cdots 3 \cdot 2 \cdot 1}{(2k)\,\phantom{(2k - 1)}\,(2k - 2) \cdots \phantom{3} \phantom{{}\cdot{}} 2 \phantom{{}\cdot{}} \phantom{1}} \\ &= (2k - 1)\,(2k - 3) \cdots 1 \tag{vi} \end{align}

 次に、式(iii)は奇数の二重階乗を用いて次のように表すことができる。 \begin{align} \left(\frac{2k - 1}{2}\right)! = \frac{(2k - 1)!!}{2^k} \cdot \sqrt{\pi} \tag{vii} \end{align}

 さらに式(v)より、半整数の階乗と整数の階乗には \begin{align} \left(\frac{2k - 1}{2}\right)! = \frac{(2k)!}{4^k\,k!} \cdot \sqrt{\pi} \tag{viii} \end{align} の関係が成り立つ。元の問題で使いやすいようガンマ関数で表すと次のようになる。 \begin{align} \Gamma\!\left(\frac{1}{2} + k\right) = \frac{\Gamma(2k + 1)\,\Gamma\!\left(\frac{1}{2}\right)}{4^k\,\Gamma(k + 1)} \tag{ix} \end{align}

 ようやく元の問題へと入る。式(A)の右辺から出発して左辺を導く。 \begin{align} \frac{1}{2^{m - 2}\,\mathrm{B}\!\left(\frac{m - 1}{2}, \frac{m - 1}{2}\right)} &= \frac{\Gamma(m - 1)}{2^{m - 2}\,\Gamma\!\left(\frac{m - 1}{2}\right)\,\Gamma\!\left(\frac{m - 1}{2}\right)} \\ &= \frac{\Gamma(m - 1)}{2^{m - 2}\,\Gamma\!\left(\frac{1}{2} + \frac{m - 2}{2}\right)\,\Gamma\!\left(\frac{m - 1}{2}\right)} \\ &= \frac{\Gamma\!\left(\frac{m}{2}\right)}{\Gamma\!\left(\frac{1}{2}\right)\,\Gamma\!\left(\frac{m - 1}{2}\right)} \\ &= \frac{1}{\mathrm{B}\!\left(\frac{1}{2}, \frac{m - 1}{2}\right)} \tag{x} \end{align}

 よって、式(A)は成り立つ。□

〈補足の補足〉式変形の途中、式(ix)の$k$に$\frac{m - 2}{2}$を代入している。式(iii)から式(viii)まで、非負の整数の$k$を考えていた。$m$が偶数(2以上)なら問題ないが、奇数(3以上)なら$\frac{m - 2}{2}$は半整数なので半整数の$k$でも証明する必要がある。(証明は易しいので省略。)