- 標本最大値は$X_{(n)} = \max\{X_1, \ldots, X_n\}$で定義される。$X_{(n)}$の漸近分布を最大極値分布または単に極値分布という。もとの確率分布が連続確率分布のとき、極値分布は位置とスケールを別として次の三つのタイプのどれかに属することが知られている。1,2
- グンベル型(グンベル分布)
- フレシェ型(フレシェ分布)
- ワイブル型(符号を変えたワイブル分布)
- 上限のない確率分布の極値分布は、裾の減衰の速さによってグンベル型かフレシェ型に属する。上側累積確率が指数的に減衰するならグンベル型、べき乗的に減衰するならフレシェ型となる。
- 上限をもつ確率分布の極値分布は、上限近傍のふるまいによってワイブル型かグンベル型に属する。
ギルバートハウス › 確率分布チートシート › 極値分布
極値分布
確率分布 | 極値分布のタイプ | |
---|---|---|
正規分布 | I | グンベル型 |
対数正規分布 | I | グンベル型 |
指数分布 | I | グンベル型 |
ガンマ分布 | I | グンベル型 |
一様分布 | III | ワイブル型 (指数型) |
ベータ分布 | III | ワイブル型 |
コーシー分布 | II | フレシェ型 (逆指数型) |
パレート分布 | II | フレシェ型 |
(上の対応表は、Beirlant et al.1をもとに作成。)
一般化極値分布
- 一般化極値分布の累積分布関数は以下の式で表される。1,2
- $\xi = 0$の場合
- (1) $F_X(x) = \exp\!\left(-\exp\!\left(-\frac{x - \mu}{\beta}\right)\right)$
- $\xi \neq 0$の場合
- (2) $F_X(x) = \exp\!\left(-\left(1 + \xi\left(\frac{x - \mu}{\beta}\right)\right)^{-1/\xi}\right)$
- 一般化極値分布で正の$\xi$のとき、フレシェ型に対応する。$\text{GEV}\!\left(\mu = \frac{\beta}{\xi},\ \beta,\ \xi\right)$は$\text{Frechet}\!\left(s = \frac{\beta}{\xi},\ k = \frac{1}{\xi}\right)$と一致する。
- 一般化極値分布で負の$\xi$のとき、ワイブル型に対応する。$\text{GEV}\!\left(\mu = \frac{\beta}{\xi},\ \beta,\ \xi\right)$は符号を変えた$\text{Weibull}\!\left(s = -\frac{\beta}{\xi},\ k = -\frac{1}{\xi}\right)$と一致する。
一般化極値分布の確率密度関数(グラフ)
特別な場合
指数分布とワイブル分布の関連分布
- ワイブル分布で$k = 1$の場合は、指数分布である。$\text{Weibull}(s,\ 1)$は$\text{Exp}\!\left(\lambda = \frac{1}{s}\right)$と一致する。〔ワイブル分布と指数分布〕
逆指数分布とフレシェ分布の関連分布
- フレシェ分布で$k = 1$の場合は、逆指数分布である。$\text{Frechet}(s,\ 1)$は$\text{InvExp}(\lambda = s)$と一致する。〔フレシェ分布と逆指数分布〕
変換(標準位置・標準スケール)
指数分布
- $X$が$\text{Exp}(1)$にしたがうとき、$\lambda$を正の実数として、$\frac{X}{\lambda}$は$\text{Exp}(\lambda)$にしたがう。〔スケール変換★〕
- $X$が$\text{Exp}(1)$にしたがうとき、$c$を正の実数として、$X^c$は$\text{Weibull}\!\left(1,\ k = \frac{1}{c}\right)$にしたがう。〔正のべき変換〕
- $X$が$\text{Exp}(1)$にしたがうとき、$c$を正の実数として、$X^{-c}$は$\text{Frechet}\!\left(1,\ k = \frac{1}{c}\right)$にしたがう。特に$\frac{1}{X}$は$\text{InvExp}(1)$にしたがう。〔負のべき変換〕
- $X$が$\text{Exp}(1)$にしたがうとき、$\log X$は符号を変えた$\text{Gumbel}(0,\ 1)$にしたがう。〔対数変換〕
- $X_1, \ldots, X_n$が$\text{Exp}(1)$に独立にしたがうとき、$\min\{X_1, \ldots, X_n\}$は$\text{Exp}(\lambda = n)$にしたがう。〔最小★〕
- $X_1, \ldots, X_n$が$\text{Exp}_\text{[maximum-extreme-value]}(1)$に独立にしたがうとき、$\max\{X_1, \ldots, X_n\}$は$\text{Exp}_\text{[maximum-extreme-value]}(\lambda = n)$にしたがう。〔最大(最大極値分布)★〕
ワイブル分布
- $X$が$\text{Weibull}(1,\ k)$にしたがうとき、$s$を正の実数として、$sX$は$\text{Weibull}(s,\ k)$にしたがう。〔スケール変換★〕
- $X$が$\text{Weibull}(1,\ k)$にしたがうとき、$c$を正の実数として、$X^c$は$\text{Weibull}\!\left(1,\ \frac{k}{c}\right)$にしたがう。〔正のべき変換★〕
- $X$が$\text{Weibull}(1,\ k)$にしたがうとき、$c$を正の実数として、$X^{-c}$は$\text{Frechet}\!\left(1,\ \frac{k}{c}\right)$にしたがう。〔負のべき変換〕
- $X$が$\text{Weibull}(1,\ k)$にしたがうとき、$\log X$は符号を変えた$\text{Gumbel}\!\left(0,\ \beta = \frac{1}{k}\right)$にしたがう。〔対数変換〕
- $X_1, \ldots, X_n$が同一の$\text{Weibull}(1,\ k)$に独立にしたがうとき、$\min\{X_1, \ldots, X_n\}$は$\text{Weibull}(s = n^{-1/k},\ k)$にしたがう。〔最小★〕
- $X_1, \ldots, X_n$が同一の$\text{Weibull}_\text{[maximum-extreme-value]}(1,\ k)$に独立にしたがうとき、$\max\{X_1, \ldots, X_n\}$は$\text{Weibull}_\text{[maximum-extreme-value]}(s = n^{-1/k},\ k)$にしたがう。〔最大(最大極値分布)★〕
逆指数分布
- $X$が$\text{InvExp}(1)$にしたがうとき、$\lambda$を正の実数として、$\lambda X$は$\text{InvExp}(\lambda)$にしたがう。〔スケール変換★〕
- $X$が$\text{InvExp}(1)$にしたがうとき、$c$を正の実数として、$X^c$は$\text{Frechet}\!\left(1,\ k = \frac{1}{c}\right)$にしたがう。〔正のべき変換〕
- $X$が$\text{InvExp}(1)$にしたがうとき、$c$を正の実数として、$X^{-c}$は$\text{Weibull}\!\left(1,\ k = \frac{1}{c}\right)$にしたがう。特に$\frac{1}{X}$は$\text{Exp}(1)$にしたがう。〔負のべき変換〕
- $X$が$\text{InvExp}(1)$にしたがうとき、$\log X$は$\text{Gumbel}(0,\ 1)$にしたがう。〔対数変換〕
- $X_1, \ldots, X_n$が$\text{InvExp}(1)$に独立にしたがうとき、$\max\{X_1, \ldots, X_n\}$は$\text{InvExp}(\lambda = n)$にしたがう。〔最大★〕
フレシェ分布
- $X$が$\text{Frechet}(1,\ k)$にしたがうとき、$s$を正の実数として、$sX$は$\text{Frechet}(s,\ k)$にしたがう。〔スケール変換★〕
- $X$が$\text{Frechet}(1,\ k)$にしたがうとき、$c$を正の実数として、$X^c$は$\text{Frechet}\!\left(1,\ \frac{k}{c}\right)$にしたがう。〔正のべき変換★〕
- $X$が$\text{Frechet}(1,\ k)$にしたがうとき、$c$を正の実数として、$X^{-c}$は$\text{Weibull}\!\left(1,\ \frac{k}{c}\right)$にしたがう。〔負のべき変換〕
- $X$が$\text{Frechet}(1,\ k)$にしたがうとき、$\log X$は$\text{Gumbel}\!\left(0,\ \beta = \frac{1}{k}\right)$にしたがう。〔対数変換〕
- $X_1, \ldots, X_n$が同一の$\text{Frechet}(1,\ k)$に独立にしたがうとき、$\max\{X_1, \ldots, X_n\}$は$\text{Frechet}(s = n^{1/k},\ k)$にしたがう。〔最大★〕
グンベル分布
- $X$が$\text{Gumbel}(0,\ 1)$にしたがうとき、$\mu$を実数、$\beta$を正の実数として、$\mu + \beta X$は$\text{Gumbel}(\mu,\ \beta)$にしたがう。〔位置スケール変換★〕
- $X$が$\text{Gumbel}(0,\ 1)$にしたがうとき、$e^{X}$は$\text{InvExp}(1)$にしたがう。また、$e^{-X}$は$\text{Exp}(1)$にしたがう。〔指数変換〕
- $X_1, \ldots, X_n$が$\text{Gumbel}(0,\ 1)$に独立にしたがうとき、$\max\{X_1, \ldots, X_n\}$は$\text{Gumbel}(\mu = \log n,\ 1)$にしたがう。〔最大★〕
- $X_1, \ldots, X_n$が$\text{Gumbel}(0,\ 1)$に独立にしたがうとき、$\lambda_1, \ldots, \lambda_n$を正の実数として、$X_1 + \log\lambda_1, \ldots, X_n + \log\lambda_n$のうち$X_i + \log\lambda_i$が最大となる確率は$\frac{\lambda_i}{\lambda_1 + \cdots + \lambda_n}$である。〔Gumbel-maxサンプリング〕
このことを用いて、カテゴリ確率を確率の対数の形で保持している場合に、確率に戻す計算を回避してカテゴリ乱数を得ることができる。(機械学習への応用はFrancis Bach3を参照。)
- Beirlant et al. Statistics of Extremes: Theory and Applications. Wiley, 2004.
- 渋谷政昭, 高橋倫也. "極値理論、信頼性、リスク管理". 21世紀の統計科学 Vol. II 自然・生物・健康の統計科学. 2014.
- Francis Bach. "The Gumbel trick".