적률생성함수 (mgf)

MGF란?

확률변수 $X$가 있을 때 $e^{tX}$의 기대값 $E(e^{tX})$을 확률변수 $X$의 적률생성함수(mgf, moment generating function)이라 한다.

정확히 표현하면, 0을 포함하는 열린구간 $t$값에 대해 $E(e^{tX})$가 실수일 때, 함수

$$ M(t) = E(e^{tX}), \quad -h < t < h \; ( \exists h>0) $$

를 확률변수 $X$의 적률생성함수라고 한다.

MGF의 성질

$$ \begin{align*} M_{X}(t) = E(e^{tX}) &= E( \sum_{k = 0}^{\infty}{\frac{t^k X^k}{k!}}) \\ &= 1 + E(X) + \frac{E(X^2)}{2!} + \frac{E(X^3)}{3!} + \dotsm + \frac{E(X^k)}{k!} + \dotsm \end{align*} $$

이므로 이로부터 $X$의 $k$차 적률 $E(X^k)$를 쉽게 계산할 수 있다. 이를테면 1차 적률(기대값과 같다) $E(X)$는 mgf의 1차 계수, 혹은 미분을 이용하여 다음과 같이 계산할 수 있다.

$$ M'(t) = E(X) + E(X^2) + \dotsm $$

이므로

$$M'(0) = E(X) $$

이다.

이를 일반화하면

$$ M^{(k)}(0) = E(X^k) $$

임을 알 수 있다.

여러 이산형 확률변수의 mgf

베르누이 분포(Bernoulli distribution)

$X \sim Bernoulli(p) $일 때 $X$의 pmf(probability mass function)은

$$f_X(x) = p^x (1-p)^{1-x},\quad x =0, 1$$

이다.

$X$의 mgf $M_X{(t)}$를 계산하면

$$ \begin{align*} M_X{(t)} = E(e^{tX}) &= \sum_{x = 0}^{1}{e^{tx} p^x (1-p)^{1-x}} \\ &= pe^t + 1-p \\ &= pe^t + q, \quad \quad \text{where} \; q = 1-p \end{align*} $$

이항분포(Binomial distribution)

이항분포의 mgf를 계산하기 위해서는 먼저 다음 기대값의 성질을 증명한다.

확률변수 $X$와 $Y$가 서로 독립일 때

$$ E(XY) = E(X)E(Y)$$

이다.

(증명)

두 확률변수 $X$, $Y$의 pdf를 각각 $f_X(x)$, $f_Y(y)$라 하고, 결합확률분포함수를 $f_{X,Y}(x,y)$ 라 하면, 두 확률변수 $X$, $Y$는 서로 독립이므로 $f_{X,Y}(x,y) = f_X(x)f_Y(y)$가 성립한다.

편의상 $X$, $Y$가 연속확률변수라 하면

$$ \begin{align*} E(XY) &= \int \int {xy f_{X,Y}(x,y) dxdy} \\ &= \int\int{xyf_X(x)f_Y(y) dxdy} \\ &= \int{xf_X(x)dx} \times \int{yf_Y(y)dy} \\ &= E(X)E(Y) \end{align*}$$

확률변수 $X \sim Bin(n,p)$일 때, $X = Z_1 + \dotsm + Z_n, Z_i \overset{iid}{\sim} Bernoulli(p)$ 이므로

$$\begin{align*} M_X{(t)} = E(e^{tX}) &= E(e^{t(Z_1 + \dotsm + Z_n)}) \\ &= E(e^{tZ_1})\dotsm E(e^{tZ_n}) \\ &= (pe^t + q)^n \end{align*} $$

기하분포(Geometric distribution)

성공확률이 $p$인 시행을 반복하여 처음으로 성공했을 때의 시행횟수를 $X$라 했을 때, X의 분포를 기하분포라 하며 $X \sim Geo(p)$로 표기한다.

정의상 $X$의 pdf는 $f_X(x) = (1-p)^{x-1}p, \quad x = 1, 2, \dotsm$ 이다.

$$\begin{align*} M_X{(t)} = E(e^{tX}) &= \sum_{x = 1}^{\infty}{e^{tx} (1-p)^{x-1}p} \\ &= \sum_{x= 1}^{\infty}{[e^t(1-p)]^x \frac{p}{1-p}}\\ &= \frac{p}{1-p} \frac{e^t (1-p)}{1-(1-p)e^t} \\ &= [1-qe^t]^{-1} pe^t \end{align*} $$

여러 연속형 확률변수의 mgf

정규분포(Normal distribution)

$X \sim N(\mu, \sigma ^2)$의 적률생성함수를 계산할 때는 여러 테크닉을 사용할 수 있다. 그 중 하나인 적분식 안에서 pdf 꼴을 만들어 식을 간단히 하는 방법을 소개하도록 하겠다. 익숙해지면 매우 편한 방법이니 알아두도록 하자. (이외에도 치환적분 등의 테크닉이 있다.)

$$\begin{align*} M_X{(t)} = E(e^{tX}) &= \int_{ -\infty }^{\infty}{ e^{tx}\frac{1}{\sqrt{2 \pi \sigma^2}} \exp{(-\frac{(x-\mu)^2}{2 \sigma^2}})dx} \\ &= \int_{ -\infty }^{\infty}{ \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{(- \frac{(x-\mu)^2}{2 \sigma^2} + \frac{2\sigma^2 tx}{2 \sigma^2} } )dx} \\ &= \int_{ -\infty }^{\infty} { \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{( - \frac{[x-(\mu+\sigma^2 t)]^2 }{2 \sigma^2} + \frac{\mu^2 - 2 \sigma^2 t \mu - \sigma^4 t^2 - \mu^2}{2 \sigma^2} )dx} } \\ &= \exp{(\mu t + \sigma^2 t^2)}\int_{ -\infty }^{\infty}{ \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{ (-\frac{[x-(\mu + \sigma^2 t)]^2}{2 \sigma^2} ) }dx }\\ &= \exp{(\mu t + \sigma ^2 t^2) } \end{align*} $$

위 식에서

$$ \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{ (-\frac{[x-(\mu + \sigma^2 t)]^2}{2 \sigma^2} )} $$

가 확률변수 $N(\mu + \sigma^2 t, \sigma^2)$의 pdf이므로,

$$ \int_{ -\infty }^{\infty}{ \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{ (-\frac{[x-(\mu + \sigma^2 t)]^2}{2 \sigma^2} ) dx} } = 1$$

임을 이용하였다. 참고로 모든 확률변수의 pdf(혹은 pmf)에 대해 $\displaystyle \int_{-\infty}^{\infty}{f_X(x) dx} = 1$ 이다.

지수분포(Exponential distribution)

여기서는 $X \sim Exp(\lambda) $의 pdf가 $\displaystyle f_X(x) = \frac{1}{\lambda} e^{-\frac{x}{\lambda}} \mathrm{I}(x>0)$ 인 version을 사용한다. $\lambda$가 rate parameter인 경우에는 $\displaystyle \frac{1}{\lambda}$ 대신 그냥 $\lambda$가 수식에 들어간다.

$$\begin{align*} M_X{(t)} = E(e^{tX}) &= \int_{0}^{\infty}{ e^{tx} \frac{1}{\lambda} e^{-\frac{x}{\lambda}} dx} \\ &= \int_{0}^{\infty}{ \frac{1}{\lambda} e^{ -( \frac{1}{\lambda} - t) x } dx} \\ &= \int_{0}^{\infty}{\frac{1}{\lambda} e^{- \frac{1-\lambda t}{\lambda} x} dx} \\ &= \int_{0}^{\infty}{\frac{1-\lambda t}{\lambda} e^{-\frac{1-\lambda t}{\lambda} x} \frac{1}{1-\lambda t} dx} \\ &= \frac{1}{1-\lambda t}\end{align*}$$

여기서도 정규분포에서 mgf를 구하는 방식과 같이 $\displaystyle \frac{1-\lambda t}{\lambda} e^{ - \frac{1-\lambda t}{ \lambda } x}$ 가 지수분포 $\displaystyle Exp(\frac{\lambda}{1-\lambda t})$의 pdf임을 이용하였다.

감마분포(Gamma distribution)

여기서는 $X \sim Gamma(\alpha, \beta)$의 pdf 가 $\displaystyle f_X(x) = \frac{1}{\Gamma(\alpha) \beta^\alpha} x^{\alpha-1}e^{-\frac{x}{\beta}} \mathrm{I}(x>0) $ 인 경우를 사용한다. $\Gamma(x)$는 Gamma function을 의미하며, Gamma함수의 parameter $\beta$는 scale parameter이다. rate parameter 인 경우에는 $\frac{1}{\beta}$ 대신 $\beta$를 대입하면 된다.

$$\begin{align*} M_X{(t)} = E(e^{tX}) &= \int_{0}^{\infty}{ \frac{e^{tx}}{\Gamma(\alpha) \beta^\alpha} x^{\alpha-1}e^{-\frac{x}{\beta}} dx} \\ &= \int_{0}^{\infty}{ \frac{1}{\Gamma(\alpha)\beta^\alpha} x^{\alpha-1} e^{-\frac{1-\beta t}{\beta} x} dx} \\ &= \int_{0}^{\infty}{ \frac{1}{\Gamma(\alpha)} (\frac{1-\beta t}{\beta})^\alpha \frac{1}{(1-\beta t)^\alpha} x^{\alpha-1} e^{-\frac{1-\beta t}{\beta} x}dx } \\ &= (1-\beta t)^{-\alpha} \int_{0}^{\infty}{ \frac{1}{\Gamma(\alpha)} (\frac{1-\beta t}{\beta})^\alpha x^{\alpha-1} e^{-\frac{1-\beta t}{\beta} x}dx } \\ &= (1-\beta t)^{-\alpha} \end{align*}$$

마찬가지로 $\displaystyle \frac{1}{\Gamma(\alpha)} (\frac{1-\beta t}{\beta})^\alpha x^{\alpha-1} e^{-\frac{1-\beta t}{\beta} x}$가 $Gamma(\alpha, \frac{\beta}{1-\beta t})$의 pdf임을 이용하였다.

마치며

위에서 여러 이산형, 연속형 확률변수들의 mgf를 계산해보았다. 수리통계 등 시험을 준비중인 학생이라면 주요 분포들의 mgf를 암기하고 있는 것이 계산에 큰 도움이 될 수 있다. 특히 계산과정 중 사용한 적분 안의 식의 꼴을 pdf형태로 만드는 스킬은 수리통계에서 매우 자주 사용되며, 편리한 계산 방법 중 하나이니 반드시 익혀두기를 바란다.

'통계학(Statistics)' 카테고리의 다른 글

분할행렬(partioned matrix)의 역행렬 (0)	2022.01.18
베타분포(Beta distribution) (1)	2022.01.13
왜도(skewness)와 첨도(kurtosis) (2)	2022.01.12
감마분포(Gamma distribution) (0)	2022.01.11
포아송 분포의 기대값 계산 (0)	2022.01.11

운좋은사람

적률생성함수 (mgf)

MGF란?

MGF의 성질

여러 이산형 확률변수의 mgf

여러 연속형 확률변수의 mgf

마치며

'통계학(Statistics)' 카테고리의 다른 글

티스토리툴바

적률생성함수 (mgf)

MGF란?

MGF의 성질

여러 이산형 확률변수의 mgf

여러 연속형 확률변수의 mgf

마치며

'통계학(Statistics)' 카테고리의 다른 글

'통계학(Statistics)' Related Articles

티스토리툴바