학생 t분포

정의[편집 | 원본 편집]

확률변수 Z, U에 대해 두 확률변수는 독립이고 Z표준정규분포를, U는 자유도 n카이제곱분포를 따른다고 하자. 즉, [math]\displaystyle{ Z\sim N(0,1), U\sim \chi_n^2 }[/math]이다. 이때 확률변수

[math]\displaystyle{ T=\frac{Z}{\sqrt{U/n}} }[/math]

가 따르는 확률분포를 자유도 n학생 t분포, 또는 스튜던트 t분포(Student's t-distribution)이라고 한다. 줄여서 t분포라고도 하며, [math]\displaystyle{ t_n }[/math]으로 표기한다.[1]

응용[편집 | 원본 편집]

정규분포 N(μ,σ2)을 따르는 서로 독립인 확률변수 [math]\displaystyle{ X_1,X_2,\cdots,X_n }[/math]에 대해 표본평균 [math]\displaystyle{ \bar{X} }[/math]표본분산 S2은 서로 독립이며 [math]\displaystyle{ \bar{X}\sim N\left(\mu,\frac{\sigma^2}{n}\right) }[/math], [math]\displaystyle{ \frac{(n-1)S^2}{\sigma^2}\sim \chi_{n-1}^2 }[/math]이다. 따라서

[math]\displaystyle{ \frac{\bar{X}-\mu}{S/\sqrt{n}}=\frac{\dfrac{\bar{X}-\mu}{\sigma/\sqrt{n}}}{\dfrac{S/\sqrt{n}}{\sigma/\sqrt{n}}}=\frac{Z}{\sqrt{\dfrac{(n-1)S^2/\sigma^2}{n-1}}}\sim t_{n-1} }[/math]

이다. 따라서 t분포는 σ를 모르는 상황에서 t검정을 할 때 검정통계량으로 사용된다.

  • 이표본 등분산 검정: [math]\displaystyle{ X_1,X_2,\cdots,X_n }[/math]가 서로 독립이고 평균 μX인 정규분포를 따르고, [math]\displaystyle{ Y_1,Y_2,\cdots,Y_m }[/math]가 서로 독립이고 평균 μY인 정규분포를 따르며(분산은 둘 모두 σ2), [math]\displaystyle{ X_i,Y_i }[/math]가 서로 독립이라고 가정하자. 그러면 검정통계량
[math]\displaystyle{ t=\frac{(\bar{X}-\bar{Y})-(\mu_X-\mu_Y)}{S_p\sqrt{\dfrac{1}{n}+\dfrac{1}{m}}} }[/math]
은 자유도가 m+n-2인 t분포를 따른다. 이때 합동표본분산(pooled sample variance) Sp[math]\displaystyle{ S_p=\frac{(n-1)S_X^2+(m-1)S_Y^2}{m+n-2} }[/math]이다.

같이 보기[편집 | 원본 편집]

각주

  1. 왜 이름이 학생 t분포냐면, t분포를 연구한 W.S. Gosset이 논문을 낼 때 필명을 Student라고 했기 때문이다. Student(1908). "The Probable Error on a Mean". Biometrika 6 (1): 1–25. doi:10.1093/biomet/6.1.1