카이제곱분포


카이제곱분포(Chi-squared distribution)정규분포를 이용한 새로운 확률분포다.

정의[편집 | 원본 편집]

확률변수 [math]\displaystyle{ Z_1,Z_2,\cdots,Z_n }[/math]독립이고 표준정규분포를 따른다고 하자. 확률변수

[math]\displaystyle{ Y=Z_1^2+Z_2^2+\cdots+Z_n^2 }[/math]

를 자유도 n카이제곱분포라고 한다. 이때, [math]\displaystyle{ Y\sim \chi_n^2 }[/math]로 표기한다.

성질[편집 | 원본 편집]

확률밀도함수[편집 | 원본 편집]

표준정규분포를 따르는 확률변수 Z에 대해 [math]\displaystyle{ Z^2\sim \Gamma\left(\dfrac{1}{2},\dfrac{1}{2}\right) }[/math]이므로, 표준정규분포를 따르는 독립인 확률변수 [math]\displaystyle{ Z_1,Z_2,\cdots,Z_n }[/math]에 대해 [math]\displaystyle{ Y=Z_1^2+Z_2^2+\cdots+Z_n^2 }[/math]라 하면 [math]\displaystyle{ Y\sim \Gamma\left(\dfrac{n}{2},\dfrac{1}{2}\right) }[/math]이다. 따라서

[math]\displaystyle{ f(x)=\dfrac{1}{2^{n/2}\Gamma(n/2)}x^{(n/2)-1}e^{-(x/2)} }[/math] (x>0)

을 얻는다.

전혀 쉽지 않은사용예시[편집 | 원본 편집]

카이 제곱 분포를 통해서 어떤 내용을 검증을 하게 되면 이를 카이 제곱 검정이라고 하는데, 실제 통계조사를 할 때에는 카이 제곱 분포표를 토대로 하여 좀 더 쉽게 통계를 하게 된다. 사실 분포표도 통계 배울때나 쓰고 실제로는 SASSPSS, R, 수완 좋으면 공학용 계산기등으로 다 계산해버리고, 믿을수는 없지만 엑셀로도 계산할 수 있다. 물론 대학원생이 엑셀로 계산해서 교수님한테 통계결과를 제출하면 짐 싸야한다.(...)

이 카이 제곱 검정을 하기 위해서는 [math]\displaystyle{ x^2 }[/math]의 값을 구해야하는데, 이 값은 적용하는 케이스 마다 다 다르다.(...) 가장 대표적인 예시로 멘델유전의 법칙에 사용했던 적중률 검정을 하면 다음과 같다. 통계전공이 아니라 통계전공분들의 수정을 부탁드립니다.누누히 말했지만 이걸 보고 과제했다가 폭망해도 리브레 위키는 책임지지 못합니다.

[math]\displaystyle{ x^2 }[/math]= Σ(관찰수-이론수)^2/이론수

※ 어디까지나 예시입니다.

[math]\displaystyle{ x^2 }[/math]를 계산하면 다음과 같이 된다.

황색 콩의 관찰수는 6022개, 이론수는 8023/4*3 = 6017.25개

관찰수-이론수 = 6022-6017.25 = 4.75

황색 콩[math]\displaystyle{ x^2 }[/math] = 4.75^2/6017.25 = 0.00375라고 칩시다.

녹색 의 관찰개수는 2001개, 이론수는 8023/4*1 = 2005.75개

관찰수-이론수 = 2001-2005.75 = -4.75

녹색 [math]\displaystyle{ x^2 }[/math] = -4.75^2/2005.75 = 0.01125라고 칩시다.

여기서 황색 콩[math]\displaystyle{ x^2 }[/math]값과 녹색 [math]\displaystyle{ x^2 }[/math]값을 더하면 0.01500이 나오는데, 이게 이 실험에서의 [math]\displaystyle{ x^2 }[/math]값이 된다.

이 실험의 자유도를 계산하면, 자유도는 실험군-1이므로, 총 2개의 실험군이 있는 이 실험의 자유도는 1이다. 엑셀의 chiinv함수로 9%신뢰도 기준으로 계산을 하면 =chiinv(0.95, 1)을 입력하면 된다이게 바로 위 항목의 계산결과이다!. 이러면 0.003932가 나오는데, 이 값은 [math]\displaystyle{ x^2 }[/math]인 0.0150보다 작다. 이걸 P>0.95라고 표시하고, 이 실험의 신뢰도값은 카이 제곱 검정에서 유효하다고, 그러니까 이 실험은 이론을 95%범위의 신뢰도 안에서 입증한다고 말을 할 수가 있다.

여기서 우리는 황색 콩의 유전자가 더 우성이라는 사실을 알 수 있다.(응?)

근거자료를 써놓고 싶은데 책을 못찾고 있어서 레포트 저장한거로 땜빵했는데, 이거 제출하고 교수님한테 끌려가서 레포트 발로 썼다고 혼났다는 사실을 참고하세요. 그래도 F는 안받았습니다.

같이 보기[편집 | 원본 편집]

외부 링크[편집 | 원본 편집]

각주