카이제곱분포: 두 판 사이의 차이

(본인 기여. http://www.mathwiki.net/%EC%B9%B4%EC%9D%B4%EC%A0%9C%EA%B3%B1%EB%B6%84%ED%8F%AC)
 
잔글 (불필요한 공백 제거)
 
(사용자 4명의 중간 판 10개는 보이지 않습니다)
1번째 줄: 1번째 줄:
{{학술 관련 정보}}
 


'''카이제곱분포(Chi-squared distribution)'''는 [[정규분포]]를 이용한 새로운 확률분포다.
'''카이제곱분포(Chi-squared distribution)'''는 [[정규분포]]를 이용한 새로운 확률분포다.
13번째 줄: 13번째 줄:
: <math>f(x)=\dfrac{1}{2^{n/2}\Gamma(n/2)}x^{(n/2)-1}e^{-(x/2)}</math> (''x''>0)
: <math>f(x)=\dfrac{1}{2^{n/2}\Gamma(n/2)}x^{(n/2)-1}e^{-(x/2)}</math> (''x''>0)
을 얻는다.
을 얻는다.
==<s>전혀 쉽지 않은</s>사용예시==
'''카이 제곱 분포'''를 통해서 어떤 내용을 검증을 하게 되면 이를 '''카이 제곱 검정'''이라고 하는데, 실제 통계조사를 할 때에는 '''카이 제곱 분포표'''를 토대로 하여 좀 더 쉽게 통계를 하게 된다. 사실 분포표도 통계 배울때나 쓰고 실제로는 [[SAS]]나 [[SPSS]], [[R]], 수완 좋으면 공학용 계산기등으로 다 계산해버리고, 믿을수는 없지만 [[엑셀]]로도 계산할 수 있다. 물론 대학원생이 엑셀로 계산해서 교수님한테 통계결과를 제출하면 짐 싸야한다.(...)
이 카이 제곱 검정을 하기 위해서는 <math>x^2</math>의 값을 구해야하는데, 이 값은 적용하는 케이스 마다 다 다르다.(...) 가장 대표적인 예시로 [[멘델]]이 [[유전의 법칙]]에 사용했던 적중률 검정을 하면 다음과 같다. <s>통계전공이 아니라 통계전공분들의 수정을 부탁드립니다.누누히 말했지만 이걸 보고 과제했다가 폭망해도 [[리브레 위키]]는 책임지지 못합니다.</s>
<math>x^2 </math>= Σ(관찰수-이론수)^2/이론수
※ 어디까지나 예시입니다.
* [[분리의 법칙]](이론) = [[홍진호|<s>황신</s> 황색 콩]]과 녹색 [[콩]]을 교배한 F2세대의 분리비는 3:1이다.
* {{위키러}}가 F2세대의 콩을 8023개를 얻었을 때 그 관찰수
** [[홍진호|황색 콩]] = 6022개
** 녹색 [[콩]] = 2001개
<math>x^2 </math>를 계산하면 다음과 같이 된다.
[[홍진호| 황색 콩]]의 관찰수는 6022개, 이론수는 8023/4*3 = 6017.25개
관찰수-이론수 = 6022-6017.25 = 4.75
[[홍진호| 황색 콩]]의 <math>x^2 </math> = 4.75^2/6017.25 = 0.00375<s>라고 칩시다.</s>
녹색 [[콩]]의 관찰개수는 2001개, 이론수는 8023/4*1 = 2005.75개
관찰수-이론수 = 2001-2005.75 = -4.75
녹색 [[콩]]의 <math>x^2 </math> = -4.75^2/2005.75 = 0.01125<s>라고 칩시다.</s>
여기서 [[홍진호| 황색 콩]]의  <math>x^2 </math>값과 녹색 [[콩]]의 <math>x^2 </math>값을 더하면 '''0.01500'''이 나오는데, 이게 이 실험에서의 <math>x^2 </math>값이 된다.
이 실험의 [[자유도]]를 계산하면, 자유도는 실험군-1이므로, 총 2개의 실험군이 있는 이 실험의 자유도는 1이다.
엑셀의 chiinv함수로 9%신뢰도 기준으로 계산을 하면 =chiinv(0.95, 1)을 입력하면 된다<s>이게 바로 위 항목의 계산결과이다!</s>. 이러면 0.003932가 나오는데, 이 값은 <math>x^2 </math>인 0.0150보다 작다. 이걸 P>0.95라고 표시하고, 이 실험의 신뢰도값은 '''카이 제곱 검정'''에서 유효하다고, 그러니까 이 실험은 이론을 95%범위의 신뢰도 안에서 입증한다고 말을 할 수가 있다.
여기서 우리는 [[홍진호| 황색 콩]]의 유전자가 더 [[우성]]이라는 사실을 알 수 있다.(응?)
<s>근거자료를 써놓고 싶은데 책을 못찾고 있어서 레포트 저장한거로 땜빵했는데, 이거 제출하고 교수님한테 끌려가서 레포트 발로 썼다고 혼났다는 사실을 참고하세요. 그래도 [[F]]는 안받았습니다.</s>


== 같이 보기 ==
== 같이 보기 ==
20번째 줄: 56번째 줄:
== 외부 링크 ==
== 외부 링크 ==
* Weisstein, Eric W. [http://mathworld.wolfram.com/Chi-SquaredDistribution.html "Chi-Squared Distribution."] From MathWorld--A Wolfram Web Resource.
* Weisstein, Eric W. [http://mathworld.wolfram.com/Chi-SquaredDistribution.html "Chi-Squared Distribution."] From MathWorld--A Wolfram Web Resource.
{{각주}}
{{연속확률분포}}


[[분류:연속확률분포]]
[[분류:연속확률분포]]

2021년 6월 16일 (수) 00:40 기준 최신판


카이제곱분포(Chi-squared distribution)정규분포를 이용한 새로운 확률분포다.

정의[편집 | 원본 편집]

확률변수 [math]\displaystyle{ Z_1,Z_2,\cdots,Z_n }[/math]독립이고 표준정규분포를 따른다고 하자. 확률변수

[math]\displaystyle{ Y=Z_1^2+Z_2^2+\cdots+Z_n^2 }[/math]

를 자유도 n카이제곱분포라고 한다. 이때, [math]\displaystyle{ Y\sim \chi_n^2 }[/math]로 표기한다.

성질[편집 | 원본 편집]

확률밀도함수[편집 | 원본 편집]

표준정규분포를 따르는 확률변수 Z에 대해 [math]\displaystyle{ Z^2\sim \Gamma\left(\dfrac{1}{2},\dfrac{1}{2}\right) }[/math]이므로, 표준정규분포를 따르는 독립인 확률변수 [math]\displaystyle{ Z_1,Z_2,\cdots,Z_n }[/math]에 대해 [math]\displaystyle{ Y=Z_1^2+Z_2^2+\cdots+Z_n^2 }[/math]라 하면 [math]\displaystyle{ Y\sim \Gamma\left(\dfrac{n}{2},\dfrac{1}{2}\right) }[/math]이다. 따라서

[math]\displaystyle{ f(x)=\dfrac{1}{2^{n/2}\Gamma(n/2)}x^{(n/2)-1}e^{-(x/2)} }[/math] (x>0)

을 얻는다.

전혀 쉽지 않은사용예시[편집 | 원본 편집]

카이 제곱 분포를 통해서 어떤 내용을 검증을 하게 되면 이를 카이 제곱 검정이라고 하는데, 실제 통계조사를 할 때에는 카이 제곱 분포표를 토대로 하여 좀 더 쉽게 통계를 하게 된다. 사실 분포표도 통계 배울때나 쓰고 실제로는 SASSPSS, R, 수완 좋으면 공학용 계산기등으로 다 계산해버리고, 믿을수는 없지만 엑셀로도 계산할 수 있다. 물론 대학원생이 엑셀로 계산해서 교수님한테 통계결과를 제출하면 짐 싸야한다.(...)

이 카이 제곱 검정을 하기 위해서는 [math]\displaystyle{ x^2 }[/math]의 값을 구해야하는데, 이 값은 적용하는 케이스 마다 다 다르다.(...) 가장 대표적인 예시로 멘델유전의 법칙에 사용했던 적중률 검정을 하면 다음과 같다. 통계전공이 아니라 통계전공분들의 수정을 부탁드립니다.누누히 말했지만 이걸 보고 과제했다가 폭망해도 리브레 위키는 책임지지 못합니다.

[math]\displaystyle{ x^2 }[/math]= Σ(관찰수-이론수)^2/이론수

※ 어디까지나 예시입니다.

[math]\displaystyle{ x^2 }[/math]를 계산하면 다음과 같이 된다.

황색 콩의 관찰수는 6022개, 이론수는 8023/4*3 = 6017.25개

관찰수-이론수 = 6022-6017.25 = 4.75

황색 콩[math]\displaystyle{ x^2 }[/math] = 4.75^2/6017.25 = 0.00375라고 칩시다.

녹색 의 관찰개수는 2001개, 이론수는 8023/4*1 = 2005.75개

관찰수-이론수 = 2001-2005.75 = -4.75

녹색 [math]\displaystyle{ x^2 }[/math] = -4.75^2/2005.75 = 0.01125라고 칩시다.

여기서 황색 콩[math]\displaystyle{ x^2 }[/math]값과 녹색 [math]\displaystyle{ x^2 }[/math]값을 더하면 0.01500이 나오는데, 이게 이 실험에서의 [math]\displaystyle{ x^2 }[/math]값이 된다.

이 실험의 자유도를 계산하면, 자유도는 실험군-1이므로, 총 2개의 실험군이 있는 이 실험의 자유도는 1이다. 엑셀의 chiinv함수로 9%신뢰도 기준으로 계산을 하면 =chiinv(0.95, 1)을 입력하면 된다이게 바로 위 항목의 계산결과이다!. 이러면 0.003932가 나오는데, 이 값은 [math]\displaystyle{ x^2 }[/math]인 0.0150보다 작다. 이걸 P>0.95라고 표시하고, 이 실험의 신뢰도값은 카이 제곱 검정에서 유효하다고, 그러니까 이 실험은 이론을 95%범위의 신뢰도 안에서 입증한다고 말을 할 수가 있다.

여기서 우리는 황색 콩의 유전자가 더 우성이라는 사실을 알 수 있다.(응?)

근거자료를 써놓고 싶은데 책을 못찾고 있어서 레포트 저장한거로 땜빵했는데, 이거 제출하고 교수님한테 끌려가서 레포트 발로 썼다고 혼났다는 사실을 참고하세요. 그래도 F는 안받았습니다.

같이 보기[편집 | 원본 편집]

외부 링크[편집 | 원본 편집]

각주