카이제곱분포(Chi-squared distribution)는 정규분포를 이용한 새로운 확률분포다.
정의
확률변수 이 독립이고 표준정규분포를 따른다고 하자. 확률변수
를 자유도 n인 카이제곱분포라고 한다. 이때, 로 표기한다.
성질
확률밀도함수
표준정규분포를 따르는 확률변수 Z에 대해 이므로, 표준정규분포를 따르는 독립인 확률변수 에 대해 라 하면 이다. 따라서
- (x>0)
을 얻는다.
전혀 쉽지 않은사용예시
카이 제곱 분포를 통해서 어떤 내용을 검증을 하게 되면 이를 카이 제곱 검정이라고 하는데, 실제 통계조사를 할 때에는 카이 제곱 분포표를 토대로 하여 좀 더 쉽게 통계를 하게 된다. 사실 분포표도 통계 배울때나 쓰고 실제로는 SAS나 SPSS, R, 수완 좋으면 공학용 계산기등으로 다 계산해버리고, 믿을수는 없지만 엑셀로도 계산할 수 있다. 물론 대학원생이 엑셀로 계산해서 교수님한테 통계결과를 제출하면 짐 싸야한다.(...)
이 카이 제곱 검정을 하기 위해서는 의 값을 구해야하는데, 이 값은 적용하는 케이스 마다 다 다르다.(...) 가장 대표적인 예시로 멘델이 유전의 법칙에 사용했던 적중률 검정을 하면 다음과 같다. 통계전공이 아니라 통계전공분들의 수정을 부탁드립니다.누누히 말했지만 이걸 보고 과제했다가 폭망해도 리브레 위키는 책임지지 못합니다.
= Σ(관찰수-이론수)^2/이론수
※ 어디까지나 예시입니다.
를 계산하면 다음과 같이 된다.
황색 콩의 관찰수는 6022개, 이론수는 8023/4*3 = 6017.25개
관찰수-이론수 = 6022-6017.25 = 4.75
황색 콩의 = 4.75^2/6017.25 = 0.00375라고 칩시다.
녹색 콩의 관찰개수는 2001개, 이론수는 8023/4*1 = 2005.75개
관찰수-이론수 = 2001-2005.75 = -4.75
녹색 콩의 = -4.75^2/2005.75 = 0.01125라고 칩시다.
여기서 황색 콩의 값과 녹색 콩의 값을 더하면 0.01500이 나오는데, 이게 이 실험에서의 값이 된다.
이 실험의 자유도를 계산하면, 자유도는 실험군-1이므로, 총 2개의 실험군이 있는 이 실험의 자유도는 1이다.
엑셀의 chiinv함수로 9%신뢰도 기준으로 계산을 하면 =chiinv(0.95, 1)을 입력하면 된다이게 바로 위 항목의 계산결과이다!. 이러면 0.003932가 나오는데, 이 값은 인 0.0150보다 작다. 이걸 P>0.95라고 표시하고, 이 실험의 신뢰도값은 카이 제곱 검정에서 유효하다고, 그러니까 이 실험은 이론을 95%범위의 신뢰도 안에서 입증한다고 말을 할 수가 있다.
여기서 우리는 황색 콩의 유전자가 더 우성이라는 사실을 알 수 있다.(응?)
근거자료를 써놓고 싶은데 책을 못찾고 있어서 레포트 저장한거로 땜빵했는데, 이거 제출하고 교수님한테 끌려가서 레포트 발로 썼다고 혼났다는 사실을 참고하세요. 그래도 F는 안받았습니다.
같이 보기
외부 링크
- Weisstein, Eric W. "Chi-Squared Distribution." From MathWorld--A Wolfram Web Resource.