내가 하는 통계 분석/R

[내가 하는 통계 분석] 피셔의 정확 검정(Fisher's exact test) in R

산격동 너구리 2021. 3. 12. 00:18

안녕하세요, 산격동 너구리입니다.

 

 

이번 포스팅은,

 

R을 이용한 "피셔의 정확 검정"입니다.

 


개요

 

피셔의 정확 검정이란??
카이제곱 검정에서 기대 빈도 가정이 충족되지 못 할 때 사용하는 검정법

편하게 생각하시려면, 표본 수가 적을 때 사용하는 카이제곱 검정이라고 생각할 수 있습니다.

 

 가정
1. 독립성 가정(한 명의 대상에게서 하나의 결과값을 얻어야 함)

 

 가설
귀무가설 : 두 변수는 서로 독립적이다. (=연관이 없다.)

대립가설 : 두 변수는 서로 독립적이지 않다. (=연관이 있다.)

 

보통 카이제곱 검정을 하고 싶으나, 기대 빈도 가정을 만족하지 못 할 때 사용하는 검정법입니다.

 

따라서, 전체적인 흐름이나 해석은 카이제곱과 동일하게 하시면 됩니다.

 

다른 점은 기대 빈도 가정이 충족되지 않았다는 점입니다.


예제

10. [산격동 너구리] Fisher exact 예제.csv
0.00MB

lunch-box.tistory.com/90

 

[내가 하는 통계 분석] 카이제곱 검정(Chi-Square test) in R

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, R을 이용한 "카이제곱 검정"입니다. 개요 카이제곱 검정이란?? 주로 2개의 명목형 변수를 대상으로 연관성에 대해 검정을 할 때 사용합니다.  

lunch-box.tistory.com

 

이전 포스팅인 카이제곱 검정과 동일한 예제입니다.

 

다른 점은, 총 90개의 관측치 중에서 45개로 추렸습니다.

 

한 중 일 사람들에게 가장 좋아하는 영화 장르에 대해 질문을 했을 떄,

 

country = 1:한국, 2:중국, 3:일본 

 

movie = 1:액션 및 스릴러, 2:로맨스 및 코미디, 3:기타 라고 생각하겠습니다.

 

 

데이터 불러오기
## 데이터 불러오기
data = read.csv("G:/산격동 너구리/[수정]/예제 파일/10. [산격동 너구리] Fisher exact 예제.csv", header = T)

 

## 빈도표
tab = table(data)

 

가정

1. 독립성 가정

 

서로 다른 사람들에게 각각 질문을 해서 결과를 얻었다고 하면 만족시킬 수 있습니다.

 

현재 상황에서는 만족하는 것으로 볼 수 있습니다.

 

 

가설
귀무가설 : 국가와 좋아하는 영화 장르는 서로 독립적이다.

대립가설 : 국가와 좋아하는 영화 장르는 서로 독립적이지 않다.

 

 

피셔의 정확 검정
## 카이제곱 검정
res = chisq.test(tab)

## 기대 빈도
res$expected

## 카이제곱 검정 결과
res

 

현실에서, "피셔의 정확 검정을 해야지" 하는 경우는 흔치 않습니다.

 

"카이제곱을 하고 싶지만, 어쩔 수 없이 피셔의 정확 검정을 해야지"의 경우가 일반적입니다.

 

이전 포스팅에서도 말씀드렸다시피 기대빈도를 직접 계산할 수는 있지만,

 

카이제곱 검정을 하면 기대빈도도 같이 구해지기 때문에,

 

현실적인 순서인 카이제곱 검정을 먼저 했습니다.

 

기대 빈도가 모자란 탓인지 경고 메시지가 함께 출력됩니다.

 

기대 빈도가 5 미만인 셀은 6개입니다.

 

총 9개의 셀 중에 6개의 셀에서 기대 빈도가 5 미만이므로, 대략 66.67%의 셀이 기대 빈도가 5미만입니다.

 

따라서, 카이제곱 검정의 가정 중 기대빈도 가정을 충족시키지 못 하므로

 

카이제곱 검정 보다는 피셔의 정확 검정을 하는 것이 더 적절해보입니다.

 

## 피셔의 정확 검정
fisher.test(tab)

피셔의 정확 검정 결과,

 

p-value=0.003 이므로 귀무가설을 기각하여,

 

"국가와 좋아하는 영화 장르는 서로 독립적이지 않다."인 대립가설을 채택하게 됩니다.

 

따라서, "국가와 좋아하는 영화 장르는 서로 연관이 있다."라는 결론을 얻을 수 있습니다.


 

이것으로 R을 이용한 피셔의 정확 검정에 대해 마치도록 하겠습니다.

 

이상, 산격동 너구리였습니다.

 

감사합니다.

 

 

 

* 잘못된 정보 및 오타가 포함되어 있을 수 있습니다.

  그대로 받아들이시기보다는 다른 사람의 의견도 참고하셔서 분석하시길 바랍니다.

 

* 포스팅 내용 및 통계 분석 관련 질문은 언제나 환영입니다.

  가능한 선에서 최대한 답변하도록 하겠습니다.