내가 하는 통계 분석/R

[내가 하는 통계 분석] 윌콕슨 순위합 검정(Wilcoxon rank sum test) or 맨-휘트니 U 검정(Mann-Whitney U test) in R

산격동 너구리 2021. 2. 6. 16:59

안녕하세요, 산격동 너구리입니다.

 

 

이번 포스팅은,

 

R을 이용한 "윌콕슨 순위합 검정", "맨-휘트니 U 검정"입니다.

 

얼핏 보면 검정법 2개를 소개해드리는 것 같지만, 사실 위의 2개는 동일한 결과를 내어줍니다.

 

따라서, 둘 중에 아무거나 하셔도 괜찮습니다.

 

여기서는 "윌콕슨 순위합 검정"으로 통일하겠습니다.


개요

 

 

 윌콕슨 순위합 검정이란??
독립표본 T검정에서 정규성 가정이 만족되지 않을 때 사용하는 비모수 검정법

독립표본 T검정과는 달리 중앙값에 관한 결과를 얻을 수 있음.

 

 가정
1. 두 그룹은 독립적이다.

2. 측정값은 최소 순서형 변수이다. (대소 비교가 가능해야 합니다.)

비모수 검정은 가정에 있어서 상당히 자유롭지만,

 

일반적으로 비모수 검정이 검정력에서 더 좋지 않은 경향을 가집니다.

 

따라서, 모수 검정의 가정을 충족시키지 못할 때 사용하는 것이 비모수 검정이라고 보시면 되겠습니다.

 

 가설
$H_0$ : 두 그룹의 중앙값의 차이는 0이다.

$H_1$ : 두 그룹의 중앙값의 차이는 0이 아니다.

예제

06. [산격동 너구리] 윌콕슨 순위합 검정 예제.csv
0.00MB

A사 닭가슴살 제품의 중량과 B사 닭가슴살 제품의 중량이 차이가 있는지 확인해보겠습니다.

 

A사 닭가슴살은 40개의 표본, B사 닭가슴살은 20개의 표본이 있으며

 

각각 독립적이고 임의로 추출했다고 하겠습니다.

 

위의 파일을 이용하였고, 통계적 유의수준은 0.05로 두었습니다.

 

 

데이터 불러오기
## 데이터 불러오기
data = read.csv("G:/산격동 너구리/[수정]/06. [산격동 너구리] 윌콕슨 순위합 검정 예제.csv", header = T)

 

 

가정

추출 과정에 의해 (1)번 가정이 만족되고,

 

측정값이 비율 척도이므로 (2)번 가정도 만족됩니다.

 

 

가설
$H_0$ : A사 닭가슴살 중량의 중앙값과 B사 닭가슴살 중량의 중앙값은 차이가 없다.

$H_1$ : A사 닭가슴살 중량의 중앙값과 B사 닭가슴살 중량의 중앙값은 차이가 있다.

예제를 위해 임의로 지정한 가설입니다.

 

상황에 맞추어 적절히 변형하시길 바랍니다.

 

 

윌콕슨 순위합 검정
## 윌콕슨 순위합 검정
# 1번 방법
wilcox.test(data[data$company=="A", "weight"], # 그룹 1의 종속 변수
            data[data$company=="B", "weight"]) # 그룹 2의 종속 변수 

# 2번 방법
wilcox.test(data = data, # 사용할 데이터셋
            weight ~ company) # 종속변수 ~ 그룹 변수

p-value가 0.05 미만이므로 귀무가설을 기각합니다.

 

따라서, "A사 닭가슴살 중량의 중앙값과 B사 닭가슴살 중량의 중앙값은 유의한 차이가 있다"라는 결론을 낼 수 있습니다.

 

또한, B사 닭가슴살 중량의 중앙값이 더 높으므로,

 

"B사의 닭가슴살 중앙값이 A사 닭가슴살 중앙값보다 유의하게 더 크다"라는 해석으로까지 확대할 수 있습니다.


이것으로 R을 이용한 윌콕슨 순위합 검정에 대해 마치도록 하겠습니다.

 

이상, 산격동 너구리였습니다.

 

감사합니다.

 

 

 

* 잘못된 정보 및 오타가 포함되어 있을 수 있습니다.

  그대로 받아들이시기보다는 다른 사람의 의견도 참고하셔서 분석하시길 바랍니다.

 

* 포스팅 내용 및 통계 분석 관련 질문은 언제나 환영입니다.

  가능한 선에서 최대한 답변하도록 하겠습니다.