내가 하는 통계 분석/R

[내가 하는 통계 분석] 대응표본 T 검정(Paired Sample t-test) in R

산격동 너구리 2021. 2. 5. 16:56

안녕하세요, 산격동 너구리입니다.

 

 

이번 포스팅은,

 

R을 이용한 "대응표본 T 검정"입니다.


개요

 

 

 대응표본 T 검정이란??
동일한 대상에게서 측정된 값의 차이 평균 검정.

(주로 동일한 대상에게서 전/후 차이를 비교하는데에 사용됨.)

 

 

 가정
정규성 가정 : 비교할 값의 차이는 정규성을 가진다.

 

 

 가설
$H_0$ : 비교할 값의 차이의 평균은 0이다. (= 값의 차이가 없다.)

$H_1$ : 비교할 값의 차이의 평균은 0이 아니다. (= 값의 차이가 있다.)

예제

03. [산격동 너구리] 대응표본 T 검정 예제.csv
0.00MB

고혈압 환자를 대상으로 A약이 혈압을 낮추는 효과가 있는지 확인하는 예시를 들어보겠습니다. 

 

before는 복용 전 혈압, after는 복용 후 혈압이라고 생각하시면 되겠습니다.

 

(의료계 전공자는 아니기 때문에... 혈압 수치나 복용량 등 세부적인 부분은 잘 모릅니다..ㅎㅎ;;

예시를 위해 만든 데이터이니 이상하더라도 귀엽게 봐주시면 감사드리겠습니다.)

 

위의 파일을 이용하였고, 통계적 유의수준은 0.05로 두었습니다.

 

데이터 불러오기
## 1. 데이터 불러오기
data = read.csv("G:/산격동 너구리/[수정]/03. [산격동 너구리] 대응표본 T 검정 예제.csv", header = T)

 

가정

1. 정규성 가정 확인

#   2-1) 정규성 가정
#    전/후 차이 구하기
data$diff = data$after - data$before # diff라는 새로운 변수 생성

#   정규성 확인
shapiro.test(data$diff)

p-value가 0.05보다 크므로 귀무가설을 채택합니다.

 

따라서, 값의 차이가 정규성 가정을 만족하는 것으로 판단할 수 있습니다.

 

 

가설
$H_0$ : A약 복용 전/후 혈압 수치 차이의 평균은 같다.

$H_1$ : A약 복용 전/후 혈압 수치 차이의 평균은 같지 않다.

예제를 위해 임의로 지정한 가설입니다.

 

상황에 맞추어 적절히 변형하시길 바랍니다.

 

대응표본 T 검정
## 3. 대응 표본 T 검정
# 1번 방법
t.test(data$before, # 비교할 값 1
       data$after, # 비교할 값 2
       paired = T) # 대응표본인지? (T/F)

# 2번 방법
t.test(data$diff) # 값의 차이에 대한 일표본 T검정과 같음

p-value가 0.05 미만이므로 귀무가설을 기각합니다.

 

따라서, "A약 복용 전/후 혈압 수치 차이의 평균은 유의한 차이가 있다"라는 결론을 낼 수 있습니다.

 

또한, 복용 후 혈압 수치가 더 낮으므로,

 

"복용 전보다 복용 후 혈압 수치의 평균이 유의하게 낮다"는 해석으로까지 확대할 수 있습니다.


 

이것으로 R을 이용한 대응표본 T 검정에 대해 마치도록 하겠습니다.

 

이상, 산격동 너구리였습니다.

 

감사합니다.

 

 

 

* 잘못된 정보 및 오타가 포함되어 있을 수 있습니다.

  그대로 받아들이시기보다는 다른 사람의 의견도 참고하셔서 분석하시길 바랍니다.

 

* 포스팅 내용 및 통계 분석 관련 질문은 언제나 환영입니다.

  가능한 선에서 최대한 답변하도록 하겠습니다.