내가 하는 통계 분석/SAS

[내가 하는 통계 분석] 독립표본 T 검정(Independent Sample t-test) in SAS

산격동 너구리 2021. 2. 23. 11:15

안녕하세요, 산격동 너구리입니다.

 

 

이번 포스팅은,

 

SAS를 이용한 "독립표본 T 검정"입니다.


개요

 

 

 독립표본 T 검정이란??
두 집단의 평균 비교

 

 

 가정
정규성 가정 : 각 집단의 표본 평균은 정규성을 가져야 한다.

등분산성 가정 : 두 집단이 분산은 동일해야 한다.

독립성 가정 : 두 집단은 서로 독립적이어야 한다.

 

 

 가설
$H_0$ : 두 모집단의 평균은 같다.

$H_1$ : 두 모집단의 평균은 같지 않다.

예제

02. [산격동 너구리] 독립표본 T 검정 예제.csv
0.00MB

대구지역 초1과 서울지역 초1의 키를 비교해보는 예시를 들어보겠습니다.

 

위의 파일을 이용하였고, 통계적 유의수준은 0.05로 두었습니다.

 

데이터 불러오기
/* 데이터 읽기 */
proc import file = "G:\산격동 너구리\[수정]\예제 파일\02. [산격동 너구리] 독립표본 T 검정 예제.csv"
	out= work.data dbms = csv replace;
run;

가정

1. 정규성 가정 확인

/* 정규성 검정하기 */
proc univariate data = data normal ;
	var height;
	class group;
run;

 

p-value가 0.05보다 크므로 귀무가설을 채택합니다.

 

따라서, 두 그룹 모두 정규성 가정을 만족하는 것으로 판단할 수 있습니다.

 

 

2. 등분산성 가정 확인

 

T 검정을 실행하면 등분산성 검정 결과를 같이 볼 수 있습니다.

 

T 검정 결과로 확인하도록 하겠습니다.

 

 

3. 독립성 가정 확인

 

제가 알기로는 독립성 가정을 확인하는 검정은 따로 없습니다.

 

독립성 가정은 말 그대로 두 그룹이 독립적인지를 의미하는 것이므로

 

예시 상황에서는 표본 추출에서 문제가 없으면 독립성 가정을 만족했다고 볼 수 있겠습니다.

 

여기서는 만족했다고 생각하겠습니다.

 

가설
$H_0$ : 두 그룹의 평균 키는 같다.

$H_1$ : 두 그룹의 평균 키는 같지 않다.

예제를 위해 임의로 지정한 가설입니다.

 

상황에 맞추어 적절히 변형하시길 바랍니다.

 

독립표본 T 검정
/* 독립표본 t-test 하기 */
proc ttest data = data ;
	var height;
	class group;
run;

맨 아래에 있는 칸이 등분산성 검정입니다.

 

p-value가 0.05 이상이므로 귀무가설을 채택합니다. 

 

따라서, 두 그룹의 분산은 동일한 것으로 볼 수 있습니다.

 

등분산 가정이 만족되었으므로, Pooled 가 적혀있는 행을 확인합니다.

 

p-value가 0.05 미만이므로 귀무가설을 기각합니다.

 

따라서, "대구지역과 서울지역의 초1의 평균 키는 같지 않다"라는 결론을 낼 수 있습니다.

 

또한, 대구지역 초1의 키가 더 크므로,

 

"대구지역 초1의 평균 키가 서울지역 초1의 평균 키보다 크다"는 해석으로까지 확대할 수 있습니다.


 

이것으로 SAS를 이용한 독립표본 T 검정에 대해 마치도록 하겠습니다.

 

이상, 산격동 너구리였습니다.

 

감사합니다.

 

 

 

* 잘못된 정보 및 오타가 포함되어 있을 수 있습니다.

  그대로 받아들이시기보다는 다른 사람의 의견도 참고하셔서 분석하시길 바랍니다.

 

* 포스팅 내용 및 통계 분석 관련 질문은 언제나 환영입니다.

  가능한 선에서 최대한 답변하도록 하겠습니다.