내가 하는 통계 분석/SPSS

[내가 하는 통계 분석] 분산 분석(ANOVA, Analysis of Variance) in SPSS

산격동 너구리 2021. 2. 16. 16:11

안녕하세요, 산격동 너구리입니다.

 

 

이번 포스팅은,

 

SPSS를 이용한 "분산 분석(Analysis of Variance)"입니다.

 

주로 앞 글자를 따서 ANOVA로 부르는데,

 

한글 이름이 더 어색할 정도로 ANOVA로 많이 알고 계실거에요.


개요

 

 

 분산 분석(ANOVA)이란??
3개 이상의 집단에 대한 평균 검정

 

 

 가정
정규성 가정 : 각각의 그룹에서 표본은 정규성을 가진다.

등분산성 가정 : 각 집단의 분산은 서로 동일해야 한다.

독립성 가정 : 표본은 서로 독립적이어야 한다.

 

 

 가설
$H_0$ : 모든 모집단의 평균은 동일하다.

$H_1$ : 모든 모집단의 평균이 동일한 것은 아니다.

예제

07. [산격동 너구리] ANOVA 예제.csv
0.00MB

A, B, C 고등학교 학생들의 하루 공부 시간을 조사했을 때,

 

고등학교 간에 공부 시간이 차이가 있는지 확인해보겠습니다.

 

위의 파일을 이용하였고, 통계적 유의수준은 0.05로 두었습니다.

 

데이터 불러오기

가정

1. 정규성 가정 확인

 

모든 그룹에서 p-value가 0.05보다 크므로 귀무가설을 채택합니다.

 

따라서, 정규성 가정을 만족하는 것으로 판단할 수 있습니다.

 

 

2. 등분산성 가정 확인

 

방금 실행한 데이터 탐색에서 등분산성 검정을 동시에 할 수 있습니다.

 

또한, SPSS에서는 ANOVA 분석을 하면 등분산성 검정 결과도 함께 제공합니다.

 

따라서, ANOVA를 실행하면서 확인하실 수도 있습니다.

 

 

3. 독립성 가정 확인

 

제가 알기로는 독립성 가정을 확인하는 검정은 따로 없습니다.

 

독립성 가정은 말 그대로 두 그룹이 독립적인지를 의미하는 것이므로

 

표본 추출방법에 따라 만족하는지 판단해주시면 됩니다.

 

가설
$H_0$ : 세 고등학교 학생들의 평균 학습 시간은 전부 같다.
$H_1$ : 세 고등학교 학생들의 평균 학습 시간이 전부 같은 것은 아니다.

예제를 위해 임의로 지정한 가설입니다.

 

상황에 맞추어 적절히 변형하시길 바랍니다.

 

ANOVA

"group" 변수가 문자형으로 설정되어 있어 분석에 사용을 하지 못 합니다.

 

분석에 앞서, 숫자형 변수로 변환하도록 하겠습니다.

[새 이름 추가]를 클릭하면,

 

다시 일원배치 분산분석으로 돌아갑니다.

 

분산의 동질성 검정에서 4가지 검정 결과를 제공해줍니다.

 

모든 검정에서 p-value가 0.05보다 크므로 분산이 동일하다는 귀무가설을 채택합니다.

 

따라서, ANOVA의 가정을 모두 만족하게 되어 아래에 있는 ANOVA 결과를 받아들일 수 있습니다.

 

 

ANOVA 결과,

 

"group"변수에 대한 p-value가 0.05 미만이므로 귀무가설을 기각합니다.

 

따라서, "세 고등학교 학생들의 평균 공부시간에는 유의한 차이가 있다"라는 결론을 낼 수 있습니다.

 

 

이 때, 모든 고등학교가 서로 유의한 차이를 가질 수도 있지만,

 

하나의 고등학교만 유의한 차이를 보일 수도 있죠.

 

하지만, ANOVA의 결과만으로는,

 

세 고등학교 중 어느 고등학교가 유의한 차이를 보이는지에 대해서는 정확히 알 수가 없습니다.

 

이 때 사용하는 것이 사후분석입니다.

 

그 중 하나인 scheffe 방법으로 해보겠습니다.

 

사후 분석

첫 번째 표에서, 각각 일대일로 차이 검정을 한 결과를 볼 수 있습니다.

 

p-value를 보면, "A"와 "C", "B"와 "C"에서 유의한 차이를 보입니다.

 

또한, 두 번째 표에서 A와 B는 '1'그룹으로, C는 '2' 그룹으로 분류되어있습니다.

 

따라서, 

 

"C 고등학교 학생들의 공부시간이 A, B 고등학교 학생들의 공부시간보다 유의하게 높음"을 알 수 있으며,

 

"A, B 고등학교 학생들의 공부 시간은 유의한 차이가 없음"을 확인할 수 있습니다.

 

 


만약, ANOVA 결과를 해석하는 것에 익숙하시다면, 

 

분산 동질성 검정부터 사후분석까지 한 번의 실행만으로도 모든 결과를 보실 수 있겠습니다.

 

 

이것으로 SPSS를 이용한 분산 분석(ANOVA)에 대해 마치도록 하겠습니다.

 

이상, 산격동 너구리였습니다.

 

감사합니다.

 

 

 

* 잘못된 정보 및 오타가 포함되어 있을 수 있습니다.

  그대로 받아들이시기보다는 다른 사람의 의견도 참고하셔서 분석하시길 바랍니다.

 

* 포스팅 내용 및 통계 분석 관련 질문은 언제나 환영입니다.

  가능한 선에서 최대한 답변하도록 하겠습니다.