내가 하는 통계 분석/SAS 19

[내가 하는 통계 분석] 복합표본 평균 차이 검정

안녕하세요, 산격동 너구리입니다. 이번 포스팅은 SAS를 이용한 "복합표본 평균차이 검정"입니다. 이전 포스팅이 두 집단의 평균 차이 검정이었는데, 오늘은 세 집단 이상일 때 사용하는 방법입니다. 개요 복합표본 평균 차이 검정 일반적으로 두 집단의 평균 차이 검정은 T-test로, 세 집단 이상에서는 ANOVA를 사용합니다. 그래서 포스팅을 따로 하긴했지만, 복합표본에서는 둘 다 동일한 명령어를 사용합니다. 그러니까, 복합표본에서는 T-test랑 ANOVA를 구별할 필요가 없습니다. 가정 역학 자료다보니 아마 가정은 잘 안 맞을겁니다. 그래도 확인하고자 하신다면, 복합표본인 것을 무시하시고 일반적인 방법으로 확인하시면 됩니다. 예제 예제는 분석지침서와 동일하게 진행하되 데이터 연도는 다릅니다. 결과를 비..

[내가 하는 통계 분석] 복합표본에서 두 집단의 평균차이 검정(국민건강영양조사) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은 SAS를 이용한 "복합표본 평균차이 검정"입니다. 복합표본이라는 단어가 붙었다고해서 너무 어렵게 생각하실 필요 없습니다. 계산은 우리가 직접하지 않습니다. 우리는 그저, 프로그램에게 정확한 명령을 내려주면 됩니다. 오늘 할 내용은, 복합표본에서 두 집단의 평균을 비교하는 예제를 실습해보겠습니다. T검정의 복합표본 버젼이라고 보시면 됩니다. T검정은 집단 간 평균 차이를 검정한다는 큰 중심을 잘 잡고 계시다면 그리 어렵지 않습니다. 바로 시작해보겠습니다. 개요 복합표본 평균차이 검정이란? 분석지침서에서 복합표본 회귀분석을 이용해서 평균을 비교한다고 나와있습니다. 회귀분석에 관한 내용이 나와도 당황하지 마시길 바랍니다! 가정 분석지침서에서는 가정을 확인하는 과..

[내가 하는 통계 분석] 국민건강영양조사 분석 준비 in SAS

안녕하세요, 산격동 너구리입니다. 확실히 취업 준비를 하다 보니, 시간이 많이 없네요..여유가 조금 생긴 김에 얼른 몇 가지 포스팅해보겠습니다. 제가 작년 한 해동안 국건영 자료 분석을 주로 했는데 국건영에 대한 포스팅은 찾기가 어렵더라구요. 그래서 블로그를 하게되면 꼭 국건영에 대해서도 포스팅하고 싶었습니다. 당분간 국건영에서 제공하는 분석지침서 내용을 따라갈 예정이고, 프로그램은 SAS만 사용할 예정입니다. 제가 SAS로만 복합표본 자료분석을 했기 때문에...다른 프로그램으로 다시 하려면 시간이 많이 걸릴 것 같네요...따라서, 국건영 자료분석 포스팅은 오직 SAS로만 업데이트합니다! 오늘의 포스팅은 국건영 데이터를 다운받고, 앞으로 따라갈 분석 지침서를 살짝 보는 내용으로 작성하겠습니다. 국민건강영..

[내가 하는 통계 분석] 스피어만 상관 계수(Spearman correlation coefficient), 켄달 타우 계수(Kendall tau coefficient) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "스피어만 상관 계수"와 "켄달 타우 계수"입니다. 피어슨 상관 계수처럼 두 변수 간 상관 관계를 나타내는 수치이지만, 피어슨 상관 계수와는 다르게 두 변수를 순서형 변수로 취급합니다. 이 때문에 피어슨 상관 관계의 가정보다 비교적 완화된 가정을 가지고 있습니다. 따라서, 피어슨 상관 계수의 가정을 충족시키지 못 할 때, 해당 분석으로 대체할 수도 있습니다. 개요 스피어만 상관 계수와 켄달 타우 계수란?? 두 변수의 상관 관계를 계량화한 수치입니다. 결과값은 -1 ~ 1 사이의 값이며, 양의 상관 관계가 있을수록 1에 가깝고, 음의 상관 관계가 있을수록 -1에 가깝습니다. 또한, 상관 관계가 없을수록 0에 가깝습니다. 피어슨 상관 계수와 ..

[내가 하는 통계 분석] 피어슨 상관 계수(Pearson correlation coefficient) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "피어슨 상관 계수"입니다. 개요 피어슨 상관 계수란?? 두 변수의 선형 상관 관계를 계량화한 수치입니다. 결과값은 -1 ~ 1 사이의 값이며, 양의 상관 관계가 있을수록 1에 가깝고, 음의 상관 관계가 있을수록 -1에 가깝습니다. 또한, 상관 관계가 없을수록 0에 가깝습니다. 가정 1. 두 변수는 연속형 변수이다. 2. 두 변수는 정규분포를 따른다. (간혹 한 변수만 정규분포를 따라도 된다고는 하지만, 이론적으로는 두 변수 모두 정규분포를 따라야합니다.) 3. 두 변수는 선형 관계를 가진다. 위의 가정 외에도 신경 써야하는 부분이 있습니다. 바로 이상치입니다. 극단적으로 값이 크거나 작은 경우가 포함되어 있으면 결과가 왜곡될 수 있습니다..

[내가 하는 통계 분석] 정확 맥니마 검정(exact McNemar test) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "정확 맥니마 검정"입니다. 사실 exact McNemar test로 표기하는 것이 맞는지는 잘 모르겠네요. 카이제곱 검정에서 빈도가 적을 때, 피셔의 정확 검정을 사용하는 것처럼 McNemar test에서도 빈도가 적을 때, exact p-value를 확인하는 것이 적절합니다. 해당 포스팅에서는 exact McNemar test로 표현하도록 하겠습니다. 개요 정확 맥니마 검정이란?? 2x2 빈도표에서 사용합니다. 표본이 독립이 아닐 때(=대응표본일 때), 맥니마 검정을 사용하는데, 이 때, 빈도가 적다면 정확 검정을 통한 p-value를 확인합니다. 이를 이번 포스팅에서는 정확 맥니마 검정이라고 표현하도록 하겠습니다. 가정 1. 표본이 ..

[내가 하는 통계 분석] 맥니마 검정(McNemar test) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "맥니마 검정"입니다. 개요 맥니마 검정이란?? 2x2 빈도표에서 사용합니다. 표본이 독립이 아닐 때(=대응표본일 때), 사용하는 검정입니다. 가정 1. 표본이 대응 표본이다. (표본들이 독립이 아님.) 2. 아래의 빈도표 기준으로 b + c > 25이어야 한다. 가설 귀무가설 : $ p_b = p_c $ 대립가설 : $ p_b \neq p_c $ 만약 귀무가설이 참이라면, b = c 입니다. 그렇게 되면, Test 1 negative와 Test 2 Negative가 동일해지고, Test 1 positive와 Test 2 positive가 동일해집니다. 따라서, 귀무가설을 기각한다는 것은 Test 1과 Test 2가 차이가 난다는 것을 의..

[내가 하는 통계 분석] 피셔의 정확 검정(Fisher's exact test) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "피셔의 정확 검정"입니다. 개요 피셔의 정확 검정이란?? 카이제곱 검정에서 기대 빈도 가정이 충족되지 못 할 때 사용하는 검정법 편하게 생각하시려면, 표본 수가 적을 때 사용하는 카이제곱 검정이라고 생각할 수 있습니다. 가정 1. 독립성 가정(한 명의 대상에게서 하나의 결과값을 얻어야 함) 가설 귀무가설 : 두 변수는 서로 독립적이다. (=연관이 없다.) 대립가설 : 두 변수는 서로 독립적이지 않다. (=연관이 있다.) 보통 카이제곱 검정을 하고 싶으나, 기대 빈도 가정을 만족하지 못 할 때 사용하는 검정법입니다. 따라서, 전체적인 흐름이나 해석은 카이제곱과 동일하게 하시면 됩니다. 다른 점은 기대 빈도 가정이 충족되지 않았다는 점입니다..

[내가 하는 통계 분석] 카이제곱 검정(Chi-Square test) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "카이제곱 검정"입니다. 개요 카이제곱 검정이란?? 주로 2개의 명목형 변수를 대상으로 연관성에 대해 검정을 할 때 사용합니다. 가정 1. 독립성 가정(한 명의 대상에게서 하나의 결과값을 얻어야 함) 2. 기대 빈도가 5미만인 셀은 전체 셀의 20% 미만이어야 한다. 가설 귀무가설 : 두 변수는 서로 독립적이다. (=연관이 없다.) 대립가설 : 두 변수는 서로 독립적이지 않다. (=연관이 있다.) 독립적이다, 독립적이지 않다의 느낌이 잘 오지 않을텐데요, X가 1이든 2든... Y가 1, 2, 3 중 어떤 값이 되는지와 무관하다면 서로 독립이라고 할 수 있습니다. 만약 독립이라면, 아래 그림과 같은 형태가 됩니다. X가 어떤 값이든 무관하..

[내가 하는 통계 분석] 크론바흐 알파 계수(Cronbach's Alpha) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SAS를 이용한 "Cronbach's Alpha"입니다. 개요 Cronbach's Alpha란?? 신뢰도를 검사하는 방법. 주로 동일한 목표를 측정하기 위한 여러 개의 설문 항목에 대해 실시합니다. * 신뢰도 검사 : 측정하고자 하는 것을 얼마나 일관적이게 측정하고 있는지 검사하는 것 가정 1. 각 항목은 동일한 주제를 측정하는 것이다. 2. 각 항목의 중요도는 모두 동일하다. 현재까지 확인되는 가정은 위와 같습니다. 하나 더 있는 것 같긴 한데, 너무 이론적인 부분이라서 크게 필요하진 않을것같네요. 확인되면 추가하겠습니다. 해석 일반적인 경우, 결과값은 0~1사이의 값을 가지며, 1에 가까울수록 신뢰도가 높은 것으로 해석합니다. 특수한 경우에는 값이 음..