내가 하는 통계 분석 56

[내가 하는 통계 분석] 복합표본 평균 차이 검정

안녕하세요, 산격동 너구리입니다. 이번 포스팅은 SAS를 이용한 "복합표본 평균차이 검정"입니다. 이전 포스팅이 두 집단의 평균 차이 검정이었는데, 오늘은 세 집단 이상일 때 사용하는 방법입니다. 개요 복합표본 평균 차이 검정 일반적으로 두 집단의 평균 차이 검정은 T-test로, 세 집단 이상에서는 ANOVA를 사용합니다. 그래서 포스팅을 따로 하긴했지만, 복합표본에서는 둘 다 동일한 명령어를 사용합니다. 그러니까, 복합표본에서는 T-test랑 ANOVA를 구별할 필요가 없습니다. 가정 역학 자료다보니 아마 가정은 잘 안 맞을겁니다. 그래도 확인하고자 하신다면, 복합표본인 것을 무시하시고 일반적인 방법으로 확인하시면 됩니다. 예제 예제는 분석지침서와 동일하게 진행하되 데이터 연도는 다릅니다. 결과를 비..

[내가 하는 통계 분석] 복합표본에서 두 집단의 평균차이 검정(국민건강영양조사) in SAS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은 SAS를 이용한 "복합표본 평균차이 검정"입니다. 복합표본이라는 단어가 붙었다고해서 너무 어렵게 생각하실 필요 없습니다. 계산은 우리가 직접하지 않습니다. 우리는 그저, 프로그램에게 정확한 명령을 내려주면 됩니다. 오늘 할 내용은, 복합표본에서 두 집단의 평균을 비교하는 예제를 실습해보겠습니다. T검정의 복합표본 버젼이라고 보시면 됩니다. T검정은 집단 간 평균 차이를 검정한다는 큰 중심을 잘 잡고 계시다면 그리 어렵지 않습니다. 바로 시작해보겠습니다. 개요 복합표본 평균차이 검정이란? 분석지침서에서 복합표본 회귀분석을 이용해서 평균을 비교한다고 나와있습니다. 회귀분석에 관한 내용이 나와도 당황하지 마시길 바랍니다! 가정 분석지침서에서는 가정을 확인하는 과..

[내가 하는 통계 분석] 국민건강영양조사 분석 준비 in SAS

안녕하세요, 산격동 너구리입니다. 확실히 취업 준비를 하다 보니, 시간이 많이 없네요..여유가 조금 생긴 김에 얼른 몇 가지 포스팅해보겠습니다. 제가 작년 한 해동안 국건영 자료 분석을 주로 했는데 국건영에 대한 포스팅은 찾기가 어렵더라구요. 그래서 블로그를 하게되면 꼭 국건영에 대해서도 포스팅하고 싶었습니다. 당분간 국건영에서 제공하는 분석지침서 내용을 따라갈 예정이고, 프로그램은 SAS만 사용할 예정입니다. 제가 SAS로만 복합표본 자료분석을 했기 때문에...다른 프로그램으로 다시 하려면 시간이 많이 걸릴 것 같네요...따라서, 국건영 자료분석 포스팅은 오직 SAS로만 업데이트합니다! 오늘의 포스팅은 국건영 데이터를 다운받고, 앞으로 따라갈 분석 지침서를 살짝 보는 내용으로 작성하겠습니다. 국민건강영..

[내가 하는 통계 분석] Sobel Test in R

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, 이전 포스팅에 이어서 "Sobel Test"에 대해 진행하겠습니다 Sobel Test 매개효과를 검정하는 검정법 중 하나입니다. 일반적으로 Baron & Kenny의 방법론의 결과와 함께 제시합니다. quantpsy.org/sobel/sobel Interactive Mediation Tests © 2010-2021, Kristopher J. Preacher Calculation for the Sobel test: An interactive calculation tool for mediation tests Kristopher J. Preacher (Vanderbilt University) Geoffrey J. Leonardelli (University of..

[내가 하는 통계 분석] 매개효과 분석(Meditation Analysis) in R

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, R을 이용한 "매개효과 분석"입니다. 그 중에서도 가장 간단한 Baron & Kenny의 방법론으로 진행할 예정입니다. 개요 매개효과 분석이란? 독립 변수 X와 종속 변수 Y 사이에서, M이라는 변수가 중간에서 매개 역할을 할 것이다. 이러한 가설을 검증하는 분석입니다. 여기서 매개효과란??! X가 Y에 직접적으로 영향을 줄 수도 있지만, X가 M에 영향을 주고, 영향을 받은 M이 다시 Y에 영향을 주는 것을 매개효과라고 합니다. 매개효과에 대해서도 완전 매개와 부분 매개라는 것이 있는데요. 완전 매개는 X가 M을 통해 Y에게 주는 영향이 전부인 것이고, 부분 매개는 X가 M을 통해 Y에게 주는 영향에, X가 직접적으로 Y에게 주는 영향이 있는 것을 말합..

[내가 하는 통계 분석] 회귀분석(3). 고차항 및 상호작용항 in R

안녕하세요, 산격동 너구리입니다. 이번에도 이전 포스팅에 이어서 진행합니다. lunch-box.tistory.com/118 [내가 하는 통계 분석] 회귀분석(2). 변수 선택법, 로그 변환 in R 안녕하세요, 산격동 너구리입니다. 저번에 이어 이번 포스팅도 "회귀분석"입니다. lunch-box.tistory.com/114 [내가 하는 통계 분석] 회귀분석(Regression) in R 안녕하세요, 산격동 너구리입니다. 이번 포스 lunch-box.tistory.com 이번에는 독립 변수의 고차항과 상호작용항을 추가해서 모형의 성능을 올려볼겁니다. 개요 고차항이란?? 말그대로 차수가 높은 항입니다. 어떤 독립변수 $X$가 있다면, $X^k$인 독립변수를 추가하는 것입니다. 상호작용항이란?? 영어로는 in..

[내가 하는 통계 분석] 회귀분석(2). 변수 선택법, 로그 변환 in R

안녕하세요, 산격동 너구리입니다. 저번에 이어 이번 포스팅도 "회귀분석"입니다. lunch-box.tistory.com/114 [내가 하는 통계 분석] 회귀분석(Regression) in R 안녕하세요, 산격동 너구리입니다. 이번 포스팅은, R을 이용한 "회귀분석"입니다. 회귀분석은 너무 유명해서 이미 참고할만한 도서, 블로그 등 좋은 자료가 충분하다고 생각합니다. 이론은 충분 lunch-box.tistory.com 이전 포스팅에서는 그냥 변수 3개를 모두 넣은 모형을 만드는 것으로 마무리를 했었는데요. 이번에는 변수 선택과 변환에 대해서 간략하게 진행해보겠습니다. 개요 변수 선택이란?? 회귀분석을 이용해 독립 변수와 종속 변수에 관한 함수를 만들었을 때, 종속 변수를 설명하는데 도움이 안 되는 독립 변..

[내가 하는 통계 분석] 회귀분석(1). 회귀분석(Regression) in R

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, R을 이용한 "회귀분석"입니다. 회귀분석은 너무 유명해서 이미 참고할만한 도서, 블로그 등 좋은 자료가 충분하다고 생각합니다. 이론은 충분하니까 저는 최대한 풀어서 쓰도록 하겠습니다. 개요 회귀분석이란? 독립 변수와 종속 변수 간의 관계를 가장 잘 나타내는 함수를 만드는 것입니다. 회귀분석을 통해 적절한 함수를 만들 수 있다면, 1) 독립 변수만으로도 종속변수를 예측할 수 있고, 2) 독립 변수가 종속 변수에 어떤 영향을 끼치는지 설명할 수 있습니다. 가정 회귀분석의 가정은 총 4가지가 있습니다. 1) 선형성 : 독립 변수와 종속 변수는 선형 관계를 가진다. 2) 등분산성 : 잔차의 분산이 동일하다. 3) 정규성 : 잔차는 정규성을 가진다. 4) 독립성 ..

[내가 하는 통계 분석] 스피어만 상관 계수(Spearman correlation coefficient), 켄달 타우 계수(Kendall tau coefficient) in SPSS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SPSS를 이용한 "스피어만 상관 계수"와 "켄달 타우 계수"입니다. 피어슨 상관 계수처럼 두 변수 간 상관 관계를 나타내는 수치이지만, 피어슨 상관 계수와는 다르게 두 변수를 순서형 변수로 취급합니다. 이 때문에 피어슨 상관 관계의 가정보다 비교적 완화된 가정을 가지고 있습니다. 따라서, 피어슨 상관 계수의 가정을 충족시키지 못 할 때, 해당 분석으로 대체할 수도 있습니다. 개요 스피어만 상관 계수와 켄달 타우 계수란?? 두 변수의 상관 관계를 계량화한 수치입니다. 결과값은 -1 ~ 1 사이의 값이며, 양의 상관 관계가 있을수록 1에 가깝고, 음의 상관 관계가 있을수록 -1에 가깝습니다. 또한, 상관 관계가 없을수록 0에 가깝습니다. 피어슨 상관 계수와..

[내가 하는 통계 분석] 피어슨 상관 계수(Pearson correlation coefficient) in SPSS

안녕하세요, 산격동 너구리입니다. 이번 포스팅은, SPSS를 이용한 "피어슨 상관 계수"입니다. 개요 피어슨 상관 계수란?? 두 변수의 선형 상관 관계를 계량화한 수치입니다. 결과값은 -1 ~ 1 사이의 값이며, 양의 상관 관계가 있을수록 1에 가깝고, 음의 상관 관계가 있을수록 -1에 가깝습니다. 또한, 상관 관계가 없을수록 0에 가깝습니다. 가정 1. 두 변수는 연속형 변수이다. 2. 두 변수는 정규분포를 따른다. (간혹 한 변수만 정규분포를 따라도 된다고는 하지만, 이론적으로는 두 변수 모두 정규분포를 따라야합니다.) 3. 두 변수는 선형 관계를 가진다. 위의 가정 외에도 신경 써야하는 부분이 있습니다. 바로 이상치입니다. 극단적으로 값이 크거나 작은 경우가 포함되어 있으면 결과가 왜곡될 수 있습니..