정치와 사회/통계학과 방법론

하나의 샘플을 가진 z-test (단일표본 z검정)

첼린저스 2016. 11. 22. 06:29

오늘은 하나의 샘플을 가진 z test를 알아보죠 한국말로는 z검정 또는 z테스트라고 합니다. 오늘은 하나의 샘플을 가진 z테스트를 알아보도록 하겠습니다. 유식한 말로 단일표본 z검정이라고 하는데 뭐 이렇게 어려운 말을 쓰는지 몰겠네요 ㅋ


z테스트는 다음과 같이 이해하면 됩니다. 


문제(실험내용)

미국의 학생들은 sat를 칩니다. 그중에서 A지역의 학생들이 친 sat 수학 부분의 평균 점수는 500점이었고, 표준편차는 100이었습니다. 한 연구자는 A지역의 학생들 중 400명을 뽑았고, 그들에게 자신이 만든 학습방법과 교재를 제공합니다. 3개월 후, 이 400명은 sat를 쳤고, 그 평균은 514점이었습니다. 


이 연구자는 자신이 만든 학습방법과 sat교재가 학생들의 sat점수에 영향을 준다고 주장하고 싶습니다.    


연구자는 무슨 실험을 원하나요?

연구자는 일종 오류의 가능성을 줄이고 싶다고 하고, 이 교재가 악영향을 끼칠지, 아니면 좋은 영향을 끼칠지 둘다 상관한다고 합니다 (올려준다고만 하는게 아니라 영향을 준다고 주장하니깐)


그러니 신뢰구간은 99%이고 2tailed test, 즉 양면 실험이라고 하는군요. 양면 실험은 쌍측검증, 양방적 검정, 양측검증 이렇게도 불립니다. 그냥 한자 안쓰고 양면실험이라고 할깨요..


z테스트를 어떻게 이해해야 하나요?

z테스트는 다음과 같이 이해해야 합니다. 그림을 그려 드리죠.


즉 단적으로 설명하면 이렇습니다. 상식적으로 a지역에 있는 모든 사람들을 연구자가 가르칠수 없지 않습니까? 그러니 400명을 뽑은 것입니다. 그들을 가르쳐서 a지역에 있는 고등학생들의 평균보다 좋은 514점이라는 점수를 얻었습니다. 


연구자는 자신이 만든 학습방법이랑 교재로 공부하면 (a지역에 있는 사람들이) 평균 점수가 올라간다고 주장하고 싶은겁니다. 다만 문제인즉슨 몇만명이나 되는 a지역에 있는 고등학생들이 죄다 500점대만 맞는게 아니라 만점을 받은 사람들도 있을거고 100점대 가깝게 맞은 사람들도 있고, 케바케라는 겁니다. 그러니 만약 우리가 뽑은 400명중에 엄청 잘하는 우등생들만 모여있거나, 아니면 공부안하는 애들이 없고 적당히 평타치는 애들만 들어와서 정작 학습방법 자체는 효과가 없는데 잘하는 애들이 400명중 우연히 뽑혀서 평균 점수 잘 나온거라고 말할수도 있지 않겠습니까?



그냥 외우세요


우리는 실험을 한번 했고 여기서 평균이 514점이 나왔습니다. 또 400명을 뽑아서 511점을 얻었습니다. 또 실험을 해서 평균값으로 487점을 얻었습니다. 이 짓을 무한반복하면 언젠가는 모집단의 평균에 가까워지게 된다는 것이 통계의 중요한 가설입니다. 


쉽게 말하자면 이러한 실험을 또 반복반복반복반복하면 개개 실험의 평균의 평균값은 모집단의 평균인 500점이랑 가깝게 된다고 주장하는 것입니다. 다만 연구자는 자신이 만든 교재와 학습방법으로 공부하면, 모집단의 평균이 분명 올라갈 것이라고 주장하는 것입니다. 즉 500점보다 높을거라고 예상하는 것이죠. 


즉 z검정의 포인트는 이겁니다. 만약 우리가 이러한 실험을 반복반복반복반복한다면 그 수많은 실험가운데, 평균이 514점이 나올 확률이 효과가 없다면 5%아래라는 것입니다. 


다시 말하자면 514점이 나왔네? 근데 만약 내 교재가 효과가 없어서 모집단의 평균이 500점이 유지된다고 가정해보자구. 그 수준의 애들 400명 뽑아서가지고 평균이 514가 나올 확률은 5%이하임. 그러니 내 교제는 효과가 있다!


라고 주장하는 거죠. 


계산은 정말 간단합니다.

설명은 어려운데 계산은 간단합니다. 


우선 제가 외우라고 한 것에서 볼 수 있듯이 평균은 514점이었습니다. 이 실험을 무한반복할지 안할지는 모르겠지만 문제는 안 됩니다. 확실히 말할수 있는건 이 실험은 앞으로 치뤄질 무한한 실험 도중에 하나라는 것입니다. 



(샘플평균 - 모집단 평균) / (표준편차/sqrt(샘플 수))


통상적으로 z검정은 샘플과 모집단을 뺀 다음에 표준편차를 나누는 거라고 알 고 있을겁니다. 그러나 이 실험은 앞으로 치뤄질 무한한 실험 도중의 하나라는 가설이므로, 오차를 감안해야 합니다. 그러니 샘플수로 나눈다고 대충 이해하시면 됩니다


통상적으로 하는 z검정은 모집단을 쥐어주고 내 점수를 준 다음에 내 점수가 모집단의 분포중 어디에 존재하고, 내 위에는 몇%가 있는지 아는 것입니다. 그러나 이 z검정은 먼저 샘플을 추출해 내고 모집단과 비교하는 겁니다. 이 샘플이 모집단과 완전히 같다는 것을 증명할 수는 없습니다. 완전히 같다면 평균이 500이 나오지 않겠습니까? 


(물론 이러한 실험을 무한반복했을때 모집단의 평균값과 같아진다는 점에서 샘플이 모집단과 같다는 것을 이론적으로 증명하긴 하지만 말입니다) 


즉 이러한 오차를 감안해야 합니다. 



(514-500) / (100/sqrt(400))

= 14/(100/20)

=14/5

=2.8



z점수는 2.8이 나옵니다. 


그럼 z테이블을 봅시다. 어케 보는지 모른다면 이 게시글을 보도록 합시다. (http://cshlife.tistory.com/217)


z테스트 2.800까지가 99.84%(0.9984)군요. 그 위에 0.16%(0.0016)가 존재한다는 거죠. 신뢰구간은 99%입니다. 즉 기각값(알파 레밸)이 0.01이지만, 2면 실험이므로 0.005가 되어야 하네요. 


0.0005<0.0016 이므로 H0를 기각할 수가 없네요. 즉 효과는 없다 입니다. 만약 95%를 잡았다면 기각을 해서, 효과가 있다라고 결론을 냈겟습니다.