Population, Sample, Model에 대한 용어 정리입니다.

Population은 모집단이고, Sample은 표본 그리고 Model은 모델(모형)이라고 합니다. 예를들어 대한민국 대학 졸업생의 평균나이를 구하려고 합니다. 그렇다면 모든 대학교의 졸업생 전체를 다 알아봐야겠죠. 이게 바로 Population, 즉 모집단을 말합니다. 하지만 이렇게 전체 알아보는게 불가능하기때문에 전국 10개 대학의 졸업생을 따로 조사해봅니다. 이게 바로 Sample, 표본이예요.

자, 여기서 생각해야할게 Population에서 구하고자 하는 값(평균나이)을 parameter, 모수합니다. 이 모수는 알 수가 없어요. 알 수 없다는게 이 값을 구한다는게 불가능하죠. 만약 가능했으면 sample(표본)을 뽑지도 않았겠죠. 그럼 sample(표본)을 전국 10개 대학교를 뽑을 수도 있고, 예산이 부족해서 3개 대학을 뽑을 수도 있잖아요. 이처럼 10개 대학을 뽑을때와, 3개 대학을 뽑을때의 수치(평균나이)가 달라질 수 있습니다. 이 수치를 바로 statistic(통계치)라고 합니다.  

Model(모델, 모형)은 population이 어떤지 리서처들이 생각하는 바를 식으로 나타낸다고 생각하면 될것 같네요. 물론 model이 population과 정확히 일치하진 않지만 그래도 표본을 통해 population과 비슷하도록 모형화합니다.

 

다시 정리해보자면, $\mu$는 모집단의 평균나이를 말하는 거고요. 알 수 없는 수치입니다. 하지만 sample, 표본을 통해 얻은 평균나이는 알 수 있죠. 이걸 $\bar{X}$ 로 표현합니다. 모집단(population)의 모수(parameter)를 모델로 만든다면 이때 $\mu$와 다르게 표현하기 위해 $\hat{\mu}$ 이라고 적습니다.

 

다음 포스팅에서 Estimator와 Estimates등 이어 설명하도록 할게요.

  

반응형

+ Recent posts