http://statnmath.blogspot.ca/2015/08/the-general-linear-model-glm.html  자세한 내용은 링크 참조하세요.

 일반선형모델 (General Linear Model, GLM)

말 그대로 일반선형모델은(GLM) response Y가 선형모델로 이뤄진걸로 말하는데요. X의 일차함수로 이뤄진 식이라고 생각하면 됩니다. 이때 Y continuous (연속변수)이고, X값은 categorical/continuous (범주형변수)를 가집니다. 변수가 연속이라도 기준에 따라 category로 나눌 수 있겠죠. 이 모델을 세우려면 the least squared linear unbiased prediction이라는 수학적 모델을 통해 식을 만들게 됩니다.

The null hypothesis is $\beta_{1}=\beta_{2}=...=\beta_{p}=0$

The GLM assumptions should be the errors are normally distributed with mean 0 and a constant variance, and they are uncorrelated.

 

ANOVA, ANCOVA, linear regression등이 GLM에 속합니다. 이번 포스팅은 GLM의 한 종류인 One-way ANOVA를 살펴보도록 하죠. 이 방법으로 두 개 혹은 그 이상의 그룹을 비교할 수 있어요. SAS R을 돌려보면 결과값이 ANOVA 테이블로 정리된걸 볼 수 있는데, 시험에 항상 나오는 문제유형이예요. 빈칸채우기.

 

그 전 포스팅에는 두개의 그룹을 비교하는걸 살펴보았는데요~ 이처럼 두개의 그룹을 비교하는거라면 이때 G 2가 됩니다. 이때 G-1을 하는 이유는 하나의 그룹의 수치를 살펴보면 다른 그룹은 수학적으로 저절로 알게 됩니다. 그러니까 쉽게 예를들어보면, 우리가 X도 모르고 Y도 모르는데 X Y를 더하면 10이라고 해봐요. X 1이면 Y 9, X 2이면 Y 8이되는것처럼 하나의 변수만 살펴보면 다른변수는 저절로 알수있기때문에 G-1로 계산을 합니다

.  

워낙 ANOVA Table은 책에서도 잘 나오니 자세한 설명은 건너띄고 Between Group Within Group만 살펴보도록 할게요.

예를들어 초등학교 4학년과 6학년의 키 차이가 있는지 살펴보려고 합니다. 그러면 4학년과 6학년의 차이가 있겠죠. 이게 Between Group을 말하고요. 4학년 개개인을 보면 개인편차(variance)가 있겠죠. 이걸 within group을 말합니다. 그래서 이 개개인의 편차보다 그룹의 편차가 더 클 경우, 두 그룹이 차이가 더 있다라고 보는 겁니다. 

반응형

+ Recent posts