http://statnmath.blogspot.ca/2015/08/the-general-linear-model-glm.html 자세한 내용은 링크 참조하세요.
일반선형모델 (General Linear Model, GLM)
말 그대로 일반선형모델은(GLM)은 response Y가 선형모델로 이뤄진걸로 말하는데요. 즉 X의 일차함수로 이뤄진 식이라고 생각하면 됩니다. 이때 Y는 continuous (연속변수)이고, X값은 categorical/continuous (범주형변수)를 가집니다. 변수가 연속이라도 기준에 따라 category로 나눌 수 있겠죠. 이 모델을 세우려면 the least squared나 linear unbiased prediction이라는 수학적 모델을 통해 식을 만들게 됩니다.
The null hypothesis is $\beta_{1}=\beta_{2}=...=\beta_{p}=0$
The GLM assumptions should be the errors are normally distributed with mean 0 and a constant variance, and they are uncorrelated.
ANOVA, ANCOVA, linear regression등이 GLM에 속합니다. 이번 포스팅은 GLM의 한 종류인 One-way ANOVA를 살펴보도록 하죠. 이 방법으로 두 개 혹은 그 이상의 그룹을 비교할 수 있어요. SAS나 R을 돌려보면 결과값이 ANOVA 테이블로 정리된걸 볼 수 있는데, 시험에 항상 나오는 문제유형이예요. 빈칸채우기.
그 전 포스팅에는 두개의 그룹을 비교하는걸 살펴보았는데요~ 이처럼 두개의 그룹을 비교하는거라면 이때 G는 2가 됩니다. 이때 G-1을 하는 이유는 하나의 그룹의 수치를 살펴보면 다른 그룹은 수학적으로 저절로 알게 됩니다. 그러니까 쉽게 예를들어보면, 우리가 X도 모르고 Y도 모르는데 X와 Y를 더하면 10이라고 해봐요. X가 1이면 Y는 9, X가 2이면 Y는 8이되는것처럼 하나의 변수만 살펴보면 다른변수는 저절로 알수있기때문에 G-1로 계산을 합니다
.
워낙 ANOVA Table은 책에서도 잘 나오니 자세한 설명은 건너띄고 Between Group과 Within Group만 살펴보도록 할게요.
예를들어 초등학교 4학년과 6학년의 키 차이가 있는지 살펴보려고 합니다. 그러면 4학년과 6학년의 차이가 있겠죠. 이게 Between Group을 말하고요. 4학년 개개인을 보면 개인편차(variance)가 있겠죠. 이걸 within group을 말합니다. 그래서 이 개개인의 편차보다 그룹의 편차가 더 클 경우, 두 그룹이 차이가 더 있다라고 보는 겁니다.
'공부정리 > Data Analysis 회귀분석' 카테고리의 다른 글
[SAS] One Way ANOVA, with Bonferroni Adjustment (0) | 2015.08.12 |
---|---|
[여러 그룹을 비교할때] The Bonferroni correction (0) | 2015.08.09 |
두 표본 t 검정 (Two Sample T-test) - 예제 (SAS) (0) | 2015.05.27 |
두 표본 t 검정 (Two Sample T-test) - 예제 (R) (0) | 2015.05.06 |
두 표본 t 검정 (Two Sample T-test) (0) | 2015.05.04 |