이번 영상에서는 단순선형회귀모델에서 b1이 정규분포를 갖는다는 내용을 다루고 있습니다. 그런데 왜!!! 정규분포를 가지게 되는 그 이유를 알고 계시나요? 그런데 어느순간 confidence interval과 Hypothesis testing에서는 t 분포로 계산하는데 그 과정에 대해 생각해본적이 계신가요??
회귀모델에서 가장 중요한 가정인, error값은 무작위적인 랜덤인 값으로 정규분포 평균 0 과 분산 sigma^2의 값을 가지고 있다는건데요. 그래서 Y역시 random 값을 가지게 되고, beta_0과 beta_1을 추정하는 b0과 b1의 식에서 Y값이 들어있기때문에 이들 역시 random variable이 됩니다.
random이라는 말은 굉장이 중요한 말인데요. 통계에 있어서 무작위한 랜덤을 값을 가진다는 것은 샘플링할때마다 다른 값을 가진다는 의미이고, 이 값은 분포로 이 변수를 이해할 수 있다는 말이기도 해요.
단순선형회귀모델이 쉽다고 생각할 수 있겠지만, 가장 기본적인 용어 설명이 많이 들어가는 만큼 정말 중요한 내용을 많이 담고 있답니다. 짧은 영상이지만 꼭 확인해보셨으면 해요~
궁금한 사항은 언제든 댓글 남겨주세요. :)
반응형
'공부정리 > Data Analysis 회귀분석' 카테고리의 다른 글
[단순선형회귀분석 증명] b1, b0, fitted Y의 분산 증명하기 (0) | 2019.08.07 |
---|---|
[단순선형회귀] b1의 표본분포 이해하기 (2) - t 분포를 갖는 이유 (0) | 2019.07.30 |
[회귀증명] unbiased estimator증명 (불편추정량) (1) | 2019.07.26 |
[회귀분석] MLE 로 b1, b0, S^2 추정값 증명 (0) | 2019.07.26 |
[SLR], 어떤 조건이 있으며, 왜 있어야할까? LS와 MLE방법의 차이 (0) | 2019.07.25 |