단순선형회귀모델에서 b1, b0, y값에 대해 분산을 구하는 증명 영상입니다. 단순선형회귀 식 중에서 도대체 왜 하필!! bo, b1, y에 대해서만 분산을 구하는지 생각해보셨나요? 이 모델에서 가정은 error가 정규분포를 따른다는건데요. 에러값은 우리가 알 수 없기때문에 이 에러의 평균치는 0이고 분산은 sigma^2으로 늘 일정하고 정규분포를 따른다고 가정을 합니다. 왜냐하면 무작위한 랜덤값은 우리가 알 수 없고, 그래서 분포를 통해서 이해하는건데요. 에러값이 정규분포를 따르기때문에 식에서의 y값도 무작위한 값 입니다. 이해가 안가신다면 제 영상 리스트를 확인해보세요. 통계학을 공부하는 학생이라면 정말 꼭 이해하고 넘어가야 합니다. 

 

 

 

 

반응형

95%의 신뢰구간을 가진다라는 말!!이 정확하게 어떤 의미를 하는걸까요?

 

우리가 연구하고자하는 연구대상을 모집단이라고 하는데요. 이 모집단의 모수들을 알 길은 전혀 없습니다. 뭐 모집단이 한정되어있고 변하지 않고 여러 조건들을 만들면, 알 수 있지만요. 암튼, 이 모수를 구하기 위해서, 모집단을 다 연구하기 힘들기에 표본, 샘플을 구해서 통계치를 구하는데요. 이 통계치가 과연 모수와 일치한다고 볼 수 있을까요?? 

 

우리가 얻은 통계치는 point estimate라고 해서 점추정이라고 하는데, 즉, 평균이면 평균값 하나, 값 하나라서 이 값이 모수의 값과 똑같이 일치하는 보장이 없잖아요. 그래서 점추정이 아니라 구간추정(interval estimate)으로 구하는데 이 구간이 바로 신뢰구간입니다. 그렇다면 이 점추정에서 오차를 더하고 빼서 구간을 구하는거겠죠. 뭐 구하는건 이 구간을 구할 수있지만 해석은요?? 

 

정말 짧은 영상이기때문에 꼭 보세요~ 

 

 

사실 통계 용어는 서로 연결되어있습니다. 즉, 이 용어를 이해하기 위해, 다른 용어를 이해해야하고..등등 뭐 통계만 그렇겠어요? 다른 학문도 마찬가지겠지만요. 통계에서 가장 기본적으로 알아야할 용어중에 하나가 바로 표본입니다. 즉 모집단에서 표본을 뽑는거죠. 통계를 공부하는 학생이라면 정확히 용어를 이해하는게 중요하기에 한번 영상을 보길 추천드려요!! 

 

 

반응형

 

b1의 표본분포에 대한 그 두번째 영상인데요. 그 전 영상에서는 b1이 정규분포를 띈다고 설명드렸습니다. 여기에 따른 동영상은 아래 참고해주세요. 

 

그런데 b1을 정규화한 값은 왜 t의 분포를 갖게 되는 걸까요? 우리는 분산을 모르기때문에 이 값 역시 추정해야해서, t의 분포를 갖는다고 간략하게 설명할 수 있지만, 더 자세하게 알고싶지 않으신가요? 

 

이를 이해하기 위해서는, 가장 기본적인 내용인 정규분포에서부터 카이제곱분포, t의 분포까지 그 관계를 살펴보는게 중요합니다. 증명보다는 통계에 있어서 가장 중요한 정의 위주로 그 흐름을 설명해보려고 해요. 이 영상을 보시게 되면, 나중에 확률통계에서도 괴장히 도움 될 수 있으니까 꼭 확인해보길 바랍니다

 

반응형

 

이번 영상에서는 단순선형회귀모델에서 b1이 정규분포를 갖는다는 내용을 다루고 있습니다. 그런데 왜!!! 정규분포를 가지게 되는 그 이유를 알고 계시나요? 그런데 어느순간 confidence interval과 Hypothesis testing에서는 t 분포로 계산하는데 그 과정에 대해 생각해본적이 계신가요?? 

 

회귀모델에서 가장 중요한 가정인, error값은 무작위적인 랜덤인 값으로 정규분포 평균 0 과 분산 sigma^2의 값을 가지고 있다는건데요. 그래서 Y역시 random 값을 가지게 되고, beta_0과 beta_1을 추정하는 b0과 b1의 식에서 Y값이 들어있기때문에 이들 역시 random variable이 됩니다. 

 

random이라는 말은 굉장이 중요한 말인데요. 통계에 있어서 무작위한 랜덤을 값을 가진다는 것은 샘플링할때마다 다른 값을 가진다는 의미이고, 이 값은 분포로 이 변수를 이해할 수 있다는 말이기도 해요. 

 

단순선형회귀모델이 쉽다고 생각할 수 있겠지만, 가장 기본적인 용어 설명이 많이 들어가는 만큼 정말 중요한 내용을 많이 담고 있답니다. 짧은 영상이지만 꼭 확인해보셨으면 해요~ 

 

궁금한 사항은 언제든 댓글 남겨주세요. :) 

 

 

반응형

 

Unbiased estimator란 무엇일까요? 단순선형회귀모델에서 OLS, 즉 최소자승법이나 MLE방법을 통해 구한 추정치, 즉 estimator에 대해 이 값들이 정말 true값과 어느정도 편차가 있는지를 확인하는건데요. 

 

E(b_0) = $/beta_0$ , E(b_1)= $/beta_1$, 이렇게 구해진다면 추정치들이 unbiased 하다라고 말 할 수 있습니다. 이 두가지를 증명하기 위해 먼저 가장 큰 특징인 것부터 증명을 하고, 이 특성을 가지고 증명을 해보겠습니다. 

 

그런데 여기에서 꼭 알아둬야할 개념이 있는데요. 바로 평균중심화입니다. centering이라고 하는데요. 이 부분에 이해가 잘 안간다면 다음 영상을 꼭 확인해주세요. 

 

 

 

 

반응형

+ Recent posts