유의확률, 즉 p-value에 대해 어떻게 설명하면 좋을까요? 전 간단하게 두 가설을 선택하기 위한 수치화된 증거라고 비유하고 싶어요. 

 

대립가설을 지지할만한 충분한 증거가 있다면 귀무가설을 기각하고, 반면 충분한 증거가 없으면, 결국 귀무가설을 선택한다고 했는데요. 이때 선택된 가설은 진실이어서가 아니라, 하나를 선택할만한 충분한 증거가 있어서 선택한거라고 설명드렸어요. 그런데 모집단의 모수라는 진실의 값을 우린 절대 알 수 없기때문에 이 모집단에 기반을 둔 가설 역시 진실의 값을 알 수 없어요. 그래서 충분한 증거를 가지고 있어도 잘못 선택할 수 있거든요. 그런데 이 증거가 많고 적음을 수치화해서 표현할 수 있다면, 잘못 선택하는걸 줄일 수 있겠죠그럼 이 증거는 어떻게 계산할까요? 

 

귀무가설은 현재 시점에서 옳다고 가정해서 시작하는거거든요. 그래서 연구하는 사람은 어떤 효과가 있거나 차이점이 있다는걸 보여주려고 연구하기때문에 이 귀무가설을 기각하고 싶어하죠. 그래서 표본을 구해서 실험을 한 뒤, 어떤 결과값, 즉 통계치를 얻었습니다. 그런데 이 통계치는요. 귀무가설이 옳다고 가정했을때, 표본으로부터 얻는 통계치거든요. 예를들어 통계치가 평균값이라고 했을때, 이런 평균값을 얻게될, 관측될 확률이 바로 p-value예요.  예를들어보자면, 우리가 현재 바라보는 시점, 귀무가설이 옳다는 시점에서 모수의 평균값이 10이라고 했어요. 그런데 샘플을 얻어서 샘플 통계치가 20이었어요. 그렇다면 이 20이 관측될만한 확률을 구하는거죠. 

 

여기서 중심극한정리의 이론이 필요합니다. 자세한 내용은 영상을 참고해주세요. 

 

https://youtu.be/TEsXCUozAsE

 

반응형

+ Recent posts