https://youtu.be/sMPmcakkBF0

머신러닝 (기계학습)에서 정밀도! 재현율! 단어만 봐도 아!!! 이건 분류모델에서 나오는 예측한 결과값을 평가하는데 나오는 값들이구나!!라고 바로 생각이 나셔야합니다.

 

Binary Classification 에 해당하는 예시로는, 환자가 병에 걸린건지 아닌지, 우린 진실을 모르지만 진실을 알기 위해 예측을 할 수 있죠. 피 뽑던가 CT촬영을 하던가 등등요. 진단 결과는 바로 예측하는거예요. 하지만 진짜 이게 진실인지 아닌지는 모릅니다. 예측을 하는 것 뿐이죠. 신용카드 결제가 사기인지 아니면 정상적인 결제인지...회사 입장에서는 모르죠. 물론 우리가 카드를 제대로 사용했다면 진실이지만, 회사 입장에서는 알 수는 없습니다. 회사에서는 얼마를, 어디에서, 몇시에 결제된건지 등등을 파악해서 이 신용카드 사용이 정상적인지 아닌건지 예측을 합니다. 

 

모델은 누구나 세울 수 있어요. 다만 어떤 모델, 얼마나 훌륭한 모델을 세웠느냐는 다른 얘기죠. 그래서 혼동행렬을 통해, 그리고 그 값들을 통해 여러가지를 분석합니다. 그런데...정밀도(precision), 재현율(Recall), 그리고 혼동행렬......혼동의 카오스...는 아니고요. True Postive, True Negative, False Positive, False Negative 아....머리아프다. 햇갈린다 하시는 분들!! 꼭 보세요. 사실 이런 개념은 글로 읽으면 잘 눈에 안들어옵니다. 영상으로 직접 보셔야 이해가 확 가요!

 

그런데 정밀도와 재현율 중에 뭐가 중요할까요? 답이 궁금하신 분, 확인해보세요~ 

 

 

 

반응형

+ Recent posts