안녕하세요. 이지영입니다.

지난 달 데이터 분석 관련 해커톤 심사위원을 맡았습니다. 모든 지원자 정보는 블라인드 처리되어 제안서만을 기준으로 채점을 했는데요. 정말 열심히 준비했는데, 사소한 실수로 점수를 깎을 수 밖에 없었던 상황이 너무 속상해서 체크리스트를 만들게 되었습니다. 총 5가지 항목을 기준으로 각 항목별 세부사항에 대해 정리한 체크리스트인데요. 

 

인스타 포스팅을 가져와봤어요. @statnmath

 

1️⃣ 제안서 주제 중...
제 체크리스트에 있는 4가지 항목 중 가장 중요한 점, 바로 <대상에 대한 구체적인 정의>에 대해 강조, 또 강조하고 싶어요.
예를 들어, <1인 가구>라고 해도 연령대, 지역, 성별 등 구체화할 수 있고, 또 이 대상이 얼마나 있는지 수치화 하면 더 좋습니다. 대상을 수치화하면 분석과 결론에 이르기까지 아주 구체적일 수 있거든요.

2️⃣ 분석 & 모데링 중...
분석은 제가 쓴 #데이터사이언티스트실전노트 를 추천하고 싶습니다. 데이터 전처리하는 과정에서, 왜 이 과정이 필요했는지, 그래서 문제점은 없었는지, 이런것만 잘 서술해도 점수가 쭉쭉 올라갑니다.

3️⃣ 시각화 중...
이 그래프로 무엇을 얘기하고 싶은지 두번, 세번 생각해 보세요. 너무 뻔히 알고 있는 것을 굳이 그래프로 보여주고 있는건 아닌지, 인사이트가 빠진 것은 아닌지 주의해야 합니다. 결국 분석이나 그래프는 문제를 해결하는 과정의 중간 단계인데요. 그 중간단계가 튼튼해야 결론 역시 논리적으로 연결될 수 있겠죠.

4️⃣ 논리성 중...
앞서 <대상에 대한 정의>를 얘기했는데요. 대상을 A라고 정의했다면, 분석이나 결론 과정에서 A'가 나오거나 B가 나오지 않도록 주의해야 합니다. 제안서에 대상을 모두 동그라미⭕️ 쳐보세요. 그리고 그 동그라미가 모두 동일한 그룹을 의미하는지 확인해야 합니다.

5️⃣ 완성도 중...
형용사가 들어있나요? <많은 효과...> 또는 <보다 적게...> 이런 단어를 숫자로 바꿔보세요. 바꿀 수 없다고요? 그건 <대상에 대한 정의>가 정확하지 않거나, 혹은 데이터를 못 찾았거나, 혹은 데이터 분석이 제대로 이뤄지지 않아서 그렇습니다.

 

@statnmath 팔로우 후 댓글 달아주시면 제가 링크 보내드리겠습니다.

 

반응형

+ Recent posts