안녕하세요. 이지영입니다. 

 

유튜브도 운영하고 있지만 사실 영상을 못 올린지 꽤 되었어요. 영상 올리고 싶은 마음은 정말 굴뚝인데, 아이 두명을 돌봐야하는 워킹맘인지라, 체력적으로 도저히 안되더라고요. 그런데 작년 11월, 클래스101에서 강의 제안을 받았어요. 데이터 분석에 관한 내용인데, 사실 파이썬으로 하는 데이터 분석은 유튜브에 올리고 싶은 마음이 큰지라, 대신 유료 강의만큼 제가 일하면서 가장 중요하게 느꼈던 부분이 무엇인가에 대해 생각해보았습니다. 

 

그게 <데이터 분석 + 데이터 모델링 + 클라우드 서비스로의 자동화> 이렇게 세 가지를 한꺼번에 생각하기 이었어요. 데이터 분석을 하게되면, 잘 정리된 데이터를 불러와 통계치 보고, 그래프 그리고.. 그렇게만 생각하곤 했거든요. 하지만 막상 일을 해보니 그게 아니었습니다. 어떤 통계치가 있는지, 어떤 시각화를 사용해야하는지, 이건 강의도 많고 책에도 잘 나와있었는데요. 더 중요한건 이걸 큰 틀에서 바라보는거였어요. 

 

왜냐고요? 

 

- 데이터는 우리가 원하는대로 있지 않습니다. 그리고 데이터 사이즈가 커질수록 이걸 한꺼번에 저장하기 보다 여러 개로 나눠서 저장하기도 하죠. 우리가 원하는 것을 얻기 위해, 원하는 답을 찾기위해 우리가 어떤 데이터를 가지고 있어야하는지, 그 데이터가 원하는 형식으로 있는지, 확인하는 작업을 거치죠. 물론 이 과정은 프로그래밍 랭귀지 기술이 필요합니다. 하지만 이 기술은 계속 하다보면 늘게 되어있어요. 하지만 우리가 어떤 데이터가 필요한지, 어떤 원하는 형식으로 갖춰야하는지- 이 부분은 연습을 하지 않으면 절대 늘 수 없습니다. 그리고 이게 얼마나 중요한 작업인지 그 필요성을 스스로 깨닫는것도 저한테 오래 걸렸던 부분이었는데, 이걸 빨리 알려주고 싶었어요. 

 

- 예측 모델 만들기 -  너무 중요하죠. 그런데 예측 모델이 여러개 있다면? 이 예측 모델을 매일 돌려야한다면? 어떻게 할까요? 

- 모든 과정을 로컬 컴퓨터가 아닌 클라우드 서비스에서 작업하려고 하면 무엇을 꼭 알아야할까요? 데이터 과학에서 자동화는 이제 필수인데요. 로컬 컴퓨터에서 작업할때와 클라우드 서비스를 활용할때 어떤 점이 달라질까요

 

강의에서 AWS를 다뤘지만, 각 클라우드 서비스마다 제공하는 서비스의 맥락은 굉장히 비슷합니다. 강의를 들으면서 개인 포트폴리오로 활용하셔도 되고, 취업 준비생 분들에게, 일을 막 시작하는 분들에게 도움되는 부분이 많았으면 하는 바람에서 강의를 만들겠다고 했었죠. 강의 댓글 중에 가장 고마웠던 댓글은, 36개의 강의가 짧은 강의인줄 알았는데 굉장히 배울게 많은 강의 였다라는 내용의 댓글이었습니다. 

 

기회가 된다면 이제 유료 강의가 아닌, 유튜브에서 강의를 올려보려고 합니다. 책 작업이 마무리 되는대로 유튜브 강의를 만들고자 하는데, 수정 작업이 길어지게 되었어요. 그래도 책 작업이 마무리 되면서, 혹시라도 제 강의가 어렵게 느껴진 분들이 계신다면, 곧 출간될 데이터 사이언티스트 실전노트와, 앞으로 올리게 될 유튜브 데이터 분석 강의로 도움을 얻으셨으면 합니다. 

 

반응형

+ Recent posts