랜선사수 시리즈를 시작하면서... 

이제까지 유튜브 댓글 중 가장 마음에 들었던 댓글은 바로 <랜선사수>라고 저를 불러줬던 댓글이었어요. 그래서 랜선사수 시리즈로 제가 지난날 방황했던 저에게, 혹은 지금의 저에게 해주고 싶은 말을 이렇게 적어보렵니다. 이 글을 보는 누군가에게 위로가, 혹은 응원이 되길 바랍니다.

 

20대, 재수까지 하면서 가고 싶었던 학과에 합격하고, 소위 스펙을 쌓아가며 취업 준비도 하고, 그래서 관련 업계로 일도 하다가, 삶의 터전을 캐나다로 옮기면서 모든 경력에 마침표를 찍었죠. 마침표를 찍는건 어렵지 않았지만 방향성을 찾는건 쉽지 않았어요. 무엇을 하면 좋을지 1년 넘게 고민하고, 고민하고, 또 고민하면서 결론을 내렸을 때 참으로 후련했던 기억이 있었습니다. 설레기도 했고요. 앞으로 무엇을 할거냐는 주변의 질문에 제 계획을 말하면 대부분 이런 반응이었어요.

이제까지 경력 쌓은게 아깝다. 
그 나이에 무슨 공부를 시작하려고? 
나이 들기 전에 빨리 애 부터 낳고 천천히 고민해. 
너 그러다 학비 빚만 쌓이고 이혼 당해.

서른살, 통계학으로 다시 대학가겠다라고 말했을 때, 응원해준 사람은 남편 뿐 이었습니다. (제 결정이 잘한 결정이냐고 물어보지도 않았는데) 학비 빚만 쌓이고 이혼당할거라는 얘기도 들었죠. 20대 후반 2년간의 고민했던 시간, 서른 살의 학부 생활 시간과 학비, 기회비용까지 따져본다면 주변의 걱정은 충분히 이해합니다. 하지만 이해가지 않았던 것은... 경력을 바꾼다는 것 = 지난 날 내 선택이 잘못된 결정이라고 인정하는 것 이라고 바라보는 관점이었어요. 내가 정말 잘못한게 있다면 10대일때 앞으로 평생 해야 할 일을 선택하지 않았다는것? 그런데 그게 정말 잘못일까요? 가치관도 변하고 제 주변 상황도 변하는데 말이죠. 

 

물론, 한국은 나이가 중요해서 그렇기도 하겠죠. 최연소 타이틀... 정말 좋아하잖아요. 하지만 최연소 당사자 한명이 아닌 나머지의 인생도 중요하지 않겠습니까? 전 캐나다로 삶의 터전을 옮긴 상태였고, 캐나다에서 나이를 따지지 않는다면, 20대의 경험으로 다시 새로운걸 도전해보고 싶었습니다. 하지만 그 도전이라는 말 조차도 나이가 들었을때 하는 도전은, 마치 현실을 모르는 사람으로 간주하더라고요

 

그래서 전 이렇게 하기로 다짐했습니다. 

누군가가 치열하게 고민하고 내린 결정에 대해서는 아무런 판단 없이, 결과를 떠나 응원하리라! 

내가 경력을 바꾼다고 해서 내가 경험한 20대가 아무런 의미가 없어지는게 아니듯이, 비록 내가 중간에 자퇴하더라도, 그래서 누군가가 그걸 실패라고 말하더라도, 내가 했던 도전은 정말 값진 거라고 생각하리라!! 라고 말이지요. 

 

솔직히 저 역시 제 판단이 맞는 것일까?에 대한 고민을 수없이 했습니다. 어쩌면 그 고민만 2년 가까이 했던 것 같아요. 그럴 때마다 

 

인생에 있어서 지름길이라는게 과연 있을까? 빠른 길을 가더라도 그게 과연 의미가 있을까. 
누군가 나를 보면, 내가 느려보이겠지만,  매 순간 고민하면서 그 길을 걸어가는 나는 잘 가고 있는 것이다.  
중간에 그만 두더라도, 그걸 실패라 하더라도, 경험 그 자체는 소중한 것이다. 

 

비전공자인데 괜찮을까요? 
이 나이에 시작해도 괜찮을까요? 

이런 질문을 유튜브 댓글에서 많이 보곤 했는데요. 물론 한국의 상황은 나이에 더 엄격하다는 것...잘 알고 있습니다. 하지만 도전에 있어서, 배움에 있어서 성공과 실패라는 두 단어로만 결론을 바라본다면 그 과정에 숨어있는 경험, 공부, 기회, 방향을 볼 수 없을거라 생각합니다. 

 

Photo by&nbsp; Brett Jordan &nbsp;on&nbsp; Unsplash

 

반응형

안녕하세요. 이지영입니다.

아주 오랜만에 글을 적다보니 어디서부터 어떻게 시작해야할지 막막한데요. 그래서 근황 및 인사부터 다시 글을 적어봅니다. 

 

2020년 가을부터 집필을 시작했습니다. 책 제목은 <데이터 사이언티스트 실전노트>로 비제이퍼블릭 출판사와 진행 중 입니다. 1년간 집필했고, 1년에 걸쳐 편집 중에 있습니다. 진행을 조금 더 빨리 할 수 있었겠지만 책 값을 조금이나마 저렴하게 하기 위해 컬러 이미지를 흑백 이미지로 수정하는 등, 편집 작업이 길어지고 있습니다. 다음 달이면 출간 날짜 정도는 알 수 있을 것 같습니다. 데이터 분석, 데이터 과학에 관심 있는 분들에게 도움이 되었으면 합니다. 

------------- 2022년 6월 출간했습니다 :) 

http://www.yes24.com/Product/Goods/110281958 

 

데이터 사이언티스트 실전 노트 - YES24

이 시대의 가장 섹시한 직업, 데이터 사이언티스트?!소문만 무성한 데이터 사이언티스트의 모든 것을 알려준다!첫째, 데이터 사이언티스트의 실제 업무를 알려드리고, 데이터 사이언티스트가

www.yes24.com

 

그리고 데이터 과학자 실무 프로젝트 주제로 클래스101 강의도 찍었습니다. 제가 캐나다에 거주하고 있다보니 영상 촬영, 편집 제가 다 했는데요. 다행히 클래스101 PD님과 작가님 제 영상을 검수해주셔서 유튜브 영상보다 퀄러티 좋은 강의를 만들 수 있었습니다. 제가 데이터 사이언티스트로 일하면서 가장 많이 하는 작업을 변형 시켜서 강의로 만들었습니다. 아무리 훌륭한 분석과 예측 모델이 있다 하더라도 그게 구현되지 않으면 아무소용 없구나...라는걸 절실히 느끼면서 데이터 분석, 예측 모델, 이걸 넘어서 조금 더 큰 틀에서 바라보는 강의를 만들고 싶었습니다. 그래서 아마존 웹 서비스, 파이썬을 이용해 데이터 분석과 예측 모델을 자동화로 구축하는 내용을 담았습니다. 

클래스101 강의&nbsp; https://class101.net/products/l4O941573GhUs5qxKhIc

 

얼굴을 공개하려니 굉장히 부끄러웠는데요. 전 워킹맘 입니다. 그리고 해외에 거주하고 있다보니 가족 도움을 받기 힘든 상황이죠. 

(갑자기 좀 쌩뚱맞게 흘러갑니다만... ) 워킹맘으로, 낮에는 일하고 저녁엔 아이를 돌보고, 새벽엔 집필 혹은 강의로 참 바쁘게 지냈던것 같아요. 

 

집필과 강의를 마치고, 앞으로 하고 싶은 일이 무엇인지, 해야 할 일이 무엇인지 정리하는 시간이 필요했습니다. 

그런데 정리가 잘 되지 않습니다. 

 

이지영이란 이름에 주어진 역할. 엄마로, 아내로, 딸로, 데이터 과학자로...그리고 이지영으로 잘 살고 있는가?에 대한 고민은 끝이 없으며 정리되지 않는구나..라는 걸로 잠정적인 결론을 내렸고, 그 성장하는 과정을 제 유튜브나, 블로그에 종종 남겨보고자 합니다. 

 

그 과정에서 전 고민을 계속 하며 성장하길 바라고,

그 과정에서 제 흔적을 보는 분들에겐 소소한 위로와 힘이 되길 바랍니다.  

 

커피챗: https://share.coffeechat.kr/이지영

비즈니스 이메일: statnmath.datascience@gmail.com 

발전적인 내용을 주고받을 수 있는 이메일은 언제든 환영합니다. 

 

감사합니다.

이지영 드림. 

반응형

안녕하세요. 이번 Q&A는 아래 영상에 달린 댓글에 대한 답변 (제 의견) 입니다. 개인적인 이유로 늦게 답변드린 점 죄송합니다. 제가 답변 드릴때 사실, 아카데믹에 관한 부분은 확인하고 올리겠지만 제가 미쳐 확인하지 못한 부분이 있을 수 있으며 또한 제 주관적인 관점도 들어가서 참고만 해주시길 바랍니다. 

 

 

youtu.be/8KNQIChxCig

 

 

질문내용:

가설검정 관련해서 여쭤보고 싶은 점이 있는데요! H0를 기각하지 못한다고 해서 H0 is true 라는 결론을 내릴 수 없는 점은 제가 이해하기로, H0가 모수로부터 연역적으로 도출되는것이 아니라 - 기존 연구자들이 생각했을때 타당하다고 보는 상태이기 때문인 것 같습니다. 예를 들어 빅뱅이론이 귀무가설이라 하면, 이게 기각이 안 된다고 해서 정말로 우주가 빅뱅에 의해 (정말정말로) 생겨났다는 논리적 결론이 나오는게 아니라 그냥 연구자들 사이에서 타당한 상태가 계속되는 것 같아요. 이렇게 이해한 점이 맞는지 궁금하구요. 같은 논리로 가령 H1가 우주의 탄생이 어떤 x현상때문이라고 해서 만약 유의수준 하 채택이 돼도 "정말로" x현상이 우주탄생의 원인이라고는 말할 수 없는 것 같아 보입니다.

 

 

두번째로 적합도/동일성(독립성) 검정을 할때는 H0를 "~~와~~간 독립이다" 로 놓고 기각이 안될 경우 "두 요소간 독립이다", 또는 모집단이 귀무가설의 분포를 따른다고 볼 수 있다 라고 서술하는 것을 많이 보게 됩니다. 이건 그냥 약속된 서술의 표현인가요? 가령 성별과 정책찬성도가 독립이라는 귀무가설을 기각하지 못한다고 독립이라고 말할수는 없어야하는데 ( 위에 따르면 ), 수험서 등에는 왜 독립으로 본다는 식으로 쓰이는지 궁금합니다 ㅜㅜ 긴 질문인데 읽어주셔서 감사합니다!!

 

 

제 의견입니다. 

제 의견을 먼저 말씀드리기 전에, 저는 통계를 캐나다에서 배워서 한국 수험서나 한국어로 된 통계책에 귀무가설에 대하서는 어떻게 명시되어있는지 본 적이 없습니다. 다만 제가 캐나다에서 교육을 받을 때 특정 교수님께선 통계를 제대로 이해하기 위해서 통계를 공부하는 사람은 제대로 표현할 줄 알아야한다는 생각을 가지고 계셨고, 거기에 동의하기에 이 영상을 만들게 되었습니다. 

 

첫번째 질문에 대한 제 생각 

H0이 기각하지 않을때 - 그러니까 귀무가설을 받아드려야 할 때 상황인데요. 

<H0가 모수로부터 연역적으로 도출되는것이 아니라 -기존 연구자들이 생각했을때 타당하다고 보는 상태> 라고 하셨는데 제가 느끼기엔 약간의 표현상의 오해가 있지 않았나 생각이 듭니다. 연구하는 분들이 새로운걸 발견하기 위해, 혹은 기존의 것을 반박하기 위해 연구를 하시겠죠. 새로운걸 발견하고 기존의 것을 반박하기 위해 연구를 했지만 그렇지 못했을때, 기존의 것(지식, 연구, 발견 등등)들이 더 타당하다고 결론을 내리겠죠. 

 

결과값이 어떻게 나오는지를 떠나서, 그러니까 H0이 기각되거나 그렇지 않거나 실험 주제를 정하고, 귀무가설 대립가설을 정하고, 실험을 하고 데이터를 구하고 계산하는 그래서 결론을 맺는 그 과정만 보았을때 시작점은 실험 대상이 되는 모집단의 모수로부터 되었다고 생각합니다. 나중에 결론을 내리고나서, H0이 기각되지 않았을때, 그러니까 귀무가설을 받아드릴때 비로서야 아 기존 연구가 타당하구나...라고 결론이 내리게 되는거죠. 

 

그래서 파란색 문장은 서로 반대되는, 서로 상반되는, 혹은 서로 상관없는 문장이라고 저는 생각하지 않습니다. 물론 제가 잘못 이해할 수도 있겠죠. 하지만 제가 통계를 공부하고 이해하는 바로는 실험 자체로는 모집단의 모수로부터 시작해서 결론을 맺어야하고, 그 이후 해석하는 과정에서 기존 연구가 타당하구나- 이렇게 얘기를 할 수 있겠죠. 

 

두번째 질문에 대한 제 생각

H0를 "~~와~~간 독립이다" 로 놓고 기각이 안될 경우 "두 요소간 독립이다", 또는 모집단이 귀무가설의 분포를 따른다고 볼 수 있다 라고 서술하는 것을 많이 보게 됩니다. ----> 라고 하셨는데요. 제 생각엔 약속된 표현이라고 생각합니다. 귀무가설의 분포를 따른다고 볼 수 있다라고 한건 맞는 표현이라 생각합니다. 그래서 두 요소간 독립이다. 라고 표현하는 건, 우리가 약속한 서술 방식인것 같아요. 물론 제가 전공에 대해 한국어로 된걸 본적이 없어서 잘못 판단할 수 있겠지만요. 

 

첫번째 답변과 이어져서 생각하시면 편하실것 같습니다. 실험 자체로 결론을 맺을때, 귀무가설의 분포를 따르기때문에 H0을 기각할 수 없다..라고 도출이 되죠. 하지만 그 후, 이해하는 과정에서 두 요소간 독립이겠구나...라고 생각할 수 있잖아요. 물론 이게 진실이 아닐수도 있겠지만 (모집단의 모수는 언제나 모르기때문에요..물론 한정된 모집답이라면 알 수도 있겠지만요) 이해하는 과정, 머릿속에서는 두 요소간 독립이다..라고 생각하는게 더 간단하고 이해하기 편하니까요.

 

 

 

정확하게 표현을 안다는 것은 그 뒤 배경과 지식을 정확하게 알고 있기때문에 그렇다고 생각하거든요. 다만, 제가 실제 일할때 혹은 공부할때는 저 혼자서는 쉽게쉽게 이해하는 쪽으로 받아드리지요, 그래서 아 accept했구나 아니구나 라고 머릿속으로 생각하곤 합니다. 다만 제가 다른 사람 앞에서 표현할때는 아무래도 조심스럽고 정확하게 말하려고 하지요.

 

뭐 뜻만 통하면 된거지 표현하는게 큰 대수냐,,, 라고 생각하는 분도 계실 수도 있겠어요. 하지만 한번쯤 정확한 표현에 대해 생각할 기회를 갖는건 중요한것 같아요. 제 답변이 도움되었으면 합니다~ 

반응형

안녕하세요. 이 영상 관련해서 질문글이 있었는데요. 내용이 길어지다보니 블로그에 정리해보는게 어떨까 싶어서 이렇게 적어봅니다. 

한달 전에 질문 주셨는데, 제가 개인사정으로 인해 유튜브를 한동안 할 수 없었어요. 오래 기다리게 해서 죄송해요. 지금도 살짝 힘든 상황이지만 늦게나마 적어봅니다. 

 

 

youtu.be/2-hAjXpue50

 

 

질문: 50명씩 10개의 샘플을 조사하는 것과, 500명인 1개 샘플을 조사하는 것은 결국 똑같은거 아닌가요?

이 질문 정말 좋은것 같아요. 전 이 질문 보자마자 모수가 가질 수 있는 범위의 정도 중요하겠다란 생각이 들었어요. 물론 제가 생각하고 답변하는게 정답은 아니고요. 다른 관점이 있을 수 있으니 이렇게 생각할수도 있구나- 라고 참고했으면 좋겠습니다. 그럼 설명 해볼게요. 

 

 

 

1. 모수의 수  (혹은 범위) 가 적을 경우 

정말 간단한 환경을 위해서 이렇게 설정해보았어요. 어떤 실험에서 대상의 전체 집단의 값이 1부터 600이라고 해봅시다. 이 모수의 평균은 300.5가 됩니다. 그런데 두 상황에 따른 평균 값이 모수와 얼마나 가까운지 한번 볼게요.  

1.1. 모수가 적을때, 50개씩 10개의 샘플인 경우 

아래 파이썬 코드를 보면, 모수에서 50개씩 무작위로 뽑은 뒤, 평균을 계산합니다. 그리고 sample_mean_list에 10개의 각 샘플 평균값을 넣었고요. 샘플 1개부터 10개까지의 평균값을 보면 통계치 값이 많이 달라진다는 점을 알 수 있습니다. 그런데 이 10개의 평균값을 계산해보았더니 297.22가 나왔네요. 

1.2. 모수가 적을때, 500개씩 1개의 샘플인 경우 

500개의 샘플 하나인 경우, 600개 중 500개를 뽑았으니 모수의 데이터 중 많은걸 포함했다고 볼 수 있는데요. 이 샘플 하나의 평균 값을 보니 305.15가 나왔어요. 샘플이 1개이니까 305.15/1 = 305.15 입니다. 

 

1.3. 어느 경우가 더 모수의 평균값과 가까울까? 

중심극한정리에서 중요한 점이, 모수의 분포가 어떨지라도, 샘플의 수가 많으면 많을수록 그 샘플의 평균값이 모수의 평균값과 가까워진다는걸 설명드렸는데요. 두 상황을 비교해보면 50개씩 10번 샘플을 구해서 그 평균값이, 500개의 1개 샘플의 평균값보다 더 가깝다는걸 알 수 있습니다. 1번의 경우 모수와의 차이가 절대값을 씌워주게되면 3.28이 나왔고요, 2번의 경우 절대값을 씌워주면 4.65가 되니까요. 각 샘플마다 얻은 평균치는 비록 모수의 평균과 차이가 꽤 나지만, 10개 평균값에 대해 평균을 내보니 모수의 평균값과 비슷해진다는걸 알 수 있었습니다. 

 

그렇다면 모수의 값이 정말 클 때 살펴보도록 하죠. 

 

2. 모수의 수  (혹은 범위) 많을 경우

상황은 같습니다. 다만 모수의 값이 1부터 1,000,000 값을 가지고 있어요. 이 모수의 평균은 500000.5가 됩니다. 그런데 두 상황에 따른 평균 값이 모수와 얼마나 가까운지 한번 볼게요. 

 

2.1. 모수가 적을때, 50개씩 10개의 샘플인 경우 

아래 파이썬 코드를 보면, 모수에서 50개씩 무작위로 뽑은 뒤, 평균을 계산합니다. 그리고 sample_mean_list에 10개의 각 샘플 평균값을 넣었고요. 샘플 1개부터 10개까지의 평균값을 보면 통계치 값이 많이 달라진다는 점을 알 수 있습니다. 각 샘플마다 모수의 평균값과 얼마나 다른지 적진 않았지만, 그 차이가 전 상황보다 더 큰걸 알 수 있습니다. 이처럼 모수의 범위가 굉장히 넓을 때, 여기에서 적은 수의 데이터를 뽑아 계산하는 경우, 각 샘플마다의 통계치의 폭이 커질 수밖에 없겠죠. 10개 평균값의 평균값을 보니 484,223.352 값이 나왔습니다. 

.2. 모수가 적을때, 500개씩 1개의 샘플인 경우 

500개의 샘플 하나인 경우, 1,000,000개 중 500개를 뽑았으니 이 샘플도 모수의 범위에 비해 굉장히 적은 수를 뽑았다고 볼 수 있겠는데요. 그래도 50개보단 훨씬 많은 수를 뽑았다고 볼 수 있겠죠. 499,346.352라는 평균값을 얻었어요. 

 

2.3. 어느 경우가 더 모수의 평균값과 가까울까? 

모수의 평균값을 기준으로 1번과 2번의 평균값 중에 어느 상황이 모수의 평균값과 더 가까운가요? 1번의 경우, 절대값을 씌워주면 15,776.704 라는 차이값이 있었고, 2번의 경우 절대값으로 654.148이라는 차이값을 얻었습니다. 그러니까 비록 1번 샘플을 구했지만 샘플 자체의 사이즈가 50보다 500, 즉 10배 더 많은 수를 가지고 있었던거죠. 

 

 

마치며... 

그렇다고 이건 절대적인건 아니예요. 왜냐하면 제가 무작위로 숫자를 뽑은거니까요. 하지만 중요한 점은 모수의 범위가 다양한데 여기에서 굉장히 적은 숫자의 샘플을 구할때, 이 평균치는 모수의 평균치와 굉장히 차이가 날 수 있다는 점은 확실합니다. 이것도 뭐 어떻게 데이터를 뽑느냐에 따라 달라질 수 있겠지만요. 무작위로 뽑았을때를 말씀드리는 겁니다. 

 

이밖에... 

여기까지는 영상 관련해서 통계학적인 관점에서 적어본거였고요. 사족이겠지만 통계학을 사랑하는 데이터과학자로 일하면서 느낌점을 적어보겠습니다. 마케팅을 성공하기 위해 이 마케팅에 해당하는 타겟을 뽑는게 중요한데요. 프로모션도 만명, 몇십만명 이렇게 대중으로 하는 것보다 정말 이 마케팅을 성공하기 위해 50명 100명 이렇게 소규모로 정확한 타겟을 정하는게 더 나을 수도 있거든요. 

 

마케팅의 성공적인 관점에서 생각해볼때, 타겟에 더 정확한 소규모의 50명에게 10개 지역을 선정해서 프로모션을 보내는것과, 조금 덜 정확한 500명의 지역 한군데 프로모션을 진행하는거랑 그 상황은 다르다고 볼 수 있겠습니다. 

 

 

하지만, 제가 적은건 절대적인건 아니고요. 제가 공부한것, 경험한것으로 적어보았습니다. 

다양한 생각, 관점 언제든지 환영합니다. 

도움 되셨으면 좋겠어요. 

반응형

앞으로 시리즈에서 이런 것들을 다룰 예정입니다. 

- 정말 알아야할 기본 통계

- 통계지식을 바탕으로 파이썬으로 구현 

- 오픈소스 데이터를 바탕으로 한 데이터 분석

- 실무 데이터 과학자의 현재 고민

- 실무 데이터 과학자의 목표 

 

이런 분들에게 도움이 됩니다. 

- 데이터에 관심 많은 학생,

- 데이터 분석가, 빅데이터 전문가, data analyst, data scienitst 등으로 취업준비하는 학생

- 구직 후 신입으로 일하는 분들 

- 데이터쪽으로 이직하고 싶으신 분들 

 

 

안녕하세요. 데이터를 다루는 모든 직무에서 갖춰야할 부분을 보면 데이터 분석 능력이 꼭 빠지지 않고 있습니다. 어떻게 하면 이 능력을 키울 수 있을까요? 사실 실무자로 일하고 있지만, 늘 마음속에서 어떻게 하면 더 잘 할 수 있을까 늘 생각하고 고민하고 있답니다. 그 팁과 현재의 고민까지도 영상에 올려보려고요. 

 

저 같은 분이 또 계실꺼라 생각해요. 

전 뒤늦게 응용통계를 공부했는데, 수능 때 마지막 수학문제를 풀고, 오랜시간 흘러서 다시 수학, 통계 공부를 하다보니까, 잘 이해가 안갔어요. 특히 증명하다가 막히면, 이게 나중에 일할때 도움이 되나?라는 의구심이 생겼고요. 실무자는 어떤 일을 하길래 이런 증명까지 공부해야하나에 대한 궁금증이 늘 있었죠. 현재 캐나다에서 만 3년차 데이터사이언티스트 일하면서 공부할때 가졌던 궁금증이 많이 풀렸어요. 감사하게도 상사와 코워커를 잘 만나서 많이 배우고 있는데요. 데이터에 관심 많은 학생분, 취업 준비하는 분이나, 이제 막 입사한 분까지 도움이 되었으면 좋겠어요. 

 

첫번째 영상은 데이터 분석, 적어도 이건 알고 시작하자!! 입니다. 기술만 있다고 분석을 잘 하는게 아니더라고요. 적어도 실무자에선 그렇게 생각합니다. 우린 1~2년 이 일을 하는게 아니잖아요. 정말 전문가가 되기 위해 한걸음씩 나아가야하는데 정말 중요한팁을 첫 영상에 소개해드리고 싶었어요.

 

 

그럼 데이터분석이란 말을 분석해볼게요. 

제가 학생때 생각했던 데이터 분석은 회귀라던가, 아노바, 상관관계 이런거였는데 실제 일 해보니 그건 정말 일부였어요. 

 

데이터분석이니까 뭔가 데이터가 있어야겠죠. 이게 출발점이라고 보면, 도착점은 어딜까요? 그래프일까요? 조금 더 멀리 가봅시다. 그래프를 그려서 깔끔하게 보고서를 만들었어요. 여기가 도착지점일까요? 더 가야해요. 왜냐하면 데이터 분석을 지금 심심해서 한게 아니잖아요. 뭔가 이유가 있으니까 한거죠. 상사가 시켰으니 한거지만, 일을 준 상사 역시 뭔가 이유가 있었다라는 겁니다.

 

단순히 일을 하는게 아니라, 우린 이 분석을 왜 하는지 늘 생각해야합니다. 이 영상을 보고 데이터 분석을 하는것과 이 영상을 보지 않고 주어진 데이터 분석을 하는건 출발점이 다르다고 생각해요.

 

https://youtu.be/Dfpi4pAzn78

 

반응형

+ Recent posts