데이터를 구성하고 있는 각각의 아이템을 변수라고 하는데요. 이 변수를 쉽게 이해하는 방법으로 분포를 보는게 있습니다. 이 분포를 이해하기 위해 여러 용어가 나오는데 Five number summary, box plot, mean, median 등을 설명하는 동영상을 만들었어요. 특히 mean과 median 평균과 중앙값이 어떻게 달라지냐에 따라 분포의 모습도 달라집니다. 어떻게 달라지는지 확인해보세요. 





반응형

안녕하세요. 통계학 문제 푸는걸 모르겠다는 학생분들, 데이터 사이언스쪽으로 일하고 싶어하는 분들!이 꼭 봤으면 하는 내용을 담았습니다. 이산데이터 연속성데이터 굉장히 쉬운 내용이지만 왜 중요한지, 어떻게 쓰이는지는 잘 못 본것 같아서요. probability문제를 푸는 요령, 처음 데이터를 받으면 어떤 것부터 해야하는지에 대해 설명해보았습니다. 





반응형

데이터가 있을때 이 데이터가 어떤 데이터인지 구분짓는게 첫 시작이자 제일 중요한 단계인데요. 다음처럼 키 데이터가 180, 179,... 주어졌을때 이 데이터를 이산데이터라고 해야할까요? 아니면 연속성 데이터라고 해야할까요? 



이산데이터라고 대답하셨으면 아래 유튜브 통계 동영상을 참고해보세요!! 








반응형

안녕하세요. 몇개월만에 다시 찾아온 것 같네요. 간단하게 근황을 적어보자면 올해 이직에 성공했습니다!!!! 하아...정말 눈물없이 들을 수 없는 이직스토리도 있지만 저 혼자 간직하는걸로 할게요. 그만큼 맘고생 몸고생하며 이직했습니다. 

이직한 곳은 이제 4개월 되었지만 정말 만족할만한 곳이예요. RnD팀에 데이터 사이언티스트로 일하고 있는데요. 저까지 열명의 데이터 사이언티스트들이 있습니다. 각각 배경은 다양해요. 컴퓨터 사이언스 (컴공)부터 통계 백그라운드는 저 혼자 입니다. 아! 수학 백그라운드도 있어요. 여러명이서 일하니까 코딩 로직을 새롭게 바라보는 시각도 생기게 되더라고요. RnD팀이다보니 일 자체도 굉장히 흥미롭고요! 최근 성과도 있었는데 그 소식은 차차 전하도록 하겠습니다. 


몇주 전 토론토 머신러닝 서밋에 다녀오게 됐어요. 티켓값이 무려 이틀에 600불이었습니다. 토론토가 머신러닝, 딥러닝, 인공지능을 이끌어가는 도시가 되어야한다!! 그래서 우린 뭘 하고 있다....이런게 주 내용이었습니다. 

Differential Privacy 에 대해 들어보셨나요? 그 전 직장은 은행이 클라이언트였던지라 데이터의 프라이버시에 관한게 굉장히 큰 이슈였어요. 특히 transaction에 대한 데이터를 보게된적이 있는데 그 사람의 모든 정보 + 어카운트정도 + 카드내역 등등 정말 개인적인 정보가 다 담겨있는건데 무섭기도 했었습니다. 이 데이터를 어떻게 노이즈를 줘서 프라이버시를 지켜줄 수 있을까에 대한 내용이예요. 빅데이터의 시대지만 데이터를 잘 보호하는게 중요하겠죠. 


전 머신러닝쪽인데 딥러닝쪽도 관심이 갑니다. 공부할게 많다는게 단점이자 장점인데...퇴근하고 오면 왜이렇게 피곤한지 모르겠어요. 

짧은 스피치도 많았는데 이런 분위기였고요. 한가지 재밌었던점은 윗분들도 많이 오셨다는겁니다. 회사에 보고를 해야했기에 열심히 사진찍고 내용듣고 하더니, 강의가 끝난 후 옆자리에 앉은 사람이 인사를 하더라고요. 재밌게 봤냐면서요. 외국은 small talk라고 가벼운 얘기?를 나누는게 정말 중요합니다. 잘 봤다, 너무 흥미롭다..라고 했더니 제가 뭘 하고 있는지 물어보더라고요. 어느 직군쪽에서 데이터 사이언티스트로 일을 한다고 했더니, 그분은 비슷한 직군쪽에서 있다며 링트인 아이디를 서로 주고받았습니다. (즉, 명함같은 느낌인거죠) 알고봤더니 부회장님...어이쿠ㅋㅋㅋㅋㅋㅋ


인공지능에 대해 스타트업 회사도 많이 생기고 하는데요. 뭘 하고 있고 어떤 것을 이루고자 하는지에 대해 듣고 있자면...솔직히 무섭기도 합니다. 회사에서 콜센터를 대신해서 로봇과 대화하는 프로그램을 개발했는데요. 어느정도 대화가 되냐면, 로보트가 전화건 사람의 영어의 악센트까지 파악해서 한국사람들의 억양의 영어로 하는지, 중국사람들의 억양의 영어로 하는지, 술을 마신 상태에서 영어로 하는지..까지 파악하는거죠. 조만간 많은 곳의 일자리가 줄어들게 될꺼라고 한다지만, 그 조만간이 진짜 코앞이구나...란 생각을 떨쳐버릴수가 없죠. 


암튼, 내년엔 블로그와 유튜브에 집중할 계획입니다. 그러고보니 방명록도 방치했었는데 죄송하게 생각하고 있습니다. 점점 일에 자리잡을수록 시간이 생기게 되면 소통을 잘하는 블로거가 되지 않을까란...생각을 하면서 다음에 또 근황 올릴게요~ 


반응형

아래 그림에서 두 개의 식을 구분할 수 있나요?  모집단, 표본, 모수치, 추정치... 쉬운 개념이지만 쉽다고 그냥 넘어간다면 놓칠 수 있는 부분이 바로 통계 기본 용어에 대한 정확한 이해인것 같습니다. Estimate과 Estimator의 차이가 뭘까요? 

아직 확실히 이해가지 않는다면 아래 동영상을 참고해보세요!! 





반응형

+ Recent posts