데이터 분석하고 싶은데, 통계 공부도 꼭 해야 하나요?

SHARE

데이터 분석하고 싶은데, 통계 공부를 꼭 해야 하나요?

패스트캠퍼스 데이터 사이언스팀에서 정말 많이 받았던 질문입니다. ‘데이터 분석’, ‘데이터 사이언스’, ‘빅데이터’ 등의 키워드가 메가 트렌드를 타면서 사람들의 관심도는 높아졌지만, 정작 어느 수준의 학습이 필요하고 무엇을 어떻게 해나가야 할지 잘 모르는 경우가 많았습니다.

그래서 패스트캠퍼스 데이터 사이언스팀에서는 처음 데이터 분석 분야를 접하시는 분들을 위한 기초 강좌인 [왕초보를 위한 데이터 분석 기초 CLASS] 강의를 진행하고 있습니다. 해당 수업 시간이나 평소에도 문의가 많이 들어왔던 질문들을 바탕으로, 많은 분들이 궁금해하실 데이터 사이언스 관련 내용을 정리해 보았습니다!


데이터 분석, 왜 해야 할까요?

많은 분들이 데이터 분석을 하고 싶어 하지만, 사실 뚜렷하게 ‘무엇을 하겠다’라고 규정되지 않은 경우가 많습니다. 혹은, 데이터 분석가의 커리어를 쌓을 것도 아닌데 이것을 알아야 할까 생각하시는 분들도 적지 않았습니다. 그렇다면 데이터 분석 역량이 왜 필요한지 간단히 짚고 넘어갈 필요가 있겠군요.

요즘은 진부한 표현이기도 하지만 ‘정보의 홍수, 빅데이터 시대’입니다. 그만큼 데이터가 통제하기 어려울 만큼 많습니다. 이런 데이터는 특정 직군들만 접하는 것이 아닙니다. 모든 직무에서 접하게 되는 데이터의 양이 엄청나게 많습니다. 그렇기 때문에 이런 데이터를 관리하고 활용하는 능력이 굉장히 중요할 수밖에 없습니다. 업종, 직무를 불문하고 데이터 분석 역량은 사실 선택이 아니고 필수인 것이죠. 어떤 특정 ‘지식’이 아니라, 이제는 반드시 알아야 하는 또 하나의 ‘상식’이라고 해도 과언이 아닙니다.

꼭 통계를 알아야 데이터 분석을 하나요?

즉각적인 답변보다는 간단한 사례를 들어볼까 합니다. 신사동 가로수길 중간에 한 커피전문점이 있다고 가정해보겠습니다. 손님이 정말 많이 오는 명당입니다. 커피전문점은 사람들로 꽉 차 있고, 직원들도 정신없이 바쁩니다. 그런데 어찌 된 일인지 매출이 딱히 오르는 것 같지 않습니다. 오히려 가끔씩 줄어들기도 합니다. 이럴 땐 어떤 것을 개선해야 할까요?

영수증을 바탕으로 정리를 해보았습니다. 어떤 음료를 많이 마셨는지, 2회 이상 방문한 고객은 얼마나 되는지, 일마다 매출은 얼마인지 등이죠. 정리해보니 특정 날짜, 특정 시간에 아이스 아메리카노가 불티나게 팔린 날들이 있네요. 지난 8월 엄청나게 찌는 듯한 폭염이 찾아왔을 때 시원한 아메리카노 한 잔을 많이 찾았군요. 날씨에 영향을 민감하게 받는 걸 보니, 가을바람이 선선해질 때 이에 알맞는 음료를 선정해 이벤트를 진행해보면 좋을 것 같습니다. 또한, 고객들이 한 번 방문하고 나면 2번 이상은 잘 방문하지 않는 것 같습니다. 좀 더 매력적으로 고객들을 끌기 위한 쿠폰 제도를 실시하고자 합니다.

위 이야기처럼 데이터 분석을 통하여 문제점을 알아내고, 해결책을 찾는데 통계 지식이 매우 유용합니다. 혹시나 ‘하나하나 세보고 따져보면 되는거 아니야?’ 생각하시는 분 계실지도 모르겠네요. 그런데 우리가 다루는 데이터다 몇 십개 밖에 안될까요? 수백, 수천, 아니 그보다 훨씬 더 엄청난 양인 경우가 거의 대부분 입니다. 이러한 수치들을 효율적으로 다루고, 인사이트를 뽑아내기 위해서는 통계 지식이 반드시 필요한거죠.

하지만 통계라는 것 때문에 너무 겁먹으실 필요는 없습니다. 여러분이 생각하는 고등학교 때 대학교 입시를 위해 공부했었던 그 수학을 떠올리실 필요는 없습니다. 꼭 필요하고 생활에서 밀접하게 쓰일 수 있는 기본적인 통계 지식을 일부 익혀주면, 충분히 기본적인 데이터 분석을 시작하는 데 무리가 없으니까요!

 

어떤 프로그램으로 데이터 분석을 하나요?

데이터 분석을 위한 다양한 도구들

데이터 분석을 하는 프로그램은 상당히 다양합니다. 논문을 써본 대학생이라면 아마 SPSS 정도는 들어보셨을 겁니다. 그 외에도 SAS, Python, R 등이 있고, 우리가 흔히 쓰는 엑셀 역시도 데이터 분석을 유용하게 할 수 있는 툴입니다. 엑셀이라고 하니 조금 반가우신가요? 엑셀로 다양한 표를 만들고, 이를 보기 좋게 막대나 꺾은선, 원형의 그래프 등을 만들 수 있습니다. 그럼 훨씬 더 데이터를 정리하기에 용이하죠. 일반적으로 사무실에서 일하거나 논문을 위해서 데이터 분석 역량을 필요로 하신다면, 엑셀을 활용한 데이터 분석을 권유해드립니다.

이미지 출처: KDnuggets

하지만 좀 더 다양하게 데이터를 시각화하려면, 좀 더 전문적인 데이터 분석 툴이 있습니다. 저희 패스트캠퍼스에서 데이터 분석을 처음 접하시는 분들이라도 통계의 개념을 알려드리는 것뿐만 아니라 ‘R’ 프로그램을 맛보게 해드립니다. 전세계적으로 가장 많이 쓰이는 데이터 분석 툴로, 무료로 공개된 소프트웨어라 자유롭게 만들고 배포도 가능합니다. 특히, 그래픽 관련 패키지를 설치하면 엑셀에서 구현하지 못하는 매우 다양한 종류의 그래프를 손쉽게 구현할 수 있습니다.

이미지 출처: https://en.wikipedia.org/wiki/R_(programming_language)

이미지 출처: https://www.fastcompany.com/3030063/why-the-r-programming-language-is-good-for-business

 

데이터 사이언스 분야의 전망은 어떤가요?

21세기 가장 섹시한 직업으로 뽑힌 ‘데이터 사이언티스트’! 그만큼 데이터 사이언스 분야에 대한 관심도가 매우 높을 뿐만 아니라, 직업 적으로도 각광받고 있습니다. 앞으로 데이터의 양은 더욱 더 늘어갈 것이기에, 이를 효율적으로 운영/관리하고 분석하며 인사이트를 뽑아낼 수 있는 인재를 기업이 선호할 수 밖에 없겠죠?

21세기 가장 섹시한 직업, 데이터 사이언티스트

패스트캠퍼스 수강생들 역시도 실제로 데이터 사이언스 분야가 전도유망한지 궁금해하시는 분들이 많았습니다. 개인적으로 이메일로 질문하셨던 분도 계신데요, 이에 대해 강사님께서 답변을 아래와 같이 달아주셨습니다.

 

Q. 통계나 데이터 분석에 대한 전문 지식이 없습니다. 나이 역시 어린 편이 아니라 걱정입니다. 지금부터 시작해서 데이터 분석가로의 커리어 전환이 가능할까요?

만약에 이쪽에 정말 관심이 많으시다면, 도전해보시는 건 좋다고 생각합니다.
무작정은 아니고 한 번 통계 관련 스터디를 참석해보시고 해볼만 하시면 전환을 생각해보시는 것도 하나의 방법입니다.
그러나 손바닥 뒤짚듯이 하는 전환보다는 서서히 업무능력 범위를 넓혀가시면서 전직을 꾀하시는 것도 좋으실 것 같습니다.
통계는 데이터 분석가가 아니더라도, 운영/실무 모두 필요한 사고력이기 때문에 일상생활에서 기사 혹은 서적을 통해 스스로 통계사고력을 기르시길 권합니다.

많은 언론에서도 예전부터 지금까지도 데이터 사이언스 분야에 대한 기대감을 감추지 않고 있습니다. 늘 전도 유망한 직업으로 데이터 사이언티스트, 데이터 분석가가 거론되지요. 또한, 빅데이터 분야에 대한 투자도 엄청나게 증가하고 있는 만큼, 미래가 더욱 기대가 됩니다!

 

최근 구인 구직 전문 사이트 글래스도어가 미국 최고의 인기 직업 25개 중에서 ‘데이터 과학자(사이언티스트)를 1위로 선정했다.

출처: 미국 1위 직업이 ‘데이터 사이언티스트?’(아이뉴스, 2016.05.09)

 

앞서 나가기 위해서는 인기 있는 데이터 수집과 분석 방법을 놓치지 않기 위해 연구하는 것이 중요합니다.

출처: 쏟아지는 데이터를 어떻게 분석하느냐에 따라 기업의 미래 결정될 것(WeeklyBiz, 2016.05.28)

 

컴퓨팅, 네트워킹, 스토리지 인프라, 기타 보아 같은 데이터센터 인프라로 구성된 인프라 시장이 연평균 21.7% 성장하며 2019년에는 전체 빅데이터 투자의 약 절반을 차지할 것으로 전망했다.

출처: 2019년 전세계 빅데이터 시장, 486억 달러 전망(CIO, 2015.11.12)

 


국내 데이터 사이언스 교육의 선구자, 패스트캠퍼스 데이터 사이언스 ▼ [이미지 클릭]

logo_345

Facebook Comments