‘빅데이터’란 무엇인가?

SHARE

Last updated on 1월 25th, 2021 at 06:58 오후

빅데이터
빅데이터가 중요한 이유 

과거 기업은 의사결정을 위해 기업 내부에서 축적된 자료만을 활용할 수밖에 없었다. 그러나 유튜브, 트위터, 페이스북, 인스타그램 등 소셜 네트워크의 등장과 확장으로 인해 기업이 활용할 수 있는, 어쩌면 활용해야 하는 데이터의 양이 기하급수적으로 늘어난 것이다.

이 ‘비정형 데이터’들을 수집할 수 있는 환경과 기술이 구축되었고, 많은 기업들은 이를 바탕으로 정보를 추출, 전략적 의사결정에 활용하거나, 문제해결에 이용하고 있다. 빅데이터는 ‘비정형 데이터’를 비롯한 수많은 데이터들을 일컫기도 하지만, 그 의사결정과 문제해결에 이용하는 제반 행위까지 폭넓게 이르는 말이기도 하다.

빅데이터. 여기까지만 읽어서는 도통 감히 잡히지 않는다. “그래서 그 빅데이터를 대체 어디에 쓴다는 건데?” 싶다. 가장 잘 알려진 사례 중 하나는 아마 구글의 ‘플루 트렌드 프로젝트(Flu Trends Project)일 것이다.

 

구글과 ZARA가 보여준 빅데이터

구글은 지난 2008년부터 독감과 관련된 검색 결과를 추적, 이를 통해 독감 발병을 예측하고자 했다. 그러나 14년 구글이 예측한 발병 예상치는 미국 질병 통제 연구센터에서 예측한 수치의 두 배에 달했다. 미디어가 독감 발생을 보도하며 질병과 무관한 검색횟수가 증가했다는 게 전문가들의 의견이었다.

이처럼 빅데이터는 정확한 정보를 잘 통제해 분석해야 한다. 그렇지 않으면 우리는 예상치 못한 수치에 당황하게 될 것이다. 구글조차도 실패할 수 있는 어려운 영역이라는 뜻이다. 그러나 세계적인 의류 브랜드인 ZARA는 이를 성공적으로 해냈다.

매해 많은 의류 브랜드가 마케팅 비용으로 천문학적인 금액을 쏟아붓지만 ZARA는 그러지 않는다. 할인 행사도 거의 없다. 그러나 사람들은 꾸준히 ZARA를 찾는다. 어떻게 가능한 일일까. 바로 고객들이 사고 싶어할 옷만 만든다는 데 있다.

판매하는 모든 옷에 지퍼, 단추, 색상, 재단 등 세부 정보를 담은 RFID 태그를 부착, 데이터를 수집해 패션 트렌드와 고객의 선호를 파악하는 것이다. 이런 데이터 분석을 통해 ZARA는 성공적인 재고관리를 해내고 있다는 평가를 받는다.

 

그래서 그게 우리랑 무슨 상관이냐고?

여전히 많은 이들에게 빅데이터는 아직 먼 얘기다. 실제로 활용할 경우 대단한 업무 성과를 낼 수 있음에도 불구하고, 그 이름 탓인지 거대한 망상으로 취급되기 일쑤다. 자세히 살펴보면 빅데이터가 분명 우리의 업무에 변화를 줄 수 있는 부분이 적지 않다. 특수한 분야의 일이 아니다.

 

1. 기획자

서비스나 제품을 기획하는 기획자에게 꼭 필요한 것은 바로 ‘감’이다. 기획자들은 이 감을 바탕으로 기획을 준비하고, 또 밀어 붙인다. 그러나 결과는 순전히 운에 맡기는 수밖에 없다. 근거가 빈약하기 때문이다.

감만 믿고 사업을 시작했다가 망하는 사례들을 우리는 많이 보았다. 그러나 빅데이터를 적극적으로 활용한다면 제품/서비스의 성공은 가까워질 수밖에 없다. 빅데이터를 통해 추출된 인사이트를 통해 서비스와 제품에 대한 전략을 만들 수 있다.

이 시대에 사람들이 가장 필요로 하는 서비스는 무엇인가, 사람들이 가장 원하는 제품은 무엇인가. 이 고민들이 더 이상 머릿속 추측이 아니라 정리된 데이터를 통해 가능해진다는 이야기다.

 

2. 마케터

마케터에게 역시 빅데이터는 더할 나위 없이 중요하다. 마케팅에 이용하는 서비스, 채널 등에서 제공하는 자체 분석, 로그를 통해 이미 수많은 데이터를 제공 받고 있다. 그러나 많은 경우 이 데이터와 마케팅은 ‘따로 논다.’ 이 지표를 어떻게 읽어야 할지 모르기 때문에, PV, 체류 시간 같은 수치만 보고서에 기입해 넣을 뿐이었다.

그러나 빅데이터를 제대로 이용한다면, 이 로그를 원하는 방식으로 조합, 분석하고 이런 중요 지표들을 정리할 수 있게 된다. 어떤 마케팅을 했을 때 결과가 좋았는지, 같은 마케팅임에도 왜 결과가 좋지 않았는지 보다 직관적으로 알아볼 수 있다는 뜻이다. 성공적인 마케팅으로 가는 지름길이, 데이터 사이에 숨어 있었다.

 

3. 신사업 발굴팀

새롭게 사업을 발굴해 회사의 미래를 준비, 대비하는 신사업 발굴팀이 빅데이터를 이용하지 않는다면, 그것이야 말로 재앙일지 모른다. 이전의 신사업을 발굴하는 팀들은 시장조사와 전문가의 의견에 전적으로 의지했다. 물론, 그것이 중요하지 않다는 것은 아니다. 그러나 그것만으로 새로운 산업에 뛰어드는 것은 도박과 다르지 않다.

빅데이터를 이용하면 데이터 분석을 통해 소비자 및 기업들이 선호하는 트렌드의 변화를 파악할 수 있다. 어떤 것이 지는 것인지, 어떤 것이 뜨는 것인지 면밀히 분석 가능하다는 것이다. 그렇다면 기업은 새로운 비즈니스 기회를 찾아내고, 성장할 수 있는 방법이 생긴다. 기업이 위기에 있다면 새로운 산업을 통해 그 위기를 타계할 수 있고, 성장세에 있다면 그 상황을 굳힐 수 있는 것.

 

4. HR 담당자

그 동안 빅데이터의 필요성이 잘 들어나지 않았던 분야일지 모른다. 언뜻 생각하기에도 인사 관리에 필요한 데이터는 스몰 데이터에 가깝고, 소셜 네트워크처럼 동적이기보다는 정적인 것처럼 느껴진다. 그러나 인력관리에 대한 관심이 증대되었다. 직원의 다양성 존중, 성별, 임금 차별 철폐 등 사회적 이슈, 직원 생산성 향상, 직원 참여와 같은 부분이 회사 운영에 매우 큰 영향을 미치고 있기 때문이다.

일부 기업에서는 빅데이터 분석을 통해 이메일 트래픽을 해석해 직원의 스트레스 수준을 모니터링 하고, 사기, 비용 남용 및 관리자의 부정을 방지하기도 한다. 빅데이터는 단지 데이터 그 이상의 의미를 지닌다는 것이다. HR 담당자가 빅데이터를 업무에 접목한다면, 회사의 인사관리는 그야말로 ‘혁신’을 맞을 수 있을 것이다.

 

빅데이터를 다루는 언어, R

그렇다면 빅데이터를 어떻게 다룰 수 있다는 걸까? 그냥 데이터들을 복사 붙여넣기로 엑셀에 놓고 일반인들은 잘 모르는 수식을 입력하면 촤르륵 하고 결과가 나오는 것일까.

빅데이터를 분석하는 데에도 툴과 언어가 있다. 바로 R이다. R은 통계 분석을 위해 개발된 언어이자, 소프트웨어다. Bell 연구소에서 개발한 S라는 프로그래밍 언어를 본따 누구나 자유롭고 쉽게 사용할 수 있도록 오픈 소스로 구현한 것이다.

R은 데이터 시각화가 편리해 바로 자료를 이미지화할 수 있다는 장점이 있다. 복잡한 데이터를 직관적으로 이해할 수 있어, 그 어떤 도구보다 많이 사용된다. 다양한 통계 분석 라이브러리를 제공한다는 것도 장점이다.

널리 이용하는 회귀 분석, ANOVA, 기계 학습 알고리즘은 물론, 많은 통계학자와 분석가들이 자신만의 알고리즘을 R로 구현해 공개하곤 한다. 세 번째. 무료라는 것이다. 오픈 소스이기 때문에 성능 및 기능의 향상이 빠르게 이루어지고 있다.

R은 다른 범용 언어와 달리 통계 분석에 특화된 언어이며, 초심자가 데이터 분석을 위해 배운다면 생각보다 쉽게 이를 접할 수 있을 것이다.

 


알 수 없는 통계용어와 개념, 숫자들. 많은 이들은 포기하거나 등을 돌린다. 무료 인터넷 강의를 듣는다고 해도 전문용어들이 난무해 좋은 강의인지 아닌지조차 헷갈릴 지경이다.

미래에 데이터 전문가를 꿈꾼다면 패스트캠퍼스에서 기초부터 차근차근 시작해 데이터의 세계로 입문해보자. 비전공자/문과생의 눈높이에 맞춘 커리큘럼으로 누구나 데이터 분석을 시작할 수 있다.

패스트캠퍼스에서 비전공자를 위한 데이터 분석 인강 보러가기

Facebook Comments