작성일 : 14-08-18 10:55
요즘 가장 핫한 직업, ‘데이터 과학자’
 글쓴이 : 한국HR컨설…
조회 : 1,089   추천 : 0  

요즘 가장 핫한 직업, ‘데이터 과학자’

 

 

 
Ramin Rahimian for The Wall Stre
공유경제 사이트 태스크래빗에서 데이터 과학자로 근무하는 천체물리학자 사바 주베리는 이 업무가 놀랄만큼 보람있다고 말한다.

 

 

크리스 페렐(28)은 천체물리학 박사학위를 받기까지 5년이란 시간을 거대한 분자 가속기에서 데이터를 수집하는데 할애했다. 하지만 요즘 그의 주업은 온라인 리뷰 사이트 옐프에서 등급을 분석하는 것이다.

페렐은 소위 ‘데이터 과학자’다. 3년전만 해도 존재하지 않던 직함이지만 이젠 고용시장에서 가장 핫한 분야로 떠올랐다. 인터넷 클릭과 각종 기기들, 스마트폰을 통해 정보들이 쏟아져나오면서, 소매업체와 은행, 중장비 제조사, 결혼중매업체까지 기업들은 너나 할 것 없이 이같은 정보를 추출해내고 분석하는 전문가를 필요로 하고 있다.

 

 

데이터 과학자에게 요구되는 스킬의 조합이 너무도 특이하기 때문에, 그들은 종종 “유니콘”으로 불린다. 링크드인에서 데이터 과학팀을 이끄는 조나단 골드만의 설명이다. 그의 팀은 2007년 ‘알 수도 있는 사람(People You May Know)’ 버튼을 개발했는데 5년 후 링크드인에서 이뤄지는 초대 메일의 절반 이상이 이 버튼 덕분일 정도로 위력을 발휘하게 된다.

기업이 원하는 이상적인 데이터 과학자는 기존의 시장 리서치 스킬 그 이상을 갖고 있어야만 한다. 갖가지 소스를 통해 유입되는 수백만 개의 데이터 조각에서 일정한 패턴을 찾고 이런 패턴에서 고객의 행동 성향을 추측해낸 뒤 특정 행동을 유발하는 요인을 집어내는 통계학적 모델을 작성할 수 있어야 한다.

일례로 전자상거래업체 엣시에서는 수년간 유방암 조기 진단을 위해 의료기록을 수집하던 생물통계학자가 이젠 사람들이 길거리에서 본 새로운 패션 스타일을 엣시에서 검색할 때 어떤 용어를 사용하는지 파악하는 모델을 작성한다.

모바일 지불결제 서비스 스퀘어에서는 사람들이 어떻게 자신의 정치적 신념을 바꾸는지를 평가하는 통계학적 모델을 작성하던 인지심리학자가, 이젠 어느 판매업체에 고객의 환불 요구가 많을지 알아내기 위한 행동 패턴을 연구한다.

 

 

응용수학 박사학위를 소지한 28세의 옐프 데이터 과학자 스캇 클락은 게놈지도에 관한 자신의 박사 논문을 옐프 광고팀이 사용할 수 있는 제품으로 변모시켰다. 현재 이 게놈지도 알고리즘은 온라인 광고에 다양한 변화를 줄 경우 이것이 소비자에게 미치는 영향을 파악하는데 사용된다.

클락은 “학계는 뭐든지 더딘 데다 내 작업이 몇몇에게만 보여진다. 하지만 옐프에서는 수억 명에게 영향을 줄 수 있는 실험을 할 수 있다”고 말했다.

하지만 이런 실험을 우려하는 목소리도 높다. 페이스북 데이터 과학팀은 최근 사용자의 감정을 조작하는 실험으로 도마에 오른 바 있다.

IAC/인터액티브코프의 온라인 데이팅 사이트 오케이큐피드의 크리스찬 러더 대표는 블로그 포스트를 통해 사이트 이용률을 높이기 위해 어떤 두 남녀의 매칭 확률을 올리는 식으로 피드를 조작했음을 고백했다.

현재 소프트웨어 개발업체 인튜이트에서 데이터 과학팀을 이끌고 있는 골드만은 기업들이 최고의 인재를 영입하기 위해 매우 적극적이라고 귀띔했다. 요즘 기업들은 지원자를 인터뷰한 지 하루이틀 내에 취업제안을 할 준비가 돼 있어야 하며 밤이나 낮 어느 때고 지원자를 만날 수 있어야 한다.

박사학위를 취득한 지원자가 억대 연봉을 제시받는 건 종종 있는 일일지 모르지만, 고용담당자들에 따르면 경력 2년인 데이터 과학자의 연봉은 무려 20~30만 달러 사이라고 한다.

 

 

 

링크드인 페이지에 직함이 데이터 과학자인 사람은 고용담당자들로부터 하루에 100통 가량의 이메일을 받는다고 한다. 컨설팅업체 부즈앨런해밀턴의 조쉬 설리반 데이터 과학팀 팀장의 말이다. 그는 능력있는 지원자의 마음을 사로잡기 위해 손수 쓴 편지를 보내는가 하면 비행기를 타고 전국 어디든 날아가 지원자의 배우자를 만나기도 한다. 통계학과 컴퓨터과학 등 지원자가 관심있을 만한 분야에 관한 서적과 초컬릿 등을 담은 선물꾸러미를 보내기도 한다.

데이터 과학자 부족현상은 수치에도 고스란히 드러난다. 구인구직 사이트 심플리하이어드닷컴과 링크드인에는 현재 2만4,000~3만6,000개의 데이터 과학자 구인광고가 게재돼 있다. 또 다른 사이트에는 지난해 말 기업 6,000곳이 데이터 과학자를 고용한다고 나와있다.

2012년 기준 데이터 과학자들의 주요 전공분야인 통계학, 생물통계학, 분자물리학, 컴퓨터과학 분야에서 배출된 박사학위 소지자는 2,500명이었다. 이러한 수급불균형을 해소하기 위해 지난 1년 동안 버지니아대, 컬럼비아대, 오하이오주립대 등 미국 내 6개 대학은 데이터 과학 분야 자격증 및 석사 프로그램을 시작했거나 시작할 계획이라고 밝혔다.

기업들은 ‘인사이트 데이터 과학 펠로우 프로그램(IDSFP)’이라는 인재등용 프로그램으로도 눈을 돌리는 추세다. 천체물리학과 신경과학, 수학 분야 박사학위 소지자들을 기업과 연결해주는 프로그램이다. 스탠포드대 근처에 소재해 있으며 기술기업들의 후원을 받는 IDSFP는 취업률 100%를 자랑한다.

IDSFP 출신은 실리콘밸리 기존기업 뿐 아니라 에어비앤비, 팔란티르 테크놀러지스, 조본 같은 스타트업 데이터 과학팀에서도 일한다. IDSFP는 올 여름 뉴욕시로도 사업을 확대했다. 뉴욕에서도 비아컴의 MTV, 메모리얼 슬론-케터링 암센터, 캐피탈원, 뉴욕타임즈 등 많은 기업이 데이터 과학자를 채용하고 있다.

 

 

5년 전이라면 학자의 길을 걷거나 월가로 진출했을 데이터 과학자들은 경기침체기 동안 과학연구에 대한 펀딩이 줄어들었기 때문에 IT 업계의 러브콜이 실감난다고 말했다.

웨어러블 헬스케어 기기업체 조본의 경우 IDSFP 출신이 이끄는 데이터 과학팀은 사용자들이 수면 목표치를 채우는데 ‘오늘 나는 ~할 것이다(Today I will)’ 버튼이 도움이 됐다는 사실을 알아냈다. 몇 시간 잠을 잘 것인지 약속하게 돼 있는 버튼을 클릭한 사용자는 평균 23분 일찍 잠자리에 든 것.

공유경제 사이트 태스크래빗에서 데이터 과학자로 근무하는 천체물리학자 사바 주베리는 이 업무가 예상외로 보람있다고 말한다.

태스크래빗은 상자 포장이나 집안일 같은 자질구레한 일을 대신해 줄 ‘래빗(인력)’을 중개해준다. 주베리는 래빗 목록을 작성하기 위해 6개월 동안 근로자의 위치, 스케줄 상의 제약, 경험, 등급, 지급률, 고용자의 특징 등을 토대로 모델을 구축했다. 따져봐야 하는 요인이 늘어날수록 모델도 더 복잡해진다.

시간의 경과와 함께 소프트웨어는 어떤 요인이 어떤 고객에게 더 중요한지를 파악해 목록을 다듬어나간다. 주베리는 알고리즘 디자인이 분자물리학의 새로운 이론을 증명해내는 것보다는 지적으로 덜 도전적일지 몰라도 훨씬 의미있게 느껴진다고 말했다.

“이건 단순한 목록이 아니다. 사람들의 생활에 직접적인 영향을 미치는 작업이다.”

 

 

- 월스트리트저널