데이터사이언스/인공지능

[사설] 데이터 분석가(Data analyst) vs 데이터 과학자(Data scientist)

bonanza 2021. 1. 20. 21:10

·흔히, 일상에서 많이 물어보는 질문이 있다.

 

데이터 분석가(Data analyst)와 데이터 과학자(Data scientist)의 차이가 뭔가?

 

쉽게 대답하기 힘들것이다.

아마 명확한 차이에 대해 정립해본적이 없을테니..

나 또한, 이에 대해 고민해보지 않아 실제 면접에 나왔을 때 대답하느라 혼났다.

 

시중에 서적에서 찾아보자.

과거에 읽었던 책에 있는 데이터 분석가(Data analyst)와 데이터 과학자(Data scientist)의 차이이다.

데이터 분석가는 데이터 정제 및 원인 분석과 결과 분석 작업(현황분석)을 주로 하고, 일부 경험 있는 분석가는 드물게 추정 작업(예측 분석)도 한다.
데이터 과학자는 현황 분석보다는 주로 산업별 전문 지식을 갖고 예측 최적화 작업을 한다.

- "데이터 과학 무엇을 하는가?" 김옥기 저자

그림도 첨부해본다.

- "데이터 과학 무엇을 하는가?" 김옥기 저자

쉽게 얘기해서

데이터분석가는 수집된 데이터의 기초 통계와 EDA(Exploratory Data Analysis)를 통한 포괄적인 현황분석를 수행하고,

데이터 과학자는 현황 분석보다는 산업별 Domain knowledge를 이용해 예측 작업에 집중한다고 한다.

 

다음은 ADP 교재에서 정의된 데이터 사이언티스트이다.

데이터 사이언티스트는 빅데이터에 대한 이론적 지식과 숙련된 분석 기술을 바탕으로 통찰력·전달력·협업 능력을 두루 갖춘 전문 인력을 의미한다.

 - Hard skill: 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련에 관련된 능력

 - Software skill: 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들기 위한 능력

 

아무래도 이해하기 힘들다.

 

아래 내용은 내가 이해하고 정리한 내용이다.

내가 봐서는 데이터 분석가와 데이터 과학자의 가장 큰 차이는 의사결정에 관여하느냐 안하느냐 인것 같다.

 

우리는 데이터(data)로 부터 insight를 얻기 위해서 데이터 분석을 수행한다.

또한 insight로 부터 유의미한 가치(value)창출을 하는 것이 데이터 분석의 궁극적인 목표일 것이다.

 

Data에서 insight를 얻기 위해서는 해당 데이터가 통계적인 방법론을 통해 통계적인 결론을 얻어야 한다.

이과정에 관여되는 것이 데이터 분석가(Data analyst) 같다.

또한, 이러한 데이터 분석의 산출물(insight)을 바탕으로 의사결정(Decision making)을 수행한다.

이는 최상의 가치(value)를 창출하는 것이 목표 일 것이다.

이를 관여하는 것이 의사 결정권자(Decision maker)이다.

의사 결정권자를 비즈니스 분석가(Bussiness analyst)라고도 한다.

 

그럼, 데이터 사이언티스트(Data scientist)는 무엇일까?

데이터 분석과 의사결정에 전반을 관여하는 것이 데이터 사이언티스트(Data scientist)라고 생각한다.

쉽게 얘기해서 Data의 수집을 위한 도메인적 지식(Domain knowledge)과 통계적인 지식(인공지능을 포함한)을 통해 insight를 발굴하고, 이를 통해 가치(value)창출을 위한 의사결정(Decision making)에도 관여하는 것 같다.

 

예를 들어, "A사업 vs B사업에 투자할까"라는 의사결정을 위해서는 A사업과 B사업에 대한 데이터 수집을 통해 통계 분석을 할 것이다.
A사업이 1,2,3번 관점에서 우세하고 B사업이 4,5,6번 관점에서 우세하다는 통계적 결론이 나온다면 이과정을 수행하는 것은 데이터 분석가(Data analyst)일 것이다.
여기에 1,2,3,4,5,6의 관점에 대한 기업환경(비용, 인력 등) & 내외부적인 환경 등을 고려하고 우선순위를 뽑는 일까지 하는 것이 데이터 사이언티스트(Data scientist)같다. 

 

그래서 내가 봐선 도메인적 지식(Domain knowledge)을 통해 데이터 분석 결과에 insight를 반영하여

의사결정에 관여하느냐 안하냐가 큰 차이인것 같다.

(데이터를 해석하여 첨언을 할 수 있냐 없냐 이다)

 

아직 정립된 의견이 없기에 개인적 의견이다.

누군가가 정리해서 얘기해주길 바란다.

반응형