채용공고로 알아보는 데이터 분석가, 사이언티스트, 엔지니어가 하는 일
데이터 관련 직군, 하는 일에서 기술 스택까지 채용공고를 통해서 살펴봅시다.
Mar 28, 2024
‘데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어’ 데이터 직무를 설명하는 비슷한 단어 사이에서 길을 잃으셨나요? 오늘은 데이터 직무 3대장이라고 불리는 데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어가 어떤 일을 하는지 이해하고, 채용 공고를 살펴보며 어떤 준비가 필요할지 알아봅시다.
데이터 분석가 vs 사이언티스트 vs 엔지니어
데이터 분석가 (Data Analyst)
데이터 분석가는 데이터를 분석 및 처리하여 의미 있는 비즈니스 결과를 창출하는 사람입니다. 데이터 직무 중 가장 비즈니스 영역과 밀접합니다.
데이터 분석가의 업무 프로세스를 거칠게 요약하면 데이터 수집 → 데이터 정리 → 통계 분석 및 모델링 → 대시보드 및 보고서 생성의 4단계로 분류할 수 있습니다.
먼저 무질서한 로우 데이터(raw data)에 분석할 기준을 세우고, 이에 따라 정리합니다. 로우 데이터는 데이터베이스에 SQL이라는 프로그래밍 언어 형태로 저장되어 있는데요. 데이터 분석가는 SQL 문법에 맞게 명령을 내려 데이터를 추출하고, 엑셀이나 파이썬을 비롯한 분석 도구로 데이터를 분석합니다. 이후 분석 결과를 토대로 가설을 세우고 대시보드나 보고서를 작성하여 팀에 공유하죠. 이때 태블로(Tableau)나 각종 BI 도구를 활용하여 직관적으로 이해할 수 있는 시각 자료로 조직의 문제 정의를 돕습니다.
*로우 데이터(raw data): 정보로 처리되기 전 가공되지 않은 데이터
👉데이터 분석가 취준생이라면 꼭 알아야 할 정보들이 더 궁금하다면? 링크
데이터 사이언티스트 (Data Scientist)
데이터 사이언티스트는 딥러닝, 머신러닝 모델을 개발하여 데이터의 패턴을 예측하는 사람입니다. 데이터 분석가보다 개발 분야에 가까운 직무로, 수학/통계, 컴퓨터 과학 지식도 겸비해야 합니다.
비즈니스 문제를 정의하고, 여기에 맞는 로우 데이터(raw data)를 탐색한 후 데이터를 정리합니다. 데이터 사이언티스트는 보통 엄청나게 많은 데이터를 수집하는 빅테크에 있는 직무라서, 이렇게 대규모의 데이터를 처리하려면 인공지능 역량이 필요합니다. 데이터 분석가와 마찬가지로, 이 결과는 비즈니스 의사 결정에 도움을 주죠.
데이터 사이언티스트는 데이터 분석가의 기술 역량과 동시에 딥러닝, 머신러닝을 위한 수학(선형대수학, 미적분학, 확률, 통계 등)과 고급 통계에 대한 지식도 필요합니다. 기본적으로 수학적인 역량을 가지고 있고, 과제를 해결하는 데 즐거움을 느끼는 사람이라면 데이터 사이언티스트에 더욱 적합합니다.
데이터 엔지니어 (Data Engineer)
데이터 엔지니어는 데이터 사이언티스트와 데이터 분석가가 데이터를 활용할 수 있도록 인프라를 구축하는 사람입니다. 데이터의 백엔드를 맡고 있다고 이해하시면 쉽습니다. 데이터 직무 중 가장 개발직군에 맞닿아 있습니다.
데이터 엔지니어가 하는 업무는 데이터 파이프라인을 구축하는 일입니다. 이를 크게 분류하면 E, T, L로 설명할 수 있습니다. E(Extract)는 데이터 수집으로, 기본적인 데이터 형태(Excel, CSV, JSON) 등을 직접 받아오거나 웹, 앱의 로그를 추출합니다. T(Transform)는 데이터 가공으로, 데이터를 분석하기 쉬운 데이터로 변환합니다. row, column 형태로 변환하여 SQL로 활용할 수 있도록 만듭니다. L(Load)은 데이터 적재로, 변환한 데이터를 데이터 창고(데이터 웨어하우스)에 저장합니다. 데이터 엔지니어는 ETL 과정을 거쳐 기업의 데이터 파이프라인을 구축하게 되는데요. 데이터 파이프라인이 제대로 설계되지 않으면 나중에 데이터를 읽어오는 데 굉장히 오랜 시간이 걸리거나 새로운 기능을 개발했을 때 기존의 데이터베이스 규격과 맞지 않아서 정보를 저장하지 못하는 문제들이 발생할 수 있습니다.
ETL 과정은 대부분 백엔드에서 이루어지기 때문에 백엔드 엔지니어 역량과 상당 부분 일치합니다. 그래서 백엔드에서 데이터 엔지니어 혹은 그 역으로 전향하는 경우도 많습니다.
컴퓨터공학 기초, 프로그래밍 언어, 데이터베이스 등 모든 것들을 알아야 하는 것은 아닙니다. 원하는 포지션의 채용 공고를 살펴보면서 하나씩 준비하는 방법을 추천해 드립니다.
위 세 직무를 한 줄로 정리하면 아래와 같습니다.
- 데이터를 분석하여 마케팅, 비즈니스적 제안을 하는 직무: 데이터 분석가
- 머신러닝으로 데이터 패턴 예측: 데이터 사이언티스트
- 데이터를 수집 및 관리하는 직무: 데이터 엔지니어
어떤 플랫폼이 재방문 주기가 지났는데도 앱에 접속하지 않는 고객에게 무료 쿠폰을 주고 싶습니다.
재방문 주기를 계산하기 위해서는 데이터 엔지니어가 구축한 데이터 파이프라인이 필요합니다. 데이터 엔지니어는 고객의 데이터를 빅데이터 시스템에 저장합니다.
저장한 데이터로 데이터 사이언티스트는 재구매 주기를 계산하기 위한 머신러닝 로직을 개발합니다. 예측 모델을 만들어서 고객이 언제 재구매할 것인지를 파악합니다.
데이터 분석가는 머신 러닝 데이터로 가설을 세우고 데이터 보고서를 만들어 마케팅 제안을 합니다.
채용 공고 살펴보기
각 직무로 취업하려면 어떤 스킬들을 익혀야 할까요? 채용공고를 통해 확인해 보세요.
데이터분석가 채용 공고
토스
당근
우아한형제들
취업에 필요한 하드스킬
- 데이터 분석 프로그래밍 언어: SQL, 파이썬, R
- 데이터 시각화 도구: Tableau 혹은 Superset
취업에 필요한 소프트 스킬
- 커뮤니케이션 능력
데이터를 다각적으로 보면서 문제를 해결하는 직무이기 때문에, 타 부서나 팀원과 커뮤니케이션을 통해 더 나은 의사 결정을 해야 합니다. 데이터를 바탕으로 경영진을 설득해야 하므로 자신의 데이터를 논리적으로 설명하는 능력이 필요합니다.
- 도메인 이해
데이터 분석가는 해당 도메인에 대한 지식이 데이터를 보는 관점을 달리할 수 있습니다. 결국 데이터를 보고 인사이트를 도출하는 작업이므로 그 데이터를 얼마나 깊게 파고드는지에 따라 문제 해결의 결과가 달라질 수 있습니다.
세 기업 모두 앞서 말한 데이터 분석가와 흡사한 하드 스킬과 소프트 스킬을 제시했습니다.
주목할 만한 점은 우아한형제들의 코딩 테스트입니다. 우아한형제들, 카카오 같은 일부 기업에서는 데이터 직렬이라도 코딩 테스트를 보는 경우가 있는데요. 코딩 테스트는 정해진 시간 안에 얼마나 효율적으로 문제 해결을 했는지 기술적으로 판단하는 근거가 되기 때문입니다. 우아한형제들의 코딩테스트는 프로그래밍 언어를 어느 정도 사용할 수 있고, 통계 및 기계학습에 대한 기초적인 지식이 있다면 어렵지 않게 볼 수 있다고 합니다.
데이터 사이언티스트 채용 공고
토스
당근
우아한형제들
취업에 필요한 하드스킬
- 데이터 분석 프로그래밍 언어: 파이썬, R, SQL 등
- 머신 러닝과 관련된 수학, 통계학
- 머신 러닝 알고리즘
- 대용량의 비정형 데이터를 다루는 워크플로우: Airflow 등
- 빅데이터 플랫폼: Hadoop, Spark, Hive 등
취업에 필요한 소프트스킬
- 학습 능력과 호기심
머신 러닝, 딥러닝 등 AI에 대한 공부가 필수적으로 요구됩니다. 앞으로 AI는 폭발적으로 발전할 예정이기 때문에 고등 수학과 통계학을 연구할 수 있는 사람이라면 더욱 좋습니다.
데이터 사이언티스트 공고에서는 머신 러닝에 대한 이해와 활용이 가장 두드러졌습니다. 우아한형제들은 데이터 분석가부터 데이터 사이언티스트까지 머신 러닝 소양을 꾸준히 강조하고 있습니다. 배민 데이터 직렬을 희망하는 분들이라면 머신 러닝에 대한 지식을 가지고 있으면 좋을 듯 합니다.
데이터 엔지니어 채용 공고
토스
당근
우아한형제들
데이터 엔지니어는 공통적으로 대용량 데이터 파이프 라인 구축을 위한 프로그래밍 언어, 클라우드 서비스, 빅데이터 프레임워크, 머신러닝 이해가 필요합니다.
취업에 필요한 하드스킬
- 컴퓨터 전산 능력: 백엔드와 유사
- 프로그래밍 언어: 파이썬, Scala, Go, R 등
- 빅데이터 프레임워크: Hadoop, Spark, Flink, Hive, Big query 등
- 클라우드 서비스 이해: AWS, GCP, Azure 등
- 머신러닝 알고리즘 이해
취업에 필요한 소프트스킬
- 커뮤니케이션 능력
데이터 엔지니어는 같은 데이터 직군인 데이터 분석가와 데이터 사이언티스트는 물론이고, 프론트엔드, 백엔드 개발자, 비개발직군과도 소통하는 업무가 많습니다. 사람들이 데이터를 잘 활용할 수 있도록 소통하는 작업이 필수적입니다.
- 데이터베이스와 데이터에 대한 깊은 이해도
데이터의 속성에 대한 깊은 이해를 바탕으로 데이터 마트를 잘 관리해야 합니다. 데이터가 잘 적재되지 않으면 이후 데이터 처리 과정에서 문제가 발생하여 이해관계자들의 업무에도 차질을 빚을 수 있습니다.
채용 한파 속에도 공고가 끊이지 않는 데이터 직무
정부는 2025년까지 데이터 시장에 43조원을 지원하고, 일자리 90만개 창출을 계획하고 있다고 합니다. 데이터 분석가, 사이언티스트, 엔지니어 업무가 중점을 두는 부분은 각각 다르지만, 데이터를 통한 비즈니스적 의사 결정 마인드를 갖춘다면 전공과 관계 없이 개인의 역량에 따라 커리어를 쌓을 수 있는 매력적인 직업입니다.
이 아티클을 읽으시는 분들은 데이터 분석가 취업에 관심이 많으실텐데요. 데이터분석 취업 준비가 궁금하다면 내일배움캠프에서 제공하는 취업 3종 패키지 무료로 받아보세요. 카카오톡 플러스친구를 추가하시면 데이터 분석가 로드맵, 이력서 작성 꿀팁과 탬플릿을 무료로 다운받으실 수 있습니다.
내일배움캠프가 데이터 분석가 취업의 꿈을 이뤄드립니다
내일배움캠프는 독보적인 커리큘럼으로 차별화된 포트폴리오를 만들고 있습니다. 업계 트렌드와 전문성을 갖춘 운영진이 이력서 작성부터 자체 채용 플랫폼, 면접까지 전 운영진이 열과 성을 다해 수강생의 취업까지 함께하고 있습니다. 내일배움캠프와 함께 데이터 분석가의 꿈을 이뤄보세요.
CREDIT
글 | 정효재 팀스파르타 에디터
취업 준비, 어디서부터 시작해야 할지 모르겠다면?
🧐비전공자인데 IT 업계 취업할 수 있을까?
😟프로젝트 경험이 부족한데, 어떻게 준비해야 할까?
🥺IT 기업으로 이직하고 싶은데 뭐부터 시작해야 할까?
이런 고민을 하고 있다면, 내일배움캠프의 IT 취업 컨설팅을 받아보세요.
취업 코칭 전문가들이 여러분의 고민을 해결해 드립니다.
다음 링크에 이메일을 입력하시면 메일로 1:1 커리어 상담권과 취준 자료집을 보내드릴게요.
Share article
Subscribe to our newsletter