본문 바로가기
취업특강

[데이터직군] 신입 데이터 직무 취업 필승 전략 특강(전 삼성전자 stellar 멘토님)

by 모닥불🔥 2024. 5. 15.

지난 화요일에 제로베이스(zero-base)라는 사이트에서 또 취업 특강을 한다길래, 예약하고 강의를 들었다.

생각보다 도움을 받아서 후기를 작성하게 되었다.

 

 

zoom으로 진행된 강의, 스텔라 강사님은 '데이터로 더 나은 세상을 만드는 사람들'이라는 주제로 강의를 시작하셨다.

 

일단 개괄적인 소개를 해주셨음. 강사님은 데싸(데이터 사이언티스트) - 프로젝트 매니저(ML/AI) - 데분(데이터 분석가)까지 다양한 데이터 관련 직군에서 종사했고, 한 12년차 정도 되었다고 하셨다(기억이 부정확할 수도 있음). 산업도 플랫폼 기업이나 화장품 회사 등 여러 곳에 머물렀었다고 함.

강의 순서는 이러했다. 데이터로 일하는 장점과 비전, 데이터로 일하는 각 직무의 역할, 포트폴리오 작성 팁! 3번이 가장 유용했으므로 1, 2번은 정말 정말 가볍게 넘어가겠음

 

챕터 1 요약. 현존하는 데이터의 90%는 최근 10년 이내에 생성되었다고 한다. 그만큼 데이터는 아주 기하급수적으로 생성되고 있는 셈... 그러고 보면, 지금 쓰고 있는 블로그를 포함하여 최근엔 공급자와 수요자 구분 없이 모든 이들이 데이터를 생성하고 소비하고 있다. 그런 의미에서 데이터 분야 자체가 계속 유망할 것임은 분명하다. 또한 여러 직군에서 다양하게 필요성이 대두되고 있으며, 비즈니스 의사결정 과정에 객관적 근거로서 사용된다. 그 결과로 조금 더 나은 세상을 만드는 데 기여할 수 있다고 함

 

 

데이터 활용 프로세스

먼저 비즈니스 문제를 정의하고 - 관련 데이터를 수집, 저장한 다음 - 데이터를 이해하기 위한 탐색/정제 과정을 거치고 - 데이터 분석 또는 모델링 단계를 수행한다. - 결과를 바탕으로 비즈니스 의사결정을 내리게 된다.

데이터 분석가와 싸이언티스트는 서로 유사하고 두 직무 간 이동도 잦은 편이라 묶어서 설명하면, 직무별로 핵심 단계가 조금씩 다르다.

  • 데이터 엔지니어는 데이터의 수집 및 저장에 더 초점을 둔다.
  • ML/AI 엔지니어는 데이터 탐색, 정제, 데이터 모델링에 초점을 둔다.
  • 데이터 분석가와 데이터 사이언티스트는 주로 데이터분석 또는 모델링을 하고, 이를 기반으로 비즈니스 의사결정을 돕는다(타 부서 설득 등).

다만 모든 직무에서 동일하게 중요한 부분은 "비즈니스 문제 정의" 이다. 어떻게 문제를 정의할 것인지가 가장 중요하다.

 

합격 포트폴리오 예시도 보여주었는데 그건 굳이 첨부하지 않겠음.. 아래는 질문 목록과 그에 대한 답변을 정리한 부분이다.

 

Q. 데이터 분석가, ML 엔지니어, 데이터 엔지니어 무슨 차이인가요?

엔지니어: 문제 정의, 문제에 맞는 데이터 수집 (무슨 요리 할거지? 아 재료 뭐 필요하겠다.)
분석가: 문제 정의, 데이터분석, 인사이트 끌어내기, 의사결정 지원(요리사)
머신러닝: 문제 정의, ML, 모델 데이터 정제 탐색 , 서비스 만들어내기 중간단계(조미료 만드는 회사?)

Q. 데이터분석가는 코딩만 주구장창 하는 사람인가요?

아니요! 숫자, 자료만 화면 너머로 다루는 딱딱한 일이 아니라 현실반영 잘 해야 됩니다.

 

Q. 포트폴리오는 어떤 걸 담아야 하나요?
경력자라면 이 사람이 해온 일을 보여줄 수 있는 포트폴리오

/ 신입: 이 사람을 써도 되겠다는 판단의 근거가 될 수 있는 포트폴리오
읽는 사람이 기대하는 자료, 만나보고싶은 느낌을 줄 수 있는 포트폴리오
크게 아래 3가지 내용을 필수적으로 담아내세요.

 

1. "직무"의 역할과 미션을 잘 이해하고 있나?
2. 충분한 직무 수행 역량을 가지고 있는가??
3. 가치나 기여도. 우리 회사에 들어왔을 때 얼마나 도움이 될까?

 

Q. 데이터분석가의 역할은?
- 의사결정 지원, 비즈니스 문제해결을 위해 데이터를 사용한 인사이트 도출
- 주제, EDA, 가치제공 경영전략제시

Q. 목차/개요가 중요한 이유
채용 담당자는 포트폴리오를 엄청 많이 봐야하니까 개요를 중심으로 가볍게 살펴볼 수밖에 없는데,
직무에 요구되는 부분을 다 커버하고 있는 것 같은지?를 보고 구체적으로 봅니다.
표지, 개요 보고 읽을 책 선택하는 것처럼..!

개요 부분에서 오... 읽어볼만하겠다. 라는 인상을 줄 수 있어야 합니다.

문제정의를 안하고 바로 본론으로 들어간 포트폴리오는 굉장히 아쉬움...
면접에서 설명? NO. 면접에 갈 기회를 잡기 위해 포트폴리오에서 잘 설명해야 합니다.

나의 기술적 역량이 있음을 보여줘야 해요. 요약해서.

가독성이 굉장히 중요. 짧은 시간 내에 빠르게 캐치할 수 있도록 하면 유리합니다.

많은 차트를 찍어내서 양만 늘리는 것보다, 필요한 그래프 몇 개만 압축해서 보여주도록.
중요도를 판단하는 스킬 또한 굉장히 중요함. 의미 있는 것만 담기!

 

tip 목적에 적합하지 않은 차트는 스스로 배제할 것. 

같은 유형의 차트만 반복적으로 사용하면 감점요소가 될 수 있으니 풍성하게 사용하되, 목적에 맞게 사용

간혹 코드를 캡처하는 경우가 있는데, 코드 레벨을 하나하나 보지도 않고, 

자잘한 코드에서 실수나 습관이 발견되면 감점이 됨...ㅠ 

회사에서 반드시 넣으라 요구한 게 아니면 넣지 않도록 하세요.

 

ML 엔지니어의 경우, 성능이 가장 좋은 모델을 선정하게 되는데, 여러 방법론을 비교해주면 플러스요인!
수치값 넣어서 뭐가 좋은진 알겠지만, 최종 선택한 모델의 '이유'를 간단하게 적어 넣으면 면접에서 디테일하게 물어볼 듯

신입인 경우, 역량을 보긴 하지만 소프트스킬: 의사결정, 문제해결역량 등을 더 많이 봄
외부에서 학습한 데이터와 실무 데이터가 많이 다르기 때문에...경쟁자 대비 '왜 데이터를 활용해야 하는지 알고 있구나' 로 판단!

 

Q. 어떤 주제로 분석을 해야 할까요?

모든 회사에 맞는 분석 주제를 정하긴 어렵겠지만, 정말 일하고 싶은 회사나 분야가 있다면 관련 주제를 선정하는 것이 굉장히 유리함. 도메인에 대한 관심도 있고, 고민해본 경험이 있으니 빠르게 학습할 수 있겠다는 인식을 줄 수 있다.

Q. ML 지원자는...
머신러닝 모델을 사용한 문제해결을 대부분 함. 실제 제품 서비스 개발 등은 어려우니까
각 단계에서 포함한 내용을 키워드 형태로 제시..!
면접관 입장에서 쉽고 빠르게 읽도록 하는 게 중요하니까 너저분해보이더라도 간단 요약 기재

 

외부데이터 활용시 ""출처, 기관""을 적어두지 않으면 안됨!! 평가기준 중 하나가 되기도 함

 

탐색 단계에서 데이터를 쭉 탐색하면서 사전 지식을 데이터로부터 끌어내는 단계
무작정 다양한 그래프 찍어내는 건 별루임...ㅠ 강조하고 싶은 것을 강조

그래프 보여주고, 옆에 요약해주는 부분이 좋다. 

그래프를 일일이 해석하는 노력을 기울이지 않도록 적절히 요약해주면 good 

필요한 정보를 잘 끄집어낼 수 있는 사람이구나 하는 포인트. 직무 역량, 업무 역량을 보여준다고 생각하고!

머신러닝: 데이터 정제 탐색 등이 중요하므로 이상치 제거, 데이터 정제 내용을 꼭 적어두도록 한다.
굳이 디테일한 코드를 첨부하기 보다는 의미와 그래프 위주로 정리해도 충분함

머신러닝: 좋은 성능이 나오는 모델을 완성하는 게 중요함. 서비스를 만드는 걸 보여줄 수 없지만 모델 완성하고 평가지표!
요 모델이 성능이 제일 좋으니, 그걸 택했습니다. 보다는 튜닝을 해서 성능을 한 번 더 끌어 올리는 작업을 해보면 '업무 역량 어필이 됨' - 어려운 상황에서도 일을 해내겠군.
실무에서 짧아도 4-5번 정도의 튜닝과 이터레이션을 하는 경우가 많으므로, 포트폴리오에서 의도적으로 표현하는 것이 중요함

비즈니스 가치로 좋은서비스와 모델의 결과를 보여주는 것이 중요하므로, 더 좋은 포트폴리오 더 만나보고 싶은 사람이 된다. 향후 계획을 기재해도 좋을 듯.... 이렇게 예측했고, 개인 마케팅을 해보면 좋을 것 같아요. 추가적으로 고객 등급에 따라 달라지는지 분석하면 더 좋은 마케팅이 될 수 있지 않을까요?
-> 요런 식으로 마무리하는 게 팁이다.

 

Q. 포트폴리오는 양 vs 질?
많은 포트폴리오보다 완성도 높은 포트폴리오 하나가 낫다.

Q. 데이터분석, 사이언티스트 비교?

미션과 역량 측면에선 차이가 별로 없다. 회사마다 부르는 명칭이 달라지기도 함. 하나의 회사에서 둘 다 있는 경우라면, (극히 적음)

분석가는 요청된 내용에 대해 분석 제공, 요 문제 분석해서 파악해주세요. 대시보드 만들기, 모니터링...

데싸는 조금 더 직접적으로 제품, 서비스 내에 들어가서 어떤 분석이 필요할지 논의하고, 분석하고, 더 나은 서비스 개발, 모델링도 다양하게 접근

 

Q. 성향에 따라 데싸/데분 선택하세요.
나는 a-z 업무 정해진 게 좋음 - 분석가
문제만 주어지면 다양하게 시도하겠슴 - 데싸
혼재해서 쓰는 경우가 많고, 이직하면서 직무간 이동도 많아서 별로 큰 의미는 없지만요.

KPI
에독?요청 진행 처리를 몇 건 했는지 등을 kpi로
처리를 단순히 빠르게 하기보단 의미있는 비즈니스 기여에 중점을 두므로, 성장에 기여한 것, 의미있는 의사결정을 내리는 것에 도움을 준것을 카운트함

Q. 처음 데이터분석 프로젝트를 하려고 하면요?
가장 쉬운 것! 취업에 쓸 수 있는 포트폴리오를 만들어야겠다보다는 모범 답안이 있는 포트폴리오. 과거 누군가가 오픈데이터로 어떠한 분석을 해냈다 라고 하는 답지가 어느정도 있는 데이터를 다뤄보자. 계속 컨닝을 하란 의미는 아니고, 같은 데이터를 가지고 나는 어떤 문제, 어떤 관점에서 어떤 방법으로 분석할지 설계하고 쭉 분석한 뒤에 비교하다 보면 분석 사례 등을 비교할 수 있을 듯...!

Q. 책 추천해주세요.

책 추천: 팩트풀니스 - 한스 로슬링 // 데이터문해력 - 카시와기 요시키
팩트풀니스...!
데이터를 잘못 오해하고 다룰 수도 있다. 데이터를 다루는 사람이 그런 실수를 하면 회사나 협업 파트너가 실수, 왜곡하게 될 수 있으니까 미리 bias를 인지하는 것이 중요.
팩트풀니스: 면접에서 함정질문에 빠지지 않을 수 있음
데이터문해력: 결과를 숫자가 아니라 의미로 받아들이고, 뭘 해야할지 사고하는 데 좋은 책

 

Q. 연차의 기준과 기대하는 정도
연차 기준은 없지만, 3년 이하 주니어 또는 신입에게는 기본적으로 '원하는 조건으로 데이터 추출 가능? SQL 역량' , 가설 검정, 예측이 필요할 때 예측 모델을 만들어보고 쪼끔 튜닝해서 쓸 수 있는가? 정도를 기대한다. 그다음으로 가면 중니어(3-7년 사이) 스스로 문제 정의를 잘 할 수 있는지, '추천 서비스 개발해야하는데 데이터를 기반으로 잘 설계해봐.' 라는 걸 기대함....!

 

Q. 타 분야 경력 사항을 쳐줄까요?
데이터 경력이 없다고 하면, 과거 경력을 경력사항으로 보진 않음. 주니어에게 기대되는 정도의 역량을 가지고 있느냐 정도만 볼 듯...! 그게 아니더라도 조직 내에서 역할을 한 적이 있다 라는 점에서는 타 분야 직무 경험이 강점이 될 수 있음 (사이드 경험) 인사팀에서 경력을 인정하느냐와는 별개임! 도메인 연결성을 어필해보자.

Q. 다른 사람의 포트폴리오는 어떻게 참고하나요?

취업스쿨에서 공개하고 있는 공개 포트폴리오를 참고하거나,

캐글처럼 동일한 문제에 대해 다양한 답변을 올리는 커뮤니티 참고(해외 커뮤니티 많음)해서 만들기

Q. 데이터관련 자격증 취득?

자격증 자체가 채용과 합격을 결정짓지는 않음!! 단.호.
그럼에도 플러스가 되는 부분은 직무에 대한 관심도와 준비, 노력을 했다. 기본적인 부분은 알고 있겠구나 정돈 검증 가능할 수 있겠다.
같은 시간이 든다고 하면, 공개 데이터로 실제 분석해보는 것이 자격증 취득하는 것보다 낫다...ㅠㅠ 훨씬 낫다!
그럼에도 자격증은 좀 자신 있어서 시험 잘 칠 수 있어서 해보고 싶다 하면 ADsP, SQLD 많이 따더라.

 

Q. 데이터 분석 포트폴리오: 줄글보다 PPT로 작성하는 것이 좋은가요?
네. 실제 일할 때도 피피티로 많이 발표함, 가독성이 더 높음(면접관의 집중도를 위해)

 

요정도로 정리해 두고 자주자주 참고해야겠다.