본문 바로가기

데이터사이언스5

[파이썬] 파이썬 입문 데이터분석 프로젝트 만들기 - (12) groupby 그룹별 집계하기 링고선생님의 파이썬 데이터분석 프로젝트 강의!강의자료로는 3-7 내용이다. 강의는 홈페이지에서 구매할 수 있음..!(사진 누르면 링크 이동)🔥 강의 목차오리엔테이션파이썬 기초 문법데이터 전처리데이터 시각화마케팅 데이터 분석 및 지표 정의하기🔥 그룹화(df.groupby)데이터를 집계할 때, 항상 전체 데이터만 집계할 순 없다. '성적' 데이터를 예로 들어 보자. 학교 전체 성적 평균, 표준편차 등을 구하는 것도 물론 의미가 있다. 하지만 반별 평균을 구하거나, 과목별 평균을 구해야 하는 경우가 더 많을 것이다. 즉, 집계를 위해 기준에 따라 그룹화 하는 것이 매우 중요하다. groupby() 코드의 기본 구조는 아래와 같다.df.gropuby( by = 'col_group' )['col_agg'].a.. 2024. 5. 19.
[데이터직군] 신입 데이터 직무 취업 필승 전략 특강(전 삼성전자 stellar 멘토님) 지난 화요일에 제로베이스(zero-base)라는 사이트에서 또 취업 특강을 한다길래, 예약하고 강의를 들었다.생각보다 도움을 받아서 후기를 작성하게 되었다.  zoom으로 진행된 강의, 스텔라 강사님은 '데이터로 더 나은 세상을 만드는 사람들'이라는 주제로 강의를 시작하셨다. 일단 개괄적인 소개를 해주셨음. 강사님은 데싸(데이터 사이언티스트) - 프로젝트 매니저(ML/AI) - 데분(데이터 분석가)까지 다양한 데이터 관련 직군에서 종사했고, 한 12년차 정도 되었다고 하셨다(기억이 부정확할 수도 있음). 산업도 플랫폼 기업이나 화장품 회사 등 여러 곳에 머물렀었다고 함.강의 순서는 이러했다. 데이터로 일하는 장점과 비전, 데이터로 일하는 각 직무의 역할, 포트폴리오 작성 팁! 3번이 가장 유용했으므로 1.. 2024. 5. 15.
구글 코랩(colab)에서 한글이 안 나오고 사각형만 나올 때 해결방법...나눔고딕폰트 까는법 사건의 발단... 강의 들으면서 공부하고 있는데 아래와 같이 줄줄줄줄 오류 메시지가 뜨더니ㅠㅠ(무서워요 선생님) 한글이 전부 네모로 뜨기 시작....ㅎ-ㅎ...(멘탈이 바사삭) 🔥 1. 강의에서 한글이 깨지지 않도록 적용하라고 한 부분pip install matplotlib seaborn # matplotlib와 seaborn 설치# 라이브러리 importimport matplotlib.pyplot as pltimport seaborn as sns# 한글 폰트 설정plt.rc('font', family = 'AppleGothic') # MACplt.rc('font', family = 'Malgun Gothic') # Windows 일단 matplotlib와 seaborn 라이브러리를 설치해주고, imp.. 2024. 5. 11.
[SQL] 데이터분석가 입문 필수 SQL 부트캠프 (13) 서브쿼리: 상관 서브쿼리 강의는 메타코드 사이트(https://mcode.co.kr/)에서 구매할 수 있다. 이제 두 번 정도?만 더 쓰면 부트캠프 강의 정리 글은 마무리될 것 같다. 파이팅🔥🔥 🔥 상관 서브쿼리 지난 글에서는 스칼라 서브쿼리(단일값), 테이블 서브쿼리(행과 열 형태)에 대해 정리했다. 이번엔 "상관" 서브쿼리 상관 서브쿼리는, 다른 서브쿼리와 달리 메인 쿼리의 행을 참조하여 수행한다. 메인 쿼리의 각 행마다 한 번씩 실행되고, 현재 행과 연관된 결과를 반환한다. 뭔가 특별한 서브쿼리 같긴 한데 이해가 잘 되지 않는다면.. 약간 for문을 생각하면 될 것 같다. 반복문처럼 메인 쿼리의 행이 100개면, 각 행에 대해 상관 서브쿼리도 100번 반복하여 돌아가며, 메인쿼리의 값들을 참조해 결과를 반환한다. 예를 살펴.. 2024. 4. 17.