본문 바로가기

빅데이터분석40

[powerBI] 메타코드 강의후기_(4) 가설설정 및 통계적 검정 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.)무료 수강 기간이 끝나서 아쉽지만 50% 세일 중이다.5. 통계적 가설 검정-1가설 1: 가격이 높은 차량에 대한 보험사기가 높을 것이다. 맨 처음에 어떻게 가설을 설정할 수 있을까?도메인 전문가가 궁금해 하는 부분조직 내에서 유사한 데이터분석 결과물을 냈던 자료구글링, 논문, 외부 조직의 인사이트 등 여러가지 자료를 참고하여 현실성 있는 가설을 세울 수 있다.그런데, 만약 아무런 전문가도, 자료도 없다면 어떻게 분석을 시작할 수 있을까? 일단 필요한 라이브러리와 데이터를 불러오자.import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.. 2024. 10. 6.
[powerBI] 메타코드 강의후기_(3) 기초통계 개념 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.)무료 수강 기간이 끝나서 아쉽지만 50% 세일 중이라고 한다. wow 지난 시간에 탐색적 데이터분석을 완료했다면, 이번엔 간단한 가설 검정 단계이다.강의에서는 가설을 세우는 과정을 자세히 설명해 주셔서 좋았다. :)3. 여러가지 통계 분석 기법통계적 기법을 활용한 EDA(탐색적 데이터 분석) 라고 소개를 하셨는데, 내 생각에는 가설을 설정하고 검정하는 통계분석에 가깝지 않을까 생각한다. 먼저, 통계적 기법의 다양한 종류를 소개해 주셨다.익숙한 T-test, ANOVA, 상관, 카이스퀘어 등도 있고 KOLMOGOROV-SMIRNOV TEST라는 것도 있었다.뭔가 어디서 한 번 들어본 것 같은데 많이 쓴 적은 없는 ... 2024. 10. 6.
구글코랩(Colab)에서 py파일 저장하고 불러오기! 함수를 만들어서 .py 파일에 저장해 두면 import로 내가 만든 함수를 불러올 수 있다. 다른 라이브러리의 함수들처럼!강의를 듣다가, 이런 내용을 듣고 있었는데... 구글코랩에서 따라하려니까 .py 파일로 저장하는 것부터 어려웠다.결국 방법을 알아냈는데, 나중을 위해 정리해 두기로 했다...! 1. 구글 드라이브 연결먼저, 코랩 새 창을 연 다음, 아래 코드를 실행시켜 내 구글드라이브와 연결한다.from google.colab import drivedrive.mount('/content/drive') 코랩을 쓰는 사람이라면 아주 익숙할 것 같은... 과정 2. 함수 생성원하는 함수를 코드로 쓴다. 함수를 실행시키는 데 필요한 라이브러리도 같이 넣어주면 좋을 것 같다.# 그래프 함수import pand.. 2024. 10. 3.
[powerBI] 메타코드 강의후기_(2) EDA 자동화 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.) 10월 3일까지 완전 무료로 들을 수 있다. 이번 글에서는 지난 글에 이어 EDA 뒷부분을 정리할 예정이다.2. EDA-시각화이 강의에서는 count plot과 histogram을 그려본다. histogram은 수치형 변수들, count plot은 범주형 변수들을 대상으로 시각화할 때 사용한다. px 로 그래프를 그리면 되는데, 어떻게 그리는지 잘 모르겠다면.. help와 dir을 사용하자. 빅분기 실기할 때도 help와 dir을 엄청 많이 썼는데, px라는 라이브러리에 어떤 그래프들이 있는지 궁금할 때는 dir, 사용법이 궁금할 때는 help(px.histogram)처럼 사용한다.# dir(px) # help(.. 2024. 9. 29.