본문 바로가기

전체 글75

[머신러닝] 메타코드 강의 후기_머신러닝 입문 부트캠프 (2) 머신러닝에 사용되는 기본 수학 개념 🔥 메타코드에서 머신러닝 입문 부트캠프 강의를 듣고 있다. 머신러닝에 대한 전반적인 지식을 익히고, 내 손으로 하이퍼파라미터도 조정해보고 최적화된 모델을 찾기 위해!! 맨날 RandomForest만 돌리는 빅분기 취득자를 졸업하자!ㅁ! 아자아자!! 근데...? 머신러닝에서 사용되는 수학적 개념들을 배우다가 포기할 뻔 했다. ㅠㅠ 자연 상수, 시그모이드 함수, log와 미분 이야기들이 막 나오는데... 그래도 힘내봐야지. 서포터즈로 이왕 제공받은 강의 열심히 끝까지 들어보려고 한다. 강의를 듣고 나면 어려운 수학적 내용도 조금은 익숙해지지 않을까?2. 회귀(Regression) - 머신러닝을 위한 기본 수학(Basic Math for ML)함수란, 두 집합 사이의 관계 혹은 규칙을 말한다. y = f(x.. 2024. 10. 13.
[머신러닝] 메타코드 강의 후기_머신러닝 입문 부트캠프 (1) 인트로, 용어정리 🔥 메타코드에서 머신러닝 입문 부트캠프 강의를 듣기 시작했다.사회조사분석사 자격증을 취득하고, ADsP, SQLD, 빅분기까지 거쳐 오면서 다양한 강의들을 접하고 공부했다.근데 머신러닝이 뭔지 아직도 제대로 모르는 것 같다.어렴풋이 느끼는 건 머신러닝 => 빅분기 2유형에서 푸는 것? RandomForest 같은 모델 import 해서 돌리는 것...? 인데, 빅분기를 취득했음에도 부끄럽게 하이퍼파라미터 최적화/튜닝 같은 건 모른다.그도 그럴 것이, 빅분기는 하이퍼파라미터에 손대지 않고 기본만 딱 하는 게 가장 점수가 높게 나온다는 썰이 많았기 때문이다. 실제로 나도 그런 경험을 했고...ㅠ그래서 이번에 또 서포터즈로 혜택을 받게 된 김에 머신러닝 입문 부트캠프 강의권을 지원받아서 듣게 되었다.이 강의.. 2024. 10. 13.
[powerBI] 메타코드 강의후기_(4) 가설설정 및 통계적 검정 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.)무료 수강 기간이 끝나서 아쉽지만 50% 세일 중이다.5. 통계적 가설 검정-1가설 1: 가격이 높은 차량에 대한 보험사기가 높을 것이다. 맨 처음에 어떻게 가설을 설정할 수 있을까?도메인 전문가가 궁금해 하는 부분조직 내에서 유사한 데이터분석 결과물을 냈던 자료구글링, 논문, 외부 조직의 인사이트 등 여러가지 자료를 참고하여 현실성 있는 가설을 세울 수 있다.그런데, 만약 아무런 전문가도, 자료도 없다면 어떻게 분석을 시작할 수 있을까? 일단 필요한 라이브러리와 데이터를 불러오자.import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.. 2024. 10. 6.
[powerBI] 메타코드 강의후기_(3) 기초통계 개념 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.)무료 수강 기간이 끝나서 아쉽지만 50% 세일 중이라고 한다. wow 지난 시간에 탐색적 데이터분석을 완료했다면, 이번엔 간단한 가설 검정 단계이다.강의에서는 가설을 세우는 과정을 자세히 설명해 주셔서 좋았다. :)3. 여러가지 통계 분석 기법통계적 기법을 활용한 EDA(탐색적 데이터 분석) 라고 소개를 하셨는데, 내 생각에는 가설을 설정하고 검정하는 통계분석에 가깝지 않을까 생각한다. 먼저, 통계적 기법의 다양한 종류를 소개해 주셨다.익숙한 T-test, ANOVA, 상관, 카이스퀘어 등도 있고 KOLMOGOROV-SMIRNOV TEST라는 것도 있었다.뭔가 어디서 한 번 들어본 것 같은데 많이 쓴 적은 없는 ... 2024. 10. 6.
구글코랩(Colab)에서 py파일 저장하고 불러오기! 함수를 만들어서 .py 파일에 저장해 두면 import로 내가 만든 함수를 불러올 수 있다. 다른 라이브러리의 함수들처럼!강의를 듣다가, 이런 내용을 듣고 있었는데... 구글코랩에서 따라하려니까 .py 파일로 저장하는 것부터 어려웠다.결국 방법을 알아냈는데, 나중을 위해 정리해 두기로 했다...! 1. 구글 드라이브 연결먼저, 코랩 새 창을 연 다음, 아래 코드를 실행시켜 내 구글드라이브와 연결한다.from google.colab import drivedrive.mount('/content/drive') 코랩을 쓰는 사람이라면 아주 익숙할 것 같은... 과정 2. 함수 생성원하는 함수를 코드로 쓴다. 함수를 실행시키는 데 필요한 라이브러리도 같이 넣어주면 좋을 것 같다.# 그래프 함수import pand.. 2024. 10. 3.
[powerBI] 메타코드 강의후기_(2) EDA 자동화 메타코드에 새로 올라온 powerBI 강의! (이미지를 클릭하면 수강신청 링크로 이동한다.) 10월 3일까지 완전 무료로 들을 수 있다. 이번 글에서는 지난 글에 이어 EDA 뒷부분을 정리할 예정이다.2. EDA-시각화이 강의에서는 count plot과 histogram을 그려본다. histogram은 수치형 변수들, count plot은 범주형 변수들을 대상으로 시각화할 때 사용한다. px 로 그래프를 그리면 되는데, 어떻게 그리는지 잘 모르겠다면.. help와 dir을 사용하자. 빅분기 실기할 때도 help와 dir을 엄청 많이 썼는데, px라는 라이브러리에 어떤 그래프들이 있는지 궁금할 때는 dir, 사용법이 궁금할 때는 help(px.histogram)처럼 사용한다.# dir(px) # help(.. 2024. 9. 29.