본문 바로가기
빅데이터분석

[파이썬] 파이썬 입문 데이터분석 프로젝트 만들기 - (4) 파이썬 기초문법: 라이브러리 설치하기

by 모닥불🔥 2024. 2. 16.

오늘도 역시 링고 선생님의 "파이썬을 이용한 데이터분석 프로젝트" 강의를 정리할 거고, 메타코드m 사이트에서 https://mcode.co.kr/ 강의 구매 가능하다. 공동구매 링크를 올렸었는데 기간이 끝나서 연결이 안된다. 예전 글도 전부 변경해 놔야지! 호다닥

 

드디어 파이썬 기초문법 마지막 시간이다. 필요한 라이브러리 설치하는 방법에 대해 알아볼 예정ㅠㅠㅠ 감격...! 지금 시간은 새벽 6시. 주말에 시간이 없어서 지금 글을 쓰고 있다. ㅋㅋㅋ 몇 시에 글을 완성할지?! 초스피드로 가보자99!! 🔥

🔥 강의 목차

오리엔테이션
파이썬 기초 문법
데이터 전처리
데이터 시각화
마케팅 데이터 분석 및 지표 정의하기

🔥파이썬 기초문법: Library(라이브러리)

라이브러리란, 특정 기능을 수행하는 코드의 모음을 말하고, 다양한 함수를 사용할 수 있다. Google 코랩에는 기본적인 라이브러리가 설치되어 있는 편! 이미 설치된 목록 보기, 특정 라이브러리 찾기, 라이브러리 설치 및 사용법을 알아보자.

 

1. 기존에 설치된 라이브러리 목록 조회 (!pip list)

!pip list

 

!pip list 라는 구문을 치면 기존에 설치되어 있는 라이브러리 목록과 버전이 쭈우욱 나온다.

 

2. 기존에 설치된 특정 라이브러리 조회 (!pip list | grep)

!pip list | grep 라이브러리명

 

!pip list 그리고 수직선 기호를 쓴 다음 grep 라이브러리명을 적으면 기존에 설치된 특정 라이브러리를 조회할 수 있다.

shift + 역슬래시(\)로 수직선 특수문자(|)를 입력할 수 있다.

예를 들어, 위와 같이 !pip list | grep pandas를 입력하면 라이브러리 이름에 pandas가 들어간 라이브러리명과 버전을 불러오는 걸 볼 수 있다.

 

3. 새로운 라이브러리 설치하기(!pip install 라이브러리명)

!pip install 설치할 라이브러리명

 

만약 내가 원하는 라이브러리를 조회했는데, 구글 코랩에 없다면 설치하면 된다. 예전부터 생각했지만 프로그래밍 언어에서는 설치가 엄청 편한 것 같다. !pip install 설치할 라이브러리명 -> 코드를 실행하면 바로 설치가 진행됨

 

4. 라이브러리 사용하기(import 라이브러리명)

설치한 라이브러리는 설치했으니까 그냥 쓰는 게 아니라 import 로 불러온 다음 사용해야 한다.

import math	# 라이브러리 불러오기
math.sqrt(16)	# 라이브러리 내 함수 사용

 

math 라이브러리에 있는 sqrt() 함수를 사용하려면 math 라이브러리를 import 한 후 사용할 수 있다. import를 안하면 사용 불가능

 

5. 별칭 지정하기(import 라이브러리명 as 별칭)

import math as m	# math 라이브러리의 별칭은 m
m.sqrt(16)		# 별칭 m을 사용하여 math 모듈의 sqrt 함수 호출

 

별칭을 지정하면 라이브러리명을 오타내지 않고 빠르게 사용할 수 있다. 라이브러리 내 함수를 사용할 때에는 라이브러리명.함수() 요런 형태로 사용해야 하는데 매번 앞쪽에 라이브러리명 또는 별칭을 지정하기 귀찮다면, 6번을 참고하자.

 

6. 특정 함수 또는 클래스만 불러오기(from math import sqrt)

from math import sqrt
sqrt(16)

 

원래 math.sqrt(16) 형태로 사용해야 하는 것을 별칭으로 지정하면 m.sqrt(16)처럼 쓸 수 있다. 여기서 더 나아가 직접 사용할 함수를 호출하면 라이브러리명 또는 별칭을 붙이지 않고 바로 sqrt(16)과 같이 사용할 수 있다.


🔥연습문제

1. pandas 모듈을 pd라는 별칭으로 import 하고, 빈 DataFrame을 생성하세요.

코드 형태 예시
import pandas ___ ___
empty_dataframe = ___.DataFrame()
print(empty_dataframe)


결과물

Empty DataFrame
Columns: []
Index: []

 

풀이를 해보자.

pandas 모듈을 pd라는 별칭으로 import 하라고 했으니까

import pandas as pd

 

그리고 빈 DataFrame을 생성하는 방법은,

import pandas as pd
empty_dataframe = pd.DataFrame()
print(empty_dataframe)

 

pd.DataFrame() 이라고 적으면 빈 데이터프레임을 생성할 수 있다. 괄호 속에 csv 파일을 넣으면 파일을 불러와서 데이터프레임을 만들 수도 있는 걸로 기억함. 그리고 이 데이터프레임 형태를 empty_dataframe이라는 변수에 저장했다. empty_dataframe 부분은 아무렇게나 써도 된다.

 

2. datetime 모듈에서 datetime 클래스만 import 하고, 현재 날짜와 시간을 출력하세요.

코드 형태 예시
from datetime import ___
current_datetime = datetime.now()
print(current_datetime)

 

어떤 라이브러리에서 특정 클래스만 import 하는 방법은 from 라이브러리명 import 클래스명 이라고 했다.

 

from datetime import datetime

current_datetime = datetime.now()
print(current_datetime)

 

  • 라이브러리: 특정 기능을 수행하는 코드의 모음
    (자주 사용하는 코드 저장해놓고 불러오기 느낌)
  • 모듈: 프로그램 내 기능적으로 분할한 부분
    (기계의 부품 느낌, 기능을 하는 단위)
  • 클래스: 어떤 객체를 표현하기 위한 문법
    (함수와 유사하지만 def 가 아닌 class로 정의, 약간 범주 느낌? 붕어빵 틀이라고 많이 비유한다.)
  • 함수: 특정 작업을 수행하는 코드의 집합
    (print(), math() 요런거, 매개변수 넣으면 return 값 나오는 형태)

라이브러리와 모듈의 차이에 대한 글: 링크

클래스와 함수의 차이에 대한 글: 링크

 

* 오늘 나온 용어들이 헷갈려서 정리해 보았다. 괄호 속에 내가 이해한 느낌을 적어 놓았는데 틀렸다면 피드백 바랍니다.

 

 

7:00 글 완성, 이제 설거지, 청소하고 출근을 해야겠다. 그럼 이만 화르륵 🔥