본문 바로가기
빅데이터분석

[파이썬] 파이썬 입문 데이터분석 프로젝트 만들기 - (7) 컬럼 Columns

by 모닥불🔥 2024. 5. 5.

 

오늘도 역시 메타코드 강의를 정리할 것이고, 강의자료로는 3-3 내용이다. 강의는 홈페이지에서 구매할 수 있음..!

(사진 누르면 링크 이동)


🔥 강의 목차

오리엔테이션
파이썬 기초 문법
데이터 전처리
데이터 시각화
마케팅 데이터 분석 및 지표 정의하기

🔥 컬럼 불러오기(1개/여러개)

1. 하나의 컬럼 조회하기

df_iris.sepal_length
df_iris['sepal_length']

 

위 두 개 모두 동일하게 df_iris라는 데이터에서 sepal_length라는 컬럼을 불러오는 코드이다.
코드를 치다보면 점으로 찍어서 불러오는 게 훨씬 간편하고 빠르다는 느낌이 들 것이다.
그런데 대괄호를 사용하는 것이 더 안정적이라고 한다.


이유1. 일단 컬럼명에 띄어쓰기가 있는 경우 점표기법으로 불러올 수 없으므로 오류 발생률이 높아진다.
이유2. 변수에 담긴 값을 가져와서 파라미터에 접근하는 경우 대괄호 표기법을 사용해야 오류가 발생하지 않는다.
👀 사실 두 번째 이유는 무슨 말인지 잘 모르겠다.

일단 대괄호가 더 안정적이고 오류도 적다 하니 무조건 대괄호로 쓰려고 한다.

어디 데이터분석 단톡에서 듣기로는 점 표기법으로 불러올 때 속도가 더 빠르다(?)고 했던 것 같은데 정확히 모르겠다.

여튼 컬럼 1개를 불러오는 방법은 데이터프레임명['컬럼명'] 으로 기억하자!

 

2. 여러 개 컬럼 동시에 불러오기

여러개의 컬럼을 불러오려면 어떻게 해야 할까?

대괄호 안에 리스트를 만든다 생각하고 넣어주면 된다. 대괄호를 두 겹으로!

df_iris[['sepal_length', 'species']]


대괄호 안에 또 줄줄 쓰기 힘들다면 컬럼명 리스트를 변수에 담고, 변수를 대괄호 안에 넣어도 괜찮다.

col_selected = ['sepal_length', 'sepal_width']
df_iris[col_selected]


🔥 컬럼 생성, 수정, 삭제하기

인프런 강의에서 파이썬 기초를 배울 때 강사님이 어떤 언어든 생성, 수정, 삭제만 알면 된다고 했다.

컬럼을 생성, 수정, 삭제하는 법을 알아보자.

1. 컬럼 생성

df['새로운컬럼명'] = 할당값

예를 들어, A 컬럼과 B컬럼을 합해서 A_plus_B라는 새로운 컬럼을 만들 수 있다. 아래와 같이 적으면 된다.

df_iris['A_plus_B'] = df_iris['A'] + df_iris['B']

2. 컬럼명 변경

df.rename( columns = {   '기존 컬럼명1: 새컬럼명1', '기존컬럼명2: 새컬럼명2'   } )
딕셔너리 형태로 이전값:새값을 짝지어 colums에 할당하여 이름을 변경한다.

df_iris.rename(columns={'sepal_length':'A', 'sepal_width':'B'}, inplace = True)

 

이름변경 전 -> 후

3. 컬럼 삭제

df.drop( labels = '컬럼명', axis = 1, inplace = True )
1: 컬럼 삭제 0: 행 삭제
inplace = True라고 적으면 원본 데이터셋에 덮어쓰기 된다.

만약에 이 부분을 적지 않으면 실제로 삭제된 것이 아니라 삭제된 것처럼 보이게 나타난다.

df_iris.drop(labels = 'petal_width', axis = 1, inplace = True)

 

요렇게 petal_width 컬럼이 삭제된 것을 볼 수 있다.

 

 

* 본 게시글은 '메타코드'의 동의를 받아 작성된 글로, 강의 내용에 대한 모든 저작권은 Ringo 선생님에게 있습니다. 개인용도의 학습 외에 무단사용은 엄격히 금지됩니다. 위반 시 법적 조취가 취해질 수 있습니다.