본문 바로가기
빅데이터분석

[파이썬] 파이썬 입문 데이터분석 프로젝트 만들기 - (1) 파이썬 기초문법: 변수와 연산

by 모닥불🔥 2024. 2. 11.

며칠간 "파이썬을 이용한 데이터분석 프로젝트"를 실제로 해볼 수 있는 메타코드 신상 강의를 들었다.

파이썬을 처음 본 사람도 따라 할 수 있도록 만들어 주셔서 따라하기 편했다. 연습 문제도 적당히 난이도 있어서 타 파이썬 기초 강의보다 도움이 된 듯한 느낌? 오늘은 첫 시간으로 파이썬 기초문법에 대해 공부한 내용을 정리할 예정.

 

요런 강의이고, 메타코드 사이트( https://mcode.co.kr/ ) 로 접속하면 강의를 구매할 수 있다. 현재 공동구매는 끝났지만 진짜 잘 가르치셔서 추천!

🔥 강의 목차

오리엔테이션
파이썬 기초 문법
데이터 전처리
데이터 시각화
마케팅 데이터 분석 및 지표 정의하기

🔥오리엔테이션, 코랩 사용법

데이터분석 과정은 위 그림과 같은데, 이 강의에서는 전처리, 시각화, 인사이트 도출 부분을 커버한다고 한다.

디테일한 강의 내용은 아래 이미지 참조

 

이 강의는 구글 코랩을 사용한다. 빅분기 실기 준비하면서 코랩을 써봤는데 엄청 편해서 좋았다. 요즘엔 다 코랩을 쓰는 듯... 구글 코랩에서는 코드를 만들거나 텍스트를 만들 수 있게 되어 있다. 기초적인 기능은 직관적이라 그냥 보고 눈치껏 할 수 있는 정도. 그 외 아래와 같은 단축어를 외워 두면 코딩 속도가 빠르고 좋다!👍🏻

 

윈도우에서는 Ctrl 키를, 맥북에서는 Cmd(커맨드) 키를 사용해서 위 단축키를 사용하면 됨

주석은 주석 처리할 부분을 선택한 후 Ctrl + / 하면 된다.


🔥파이썬 기초문법: 변수와 연산

Print(출력)

print("Hello World")

 

print()를 사용하면 괄호 안의 내용을 출력할 수 있다. 구글 코랩에서는 print 함수를 쓰지 않고 코드를 실행해도 결과가 출력되지만 셀의 '마지막 줄'을 출력한다. 즉, 중간 내용을 출력하고 싶거나 여러 개의 결과를 출력하고 싶으면 print 함수를 써야 한다. 빅데이터분석기사 시험 환경에서는 일일이 print 함수를 사용해 출력해야 하므로 print로 출력하는 법을 습관화 하는 것이 좋다.

 

Variable(변수)

df = [1, 2, 3, 4, 5, 6, 7, 7, 7, 7]

 

프로그래밍 언어에서 변수는 데이터 값을 저장하는 컨테이너라고 한다. 긴 코드를 변수 하나에 할당해서 그 변수를 불러올 수 있는 기능(예를 들면 전화를 걸 때 010-0000-0000을 모두 쳐서 전화를 거는 것이 아니라 단축키 1번에 저장한 뒤 사용하는 것과 유사함)

import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4, 5, 6, 7, 7, 7, 7, 7, 7, 7])

# 이렇게 긴 데이터를 plt.plot() 함수에 넣어야 할 때,
# df에 할당하면 아래와 같이 간결하게 사용 가능

import matplotlib.pyplot as plt
df = [1, 2, 3, 4, 5, 6, 7, 7, 7, 7, 7, 7, 7]
plt.plot(df)

 

강의에서 데이터분석에서 변수를 활용한 사례를 소개해 주셨다. 코드를 실행하면 위와 같은 그래프를 그릴 수 있다. :D

 

a = 5
print(type(a))

 

변수명 = 값 형태로 변수 할당을 하면 된다. 할당한 변수는 구글 코랩 좌측 바에서 {x}를 클릭하면 볼 수 있다.

print(type(변수))를 입력하면 해당 변수의 데이터타입을 조회할 수 있다.

 

파이썬에서 5와 같은 정수는 integer(int)형, 4.5와 같은 실수는 float로 출력되는데 프로그램 상에서 float보다 int를 더 빠르게, 오류 없이 계산하므로 둘을 구분해서 사용한다.

 

a = "Hello" # 문자열(string)

 

문자열을 할당할 때에는 따옴표로 감싸 주어야 한다. 왜냐하면 파이썬에서 따옴표로 둘러싸인 텍스트는 문자열로 인식되고, 따옴표가 없으면 변수명 또는 식별자(함수명/클래스명 등)로 인식하기 때문이다. 따옴표를 세 개 넣으면 여러 줄에 텍스트를 넣을 수 있다.

 

재할당

a = 5
print(a)

a = "python"
print(a)

 

파이썬에서 변수는 한 번만 할당할 수 있는 게 아니다. 만약 a라는 변수에 5를 할당하면 정수형(int) 값 5가 할당되지만, a = "python"과 같이 동일한 변수에 다른 값을 재할당하면 덮어쓰기 되어 a는 python이라는 문자형(str), "python"이 된다.

 

Case Sensitivity

variable = 10
Variable = 20

 

파이썬은 대소문자를 구분하기 때문에 variable = 10, Variable = 20과 같이 정의하면 둘은 서로 다른 변수가 된다.

 

Operation(연산)

+ (덧셈)
- (뺄셈)
* (곱셈)
/ (나눗셈)
// (몫)
% (나머지)

 

파이썬에서는 덧셈, 뺄셈, 곱셈, 나눗셈과 더불어 몫과 나머지를 구할 수 있다. 여러 연산을 겹쳐서 구현하는 경우에 사칙연산 계산 순서에 따라 계산된다(괄호가 없다는 가정 하에 곱하기, 나누기 먼저 -> 더하기 빼기를 그 다음으로 계산함, 괄호를 넣으면 괄호 속 연산을 먼저 한다.)

 

str1 = "Hello"
str2 = "World"

print(str1 + " " + str2)

 

문자열도 덧셈 연산으로 쉽게 연결할 수 있다.

 

f-strings

 

만약에 "내 이름은 ㅇㅇㅇ이고, 나이는 ㅇㅇ살입니다." 라는 문장에서 이름과 나이에 들어갈 값이 매번 바뀐다면, f-strings를 써서 변수를 문자열 내에 포함시켜줄 수 있다. f-strings는 f"문자 {변수명} 문자" 형태로 사용한다. 아래 예시를 보자.

name = "Alice"
age = 24

formatted_string = f"내 이름은 {name}이고, 나이는 {age}살입니다."

 

위 코드를 실행하면 내 이름은 Alice이고, 나이는 24살입니다. 라는 문장이 출력된다. name의 값을 John으로 바꾸고 출력하면 문장도 내 이름은 John이고, 나이는 24살입니다. 라고 바뀐다. f-strings를 쓰면 문자열 내 일부분을 변수화 할 수 있다.


🔥연습문제

 

아래 연습 문제를 직접 풀어보고 해설을 들었다. 코딩 세계에서는 "백문이 불여일타"라는 말이 유명하다. 강의를 백 번 보고 듣는 것보다 한 번 써보는 것이 더 좋다는 뜻.. 직접 써보면서 많이 연습해야 할 것 같다.

# 1. 다음 코드를 활용하여 Hellow World를 출력하시오.

str1 = _____
str2 = _____

print(_____)
# 2. 변수 x와 y를 할당하여 몫과 나머지를 아래와 같이 출력하시오(단, 출력에 f-string으로 직접 변수 값을 입력하라).
# 출력값: 5 나누기 3의 몫은 1이고 나머지는 2이다.

x = 5
y = 3

quotient = ___
remainder = ___

print(___)

 

 

1번 문제 풀이

str1 = "Hello"
str2 = "World"

print(str1+" "+str2)

 

2번 문제 풀이

x = 5
y = 3

quotient = x//y
remainder = x%y

print(f"{x} 나누기 {y}의 몫은 {quotient}이고 나머지는 {remainder}이다.")

 

🔥 다음 강의는 함수에 대한 내용! 설 연휴지만 파이팅!!! 화르륵