본문 바로가기
데이터시각화

[메타코드] 파이썬 입문 데이터분석 (7) px.strip() 파이썬으로 strip plot 그리기 + scatter plot(산점도)과 strip plot(줄무늬 플롯)의 차이점

by 모닥불🔥 2024. 7. 7.

 

오늘도 조용히 공부하는 타닥타닥 모닥불🔥...! 이번 시각화는 strip plot이다.

 

이미지를 클릭하면 강의 사이트로 이동한다.

* 가입 시 5천원 주는 추천인 코드: EQQW-36EH-JY4P 추가해주시면 감사합니다.


🔥 강의 목차

오리엔테이션
파이썬 기초 문법
데이터 전처리
데이터 시각화
마케팅 데이터 분석 및 지표 정의하기

🔥 마케팅 데이터 전처리 &자동화 프로젝트(7) strip plot 스트립 플롯

약간은 생소한 strip plot. 개별 데이터 포인트를 배치하여 데이터 분포와 개별 값의 분포를 시각적으로 표현 한다고 한다. 정의를 봐도 뭔지 모르겠으니 예시 데이터로 확인해보자.

 

일단은 strip plot의 코드스니펫

import plotly.express as px
import pandas as pd

# px.strip() 함수를 사용하여 스트립 플롯 생성
fig = px.strip(
    df,                  # 데이터 프레임
    x='Category',        # x축에 표시될 데이터 열의 이름
    y='Value',           # y축에 표시될 데이터 열의 이름
    color = 'red/green/blue' #color
    title='Sample Strip Plot'  # 차트 제목
)

# 차트 표시
fig.show()

 

사용할 예시 데이터는 seaborn 라이브러리에 있는 iris 데이터이다. 아래와 같이 생김

import seaborn as sns
iris = sns.load_dataset('iris')

 

import plotly.express as px
import pandas as pd

# px.strip() 함수를 사용하여 스트립 플롯 생성
fig = px.strip(
    iris,                  # 데이터 프레임
    x='species',        # x축에 표시될 데이터 열의 이름
    y='sepal_length',           # y축에 표시될 데이터 열의 이름
    color = 'species', #color: red/green/blue
    title='Sample Strip Plot'  # 차트 제목
)

# 차트 표시
fig.show()

 

범주형 데이터인 species(붓꽃의 종) 종류에 따라 sepal_length(꽃잎의 길이)가 어떻게 분포되어 있는지 한 눈에 볼 수 있다. setosa 종은 꽃잎이 짧은 편이고, virginica 종은 긴 편이구나 하는 식으로 딱 보인다.

 

strip plot은 줄무늬 플롯 혹은 스트립플롯이라고 불린다고 한다.

빅분기 필기를 공부할 때 다양한 차트를 공부했음에도 이 차트는 처음 들어봤다.

산점도랑 비슷하게 생겼는데 산점도랑은 또 다르다고 함

 

🔥 Strip plot과 Scatter plot의 차이점이 뭘까?

챗 GPT한테 물어본 결과, 목적부터가 다르다고 한다.

  • strip plot은 범주형 데이터의 각 범주 내 데이터를 시각화 하기 위한 목적으로 사용된다.
  • 반면 scatter plot(산점도)은 두 연속형 변수 간의 관계를 표현하기 위해 사용한다.

각 그래프가 사용되는 상황을 예로 들면, 아래와 같다.

 

Strip plot

x축: 반 (A, B, C, D) => 범주형

y축: 성적 (0-100) => 연속형

각 반별로 학생들의 성적 분포를 시각화할 때 사용

 

Scatter plot

x축: 공부 시간 (시간) => 연속형

y축: 시험 점수 (점수) => 연속형

공부 시간에 따른 시험 점수의 분포와 관계를 시각화할 때 사용

 

모양을 봐도 조금 다른게, Strip plot은 세로 혹은 가로로 긴 띠 형태로 나타난다!

범주형 데이터는 수치형처럼 퍼질 수 없기 때문에 데이터 특성을 생각하면 당연한 것이긴 함 :)

 

이런 차트도 꼼꼼하게 알려주시다니, 역시 링고 선생님 짱이에요 /ㅁ/ 호호

 

* 본 게시글은 '메타코드'의 동의를 받아 작성된 글로, 강의 내용에 대한 모든 저작권은 Ringo 선생님에게 있습니다. 개인용도의 학습 외에 무단사용은 엄격히 금지됩니다. 위반 시 법적 조취가 취해질 수 있습니다.