판다스(Pandas) 데이터프레임은 시각화를 위해 Matplotlib 과 함께 사용할 수 있습니다.
Matplotlib 를 사용하여 데이터프레임을 다양한 방식으로 시각화할 수 있습니다.
아래에는 몇 가지 판다스 데이터프레임 시각화 예제를 상세히 설명하겠습니다.
Matplotlib 라이브러리 임포트
먼저, 필요한 라이브러리를 임포트하고 샘플 데이터프레임을 생성하는 예제부터 시작하겠습니다.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 샘플 데이터프레임 생성
data = {'Year': [2010, 2011, 2012, 2013, 2014],
'Sales': [500, 800, 1200, 900, 1500],
'Expenses': [300, 400, 600, 500, 800]}
df = pd.DataFrame(data)
Matplotlib 그래프
선 그래프
데이터프레임의 열을 선 그래프로 표시할 수 있습니다. plot()
메서드를 사용하여 선 그래프를 그릴 수 있습니다.
예를 들어, ‘Year’를 x축, ‘Sales’를 y축으로 설정하여 선 그래프를 그리는 방법은 다음과 같습니다.
df.plot(x='Year', y='Sales', kind='line')
plt.show()
막대 그래프
데이터프레임의 열을 막대 그래프로 표시할 수도 있습니다. plot()
메서드의 kind
매개변수를 'bar'
로 설정하여 막대 그래프를 그릴 수 있습니다.
예를 들어, ‘Year’를 x축, ‘Sales’를 y축으로 설정하여 막대 그래프를 그리는 방법은 다음과 같습니다.
df.plot(x='Year', y='Sales', kind='bar')
plt.show()
산점도
두 개의 열을 산점도로 표시할 수도 있습니다. plot()
메서드의 kind
매개변수를 'scatter'
로 설정하여 산점도를 그릴 수 있습니다.
예를 들어, ‘Expenses’를 x축, ‘Sales’를 y축으로 설정하여 산점도를 그리는 방법은 다음과 같습니다.
df.plot(x='Expenses', y='Sales', kind='scatter')
plt.show()
히스토그램
데이터프레임의 열을 히스토그램으로 표시할 수도 있습니다. plot()
메서드의 kind
매개변수를 'hist'
로 설정하여 히스토그램을 그릴 수 있습니다.
예를 들어, ‘Sales’ 열의 히스토그램을 그리는 방법은 다음과 같습니다.
df['Sales'].plot(kind='hist')
plt.show()
상자 그림
데이터프레임의 열을 상자 그림으로 표시할 수도 있습니다. plot()
메서드의 kind
매개변수를 'box'
로 설정하여 상자 그림을 그릴 수 있습니다.
예를 들어, ‘Sales’와 ‘Expenses’ 열의 상자 그림을 그리는 방법은 다음과 같습니다.
df[['Sales', 'Expenses']].plot(kind='box')
plt.show()
위의 예제에서는 Matplotlib의 plt
객체를 사용하여 그래프를 표시하였습니다. plt.show()
함수를 호출하여 그래프를 화면에 출력합니다.
판다스 데이터프레임을 시각화하는 방법은 다양하며, 데이터의 종류와 분석 목적에 따라 적절한 시각화 방법을 선택할 수 있습니다.
Matplotlib을 사용하여 그래프를 그리는 과정에서 추가적인 설정과 스타일을 적용할 수도 있습니다.