[Python] 12. Pandas 데이터프레임 시각화 함수 만들어 사용하기

데이터프레임을 시각화하는 함수를 만들어 사용하는 다양한 예제를 알려드리겠습니다.
시각화에는 matplotlibseaborn 라이브러리를 함께 활용하여 다양한 그래프를 생성합니다.

Python 함수를 만드는 방법

우선 파이썬에서 함수를 만드는 방법에 대해 상세히 설명드리겠습니다.
함수는 프로그래밍에서 코드의 블록을 재사용하고 모듈화하는데 사용되며, 특정 작업을 수행하는 코드를 하나의 논리적 단위로 묶는데 도움이 됩니다.
함수를 정의하고 호출하는 방법은 다음과 같습니다.

함수 정의

파이썬에서 함수를 정의하는 방법은 def 키워드를 사용합니다. 기본적인 함수 정의 구문은 다음과 같습니다.

def 함수이름(매개변수1, 매개변수2, ...):
    # 함수가 수행할 작업들
    return 결과값
  • def: 함수를 정의하는 키워드입니다.
  • 함수이름: 함수의 이름을 지정합니다. 함수 이름은 식별자 규칙을 따라야 합니다.
  • 매개변수1, 매개변수2, ...: 함수가 입력으로 받는 매개변수들을 지정합니다. 필요한 경우 매개변수를 생략할 수도 있습니다.
  • :: 콜론(:)을 사용하여 함수 정의의 끝을 표시합니다.
  • # 함수가 수행할 작업들: 함수의 본체에 해당하는 코드 블록을 작성합니다.
  • return 결과값: 함수가 값을 반환하는 경우 return 키워드를 사용하여 반환할 값을 지정합니다.

예를 들어, 두 수를 더하는 간단한 함수를 정의하는 예제는 다음과 같습니다.

def add_numbers(x, y):
    result = x + y
    return result

함수 호출

함수를 호출하려면 함수 이름과 필요한 인자(인수)를 사용합니다.
함수를 호출하면 함수의 본체에 정의된 코드가 실행됩니다. 함수가 반환하는 값을 변수에 할당하거나, 단순히 함수를 호출하여 결과를 확인할 수 있습니다.

# 함수 호출하여 결과를 반환받기
result = add_numbers(5, 10)
print(result)  # 출력: 15

# 함수 호출하여 결과를 확인하기
add_numbers(3, 7)  # 출력: 10

위의 예제에서 add_numbers() 함수는 두 개의 인자를 받아서 합계를 반환하는 간단한 함수입니다.
함수를 호출할 때, 인자로 510을 전달하여 합계를 계산하고, 반환된 결과를 result 변수에 할당하여 출력합니다.

이렇게 파이썬에서 함수를 만들고 호출하는 방법을 사용하면 프로그램을 모듈화하고 재사용 가능한 코드 블록을 생성할 수 있으며, 코드를 더욱 간결하고 효율적으로 구성할 수 있습니다.
함수는 프로그래밍에서 중요한 개념이므로 많은 사용법과 기능을 학습하시면 더욱 다양한 기능을 활용할 수 있습니다.

Pandas 데이터프레임 시각화 함수

먼저, 아래와 같은 샘플 데이터프레임을 사용하여 예제를 설명하겠습니다.

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 샘플 데이터프레임 생성
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
        'Age': [25, 30, 35, 28, 32],
        'Salary': [50000, 60000, 70000, 55000, 65000],
        'Department': ['HR', 'Finance', 'IT', 'HR', 'IT']}
df = pd.DataFrame(data)

막대 그래프

def bar_plot(dataframe, x, y, title):
    plt.figure(figsize=(8, 6))
    sns.barplot(data=dataframe, x=x, y=y)
    plt.title(title)
    plt.xlabel(x)
    plt.ylabel(y)
    plt.show()

bar_plot(df, x='Name', y='Age', title='Age Distribution')

히스토그램

def histogram(dataframe, column, bins, title):
    plt.figure(figsize=(8, 6))
    sns.histplot(data=dataframe, x=column, bins=bins, kde=True)
    plt.title(title)
    plt.xlabel(column)
    plt.show()

histogram(df, column='Age', bins=10, title='Age Histogram')

박스 플롯

def box_plot(dataframe, x, y, title):
    plt.figure(figsize=(8, 6))
    sns.boxplot(data=dataframe, x=x, y=y)
    plt.title(title)
    plt.xlabel(x)
    plt.ylabel(y)
    plt.show()

box_plot(df, x='Department', y='Salary', title='Salary Distribution by Department')

산점도

def scatter_plot(dataframe, x, y, title):
    plt.figure(figsize=(8, 6))
    sns.scatterplot(data=dataframe, x=x, y=y)
    plt.title(title)
    plt.xlabel(x)
    plt.ylabel(y)
    plt.show()

scatter_plot(df, x='Age', y='Salary', title='Age vs. Salary')

빈도 막대 그래프

def count_plot(dataframe, column, title):
    plt.figure(figsize=(8, 6))
    sns.countplot(data=dataframe, x=column)
    plt.title(title)
    plt.xlabel(column)
    plt.show()

count_plot(df, column='Department', title='Department Count')

위의 예제에서는 각 시각화 함수에 데이터프레임과 그래프에 필요한 column들을 전달하여 시각화를 수행합니다.
matplotlibseaborn 라이브러리를 사용하여 시각화하며, 각 함수에서 그래프의 타이틀, x축, y축 등의 설정을 지정하여 그래프를 깔끔하게 만듭니다.
이러한 방법을 활용하여 데이터프레임에 맞는 다양한 시각화를 수행할 수 있습니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤