[Python] 24. Pandas 데이터프레임 IF 문을 사용하는 다양한 예제

Pandas는 파이썬에서 데이터 조작 및 분석을 위한 강력한 라이브러리입니다. IF 문을 사용하여 데이터프레임을 조작하는 다양한 예제를 제공하겠습니다.


조건에 따라 열 추가하기

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22]}
df = pd.DataFrame(data)

df['Category'] = df['Age'].apply(lambda x: 'Young' if x < 25 else 'Adult')
print(df)

이 예제에서는 데이터프레임에 “Category”라는 새로운 열을 추가합니다. “Age” 열의 값에 따라 각 행의 “Category” 열 값을 “Young” 또는 “Adult”로 설정합니다. apply() 함수를 사용하여 각 행의 “Age” 값을 검사하고 조건에 따라 “Young” 또는 “Adult” 값을 반환합니다.

조건에 따라 특정 행 선택하기

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22]}
df = pd.DataFrame(data)

young_people = df[df['Age'] < 25]
print(young_people)

이 예제에서는 “Age” 열의 값이 25 미만인 행을 선택합니다. 데이터프레임을 필터링하여 조건을 충족하는 행만 선택합니다.

조건에 따라 열 값 변경하기

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22]}
df = pd.DataFrame(data)

df.loc[df['Age'] < 25, 'Age'] = 21
print(df)

이 예제에서는 “Age” 열의 값이 25 미만인 행의 “Age” 값을 21로 변경합니다. loc을 사용하여 조건에 맞는 행과 열을 선택하고 값을 변경합니다.

여러 조건을 결합하여 필터링

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22],
        'Salary': [50000, 60000, 45000]}
df = pd.DataFrame(data)

young_high_salary = df[(df['Age'] < 25) & (df['Salary'] > 45000)]
print(young_high_salary)

이 예제에서는 “Age” 열의 값이 25 미만이고 “Salary” 열의 값이 45000 초과인 행을 선택합니다. 두 가지 조건을 & 연산자로 결합하여 필터링합니다.

조건에 따라 새로운 열 생성하기

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22]}
df = pd.DataFrame(data)

df['Status'] = ['Student' if age < 25 else 'Working' for age in df['Age']]
print(df)

이 예제에서는 “Age” 열의 값에 따라 “Status”라는 새로운 열을 생성합니다. 조건에 따라 리스트 컴프리헨션을 사용하여 각 행의 “Age” 값을 검사하고 “Student” 또는 “Working” 값을 설정합니다.

조건에 따라 함수 적용하기

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 22]}
df = pd.DataFrame(data)

def categorize_age(age):
    if age < 25:
        return 'Young'
    else:
        return 'Adult'

df['Category'] = df['Age'].apply(categorize_age)
print(df)

이 예제에서는 “Age” 열의 값에 따라 “Category” 열을 생성하는 함수를 정의하고 apply() 함수를 사용하여 각 행의 “Age” 값을 함수에 적용하여 “Category” 값을 설정합니다.

이러한 예제들은 Pandas 데이터프레임에서 조건에 따라 열과 행을 조작하는 방법을 보여줍니다. Pandas는 데이터 조작을 위한 다양한 기능을 제공하며, 이를 활용하여 데이터프레임을 원하는대로 다룰 수 있습니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤