[Python] 03. Pandas 데이터프레임 합치기

판다스 데이터프레임을 합치는 방법에는 여러 가지가 있습니다.
데이터프레임을 합치는 작업은 데이터의 결합이나 병합을 의미하며, 여러 데이터프레임을 하나로 결합하여 더 크고 풍부한 데이터를 생성할 수 있습니다.
판다스에서는 merge(), concat(), join() 등의 함수를 제공하여 데이터프레임을 합칠 수 있습니다.
다음은 각 함수를 사용하여 데이터프레임을 합치는 방법에 대한 예제입니다.

merge() 함수를 사용하여 데이터프레임 병합

데이터프레임을 공통된 열(또는 인덱스)을 기준으로 병합합니다.
이 함수는 SQL의 JOIN 연산과 유사한 방식으로 작동합니다.

import pandas as pd

# 첫 번째 데이터프레임 생성
data1 = {'ID': [1, 2, 3],
         'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1)

# 두 번째 데이터프레임 생성
data2 = {'ID': [2, 3, 4],
         'Age': [25, 28, 30]}
df2 = pd.DataFrame(data2)

# 'ID' 열을 기준으로 데이터프레임 병합
merged_df = pd.merge(df1, df2, on='ID')
print(merged_df)

출력 결과

   ID  Name  Age
0   2  Emma   25
1   3  Peter  28

concat() 함수를 사용하여 데이터프레임 병합

데이터프레임을 행 또는 열 방향으로 연결합니다.
이 함수는 데이터프레임을 단순히 이어붙이는 역할을 합니다.

import pandas as pd

# 첫 번째 데이터프레임 생성
data1 = {'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1)

# 두 번째 데이터프레임 생성
data2 = {'Name': ['Alice', 'Bob']}
df2 = pd.DataFrame(data2)

# 데이터프레임 연결
concatenated_df = pd.concat([df1, df2])
print(concatenated_df)

출력 결과

   Name
0  John
1  Emma
2 Peter
0 Alice
1   Bob

join() 함수를 사용하여 데이터프레임 병합

데이터프레임을 인덱스를 기준으로 병합합니다.
인덱스를 활용하여 데이터프레임을 결합합니다.

import pandas as pd

# 첫 번째 데이터프레임 생성
data1 = {'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1, index=[1, 2, 3])

# 두 번째 데이터프레임 생성
data2 = {'Age': [25, 28, 30]}
df2 = pd.DataFrame(data2, index=[2, 3, 4])

# 인덱스를 기준으로 데이터프레임 결합
joined_df = df1.join(df2)
print(joined_df)

출력 결과

   Name  Age
1  John  NaN
2  Emma  25.0
3 Peter  28.0

위의 예제들은 데이터프레임을 합치는 간단한 방법을 보여주고 있습니다.
데이터프레임을 합치는 작업은 데이터를 통합하거나 연관된 정보를 결합하는 데 유용합니다.
실제 데이터에 따라 적합한 방법을 선택하여 데이터프레임을 합치면 됩니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤