판다스 데이터프레임을 합치는 방법에는 여러 가지가 있습니다.
데이터프레임을 합치는 작업은 데이터의 결합이나 병합을 의미하며, 여러 데이터프레임을 하나로 결합하여 더 크고 풍부한 데이터를 생성할 수 있습니다.
판다스에서는 merge()
, concat()
, join()
등의 함수를 제공하여 데이터프레임을 합칠 수 있습니다.
다음은 각 함수를 사용하여 데이터프레임을 합치는 방법에 대한 예제입니다.
merge()
함수를 사용하여 데이터프레임 병합
데이터프레임을 공통된 열(또는 인덱스)을 기준으로 병합합니다.
이 함수는 SQL의 JOIN 연산과 유사한 방식으로 작동합니다.
import pandas as pd
# 첫 번째 데이터프레임 생성
data1 = {'ID': [1, 2, 3],
'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1)
# 두 번째 데이터프레임 생성
data2 = {'ID': [2, 3, 4],
'Age': [25, 28, 30]}
df2 = pd.DataFrame(data2)
# 'ID' 열을 기준으로 데이터프레임 병합
merged_df = pd.merge(df1, df2, on='ID')
print(merged_df)
출력 결과
ID Name Age
0 2 Emma 25
1 3 Peter 28
concat()
함수를 사용하여 데이터프레임 병합
데이터프레임을 행 또는 열 방향으로 연결합니다.
이 함수는 데이터프레임을 단순히 이어붙이는 역할을 합니다.
import pandas as pd
# 첫 번째 데이터프레임 생성
data1 = {'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1)
# 두 번째 데이터프레임 생성
data2 = {'Name': ['Alice', 'Bob']}
df2 = pd.DataFrame(data2)
# 데이터프레임 연결
concatenated_df = pd.concat([df1, df2])
print(concatenated_df)
출력 결과
Name
0 John
1 Emma
2 Peter
0 Alice
1 Bob
join()
함수를 사용하여 데이터프레임 병합
데이터프레임을 인덱스를 기준으로 병합합니다.
인덱스를 활용하여 데이터프레임을 결합합니다.
import pandas as pd
# 첫 번째 데이터프레임 생성
data1 = {'Name': ['John', 'Emma', 'Peter']}
df1 = pd.DataFrame(data1, index=[1, 2, 3])
# 두 번째 데이터프레임 생성
data2 = {'Age': [25, 28, 30]}
df2 = pd.DataFrame(data2, index=[2, 3, 4])
# 인덱스를 기준으로 데이터프레임 결합
joined_df = df1.join(df2)
print(joined_df)
출력 결과
Name Age
1 John NaN
2 Emma 25.0
3 Peter 28.0
위의 예제들은 데이터프레임을 합치는 간단한 방법을 보여주고 있습니다.
데이터프레임을 합치는 작업은 데이터를 통합하거나 연관된 정보를 결합하는 데 유용합니다.
실제 데이터에 따라 적합한 방법을 선택하여 데이터프레임을 합치면 됩니다.
[Python] 04. Pandas 데이터프레임 누락된 데이터 처리하기
판다스(Pandas)는 데이터프레임에서 누락된 데이터(결측치)를 처리하는 다양한 방법을 제공합니다. 이러한 처리 방법은 데이터의 일관성을 유지하고 분석을 정확하게 수행하기 위해 중요합니다.…