🔍 데이터 병합
cf) 데이터 [right], [left] 만들기
- 딕셔너리 안에 리스트 형태(컬럼 기준으로 열 값이 들어감)
left = pd.DataFrame({
"key": ["K0","K1","K2","K4"],
"A": ["A0","A1","A2","A3"],
"B": ["B0","B1","B2","B3"]
})
- # 리스트 안에 딕셔너리 형태(행 하나씩 들어감)
right = pd.DataFrame([
{"key":"K0","C":"C0","D":"D0"},
{"key":"K1","C":"C1","D":"D1"},
{"key":"K2","C":"C2","D":"D2"},
{"key":"K3","C":"C3","D":"D3"}
])
right
1. pd.merge(data1, data2, how="방법", on="기준")
- 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법
- 기준이 되는 컬럼이나 인덱스를 키값이라고 한다.
- 기준이 되는 키값은 두 데이터 프레임에 모두 포함되어야 한다.
- how="inner"가 디폴트 값(교집합)
pd.merge(left, right, on="key")
pd.merge(left, right, how="inner", on="key")
- how="outer" : 합집합
pd.merge(left, right, how="outer", on="key")
- how를 이용하여 어느 쪽을 대표로 할 지 정할 수 있음
pd.merge(left, right, how="left", on="key")
pd.merge(left, right, how="right", on="key")
2. set_index("인덱스", inplace=True)
- 선택한 컬럼을 데이터 프레임 인덱스로 지정
result.set_index("key", inplace=True)
3) 그 외
- concat()
- join()
'Python > Python 데이터분석' 카테고리의 다른 글
[Matplotlib] 산점도(Scatter Plot) 그리기 (0) | 2022.05.27 |
---|---|
[Matplotlib] Matplotlib 이란? (0) | 2022.05.26 |
[Pandas] 함수 사용 (0) | 2022.05.25 |
[Pandas] 컬럼 추가 및 제거 (0) | 2022.05.25 |
[Pandas] Offset index와 Condition (0) | 2022.05.25 |