deda
Deda의 데이터 디자인
deda
전체 방문자
오늘
어제
  • 분류 전체보기 (121)
    • Python (27)
      • Python 기초 (17)
      • Python 데이터분석 (10)
    • SQL (9)
    • Coding test (54)
      • Python 기초문제 (45)
      • LeetCode (9)
    • BigData (2)
    • ZeroBase (3)
    • UX (0)
    • Business Review (1)
    • 통계 & 수학 (17)
      • 통계학 (14)
      • 수학 (3)
    • 스터디 (6)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 팩토리얼
  • 네카라쿠배
  • 데이터사이언티스트
  • 미니콘다
  • 제로베이스
  • 군수열
  • 모듈
  • 데이터분석
  • 소인수분해
  • pandas
  • 마이데이터
  • 등차수열
  • 데이터엔지니어
  • 데이터분석가
  • 빅데이터
  • matplotlib
  • BMI
  • 기초수학
  • 파이썬
  • 등비수열
  • 부트캠프
  • 계산기
  • 프로그래밍
  • 함수
  • 계차수열
  • 코딩
  • 통계
  • 릿코드
  • SQL
  • 최소공배수

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
deda
Python/Python 데이터분석

[Pandas] 데이터 병합

[Pandas] 데이터 병합
Python/Python 데이터분석

[Pandas] 데이터 병합

2022. 5. 25. 19:02

🔍 데이터 병합

cf) 데이터 [right], [left] 만들기

 - 딕셔너리 안에 리스트 형태(컬럼 기준으로 열 값이 들어감)

left = pd.DataFrame({
    "key": ["K0","K1","K2","K4"],
    "A": ["A0","A1","A2","A3"],
    "B": ["B0","B1","B2","B3"]
})

 

- # 리스트 안에 딕셔너리 형태(행 하나씩 들어감)

right = pd.DataFrame([
    {"key":"K0","C":"C0","D":"D0"},
    {"key":"K1","C":"C1","D":"D1"},
    {"key":"K2","C":"C2","D":"D2"},
    {"key":"K3","C":"C3","D":"D3"}  
])
right

 

1. pd.merge(data1, data2, how="방법", on="기준")

- 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법

- 기준이 되는 컬럼이나 인덱스를 키값이라고 한다.

- 기준이 되는 키값은 두 데이터 프레임에 모두 포함되어야 한다.

 

- how="inner"가 디폴트 값(교집합)

pd.merge(left, right, on="key")
pd.merge(left, right, how="inner", on="key")

- how="outer" : 합집합

pd.merge(left, right, how="outer", on="key")

 

 

- how를 이용하여 어느 쪽을 대표로 할 지 정할 수 있음

pd.merge(left, right, how="left", on="key")
pd.merge(left, right, how="right", on="key")

 

2. set_index("인덱스", inplace=True)

- 선택한 컬럼을 데이터 프레임 인덱스로 지정

result.set_index("key", inplace=True)

 

3) 그 외 

- concat()

- join()

'Python > Python 데이터분석' 카테고리의 다른 글

[Matplotlib] 산점도(Scatter Plot) 그리기  (0) 2022.05.27
[Matplotlib] Matplotlib 이란?  (0) 2022.05.26
[Pandas] 함수 사용  (0) 2022.05.25
[Pandas] 컬럼 추가 및 제거  (0) 2022.05.25
[Pandas] Offset index와 Condition  (0) 2022.05.25
  • 🔍 데이터 병합
'Python/Python 데이터분석' 카테고리의 다른 글
  • [Matplotlib] 산점도(Scatter Plot) 그리기
  • [Matplotlib] Matplotlib 이란?
  • [Pandas] 함수 사용
  • [Pandas] 컬럼 추가 및 제거
deda
deda
데이터 분석 / 파이썬 / UX / 정량리서치

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.