🔍 Pandas란?
- python에서 R만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈
- 단일 프로세스에서는 최대 효율
- 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨(스테로이드 맞은 엑셀)
import pandas as pd
🗝 Pandas 자료구조
- Pandas에서는 기본적으로 정의되는 자료구조인 Series와 Data Frame을 사용.
1) series
- index와 value로 이루어져 있음
- 한가지 타입만 가질 수 있음
- 수로만 이루어져 있으면 연산 가능
pd.Series([1,2,3,4])
pd.Series([1,2,3,4], dtype=np.float64)
pd.Series(np.array([1,2,3,4]))
pd.Series({"key":"value"})
data % 2
2) DataFrame
- index, value, column로 이루어져 있음
- pd.DataFrame(values, index=i, columns=[])
data = np.random.randn(6,4)
dates = pd.date_range("20210101", periods=6)
df = pd.DataFrame(data, index=dates, columns=["A","B","C","D"])
'Python > Python 데이터분석' 카테고리의 다른 글
[Pandas] 데이터 병합 (0) | 2022.05.25 |
---|---|
[Pandas] 함수 사용 (0) | 2022.05.25 |
[Pandas] 컬럼 추가 및 제거 (0) | 2022.05.25 |
[Pandas] Offset index와 Condition (0) | 2022.05.25 |
[Pandas] 정보 탐색 및 정렬 (0) | 2022.05.25 |