이번 시간에는 파이썬에 Pandas 라이브러리 2가지 데이터 형태인 Series 와 Dataframe 데이터 구조에 대해서 알아보겠습니다.
1. Pandas library
더보기
Pandas library란 ?
- 정형 데이터(xlsx, csv 데이터 등)를 처리하는 라이브러리
Pandas library에는 2가지의 데이터 타입이있다.
- Series - 모든 유형의 데이터 가지고 있는 1차원의 배열
- Dataframe - 2차원의 배열, 행과 열이 있는 2차원의 데이터 구조
Series
- index - value 로 이루어짐
s3 에서 보듯 Series에서 데이터 타입을 일치 시킴
Dataframe
- index - column - value 로 이루어짐
Dataframe 의 장점
- 대용량 데이터를 빠르고 쉽게 다를 수 있다.
- 복잡한 기능을 구현하기 쉽고, 데이터 전처리를 쉽게 할 수 있다.
- 다른 시스템과 연동이 쉽다.
데이터프레임에서 [] 하나만의 사용으로 Series 형태로 가져올 수 있다
but 여러컬럼을 가져올 땐 dataframe 형태로만 가져올 수 있다.
참고 : Python Pandas 실무 데이터 분석 1탄 (Series / Dataframe 구조) #Python #파이썬 #Pandas (youtube.com)