본문 바로가기
통계/데이터 분석 기초

Python Pandas 실무 데이터 분석(Series, Dataframe 구조)

by 만슨 2024. 3. 11.

이번 시간에는 파이썬에 Pandas 라이브러리 2가지 데이터 형태인 Series 와 Dataframe 데이터 구조에 대해서 알아보겠습니다.

1. Pandas library

더보기

Pandas library란 ? 

- 정형 데이터(xlsx, csv 데이터 등)를 처리하는 라이브러리 

 

Pandas library에는 2가지의 데이터 타입이있다. 

 

  • Series - 모든 유형의 데이터 가지고 있는 1차원의 배열
  • Dataframe - 2차원의 배열, 행과 열이 있는 2차원의 데이터 구조

 

Series

  • index - value 로 이루어짐

 

s3 에서 보듯 Series에서 데이터 타입을 일치 시킴

 

Dataframe

  • index - column - value 로 이루어짐

Dataframe 의 장점

  1. 대용량 데이터를 빠르고 쉽게 다를 수 있다. 
  2. 복잡한 기능을 구현하기 쉽고, 데이터 전처리를 쉽게 할 수 있다.
  3. 다른 시스템과 연동이 쉽다.

 

데이터프레임에서 [] 하나만의 사용으로 Series 형태로 가져올 수 있다

 

but 여러컬럼을 가져올 땐 dataframe 형태로만 가져올 수 있다. 

Series 형태로 가져온 경우
DataFrame 형태로 가져온 경우

 

 

참고 : Python Pandas 실무 데이터 분석 1탄 (Series / Dataframe 구조) #Python #파이썬 #Pandas (youtube.com)