본문 바로가기
통계/데이터 분석 기초

Python Pandas 실무 데이터 분석(행 추출, 정렬, 필터링, 저장)

by 만슨 2024. 3. 14.

이번시간에는 가져온 데이터에 행 추출, 정렬, 필터링(오름차순,내림차순), 저장 을 해보겠습니다

 

1. 행 추출

iloc[행 번호] 

- 행 번호에 맞는 데이터를 추출 해준다 

 

위와 같이 행 범위를 설정해주어 추출 하는것도 가능하다.

 

2. 데이터 정렬

2.1 sort.values(by='정렬기준', ascending = True or False)
- 정렬기준에 따라 정렬 해준다 여기서 ascending 을 생략 및 True로 설정하면 오름차순  False로 설정하면 내림차순으로 정렬 된다 

 

 

2.2 sort.value(by=['정렬기준1','정렬기준2']) 

- 여러가지 정렬기준을 정하고 싶을 땐 by라는 함수 안에 리스트 형태로 정렬기준을 여러가지 지정 해준다.

 

 

 

3. 데이터 필터

 

데이터들 중에 조건에 맞는 데이터를 추출 해보자

 

['조건 컬럼명'].value_count()

- 조건 컬러명의 카운트를 보여준다. 

 

loc[조건]

- 조건에 맞는 행을 필터링 해주는 함수

- 여러 조건에 맞는 행을 가져오고 싶을 때는 조건을 &(and기호)로 묶어 가져온다

ex) df1.loc[filter1 & filter2]

 

연습

연령대가 30대 이하이고 성별이 여성인 데이터를 구매금액이 높은 순서정렬하여 추출하라 

 

더보기

filter1 = (df1['연령대'] == '30대이하')

filter2 = (df1['성별'] == '여')
df1.loc[filter1 & filter2].sort_values(by = '구매금액', ascending = False)

 

 

저장 

to_csv('파일경로/파일명.csv')

- csv형태로 저장, 파일경로 생략하면 스크립트가 있는 폴더에 저장 된다.

 

 

encoding = 'cp949' 를 통해 한글이 깨지지 않고 보이게 저장

 

참고 : [데이터분석] 분식이의 Python Pandas 실무 데이터 분석 3탄 (행 추출하기 / 정렬하기 / 필터링 / 저장) #Python #파이썬 #Pandas (youtube.com)