이번시간에는 가져온 데이터에 행 추출, 정렬, 필터링(오름차순,내림차순), 저장 을 해보겠습니다
1. 행 추출
iloc[행 번호]
- 행 번호에 맞는 데이터를 추출 해준다
위와 같이 행 범위를 설정해주어 추출 하는것도 가능하다.
2. 데이터 정렬
2.1 sort.values(by='정렬기준', ascending = True or False)
- 정렬기준에 따라 정렬 해준다 여기서 ascending 을 생략 및 True로 설정하면 오름차순 False로 설정하면 내림차순으로 정렬 된다
2.2 sort.value(by=['정렬기준1','정렬기준2'])
- 여러가지 정렬기준을 정하고 싶을 땐 by라는 함수 안에 리스트 형태로 정렬기준을 여러가지 지정 해준다.
3. 데이터 필터
데이터들 중에 조건에 맞는 데이터를 추출 해보자
['조건 컬럼명'].value_count()
- 조건 컬러명의 카운트를 보여준다.
loc[조건]
- 조건에 맞는 행을 필터링 해주는 함수
- 여러 조건에 맞는 행을 가져오고 싶을 때는 조건을 &(and기호)로 묶어 가져온다
ex) df1.loc[filter1 & filter2]
연습
연령대가 30대 이하이고 성별이 여성인 데이터를 구매금액이 높은 순서정렬하여 추출하라
filter1 = (df1['연령대'] == '30대이하')
filter2 = (df1['성별'] == '여')
df1.loc[filter1 & filter2].sort_values(by = '구매금액', ascending = False)
저장
to_csv('파일경로/파일명.csv')
- csv형태로 저장, 파일경로 생략하면 스크립트가 있는 폴더에 저장 된다.
encoding = 'cp949' 를 통해 한글이 깨지지 않고 보이게 저장