본문 바로가기
통계/데이터 분석 기초

Python Pandas 실무 데이터 분석 : 엑셀 데이터 전처리2 (Table Join)

by 만슨 2024. 3. 18.

 

이번 시간에는 저번시간에 이어 엑셀 데이터 전처리를 이어서 마무리 해보겠습니다.

 

 

저번시간에 실제 데이터를 전처리하여 위와같은 날짜를 키로 가진 물품에 대한 제고량을 알수있는 형태로 만들어 주었습니다.

 

이어서 계속 진행해보겠습니다.

 

먼저 컬럼명을 정의해주겠습니다.

 

 

rename 함수를 사용하여 컬럼명을 재정의 해주었습니다.

 

이제 원래의 데이터와 우리가 전처리 해준 데이터를 붙혀 보도록 하겠습니다.

 

데이터 합치기 

 

제품명을 기준으로 정렬되어 있는 재고 데이터

 

우선 기존의 데이터중 필요한 데이터프레임을 가져옵니다.

 

그 다음 우리가 전처리해준 데이터프레임과 기존 데이터프레임을 합쳐보도록 하겠습니다 .

 

Table Join

  1. right / left - 명시해준 테이블을 기준으로 다른 테이블에 데이터를 가져와서 합친다
  2. inner - 중복된 데이터들만 가져와서 합친다
  3. outer - 모든 데이터를 가져와서 합친다. 즉 결측치가 생길 수 도 있다. 

merge 함수를 사용하여 두 테이블을 붙혀주겠습니다

ex) pd.merge(df1,df2, how = ' 방법 ', on = '기준이 되는 컬럼명' )

 

 

두가지 테이블을 날짜를 기준으로 join 해주겠습니다.

 

 

 

데이터 분석

 

이제 전처리가 완성 된 데이터로 간단한 데이터 분석을 해보겠습니다 .

 

 

위처럼 pivot_table을 이용하여 월별 재고량의 합계를 알 수 있고

 

 

데이터를 시각화하여 한 눈에 알아볼 수 도 있습니다.