데이터 전처리2 Python Pandas 실무 데이터 분석 : 엑셀 데이터 전처리 3 (Stack / Melt) 엑셀 데이터 전처리를 이어서 진행 해보겠습니다. 데이터 오늘 전처리할 데이터는 음료회사의 점포, 상품, 수량으로 이루어진 데이터 이다 오늘 목표는 점포 별 판매량의 추이를 그래프로 표현 상품의 종류를 나누어 표현 가장 많이 팔린 점포만 확인 입니다 데이터 재구조화 및 전처리 원본 데이터의 구조를 바꾸어 주는 것 pivot(), pd.pivot_table() stack(), unstack() melt() wide_to_long 먼저 필요없는 컬럼인 '순번', '상품코드' 컬럼을 삭제 해준 후 상품명을 기준으로 각 점포별 수량을 볼 수 있게 재구조화 해주겠습니다. 1. Stack 함수 상품명을 index로 둔 다음 stack 함수를 이용하여 전처리 - '상품명'을 index로 둔 이유는 value값에 수치 .. 2024. 3. 26. Python Pandas 실무 데이터 분석 : 엑셀 데이터 전처리2 (Table Join) 이번 시간에는 저번시간에 이어 엑셀 데이터 전처리를 이어서 마무리 해보겠습니다. 저번시간에 실제 데이터를 전처리하여 위와같은 날짜를 키로 가진 물품에 대한 제고량을 알수있는 형태로 만들어 주었습니다. 이어서 계속 진행해보겠습니다. 먼저 컬럼명을 정의해주겠습니다. rename 함수를 사용하여 컬럼명을 재정의 해주었습니다. 이제 원래의 데이터와 우리가 전처리 해준 데이터를 붙혀 보도록 하겠습니다. 데이터 합치기 우선 기존의 데이터중 필요한 데이터프레임을 가져옵니다. 그 다음 우리가 전처리해준 데이터프레임과 기존 데이터프레임을 합쳐보도록 하겠습니다 . Table Join right / left - 명시해준 테이블을 기준으로 다른 테이블에 데이터를 가져와서 합친다 inner - 중복된 데이터들만 가져와서 합친다.. 2024. 3. 18. 이전 1 다음