본문 바로가기
통계/데이터 분석 기초

Python Pandas 실무 데이터 분석 : 날짜 데이터 처리

by 만슨 2024. 3. 15.

이번시간은 날짜 파이썬 Pandas 라이브러리를 이용하여 날짜데이터를 처리해보는 시간을 가져보도록 하겠습니다.

 

날짜 형태의 데이터로 바꿔주기 

 

to_datetime 함수

 

 

object 이던 '날짜' 컬럼이 

 

datetime64[ns] 로 바뀐것을 볼 수 있다. 

 

날짜 형태로 바뀐 데이터에서 dt.momth, dt.week, dt.day, dt.day_name등 여러가지 함수를 이용하여 값을 가져와 사용할 수 있다. 

 

 

그러나 to_datetime 함수 사용시 datetime 함수에 맞지 않는 형태로 기입되어 있으면 변환이 되지 않는다!

 

ex)

 

위와 같이 '오전' 이라는 문자가 포함 되어 있는 데이터를 to_datetime 함수를 이용하여 변환시켜 보겠다 

 

 

타입에러의 발생으로 변환되지 않는다. 

 

해결방법 

apply 함수를 통해 내가 가져오고싶은 길이만큼에 자리수만 가져와서 변환시켜 보겠다.

 

apply 함수 - Dataframe['컬럼명'].apply(함수) 구조로 우리가 원하는 컬럼에 원하는 함수를 적용시킬 수 있는 함수이다. 

 

 

 

오류없이 잘 변환되어 나오는 것을 볼 수 있다.

 

 

위와 같이 배송시간을 구하여 그에따른 대표값들 또한 확인해 볼 수 있다.

 

 

위와 같이 '-' 구분이 되어있지 않은 숫자 데이터도 

 

 

apply 함수를 통해 내가 정의한 함수를 사용하여 datetime으로 변환 시킬 수 있다.

 

 

참고 : [매일 10분 데이터 분석] 날짜데이터를 처리 하자! 2편 (python / date time / pandas / apply ) (youtube.com)