이번시간은 날짜 파이썬 Pandas 라이브러리를 이용하여 날짜데이터를 처리해보는 시간을 가져보도록 하겠습니다.
날짜 형태의 데이터로 바꿔주기
to_datetime 함수
object 이던 '날짜' 컬럼이
datetime64[ns] 로 바뀐것을 볼 수 있다.
날짜 형태로 바뀐 데이터에서 dt.momth, dt.week, dt.day, dt.day_name등 여러가지 함수를 이용하여 값을 가져와 사용할 수 있다.
그러나 to_datetime 함수 사용시 datetime 함수에 맞지 않는 형태로 기입되어 있으면 변환이 되지 않는다!
ex)
위와 같이 '오전' 이라는 문자가 포함 되어 있는 데이터를 to_datetime 함수를 이용하여 변환시켜 보겠다
타입에러의 발생으로 변환되지 않는다.
해결방법
apply 함수를 통해 내가 가져오고싶은 길이만큼에 자리수만 가져와서 변환시켜 보겠다.
apply 함수 - Dataframe['컬럼명'].apply(함수) 구조로 우리가 원하는 컬럼에 원하는 함수를 적용시킬 수 있는 함수이다.
오류없이 잘 변환되어 나오는 것을 볼 수 있다.
위와 같이 배송시간을 구하여 그에따른 대표값들 또한 확인해 볼 수 있다.
위와 같이 '-' 구분이 되어있지 않은 숫자 데이터도
apply 함수를 통해 내가 정의한 함수를 사용하여 datetime으로 변환 시킬 수 있다.
참고 : [매일 10분 데이터 분석] 날짜데이터를 처리 하자! 2편 (python / date time / pandas / apply ) (youtube.com)