728x90
반응형
내가 가진 data의 datetime column은 날짜와 시간이 같이 들어가있다.
아직은 day & time을 한번에 인식하고 정렬해주는 기능을 찾지 못했기 때문에 (없을 확률이 더 큼 ㅠㅋㅋ)
날짜 따로, 시간 따로 col을 분리해줄 것이다.
일단 csv 파일을 불러올 때 parse_dates를 이용해서 datetime을 날짜로 불러온다.
bike_data_2011_2012["date"] = [d.date() for d in bike_data_2011_2012['datetime']]
bike_data_2011_2012["time"] = [d.time() for d in bike_data_2011_2012['datetime']]
위 코드를 입력한 후, head()로 보면
짠 ! 맨 우측 date, time이 분리되어 추가되었다.
물론 원래의 col인 datetime은 여전히 존재한다.
date와 time을 맨 앞으로 column 위치를 변경하고 싶어서
우선 하나하나 다 적기 귀찮으니까 복붙할 col list를 출력하였다.
cols = list(bike_data_2011_2012.columns.values)
print(cols)
출력된 col list 복붙 !
bike_data_2011_2012 = bike_data_2011_2012[['datetime', 'date', 'time', 'season',
'holiday', 'workingday', 'weather', 'temp', 'atemp', 'humidity', 'windspeed', 'count']]
이렇게 복붙하고 맨 우측에 있던 date, time을 앞에 붙여넣고
head()로 확인해보면 위치가 변경된 것을 알 수 있다.
원래 datetime col은 드랍해주고,
bike_data_2011_2012 = bike_data_2011_2012.drop(['datetime'], axis = 1)
bike_data_2011_2012.head()
우선 date를 기준으로 data들을 정렬한 다음, time으로 정렬 (오름차순)
bike_data_2011_2012_sort = bike_data_2011_2012.sort_values(by=["date", "time"], ascending=[True, True])
저장
bike_data_2011_2012_sort.to_csv("sample.csv", index=None)
[최종]
train(1일~19일) dataset과
test (20일~말일) dataset이 합쳐져서
순서가 뒤죽박죽이었는데
date와 time으로 구분하니까 날짜와 시간 순서대로 data들이 깔끔하게 정리되었다.
google은 제 2의 어머니같은 존재라는 것을 다시 한번 느끼게 되었다.
구글 만세
728x90
반응형
'[Language] > Python' 카테고리의 다른 글
[Window] Python 3.12.4 & VSC & Pandas 설치 (0) | 2024.06.20 |
---|---|
[Mac/Python] Version 확인 (0) | 2024.01.06 |
[Jupyter Notebook] Index 제거 후 CSV 파일 저장 (0) | 2022.07.28 |
Pip LightGBM : OSError (0) | 2022.07.26 |
문자열 입력(3) (0) | 2022.03.14 |