Pandas데이터 조작 및 분석을 위한 Python 라이브러리이다.특히 data frame(데이터 프레임)을 사용하여 테이블 형식의 데이터를 쉽게 다룰 수 있도록 도와준다.데이터 불러오기, 정리, 변환, 분석 등의 작업을 효율적으로 수행 가능하다.주요 기능데이터 읽기 및 쓰기 (CSV, Excel, SQL 등)데이터 정리 및 변환데이터 필터링 및 선택그룹화 및 집계시계열 데이터 분석# 설치pip install pandas# importimport pandas as pd# CSV 파일 읽기df = pd.read_csv('filename.csv')# 데이터 프레임의 첫 몇 행 보기print(df.head()) RequestsHTTP 요청을 보내기 위한 Python 라이브러리이다.웹 페이지에서 데이터를 가져오..
[Language]/Python
업무와 관련된 주요 일로 사용하려는 것은 아니다.그러나 자동화하고 싶은 요소가 생겨 파이썬을 설치하게 되었다. 어차피 개인이 쓰는 거라 버전이 딱히 필요 없을 것 같아서, 3.12.4로 다운받겠다.1. Python 3.12.4 설치1. Python 다운로드 웹사이트 이동 https://www.python.org/downloads/ Download PythonThe official home of the Python Programming Languagewww.python.org2. Python 3.12.4 설치 프로그램 다운3. 체크박스 모두 체크하고 Install Now4. 다운로드 대기5. Disable path length limit 해제윈도우 10에서는 경로에 대한 글자 수 제한이 존재하여, 제한 해..
내가 가진 data의 datetime column은 날짜와 시간이 같이 들어가있다. 아직은 day & time을 한번에 인식하고 정렬해주는 기능을 찾지 못했기 때문에 (없을 확률이 더 큼 ㅠㅋㅋ) 날짜 따로, 시간 따로 col을 분리해줄 것이다. 일단 csv 파일을 불러올 때 parse_dates를 이용해서 datetime을 날짜로 불러온다. bike_data_2011_2012["date"] = [d.date() for d in bike_data_2011_2012['datetime']] bike_data_2011_2012["time"] = [d.time() for d in bike_data_2011_2012['datetime']] 위 코드를 입력한 후, head()로 보면 짠 ! 맨 우측 date, ti..
이 data들을 아래처럼 저장하고 싶었으나 이상한 Unnamed column이 앞에 추가되어 저장되었다. 덕분에 row data들이 17,379개 있다는 것을 알게 되었으나 Unnamed col을 없애버리고 싶었다. dataframe_name.to_csv("filename.csv", index=None) index = None 을 우측에 적어주니까 Unnamed가 사라졌다
Bike share demand prediction 과제 수행 중, lightGBM 모델을 설치하는데 문제가 생겼다. 참고로 나는 MacOS를 사용한다. 기본 윈도우 서버에서 돌린 모델을 가져와 MacOS로 옮겼기 때문에 따로 설치가 필요한 모델들은 설치를 해줘야만 했다. XGBoost나 CatBoost는 pip 명령어로 잘 설치가 되었는데 이상하게 lightGBM만 말썽이었다. pip으로 설치가 되었다고 나왔고, kernel 또한 재시작 하였으나, 아래와 같은 OSError를 봐야했다. ⚫️ 나는 실패했지만 혹시나 필요한 누군가를 위해 'Homebrew 설치' 더보기 "MacOS에서 수월하게 프로그램을 설치할 수 있는 패키지 관리자인 Homebrew를 설치해야 한다길래 설치하였다." 실패했다. Home..
1. 문자 개수 세기 (Count) a="hobby" print(a.count('b')) #count()함수 사용 -> 문자열 중 문자 'b' 개수 출력 '2' 위치 알려주기 (fint, index) a="Python is the best choice" print(a.find('b')) #b의 위치 print(a.find('k')) #k 위치 14 #문자열에서 b가 처음 나온 위치 -1 #문자열에 존재하지 않을 때 -1이 반환됨 a="Life is too short" print(a.index('t')) print(a.index('k')) 8 #t가 처음 나온 위치 Traceback (most recent call last): File "/Users/soheepark/Documents/a=1.py", li..
1. 문자열 포매팅 : 문자열 내 특정값 바꿔줌 숫자 바로 대입 print("I eat %d apples." %3) #%d : 숫자 넣고 싶은 자리 #%3 : 숫자 3 대입 'I eat 3 apples.' 문자열 바로 대입 print("I eat %s apples." %"five") #%s : 문자열을 넣기 위해서는 %s를 써야 한다. 'I eat five apples.' 숫자 값 나타내는 변수 대입 number=3 print("I eat %d apples." %number) #number 변수 대입 'I eat 3 apples.' 2개 이상 값 넣기 number=10 day="three" print("I ate %d apples. so I was sick for %s days." %(number, da..
*이스케이프 코드 \n : 줄 바꿈 \t : 문자열 사이 탭 간격 줌 \\ : 문자 \ 그대로 표현 \' : ' 그대로 표현 \" : " 그대로 표현 \r : 현재 커서 가장 앞 이동 \f : 현재 커서 다음 줄 이동 \a : 출력 시 '삑' 소리 남 \b : 백스페이스 \000 : null 문자 1. 문자열 종류 " " : 큰따옴표 ' ' : 작은따옴표 """ """ : 큰따옴표 3개 ''' ''' : 작은따옴표 3개 2.(') 문자열에 작은따옴표 포함 Python's favortie food is perl food="Python's favortie food is perl" print(food) Python's favortie food is perl 문자열에 큰따옴표(") 포함 "Python is ve..
IDLE 프로그램은 print를 입력하지 않아도 출력 결과물을 보여주기도 하지만, Visual Studio Code는 print를 입력해야 출력 결과물을 보여준다. 하지만 비주얼 스튜디오가 입력하는 것과 보기에는 간편하다. 1. 사칙연산 + : 더하기 - : 뺄셈 * : 곱셈 / : 나눗셈 ** : a*b 결과값의 제곱값 a=3 b=4 print(a**b) #a*b=7의 제곱값 81 % : 나눗셈 나머지값 print(7%3) #7과 3 나눗셈 나머지값 1 // : 나눗셈 몫 반환 print(7//4) #7/4 후 몫 반환 1