첫 ppt 발표 : 2022. 5. 2. 월요일 개선 ppt 발표 : 2022. 5. 23. 월요일 실제로 첫 프로젝트를 발표한지 두달이 지났지만 나의 변화를 보기 위해 올린다..^^ 피드백과 개선사항 위주로 업로드하려고 한다. 1) PPT 퀄리티 1. 정말 조잡한 목차 모델링까지 완료해서 목차를 수정하였다. 보통 kaggle에 있는 bike share demand는 test 데이터셋의 label을 예측하는 것이기 때문에 전체적인 수치를 예측하는 것까지 나와있지 않다. 그러나, 나는 해당 사업을 진행하고 있는 기업이 나에게 예측 의뢰를 맡겼다는 컨셉을 잡았기 때문에 test label만 예측하기에는 뭔가 찝찝했다. 그래서 전체적인 bike share demand도 예측하는 모델링을 진행하였다. train..
[Data Science]/Data Analysis
capital bike share demand 진행 중 error 모음집이다. AttributeError: 'Series' object has no attribute 'value' [원인] 1. counts 뒤 ( ) 실수로 빠뜨림 2. value.counts() 가 아니라 value_counts()임 [해결] train["dayofweek"].value_counts() TypeError: The DTypes and do not have a common DType. For example they cannot be stored in a single array unless the dtype is `object`. LR(선형회귀) 분석을 위해 데이터를 Train, Test 으로 분리하는 과정에서 생긴 에러이다..
Kaggel - Capital bike share demand 과제 中 datetime season holiday workingday weather temp atemp humidity windspeed count 필드 총 10개의 row data를 가지고 있는 train.csv와 test.csv 이 두 파일을 합칠 예정이다. import csv import glob import os input_path = r'D:\predict' #합칠 파일들이 들어있는 디렉토리 경로 output_file = r'D:\predict\sample.csv' #최종 파일명 file_list = glob.glob(os.path.join(input_path, '*.csv')) with open(output_file, 'w') a..
https://en.wikipedia.org/wiki/List_of_bicycle-sharing_systems#Bicycle_sharing_systems List of bicycle-sharing systems - Wikipedia en.wikipedia.org https://terms.naver.com/entry.naver?docId=3566538&cid=43667&categoryId=43667 공공 자전거 주민들의 편의를 도모하고 교통 체증, 대기오염 문제를 해결하기 위해 정부나 지역 내 민간단체가 대여·반납 체계를 갖춰 주민들에게 빌려 주는 자전거를 말한다. | 외국어 표기 | terms.naver.com -정부/지역 내 민간단체가 대여, 반납 체계를 갖춰 해당 지역의 주민/방문객에게 빌려주는 자전..
Jupyter Notebooks 환경에서 Python을 이용하여 분석하겠다. [CSV 파일 불러오기] bike sharing demand.csv 파일 불러오기 #Pandas : Python Data Analysis Library #pandas imporing as pd import pandas as pd #bike sharing demand.csv 불러오기 #datetime → 날짜로 해석 : parse_dates option train = pd.read_csv("bike sharing demand.csv", parse_dates=["datetime"]) #정의 된 train - data의 모양 print print(train.shape) #head() : train - data 상위 5개 train.h..
2011.1.20 ~ 2012.12.31 season, holiday, workingday, weather, temp, atemp, humidity, windspeed https://www.wunderground.com/history/daily/us/dc/washington/KDCA/date/2011-1-20 Arlington County, VA Weather History | Weather Underground © Copyright TWC Product and Technology LLC 2014, 2022 www.wunderground.com 시간 별 온도/강수량/풍속/돌풍 확인 가능 * 온도 기준 : 화씨 (Fº) * 온도 : 화씨온도(Fº -> Cº) 변경 일/시간/날씨 별 이용자 수 카운트 지형/..
회귀 분석의 독립 변수로는 트립 생성, 트립 인력 및 각 역에서 도보 400미터 이내의 교통망 요소 초기 미조정 회귀 분석은 14개의 독립 변수 중 12개가 통계적으로 유의하다는 것을 나타냅니다(없음). 다른 변수의 영향에 대한 제어). 다변량 회귀 분석에서는 통계적으로 5를 가리킵니다. Capital Bikeshare 사용에 대한 중요한 결정 요인: 인구(20~39세) 비백인 집단 소매 밀도(알코올 라이센스를 프록시로 사용) 지하철역 자전거 공유 시스템 중앙으로부터의 거리 점점 더 다양한 목표와 이를 이행할 수 있는 재정적 여력이 크게 감소함 교통 계획 분야는 기로에 서 있습니다. 한편으로, 정부는 경제 개발, 환경 지속 가능성, 그리고 종종 경쟁하는 우선 순위들을 촉진한다. 사회 정..
Capital bikeshare 분석 [1] https://account.capitalbikeshare.com/map Capital Bikeshare | Bike share in the Metro DC area account.capitalbikeshare.com 1.Washington D.C. 위치에 제일 많이 분포하고 있다. 버지니아주와 메릴랜드주 일부까지 뻗어있다. (헬멧 착용 필수) 2. 가격 2-1. Single Trip : 자전거 $1에 잠금 풀고 분마다 0.05$씩 클래식 자전거 대여/0.15$씩 ebike 대여 ($1 = \1,151.8) -> ebike : 페달 보조 모터 존재 / classic bike : 보조 모터 x -> capital bikeshare 역에서 ebike 주차는 무료...
Washington D.C. 분석 [1] https://en.wikipedia.org/wiki/Washington,_D.C. Washington, D.C. - Wikipedia From Wikipedia, the free encyclopedia Jump to navigation Jump to search Capital city of the United States Federal capital city and federal district in the United States Washington, D.C.District of Columbia Nickname(s): D.C., The DistrictMotto(s): Justiti en.wikipedia.org https://terms.naver.com/ent..
https://www.kaggle.com/competitions/bike-sharing-demand/data Bike Sharing Demand | Kaggle www.kaggle.com 더보기 Bike sharing systems are a means of renting bicycles where the process of obtaining membership, rental, and bike return is automated via a network of kiosk locations throughout a city. 자전거 공유 시스템은 도시 전역의 키오스크 위치 네트워크를 통해 회원권, 대여, 자전거 반납 절차를 자동화하는 자전거들을 빌리는 수단이다. Using these systems, peopl..
CRISP-DM (Cross Industry Standard Process For Data Mining) 모든 산업 군에서 활용 가능한 데이터 과학에서의 분석 방법론의 일종 1. 비즈니스 이해 : 데이터 분석 목적 2. 데이터 이해 : 목적에 따른 데이터들의 타당성 검토 3. 데이터 준비 : 데이터들이 정확한가? 4. 모델링 : 데이터들 간 관계성 5. 검증 및 평가 : 분석 결과의 정확성 / 당위성 6. 구현 및 게시 : 분석 적용 1. 비즈니스 이해 가장 중요하다. 이 데이터의 분석 목적이 무엇인지 정확하게 지정해야 하고, 관련된 데이터의 정보란 정보는 전부 다 수집해야 한다. 궁금증이 꼬리에 꼬리를 물어야 정확한 인사이트를 도출해 내는 단계이다. 예를 들어 타이타닉의 기본 정보는 물론, 승선했을 때..
RapidMiner 프로그램을 이용할 예정이다. GUI 형식으로 되어 있어 데이터 분석 초보자가 사용하기에 편리하다는 이점이 있다. 1. 데이터 전처리 -타이타닉 데이터를 Process 창에 끌어다 놓으면 [Retrieve Titanic] 박스가 생성된다. 💡 Retrieve : 회수하다, (정보를) 검색하다 set role operator을 배치해주고 파라미터 내 attribute name(속성 이름)을 정해준다. 이름으로 정해줬다. ▶attribute name 설명 더보기 attribute name Description: The name of the Attribute which role should be changed. The name can be selected from the dropdown me..