Unsupervised Learning (비지도 학습) 1. Association Analysis (연관 분석) 장바구니 분석 대용량 데이터 아이템 간 연관성 찾아냄 EX) 월마트 : 맥주 - 기저귀 연관성 용어 Support (지지도) 거래집합 -> (해당 항목집합) 상대적 발생 빈도 (전체 경우의 수) 계산량 ↓ Apriori 알고리즘 Ex) 맥주 구매인 -> 대부분 콜라도 구매 Confidence (향상도) Rule Strength (연관규칙 강도) [선행항목 A / 후행항목 B] A∩B /A Lift (향상도) 항목 A, B : 구매 패턴 독립적 or 상관 관계 파악 (A 구매 → B 확률) / (B 임의로 구매 될 확률) Lift(A->B) = support(A,B) / support(A) * ..
[Data Science]/Data Analysis
Supervised learning (지도학습 분석기법) 1. Dedision Tree (의사결정나무) 데이터 분류, 예측 -> 도표화 장점) 1. IF THEN 형태 표현 : 결과 이해 / 해석 용이 2. 통계적 가정 필요X 3. 분류 과정 -> 변수 중요도 파악 가능 단점) 1. 적합 모형 만듦 -> 시간 소요 多 2. 변수 간 상관성 파악 어려움 (∵각각 하나의 변수 기준 구분) Data Set : Titanic training (생존요인 관련 속성만 포함) 생존확률에 가장 큰 영향 미치는 속성 : 성별 > 승선한 부모/자녀 수 > 승선한 형제자매/배우자 수 > Passenger Fare 순 2. K-NN (K-Nearest Neighbor / 최근접 이웃 알고리즘) New data - Neares..