RapidMiner 프로그램을 이용할 예정이다. GUI 형식으로 되어 있어 데이터 분석 초보자가 사용하기에 편리하다는 이점이 있다. 1. 데이터 전처리 -타이타닉 데이터를 Process 창에 끌어다 놓으면 [Retrieve Titanic] 박스가 생성된다. 💡 Retrieve : 회수하다, (정보를) 검색하다 set role operator을 배치해주고 파라미터 내 attribute name(속성 이름)을 정해준다. 이름으로 정해줬다. ▶attribute name 설명 더보기 attribute name Description: The name of the Attribute which role should be changed. The name can be selected from the dropdown me..
1. 출력 public class HelloWorldApp { public static void main(String[] args) { //main : method System.out.println("Hello World!!"); } } Hello World!! 학교 다닐 때 처음으로 배웠던 간단한 출력 기능. 다시 배우고 있다. 학교 다닐 때 열심히 할걸 후회해도 지금 다시 열심히 하면 된다. 소스코드 이름을 직관적으로 짓자. 어떤 기능과 구현하려는 목적이 무엇인지 한눈에 파악할 수 있어야 한다. 💡class 이름과 맨 위 public class 뒤 이름이 같아야 한다. 2. 데스크탑 기능 //desktop App, 데스크탑이 뜨면서 "Hello World!!"가 뜬다. import javax.swin..
1. 초기 코드 //IOT 작동 소스코드 2 //이사갈 때 id값 직접 수정 및 컴파일 : 복잡함 //프로그램 실행 -> 사용자의 주소 직접 입력 -> 아이디값 세팅식으로 바꾸기 import javax.swing.JOptionPane; //JOptionPane 기능 사용하기 위한 swing 기능 추가 import org.opentutorials.iot.Elevator; //org 패키지 내 opentutorials 내 iot 내 Elevator 소스코드를 가져와서 쓰겠다는 의미. import org.opentutorials.iot.Lighting; import org.opentutorials.iot.Security; public class OkJavaGoinHomeinput { public static ..
디버깅 (debugging) : 시스템의 논리적 오류 / 버그 찾아냄 -> 원인 밝힘 -> 수정하는 작업 과정 💡 자바 이클립스를 이용하여 디버깅을 해보겠다. 1. break point 지정 36번 줄 좌측 빈공간 더블 클릭 -> 동그라미 표시 : break point 지정 완료 💡break point 지정 후 다시 더블 클릭 : break point 해제 2. debugger click 벌레 아이콘 클릭 3. switch click 4. debugging 5. 확인 우측 창을 보면 초기에 설정해놓은 변수 값이 잘 세팅되어 있다. (id값 & bright값) 6. debug 창 나가기 현재는 debug 창에 위치해 있기 때문에 벌레 아이콘에 체크되어 있다. debug 창을 나가려면 벌레 아이콘 옆 패키지..
비주얼 스튜디오 2022 기준 1. New 프로젝트 생성 콘솔 앱 - 솔루션 및 프로젝트를 같은 디렉터리에 배치(D) 클릭 2. 입력하고자 하는 코드 입력 3. 빌드(B) - 솔루션 정리 4. 프로젝트 - 속성 5. 일반 - Release 확인 6. 표시 부분 Release 확인 7. 빌드 - 솔루션 다시 빌드 8. 최종 결과 확인 빌드 오류가 뜨고 exe 프로그램이 없다고 에러가 나서 프로젝트 삭제하고 처음부터 이 과정으로 해보니 정상적으로 작동된다. 잘 작동하다가도 빌드 오류가 뜨는 경우여서 차라리 삭제하고 다시 프로젝트를 생성했다. C:\Users\USER\source\repos\test1\x64\Release 안내 된 경로를 따라 가봤는데 exe 프로그램이 없었다. 그럼 그동안 어떻게 작동되었던 ..
Unsupervised Learning (비지도 학습) 1. Association Analysis (연관 분석) 장바구니 분석 대용량 데이터 아이템 간 연관성 찾아냄 EX) 월마트 : 맥주 - 기저귀 연관성 용어 Support (지지도) 거래집합 -> (해당 항목집합) 상대적 발생 빈도 (전체 경우의 수) 계산량 ↓ Apriori 알고리즘 Ex) 맥주 구매인 -> 대부분 콜라도 구매 Confidence (향상도) Rule Strength (연관규칙 강도) [선행항목 A / 후행항목 B] A∩B /A Lift (향상도) 항목 A, B : 구매 패턴 독립적 or 상관 관계 파악 (A 구매 → B 확률) / (B 임의로 구매 될 확률) Lift(A->B) = support(A,B) / support(A) * ..
Supervised learning (지도학습 분석기법) 1. Dedision Tree (의사결정나무) 데이터 분류, 예측 -> 도표화 장점) 1. IF THEN 형태 표현 : 결과 이해 / 해석 용이 2. 통계적 가정 필요X 3. 분류 과정 -> 변수 중요도 파악 가능 단점) 1. 적합 모형 만듦 -> 시간 소요 多 2. 변수 간 상관성 파악 어려움 (∵각각 하나의 변수 기준 구분) Data Set : Titanic training (생존요인 관련 속성만 포함) 생존확률에 가장 큰 영향 미치는 속성 : 성별 > 승선한 부모/자녀 수 > 승선한 형제자매/배우자 수 > Passenger Fare 순 2. K-NN (K-Nearest Neighbor / 최근접 이웃 알고리즘) New data - Neares..
[제 32회 ADsP 합격] 1 공부 기간 2주 (데이터 관련 지식 노베이스) 2 교재 2020 데이터 분석 준전문가 ADsP 한 권으로 끝내기 / 황소걸음 3 시험일 2022. 2. 26. Sat. 10:00A.M. 4 시험장소 인천옥련중학교 (220226 기준 주차 가능) 5 결과 발표일 2022. 3. 25. Fri. 10:00A.M. 6. 성적 7. 자격증 발급 [ADsP 사전 정보] 1 시험 범위 데이터 이해, 데이터분석 기획, 데이터 분석 2 시험 형태 필기시험 3 시험 응시 자격 제한없음 4 시험 응시 준비물 컴퓨터사인펜, 볼펜, 신분증, 수험표 5 응시료 ₩50,000 6 접수 사이트 https://www.dataq.or.kr/www/main.do 4. 시험 문항수 및 배점 [공부 접근법]..
1. 문자 개수 세기 (Count) a="hobby" print(a.count('b')) #count()함수 사용 -> 문자열 중 문자 'b' 개수 출력 '2' 위치 알려주기 (fint, index) a="Python is the best choice" print(a.find('b')) #b의 위치 print(a.find('k')) #k 위치 14 #문자열에서 b가 처음 나온 위치 -1 #문자열에 존재하지 않을 때 -1이 반환됨 a="Life is too short" print(a.index('t')) print(a.index('k')) 8 #t가 처음 나온 위치 Traceback (most recent call last): File "/Users/soheepark/Documents/a=1.py", li..
1. 문자열 포매팅 : 문자열 내 특정값 바꿔줌 숫자 바로 대입 print("I eat %d apples." %3) #%d : 숫자 넣고 싶은 자리 #%3 : 숫자 3 대입 'I eat 3 apples.' 문자열 바로 대입 print("I eat %s apples." %"five") #%s : 문자열을 넣기 위해서는 %s를 써야 한다. 'I eat five apples.' 숫자 값 나타내는 변수 대입 number=3 print("I eat %d apples." %number) #number 변수 대입 'I eat 3 apples.' 2개 이상 값 넣기 number=10 day="three" print("I ate %d apples. so I was sick for %s days." %(number, da..
*이스케이프 코드 \n : 줄 바꿈 \t : 문자열 사이 탭 간격 줌 \\ : 문자 \ 그대로 표현 \' : ' 그대로 표현 \" : " 그대로 표현 \r : 현재 커서 가장 앞 이동 \f : 현재 커서 다음 줄 이동 \a : 출력 시 '삑' 소리 남 \b : 백스페이스 \000 : null 문자 1. 문자열 종류 " " : 큰따옴표 ' ' : 작은따옴표 """ """ : 큰따옴표 3개 ''' ''' : 작은따옴표 3개 2.(') 문자열에 작은따옴표 포함 Python's favortie food is perl food="Python's favortie food is perl" print(food) Python's favortie food is perl 문자열에 큰따옴표(") 포함 "Python is ve..
IDLE 프로그램은 print를 입력하지 않아도 출력 결과물을 보여주기도 하지만, Visual Studio Code는 print를 입력해야 출력 결과물을 보여준다. 하지만 비주얼 스튜디오가 입력하는 것과 보기에는 간편하다. 1. 사칙연산 + : 더하기 - : 뺄셈 * : 곱셈 / : 나눗셈 ** : a*b 결과값의 제곱값 a=3 b=4 print(a**b) #a*b=7의 제곱값 81 % : 나눗셈 나머지값 print(7%3) #7과 3 나눗셈 나머지값 1 // : 나눗셈 몫 반환 print(7//4) #7/4 후 몫 반환 1