일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 얼굴합성앱추천
- 딥페이크
- subset
- r
- 티스토리챌린지
- SAS 연산오류
- 웨카
- 기계학습
- 베트남 #자동차 #베트남자동차보급율
- 토드부크홀츠
- 강의자료
- 일본 뜀틀 응원 기적 감동
- R 프로그래밍
- 오블완
- 리더쉽
- SAS
- FPT #베트남기업
- hdmi젠더
- SAS 계산오류
- Deepfake
- 뉴스로 이해하는 베트남
- HDMI-DVI
- 지방자치단체조합
- SAS 날짜
- 데이타마이닝 툴
- 사례기반추론
- SAS에서 한글사용
- 스틱pc
- 베트남삼겹살
- 책모음
- Today
- Total
지식노동자의 노트
Weka실습 Decision Tree 본문
앞선 글에서 밝혔듯이 <Data Mining, Ian H.Witten & Eibe Frank>의 Chapter10을 따라 Weka로 Decision Tree 를 만들어 보겠습니다.
|
1. 우선 Weka를 실행시키셔야겠죠?
저는 Mac OS용 입니다. Explorer를 클릭 해 주세요.
Explorer가 성공적으로 열렸습니다. Open file 버튼을 클릭하세요
Weka를 Download 받을 때 data도 함께 Down받았습니다. data폴더에 weather.arff를 선택합니다.
여기까지 data를 성공적으로 load했습니다. 이제 Tree를 만들어 보겠습니다.
상단의 Classify 탭을 선택하시고 Classifier를 선택하겠습니다. Choose버튼 클릭.
여러 classifiers중에서 trees 하위에 J48을 선택하세요
제대로 classifier를 선택했습니다.
이제 주저없이 좌측의 Start를 클릭하시면 오른쪽 아래에서 눈깜짝할 사이만큼만 새가 파닥거리고 output창에 결과가 나타납니다. 이제 결과를 해석하기만 하면 되는거죠.
결과창은 처음에 data가 14개의 instances와 5개의 attributes로 되어 있다고 알려주는 것으로 시작합니다. 이어서 각 Attributes의 이름이 나오고 10-fold-cross-validation으로 평가되었다고 알려 줍니다. 이어서 text형태로 tree가 나옵니다. outlook=sunny일 때, humidity <= 75이면 play=yes 인데, 2개의 instances가 해당되고 모두 정분류 된 것으로 나옵니다. 만약 (2.0/1.0)이라면 오분류된 instance의 개수가 1개 있다는 얘깁니다.
이렇게 해서 간단히 tree를 만들어 봤습니다. 결과창에 대한 더 자세한 해석과 결과 list를 우클릭해서 볼 수 있는 많은 옵션들이 있습니다. 이 부분은 다음에 다루겠습니다.
'데이타마이닝' 카테고리의 다른 글
Weka 예제 파일(arff) 위치 (0) | 2015.08.06 |
---|---|
R package malformed error (0) | 2015.06.11 |
R 관련 서적 모음 (0) | 2015.01.08 |
사례기반추론 SAS Coding (0) | 2012.07.02 |
무료 데이타마이닝툴 WEKA(웨카) (0) | 2012.05.22 |