지식노동자의 노트

Weka실습 Decision Tree 본문

데이타마이닝

Weka실습 Decision Tree

생각하는너구리 2012. 6. 5. 22:38
728x90

앞선 글에서 밝혔듯이 <Data Mining, Ian H.Witten & Eibe Frank>의 Chapter10을 따라 Weka로 Decision Tree 를 만들어 보겠습니다.


Data Mining: Practical Machine Learning Tools and Techniques (Paperback / 3rd Ed.)
외국도서
저자 : Eibe Frank,Ian H. Witten
출판 : Morgan Kaufmann Publishers 2011.01.20
상세보기


1. 우선 Weka를 실행시키셔야겠죠?

저는 Mac OS용 입니다. Explorer를 클릭 해 주세요.



Explorer가 성공적으로 열렸습니다. Open file 버튼을 클릭하세요




Weka를 Download 받을 때 data도 함께 Down받았습니다. data폴더에 weather.arff를 선택합니다.


여기까지 data를 성공적으로 load했습니다. 이제 Tree를 만들어 보겠습니다.


상단의 Classify 탭을 선택하시고 Classifier를 선택하겠습니다. Choose버튼 클릭.


여러 classifiers중에서 trees 하위에 J48을 선택하세요


제대로 classifier를 선택했습니다.


이제 주저없이 좌측의 Start를 클릭하시면 오른쪽 아래에서 눈깜짝할 사이만큼만 새가 파닥거리고 output창에 결과가 나타납니다. 이제 결과를 해석하기만 하면 되는거죠.


결과창은 처음에 data가 14개의 instances와 5개의 attributes로 되어 있다고 알려주는 것으로 시작합니다. 이어서 각 Attributes의 이름이 나오고 10-fold-cross-validation으로 평가되었다고 알려 줍니다. 이어서 text형태로 tree가 나옵니다. outlook=sunny일 때, humidity <= 75이면 play=yes 인데, 2개의 instances가 해당되고 모두 정분류 된 것으로 나옵니다. 만약 (2.0/1.0)이라면 오분류된 instance의 개수가 1개 있다는 얘깁니다.


이렇게 해서 간단히 tree를 만들어 봤습니다. 결과창에 대한 더 자세한 해석과 결과 list를 우클릭해서 볼 수 있는 많은 옵션들이 있습니다. 이 부분은 다음에 다루겠습니다.

반응형

'데이타마이닝' 카테고리의 다른 글

Weka 예제 파일(arff) 위치  (0) 2015.08.06
R package malformed error  (0) 2015.06.11
R 관련 서적 모음  (0) 2015.01.08
사례기반추론 SAS Coding  (0) 2012.07.02
무료 데이타마이닝툴 WEKA(웨카)  (0) 2012.05.22
Comments