Uczenie maszynowe - proste algorytmy i ich ocena
Zagadnienia:
- radzenie sobie z niedoskonałymi danymi
- metody wyznaczania trafności klasyfikowania
- krzywa ROC — na jakich wymiarach jest opisana, do czego odnoszą się punkty w przestrzeni ROC, charakterystyczne punkty w tej przestrzeni
- algorytmy k-means i k-NN
Materiały:
Obowiązkowe:
- wykład
- http://en.wikipedia.org/wiki/Receiver_operating_characteristic (do rozdziału Curves in ROC space włącznie)
Uzupełniające
- http://www.cs.waikato.ac.nz/~eibe/Slides2edRev2.zip (na zajęcia zwłaszcza rozdział 5 slajdy 56-60)
- http://www.cs.waikato.ac.nz/~ml/weka/
- http://stats.stackexchange.com/questions/82162/kappa-statistic-in-plain-english
Plan:
1. Zapoznanie się z pozostałymi wskaźnikami oferowanymi przez program WEKA:
- kappa
- ROC Area
2. Sprawdzenie i porównywanie różnych metod testowania:
- use training set
- percentage split
- cross-validation
3. Zapozanie się z algorytmami:
- k-NN (klasyfikacja)
- SimpleKMeans (grupowanie)
- Simple Linear Regression
- Apriori
Algorytm grupowania - K-means
Interaktywna wizualizacja: http://stanford.edu/class/ee103/visualizations/kmeans/kmeans.html
Opis: http://www.cezarywalenciuk.pl/post/2012/12/19/Algorytm-centroidow-K-Srednie.aspx
Pliki dla Weki
Sprawozdanie
- kNN w Wece to IBk
wersja strony: 35, ostatnia edycja: 22 May 2018 10:09