Uczenie maszynowe - proste algorytmy i ich ocena

Zagadnienia:

  • radzenie sobie z niedoskonałymi danymi
  • metody wyznaczania trafności klasyfikowania
  • krzywa ROC — na jakich wymiarach jest opisana, do czego odnoszą się punkty w przestrzeni ROC, charakterystyczne punkty w tej przestrzeni
  • algorytmy k-means i k-NN

Materiały:

Obowiązkowe:

Uzupełniające

Plan:

1. Zapoznanie się z pozostałymi wskaźnikami oferowanymi przez program WEKA:

  • kappa
  • ROC Area

2. Sprawdzenie i porównywanie różnych metod testowania:

  • use training set
  • percentage split
  • cross-validation

3. Zapozanie się z algorytmami:

  • k-NN (klasyfikacja)
  • SimpleKMeans (grupowanie)
  • Simple Linear Regression
  • Apriori

Algorytm grupowania - K-means

Interaktywna wizualizacja: http://stanford.edu/class/ee103/visualizations/kmeans/kmeans.html
Opis: http://www.cezarywalenciuk.pl/post/2012/12/19/Algorytm-centroidow-K-Srednie.aspx

Pliki dla Weki

pogoda,bank,dom,supermarket

Sprawozdanie

  • kNN w Wece to IBk

szablon

© A. Czoska, M. Komosiński, B. Kroll, A. Kupś, A. Mensfelt, B. Szopka