Laboratoria z LSED + MSR + TEXT
LSED - Laboratorium Statystycznej Eksploracji Danych
MSR - Zastosowanie pakietu R w statystyce medycznej
TEXT - Eksploracja Tekstu i Wyszukiwanie Informacji w Mediach Społecznościowych
LSED: http://www.if.pw.edu.pl/~julas/LSED/
MSR: http://www.if.pw.edu.pl/~paluch/MSR/msr.html
TEXT: http://www.if.pw.edu.pl/~julas/TEXT/
LSED PLAN:
0. Wprowadzenie do R
- Dyskryminacja Fisherowska (biblioteki: MASS, scatterplot3d)
- LDA, QDA i naiwny Bayes (biblioteki: MASS, mvtnorm, klaR, e1071)
- Ocena klasyfikatorów (biblioteki: Hmisc, MASS, klaR, e1071)
- Metoda najbliższych sąsiadów (biblioteki: MASS, class)
- Drzewa klasyfikujące 1 (biblioteki: MASS, rpart, rpart.plot)
- Drzewa klasyfikujące 2 (biblioteki: MASS, rpart, rpart.plot)
- Zespoły klasyfikatorów (biblioteki: MASS, rpart, rpart.plot, Hmisc, adabag, randomForest)
- Maszyny wektorów nośnych (biblioteki: MASS, e1071)
- Analiza skupień (biblioteki: MASS)
- Analiza składowych głównych i skalowanie wielowymiarowe (biblioteki: kernlab)
MSR PLAN:
- Wprowadzenie do R
- Obsługa macierzy, tworzenie wykresów i losowanie danych
- Wczytywanie i zapis danych, regresja liniowa, binowanie, dystrybuanta
- Pakiet ggplot2 - wykresy, regresja liniowa
- Testowanie hiptez statystycznych
- Testowanie zgodności z rozkładem, korelacje
- Dopasowanie parametrów rozkładu, jednoczynnikowa analiza wariancji
- Wielokrotna regresja liniowa, regresja logistyczna i regresja Poissona
- Wieloczynnikowa i wielowymiarowa analiza wariancji
TEXT PLAN:
0. wprowadzenie do pakietu R
- ggplot2, potoki oraz dplyr
- tidy text, tibble, zliczanie słów, gutenbergr
- ważenie termów, korpusy, macierz termów-dokumentów
- prawa lingwistyczne
- n-gramy
- analiza sentymentu I
- analiza sentymentu II
- modele tematyczne
- word2vec i GloVe
- dane on-line, API, analiza