Releases: Top-Models/TOMMY
TOMMY
TOMMY is een topic modelling applicatie die ontwikkeld is door studenten van de Universiteit Utrecht in opdracht van EMMA.
Voor het uitvoeren van topic modelling wordt het achterliggende Latent Dirichlet Allocation (LDA) algoritme of Non-Negative Matrix Factorization (NMF) algoritme uitgevoerd op de door de gebruiker aangeleverde bestanden. LDA en NMF zijn topic modelling algoritmes die topics herkennen in deze bestanden. Het aantal topics N kan door de gebruiker binnen de applicatie gekozen worden. LDA of NMF zullen dan N lijsten (dit zijn de topics) teruggeven met woorden en bijbehorende gewichten, waarbij het gewicht aangeeft hoe sterk een woord bij een topic past.
Het algoritme gaat ervan uit dat elk document elk topic tot op zekere hoogte bevat, ook al is het maar voor een heel klein deel. In deze gebruikershandleiding staat beschreven hoe u TOMMY kunt gebruiken en hoe de ruwe data geproduceerd door LDA of NMF goed onderzocht kan worden.