GitHub - johnson-xu01/word2vec_kmeans_LR: word2vec for words representing, kmeans for words clustering , logistic regression for sentence classification.

word2vec_kmeans_LR

word2vec, kmeans, logistic regression

gensim word2vec model training , preservation , reloading and converting.
words clustering with kmeans.
logistic regression model training, preservation, reloading for sentence classification based on word vector.

Dependent package: gensim scikit-learn jieba

some word vector results

show_word_most_similar("演员", model, 10)

1    群众演员      0.6856100559234619
2    演員        0.6725834012031555
3    跟组        0.6159209609031677
4    替身        0.5973879098892212
5    群众        0.5957409739494324
6    男女老少      0.5860865712165833
7    灯光师       0.5850135087966919
8    摄影摄像      0.5805505514144897
9    配音员       0.5796741843223572
10   艺助        0.5716033577919006

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
LR_model		LR_model
model		model
001_cut_sentences.ipynb		001_cut_sentences.ipynb
002_word2vec.ipynb		002_word2vec.ipynb
003_kmeans.ipynb		003_kmeans.ipynb
004_logistic_regression.ipynb		004_logistic_regression.ipynb
005_CM_LR_final.ipynb		005_CM_LR_final.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

word2vec_kmeans_LR

some word vector results

About

Releases

Packages

Languages

johnson-xu01/word2vec_kmeans_LR

Folders and files

Latest commit

History

Repository files navigation

word2vec_kmeans_LR

some word vector results

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages