chuyuenin / -Mahout- Public

forked from kadoufall/news-recommender

Notifications You must be signed in to change notification settings
Fork 0
Star 0

基于 Mahout 的新闻推荐系统

0 stars 27 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.mvn/wrapper		.mvn/wrapper
data		data
src		src
.gitignore		.gitignore
README.md		README.md
mvnw		mvnw
mvnw.cmd		mvnw.cmd
pom.xml		pom.xml

Repository files navigation

基于Mahout的新闻推荐系统

相关技术

推荐算法
- 基于用户的协同过滤
- 基于内容的推荐
- 基于热点的推荐
Mahout：整体框架，实现了协同过滤
Deeplearning4j，构建VSM
Jieba：分词，关键词提取
HanLP：分词，关键词提取
Spring Boot：提供API、ORM

关键实现

基于用户的协同过滤

直接调用Mahout相关接口即可
选择不同的用户相似度度量方法，这里选择了基于谷本系数、基于对数似然和基于曼哈顿距离

基于内容的推荐

对新闻文本进行分词
调用Deeplearning4j中构建paragraphvector的方法，通过doc2vec构建VSM
用Gensim会更方便点

基于热点的推荐

统计最高浏览量
过滤一定时间前的新闻保证热点的准确

评测指标

测试数据集
F1-Measure(precision + recall)

算法	最近邻数量K	推荐数N	F1-Measure
UserCF--Tanimoto	20	11	0.481591183699049
UserCF--LogLike	10	11	0.486337485027766
UserCF--CityBlock	30	8	0.424612102745937
ContentBased	-	5	0.0491655390166893
HotSpots	-	14	0.118524972063865

About

基于 Mahout 的新闻推荐系统

Report repository

Releases

No releases published

Packages

No packages published

Languages

Java 100.0%