Release-1.5.0
Release-1.5.0
在Angel 1.5.0,我们针对高维度稀疏模型场景做了大量的优化。在系统层,我们重构了流量控制和异常处理,加强稳定性,提升PS的支撑能力;在算法层,我们重构了优化算法库和LR/FM等算法, 同时在Spark On Angel上实现了支持稀疏模型的基于OWLQN/FTRL的LR算法,计算效率明显提升。
Core
- 重构PS流量控制机制
- 重构数据RPC异常处理机制
- 重构模型分区算法,优化高维度稀疏模型的切分方式
- 优化在Worker只包含一个Task场景下内存使用效率
- distribute serving功能优化,支持分布式运行模式和批量的大模型预测
- 在PSF函数中添加对稀疏long类型向量的支持
- BugFix:修复客户端在高并发发送请求时可能卡住的问题
- BugFix:修复模型元数据文本副本数为1的问题
MLLib
- 重构LR算法,优化收敛速度慢,L1正则化下稀疏度不够的问题,优化偏置项处理
- 重构FM算法,在高维度模型场景下计算效率大幅度提升
- 重构优化算法库,添加Momentum/AdaGrad/AdaDelta/Adam等优化算法,目前新的优化算法库还是一个试用特性,后续会逐步取代老的优化算法库
- BugFix:修复稀疏型模型稀疏度计算错误的问题
Spark on Angel
- 新增SparseLR With FTRL,采用mini-batch Async FTRL的梯度更新方式
- 新增SparseLR With OWLQN
- 优化SparsePSVector merge和计算性能
文档
- 全面更新算法文档,优化公式显示,调整部分算法参数的名称和含义