突破性能极限:CPU基深度FFMs在多数据中心规模上的高效部署
摘要
本文由Blaž Škrlj等人撰写,详细介绍了一种基于CPU的深度场感知分解机(Deep FFMs)的实现及其在多数据中心规模上的部署。该研究主要针对点击率预测问题,通过一系列优化技术,实现了每秒超过3亿次预测的高性能。论文中提出的解决方案包括模型搜索、在线模型训练、存储、传输和服务的优化,以及一种新的权重量化方法,显著减少了数据中心间权重传输的带宽需求。此外,该研究还将相关技术和引擎开源,以促进机器学习社区的发展。
Read more...








