爱奇艺双DNN排序模型实践探索

作者:蛮不讲李2024.12.02 14:34浏览量:7

简介:爱奇艺通过双DNN排序模型与在线知识蒸馏技术,在推荐系统中实现了模型效果与推理效率的平衡,显著提升了短视频和图文信息流的用户指标。

深度学习快速发展的时代,排序模型作为推荐系统的核心组件,其性能的优化一直是学术界和工业界关注的重点。随着模型结构的不断复杂化,更深更宽的模型虽然能够带来显著的效果提升,但同时也面临着推理效率下降的问题。为了解决这个问题,爱奇艺提出了一种创新的解决方案——双DNN排序模型,并结合在线知识蒸馏技术,在推荐系统中取得了显著成效。

一、深度学习时代排序模型的演进

深度学习时代的排序模型演进可以分为三个阶段:萌芽期、中兴期和突破期。

  1. 萌芽期:DNN开始被引入推荐排序模型,其优点在于神经网络能隐式建模不同特征间的高阶特征组合。国内最早应用案例是百度等公司在2013年左右开始将DNN用作CTR模型。
  2. 中兴期:深度排序模型开始被广泛接受,代表模型为WDL和DeepFM等,这些模型在DNN基础上增加了显示的一阶或二阶特征组合,提升了模型性能。
  3. 突破期:从DCN、xDeepFM开始,深度排序模型变得更深更宽,尤其重视使用DL组件来显示建模高阶特征交叉,其显示的高阶特征组合更符合算法工程师对排序模型的期许。

然而,随着模型复杂度的增加,推理效率问题日益凸显。为了平衡模型效果和推理效率,爱奇艺提出了双DNN排序模型。

二、双DNN排序模型

双DNN排序模型由两个DNN CTR Model组成,左侧是Teacher(复杂模型,模型性能好但推理性能差),右侧是Student(简单模型,模型性能一般但推理性能佳)。两者共享特征输入和表示,但左侧模型相比右侧多了Feature Interaction Layer。

该模型的核心在于提出了新的联合训练方法,从而解决了高性能复杂模型的上线问题。其特点和优势包括:

  1. 双DNN结构:通过左侧复杂模型和右侧简单模型的联合训练,实现知识迁移。
  2. Feature Transfer:两个DNN共享特征表示层,使得右侧DNN能够复用左侧DNN的特征表示。
  3. KD One the Fly:将知识蒸馏过程融入联合训练中,使用左侧Teacher模型的预测结果指导右侧Student模型的学习。
  4. Classifier迁移:除了使用Teacher模型的预测结果作为监督信号外,还让其hidden layer作为监督信号指导Student的hidden layer,进一步提升Student模型的性能。

三、在线知识蒸馏的实践

在线知识蒸馏是双DNN排序模型中的关键技术。与传统的离线知识蒸馏不同,在线蒸馏时教师模型和学生模型同步更新,整个知识蒸馏框架都是端到端可训练的。这种方案具有高效并行计算的优势,能够实现单阶段端到端的训练。

在爱奇艺的推荐系统中,双DNN排序模型与在线知识蒸馏技术的结合取得了显著成效。在短视频信息流和图文信息流两个重要场景上线后,都获得了明显的正向效果。其中,短视频场景时长指标提升了6.5%,点击率指标提升了2.3%;图文推荐场景时长指标提升了4.5%,点击率指标更是提升了14%。

四、产品关联:千帆大模型开发与服务平台

在爱奇艺的双DNN排序模型实践中,千帆大模型开发与服务平台扮演了重要角色。该平台提供了强大的模型开发和部署能力,支持复杂的深度学习模型构建和训练。通过千帆大模型开发与服务平台,爱奇艺能够高效地构建和部署双DNN排序模型,实现模型效果与推理效率的平衡。

同时,千帆大模型开发与服务平台还支持在线学习和模型实时更新,使得爱奇艺的推荐系统能够不断适应用户行为的变化,提升用户体验。

五、总结

爱奇艺通过双DNN排序模型与在线知识蒸馏技术的结合,在推荐系统中实现了模型效果与推理效率的平衡。这一创新方案不仅提升了用户指标,还为推荐系统的未来发展提供了新的思路。随着深度学习技术的不断发展,相信爱奇艺的推荐系统将会取得更加显著的成效。