爱奇艺短视频粗排模型优化提升链路一致性

作者:问题终结者2024.12.02 14:36浏览量:75

简介:爱奇艺短视频推荐团队通过优化粗排模型,从GBDT升级为双塔DNN,并采用知识蒸馏、Embedding参数优化及线上Inference优化等技术,显著提升链路目标一致性,用户人均消费时长等指标均有所增长。

在工业界的推荐系统中,链路目标一致性是确保推荐效果和用户体验的关键。爱奇艺短视频推荐团队在这一领域进行了深入探索和实践,特别是在粗排模型的优化上,取得了一系列显著成果。本文将详细介绍爱奇艺短视频推荐之粗排模型的优化历程,以及这些优化如何提升链路目标一致性。

一、粗排模型的作用与选型

推荐系统通常包括召回、粗排、精排以及重排四个阶段,每个阶段都像是一个漏斗,从海量的物品集合中过滤出用户最有可能感兴趣的物品。其中,粗排模型的主要作用是统一计算和过滤召回结果,在尽量保证推荐准确性的前提下减轻精排模型的计算压力。

在粗排模型的选型上,爱奇艺短视频推荐团队经历了从GBDT到双塔DNN的转变。GBDT模型虽然结构简单,但特征处理和挖掘方面需要投入大量的人力,且预估结果与精排模型存在较大差异。为了提升链路目标一致性,团队决定采用当前工业界应用最广泛的粗排模型——基于向量内积的双塔DNN模型。

二、双塔DNN粗排模型的优化

1. 特征集合裁剪

在构建双塔DNN粗排模型时,为了控制模型参数的复杂度,团队对粗排的特征集合进行了大量裁剪。用户侧和视频侧都只采用了少部分精排模型的特征子集,确保粗排模型既能够捕捉到关键信息,又不会过于复杂。

2. 知识蒸馏

为了弥补特征裁剪带来的损失,保证裁剪后粗排模型的精度,团队采用了知识蒸馏的方法来训练粗排模型。在teacher-student框架中,以精排模型为teacher来指导粗排模型的训练,从而得到一个结构简单、参数量小但表达力不弱的粗排模型。这一方法显著提升了粗排模型的精度,并使其能够更好地对齐精排模型的目标。

3. Embedding参数优化

为了进一步减少参数量级、压缩模型大小并提高模型传输速度,团队将模型embedding参数的优化器替换为稀疏解优化神器FTRL。这一调整不仅离线Auc有小幅提升,还使得训练得到的粗排模型embedding参数全为0的比率高达49.7%。在模型导出时,裁剪掉全为0的embedding参数,粗排模型大小减小了46.8%,传输速度提升近一倍,同时线上加载模型的内存消耗也降低了100%。

4. 线上Inference优化

除了离线训练时的优化外,团队还对双塔粗排模型的线上inference计算进行了优化。通过合并计算user侧embedding、对高频视频的embedding进行缓存等措施,显著提升了粗排模型的线上计算性能。这一优化使得粗排模型打分计算服务p99的计算耗时减少了19ms左右。

三、级联模型的迭代

随着后续业务的迭代和逐步深入,精排模型的学习目标也不断调整。为了方便添加不同的学习目标并一劳永逸地解决粗排模型目标和精排模型目标一致性的问题,团队将粗排模型升级为级联模型。这一模型能够自适应地对齐精排模型目标的变化,同时也节省了蒸馏训练的环节,大大节省了训练资源消耗。

四、优化成果与应用

经过上述一系列的优化措施后,爱奇艺短视频推荐的双塔DNN粗排模型线上计算性能与之前的GBDT模型基本持平甚至更优。该模型分别应用到了爱奇艺热点频道和随刻首页推荐场景中,两边的线上指标都有显著提升。其中随刻首页feed推荐的用户人均消费时长涨了3%左右;爱奇艺热点频道的人均消费时长也涨了1%,ctr和人均消费视频数也都有2%的涨幅。

五、产品关联:千帆大模型开发与服务平台

在爱奇艺短视频推荐的粗排模型优化过程中,千帆大模型开发与服务平台发挥了重要作用。该平台提供了强大的模型开发、训练和部署能力,使得团队能够快速迭代和优化粗排模型。同时,千帆大模型开发与服务平台还支持多种模型架构和算法,为团队提供了丰富的选择空间。通过利用该平台,爱奇艺短视频推荐团队得以更高效地实现链路目标一致性的提升。

综上所述,爱奇艺短视频推荐团队通过优化粗排模型、采用知识蒸馏、Embedding参数优化及线上Inference优化等技术手段,显著提升了链路目标一致性。这些优化措施不仅提高了推荐系统的准确性和效率,还为用户带来了更好的使用体验。未来,随着技术的不断进步和业务需求的不断变化,爱奇艺短视频推荐团队将继续探索和实践更多创新的优化方法和技术手段。