简介:QQ浏览器通过系统融合、算法优化、深度学习应用等策略,提升搜索相关性。主搜子系统和垂搜子系统协同工作,结合召回、粗排、精排流程,利用PNR、DCG等评估手段,确保搜索结果精准满足用户需求。
在信息爆炸的时代,搜索引擎作为连接用户与信息的重要桥梁,其搜索相关性的高低直接影响着用户体验。QQ浏览器,作为一款拥有庞大用户基础的搜索工具,不断探索和实践,以提升搜索相关性为核心目标,致力于为用户提供更加精准、高效的搜索服务。
QQ浏览器在搜索相关性提升方面,首先进行了系统的深度整合。2021年,QQ浏览器完成了看点、搜狗两套系统的系统级融合,这一举措不仅实现了人员、技术的全面融合,还推动了系统架构的优化升级。融合后的系统从逻辑上分为两大搜索子系统:主搜子系统和通用垂搜子系统。主搜子系统主要负责在传统Web网页、Web图片、H5形态网页等稳定业务形态下的检索需求,而通用垂搜子系统则专注于对接高速迭代、快速部署的业务,如微信公众号文章、企鹅号图文、企鹅号视频等新型内容搜索。
在算法层面,QQ浏览器采用了金字塔型的漏斗结构,通过召回、粗排、精排三大阶段,逐步筛选出最符合用户需求的搜索结果。召回层利用文本检索和向量检索相结合的方式,既保证了召回的效率,又提升了召回的准确性。向量检索部分,通过深度模型将Query和Doc映射到隐空间,实现了近似一段式检索,相比传统的二段式检索,效果显著提升。
粗排层则采用计算复杂度相对较低的方式进行特征捕捉,包括相关性类特征、Query和Doc的静态特征以及统计类特征。这些特征的综合运用,为后续的精排提供了有力的支持。
精排层是搜索算法的核心部分,它需要对粗排层输入的Doc集合进行更精细化的区分。在这一阶段,QQ浏览器综合考虑了相关性、时效性、质量权威性、点击预估等多个维度,确保最终呈现给用户的搜索结果既准确又权威。
为了确保搜索相关性的持续提升,QQ浏览器建立了完善的评估体系。离线评估主要关注PNR(Positive-Negative Ratio)和DCG(Discounted Cumulative Gain)等指标的变化,这些指标能够直观地反映搜索结果的准确性和排序质量。在线评估则通过Interleaving实验和人工GSB评估等方式,收集用户反馈,进一步优化搜索算法。
值得一提的是,QQ浏览器还积极引入深度学习技术,不断提升搜索算法的智能化水平。通过深度学习模型的训练和优化,QQ浏览器能够更好地理解用户意图,提升搜索结果的语义匹配度。
在QQ浏览器的搜索相关性提升过程中,千帆大模型开发与服务平台发挥了重要作用。该平台提供了强大的模型训练和优化能力,为QQ浏览器搜索算法的持续升级提供了有力支持。通过千帆大模型开发与服务平台,QQ浏览器能够不断引入新的技术和算法,确保搜索相关性的持续提升。
例如,在搜索引擎的召回层中,千帆大模型开发与服务平台可以帮助训练更加精准的向量检索模型,提升召回效率和准确性。在粗排和精排阶段,该平台也可以提供丰富的特征工程和模型优化工具,帮助QQ浏览器构建更加高效的排序算法。
QQ浏览器在提升搜索相关性的道路上不断探索和实践,通过系统融合、算法优化、深度学习应用等策略,取得了显著的成效。未来,随着技术的不断进步和用户需求的不断变化,QQ浏览器将继续优化搜索算法,提升搜索相关性,为用户提供更加精准、高效的搜索服务。
同时,QQ浏览器也将继续加强与千帆大模型开发与服务平台等合作伙伴的合作,共同推动搜索技术的创新和发展,为构建更加智能、便捷的信息检索生态贡献力量。