大众点评搜索相关性技术的深度剖析与实践

简介：本文深入探讨了大众点评搜索相关性技术的核心原理与实践应用，通过解析复杂搜索场景下的相关性问题，结合深度学习和预训练模型，提出了有效的解决方案，旨在提升用户搜索满意度。

在数字化时代，搜索引擎已成为人们获取信息和服务的重要入口。作为生活服务领域的佼佼者，大众点评的搜索功能不仅承载着用户的找店需求，更是平台提升用户体验的关键环节。本文将从技术角度深度剖析大众点评搜索相关性的实现原理，并分享实践中的经验与挑战。

搜索相关性是衡量用户查询（Query）与返回结果（Doc）之间相关程度的重要指标。在大众点评的搜索场景中，它直接关系到用户能否快速找到满足需求的商户。因此，准确计算搜索词与商户之间的相关性，是提升搜索体验、增强用户粘性的关键。

大众点评的搜索场景具有高度的复杂性，主要体现在以下几个方面：

为了应对上述挑战，大众点评在搜索相关性技术上进行了深入的探索与实践。

早期的文本匹配方法主要基于字面匹配，如TF-IDF、BM25等。这些方法计算效率高，但泛化性能差，无法处理一词多义或多词一义的问题。因此，大众点评逐步转向语义匹配模型，以更准确地理解用户意图。

随着深度学习和预训练模型的发展，大众点评引入了深度语义匹配模型来提升搜索相关性。这些模型从实现方法上分为基于表示（Representation-based）和基于交互（Interaction-based）两种。

基于表示的模型：如DSSM、NRM、SentenceBERT等，这些模型分别学习Query和Doc的语义向量表示，再通过计算向量相似度来判断相关性。这种方法在线上使用时计算速度较快，但可能缺乏Query与Doc之间的交互信息。
基于交互的模型：如ESIM、BERT等，这些模型在底层输入阶段就让Query和Doc进行交互，建立匹配信号后再融合成匹配分。这种方法能够更充分地利用Query与Doc之间的交互信息，提升模型表达能力。

大众点评基于美团海量业务语料训练的MT-BERT预训练模型，在搜索场景下优化Query与商户（POI）的深度语义相关性模型。通过引入预训练模型，大众点评能够更准确地理解用户查询的语义，从而返回更相关的商户结果。

在将深度语义匹配模型应用于大众点评搜索场景时，团队面临了诸多挑战，如如何构造POI侧模型输入信息、如何使模型适配点评搜索相关性计算以及如何优化模型上线的性能等。

构造POI侧模型输入信息：针对商户信息复杂多样的问题，大众点评通过精心设计输入特征，结合商户名、类目、地址、团单等多种信息，构建了具有丰富信息量的POI侧模型输入。
模型适配与优化：通过多阶段训练、多任务学习等策略，大众点评使模型更好地适应点评搜索场景的相关性计算需求，并优化了模型的计算性能和稳定性。

经过一系列的技术探索与实践，大众点评的搜索相关性得到了显著提升。用户能够更快速地找到满足需求的商户，搜索满意度和平台粘性均有所提升。未来，大众点评将继续深化在搜索相关性技术上的研究与实践，引入更多先进的技术和方法，为用户提供更加智能、高效的搜索体验。

搜索相关性是搜索引擎的核心竞争力之一。大众点评通过不断探索与实践，在搜索相关性技术上取得了显著成果。相信在未来，随着技术的不断进步和应用场景的持续拓展，大众点评的搜索功能将更加智能化、人性化，为用户带来更加便捷、高效的生活服务体验。