搜索服务概览
概览
本文聚焦于搜索服务构建阶段,围绕Logic Data Search模板展开,完整覆盖从检索逻辑定义到检索服务上线发布的核心操作流程:
- 基于Logic Data Search模板,完成入参配置,定义检索接口的请求参数与返回格式;
- 再通过检索逻辑代码调整,实现关键词匹配、向量相似度计算、过滤规则、排序策略等个性化检索逻辑的自定义开发;
- 随后完成出参配置,明确检索结果的返回字段与格式;
- 最终将配置完成的检索逻辑发布为在线服务,并支持在AIP Logic、AB、workshop等业务场景中直接调用,完成检索服务的上线与业务落地。
前提条件
当前账号已拥有数据搜索权限。
检索服务配置
创建与配置数据搜索
创建数据搜索
- 登录百度胜算控制台,在侧边导航选中数据搜索模块。
- 单击列表右上角创建按钮,进入配置流程。
- 填写相关配置项,详细配置项说明参照表1。
表1 数据搜索基本配置说明
| 配置项 | 说明 |
|---|---|
| 名称 | 填写名称,名称不可重复。支持中文、英文、数字、中划线、下划线,不超过256字符。 |
| 所属位置 | 输入项目路径,也可以单击右侧浏览按钮,选择所属项目。 |
| 描述 | 填写描述信息,不超过500个字符。 |
添加并配置节点
搜索数据构建需通过输入Block、高代码节点、输出Block三者协同完成:
- 输入Block:接入原始数据源;
- 高代码:完成数据清洗、向量化处理;
- 输出Block:输出标准化数据集并写入检索库。
输入Block
输入Block作为搜索数据构建的首个核心节点,是原始数据进入处理链路的入口,具体配置说明如下:
表2 输入Block参数说明
| 配置项 | 说明 |
|---|---|
| 变量名称 | 自定义的变量名称,支持英文大小写字母、数字、下划线,且必须以字母开头,大小不超过128个字符。 |
| 变量类型 | 支持String、Boolean、Date、DateTime、Number五种类型。 |
| 描述 | 对当前Block变量的补充说明。 |
| 必填 | 标识该变量是否为必填项,若为必填项,未填写则无法完成Block参数配置。 |
| 默认值 | 系统预设的变量初始值,未手动配置时自动生效。 |
| 操作 |
|
高代码
高代码作为搜索数据构建链路中的灵活扩展节点,用于实现复杂场景下的数据自定义处理逻辑。支持通过编写代码对上游输入数据进行清洗、转换、字段增强、规则过滤与逻辑编排,满足个性化的数据预处理需求,具体配置说明如下:
表3 高代码Block参数说明
| 配置项 | 说明 |
|---|---|
| 名称 | 自定义高代码Block的名称。 |
| 向量化服务 | 根据入参中配置的object_type匹配对应的 Embedding 模型,并从ModelServing获取模型服务。入参配置为空时,下拉列表不展示可选项。 |
| 重排序服务 | 系统预置Rerank模型服务。若模型服务列表为空,界面将提示用户先在ModelServing完成模型部署。 |
| 代码类型 | 默认是Python。 |
| 函数代码 | 以自定义函数形式编写的高代码逻辑,支持参数传入与结果返回。 |
| 自定义调优 | 针对向量化 / 重排序算法的参数调优代码 |
| 输出参数 | 高代码Block执行后返回的参数配置,需明确参数名称、类型、含义:
|
输出Block
输出Block作为搜索数据构建链路的最终节点,负责将经过处理后的标准化数据输出至检索引擎,完成索引构建与数据入库,为后续数据检索服务提供可用的数据载体,具体配置说明如下:
表4 输出Block参数说明
| 配置项 | 说明 |
|---|---|
| 输出变量 | 返回的结果参数名称。 |
| 引用变量 | 引用上游Block输出的变量,作为当前输出变量的计算来源。变量名称、数据类型需与上游输出完全保持一致,否则会导致参数传递失败。 |
| 操作 |
|
基本信息
单击右侧基本信息按钮,在弹出的配置面板中可查看当前节点的名称、API名称、创建人、创建时间、所属位置和描述,并支持根据业务需求修改节点名称与描述。
调试
完成节点配置后,单击右侧测试按钮,系统会根据Block的输入变量展示全部输入项供用户填写。用户输入完成后,点击运行测试按钮,将展开所有Block的运行信息及相关日志。
保存发布
完成配置与测试验证后,可单击保存按钮对当前配置进行持久化存储。确认配置无误后,单击发布按钮将配置生效至运行环境,发布成功后即可正常调用。
查看数据搜索列表
- 登录百度胜算控制台,在选中的工作空间操作列单击打开按钮,进入空间内。
- 侧边导航选择数据搜索,即可查看数据搜索列表的详细信息,也可根据名称进行搜索查看,具体字段说明可参考表7。
表7 数据搜索列表字段说明
| 列表项 | 说明 |
|---|---|
| 名称 | 用户自定义的数据搜索任务名称。 |
| 描述 | 用户自定义的对当前数据搜索任务的描述。 |
| API名称 | 当前数据搜索任务对应的API名称。 |
| 发布状态 | 显示当前任务的发布状态,发布状态分为:已发布、未发布和已发布有更新。支持通过发布状态进行筛选。 |
| 创建人 | 创建该任务的用户名称。 |
| 创建时间 | 创建任务的时间。 |
| 操作 | 单击操作列不同按钮,对实例进行不同操作。
|
检索服务使用
Logic使用
已发布的搜索服务可在Logic模块中被调用并集成至业务流程,实现检索能力与业务逻辑的统一编排与执行。在完成输入配置后,即可在逻辑流程中添加对应的数据搜索操作。关于Logic中调用搜索服务的详细操作步骤,可参见逻辑建模相关文档。
评价此篇文章
