百度AI搜索应用搭建
整体概述
为什么需要AI搜索
当前,大模型预训练存在信息时效性不足和幻觉问题,而传统搜索引擎需要用户反复搜索、筛选和阅读信息,过程既繁琐又效率低下。相比之下,引入实时、权威的信息源作为上下文,并利用生成式AI技术,AI搜索能够直接提供精准答案,从而有效简化信息筛选和整合总结的步骤,大幅提升搜索效率和用户体验。[示例应用]
行业趋势
AI搜索发展迅猛,正朝着高效、场景化、多模态方向前进。技术进步让用户更愿直接获取精准答案,搜索引擎需快速处理大量数据,根据应用场景智能匹配资源,直接输出答案。像一些AI搜索产品,凭借多模态搜索能力,支持多种输入方式,能在复杂场景中整合信息,更好地理解用户意图,提供高质量答案。
AI搜索在全链路优化、快速响应和智能扩展查询内容等方面持续突破。未来,它不仅是信息检索工具,还将具备整合、创作、翻译等功能,成为全能型智能助手。简约设计和一站式服务是大势所趋,满足用户对速度、精准性和易用性的需求。
基于AI搜索接口的应用搭建
接下来,就让我们一起动手,来搭建一个属于你的专属AI搜索应用吧。它的每一步都很简单,就像搭积木一样,只要开始,就会发现乐趣无处不在。准备好迎接属于你的第一块“积木”了吗?
AI搜索接口简介
接口描述
百度AI搜索组件将百度搜索能力与大模型技术结合,支持实时全网搜索与智能总结,适用于智能客服、信息查询助手、教育培训等场景,满足各行业需求。用户可快速获取精准答案,提升工作效率。开发者也可轻松集成该接口,为应用接入智能搜索能力,优化用户体验。
亮点优势
体验“好”:支持图片、文字、语音等多种输入形式,满足不同用户需求。同时,还融合了内部知识与百度搜索,直接输出高质量结论,大幅节省用户时间。
搜索“强”:百度 AI 搜索能够自动优化和扩展查询内容,并通过并行搜索提升搜索效率和准确性。搜索结果支持图文并茂的呈现方式,使信息更加直观易懂。
服务“稳”:服务稳定可靠,经过全链路优化,实现快速响应并有效降低时延。同时,采用国家级安全合规策略,全面保障搜索结果的安全性与合规性。
功能概要
能力 | 介绍 |
---|---|
搜索模式选择 | 支持配置不搜索仅模型回答、必过搜索、智能判断是否过搜索 |
模型选择 | 支持配置包括ERNIE-3.5-8K、DeepSeek-R1、DeepSeek-V3在内的所有主流大模型 |
模型配置 | 可配置提示词模版、人设指令、temperature、top_p |
多轮对话 | 支持对多轮对话进行AI搜索回答 |
多模态图像问答 | 支持用户输入图像和文字,进行搜索问答 |
输入改写 | 支持将用户原始输入改写为更适合搜索的内容进行搜索 |
指定站点搜索 | 支持指定搜索的站点内容 |
深搜索 | 支持联网搜索获取数十个参考内容进行总结 |
多模态内容搜索 | 支持选择网页、图片、视频 |
参考内容发布时间 | 支持配置搜索内容发布的时间范围 |
参考内容排序 | 支持对搜索后的参考内容进行展示排序的设置 |
参考内容来源过滤 | 支持对搜索后的参考内容设置来源站点范围 |
参考内容数量 | 支持设置最大返回的参考数量 |
深度思考 | 支持与DeepSeek-R1搭配使用,进行进一步的逻辑推理后答复 |
图文并茂的总结 | 不仅为文字回复,可支持设置总结内容图文并茂 |
参考脚标 | 支持配置是否显示 |
内容安全 | 对齐百度集团能力的内容安全策略,并支持自定义 |
知识/回复干预 | 可配置结合用户自有知识和搜索结果共同进行回答 |
流式输出 | 支持配置是否流式输出 |
推荐追问生成 | 支持生成推荐问 |
应用搭建指南
设置合适的接口传参
目前百度AI搜索提供两个版本的API:
- V2版本(Beta): 功能更强大,支持多种新特性
- V1版本: 稳定版本,功能相对基础
如果您需要最新功能,建议使用V2版本;如果稳定性优先,可以选择V1版本。详细参数请看API文档,下文皆以V2版本为例。
1. 搜索模式选择
"search_mode": "auto"// 可选值: "auto"(自动判断), "required"(强制搜索), "disabled"(禁用搜索)
适用场景:
auto
: 自动判断,如果上游没有判断是否需要搜索才能正确回答用户query,建议打开该开关,适合通用问答required
: 强制搜索,想要稳定获得百度搜索结果并根据搜索结果进行回答建议打开该开关,比如用户query需要最新信息进行回答时,适合新闻、实时信息检索等disabled
: 禁用搜索,适合文本创作
2. 模型选择
"model": "deepseek-r1"// 可选多种模型
适用场景:
ernie-3.5-8k
: 追求效果和性能的平衡,适用于大多数场景deepseek-r1
: 需要思考场景,比如代码生成、数学计算等ernie-4.0-turbo-8k
: 图文混排场景,如旅游介绍、美食推荐ernie-speed-pro
: 对性能要求高(对效果要求稍低一点),比如车机、硬件场景
3. 深搜索与深度思考
"enable_deep_search": true,
"enable_reasoning": true// 仅DeepSeek-R1模型生效
适用场景: 如果想要较多搜索结果(几十条)就打开这个开关,实际上通过搜索更广泛的内容,模型生成的回答也更丰富、全面。
4. 回答输出格式
"response_format": "rich_text", // 可选值: "auto", "text", "rich_text"
"model": "ernie-4.0-turbo-8k"// 推荐使用ernie-4.0系列
适用场景:
- auto:模型自动判断是纯文本输出还是图文混排输出,在适合图文混排输出的场景下会生成图文混排的输出,答案的可读性和信息丰富度更高
- text:纯文本输出
- rich_text:图文混排输出,适合美食推荐、旅游攻略
5. 站点过滤与自定义知识
"search_domain_filter": ["baidu.com"],
"additional_knowledge": [
{
"priority": -10,
"data": {"content": "自定义内容", "title": "自定义标题", "url": "来源网址"}
}
]
适用场景:
search_domain_filter 参数配置可以指定信息来源。比如政务场景下,为了保证信息的可靠性,可以指定站点是政府网站。
6. 自定义大模型总结prompt template
"prompt_template": "根据以下内容回答问题:{{context_out}} 用户问题:{{query}}"
适用场景:
如果使用预置模板(不传prompt_template参数),怎么调整人设都达不到预期效果,可以设置自定义模板进行效果调优。
注:不建议一开始就自行修改模板,预置模板经过优化调整,并通过多方客户评估,已适配大多数应用场景。
7. 本地检索结果
"additional_knowledge": [
{
"priority": 0,
"data": {
"content": "珠穆朗玛峰是世界最高峰,位于中国和尼泊尔的边界。"
}
}
]
适用场景:
调用方提供的定制化知识内容集合,与公开的联网搜索结果构成合集,注入到模型中进行问答总结。知识注入的条数和长度, 与模型有关,限制最大10条。
可以配合 priority(优先级参数)使用,让本地搜索结果在能回答问题时优先被采用。当前支持三个优先级:-1、0、1,数值越小优先级越高,回答时会优先选择高优先级的内容。其中,百度搜索结果的优先级为 0。
8. 选择流式输出
"stream": true
适用场景:
适合实时交互场景,提升用户体验。
9. 是否生成追问
"enable_followup_queries": true
适用场景:
如果是想利用百度AI搜索接口做对话产品,建议打开该开关,可以在回答后主动推荐相关追问,提升对话连贯性。
场景实战示例
1. 新闻资讯助手
{
"messages": [
{"role": "user", "content": "今天有什么重要新闻"}
],
"stream": true,
"model": "ernie-3.5-8k",
"search_mode": "required",
"search_recency_filter": "week",
"enable_corner_markers": true,
"resource_type_filter": [{"type": "web", "top_k": 10}]
}
2. 旅游景点介绍
{
"messages": [
{"role": "user", "content": "介绍西湖的景点和特色"}
],
"model": "ernie-4.0-turbo-8k",
"instruction": "你是专业的旅游顾问,介绍内容要生动形象。",
"response_format": "rich_text",
"resource_type_filter": [
{"type": "web", "top_k": 5},
{"type": "image", "top_k": 5}
]
}
3. 专业领域问答
{
"messages": [
{"role": "user", "content": "分析量子计算在AI中的应用前景"}
],
"model": "deepseek-r1",
"enable_reasoning": true,
"enable_deep_search": true,
"search_domain_filter": ["arxiv.org", "nature.com", "science.org"],
"instruction": "你是一位AI和量子计算领域的专家,请提供深入的分析和见解。"
}
前端搭建
示例代码(敬请期待...)
常见问题解决
- 内容准确性不足: 增加搜索结果数量、启用深度搜索、使用特定领域站点过滤
- 信息源时效性低: 配置更短的时效范围,启用时效性改写
- 内容太简略: 使用专业模型(如deepseek系列),调整人设指令要求详细回答
- 信息专业性不足: 添加自定义知识,限定搜索特定行业站点