深度研究Agent
产品简介
百度千帆深度研究Agent产品,可基于全网公开信息及上传文件,实现深度迭代检索。支持按照指定大纲生成深度研究报告。支持自主完成多步骤研究任务,实时整合文本、图像、PDF等多模态数据,生成带引用的高质量结构化报告,显著提升专业分析速度与深度。 本产品的功能特色为:
- 基于强大自研DeepSearch能力,支持复杂问题逐步拆解、迭代检索
- 基于业界领先的RAG能力,支持上传及解析多模态文件,联合企业内部信源的混合检索增强。支持WORD/PPT/PDF等格式文本文件、表格文件、图片等文件格式,并独家支持音频文件的解析及混合检索
- 支持文字图表混排格式报告生成,包括Markdown、HTML格式输出,以及PPT进一步生成的能力
执行流程
具体执行流程包括检索配置、需求澄清、大纲生成及编辑、全文报告生成等步骤。
检索配置
支持进行信息检索增强配置。除联网检索外,支持添加本地文件作为参考信源,完成混合检索任务。最终报告将基于上传文件内容,以及联网公开信息综合生成。
支持文本、表格、图片、音频四类文件模态,总计可最多上传10个文件
- 文本:支持.doc/.docx/.txt/.pdf/.ppt/.pptx格式文件。其中.txt文件单个不超过10MB,.pdf文件单个不超过100MB且不能超过3000页,.ppt/.pptx文件不超过400页,.doc/.docx文件单个不超过100MB且不超过2500页(超出范围部分会被自动忽略)
- 表格:支持.xlsx/.xls格式文件、UTF-8、GBK、GB2312、GB18030、ASCII五种编码格式。单个文件大小不超过100MB、内容不超过10万行、20、每行不超过15万字,且文件中最多支持一个sheet工作表(超出范围的内容会被自动忽略)
- 图片:支持.png/.jpg/.jpeg/.bmp格式文件,单个文件不超过10MB
- 音频:支持.wav/.pcm格式文件,单个文件不超过10MB
上传文件后,将进行初步的内容解析,支持一般的文件问答能力,如总结摘要、润色等。进一步生成报告时,将对上传文件做RAG切片处理,在深度搜索的过程中将根据query对切片进行召回,从而在报告的适当位置插入相关性较高的文件内容。
需求澄清
可根据用户输入的query自动生成关于范围及诉求细节等需求澄清类问题,提升检索准确性。 澄清内容包含但不限于主题、目的、篇幅要求、语言等内容。
大纲确认及编辑
需求澄清后,经过浅搜索步骤,生成大纲及调研计划。生成大纲层级为文章标题、一级标题、二级标题,以及每个二级标题的调研计划。 如需进行修改,用户可通过输入query,用自然语言描述给出修改意见,或在页面中直接编辑大纲。大纲各项层级内容均支持增加、删除及修改。
任务拆解及执行
确认大纲后,规划Agent将对各级大纲以及调研内容进行任务拆分及规划,并输出待办清单,由深度搜索Agent执行。 深度搜索Agent能理解复杂query,分步拆解多步任务,迭代搜索,边搜边想;执行过程中可调度各类检索接口,包括百度搜索、爬虫、RAG等。执行过程中的详情在右侧的面板中进行了可视化展示;支持并行执行提高检索效率。
研究报告生成
当前支持markdown及HTML两种文件格式输出,其中markdown格式报告为纯文本内容,HTML格式报告除文本内容外可支持图表的渲染和展示。 生成后,可在右侧预览框中对内容进行预览。报告正文中,在女子末尾有相应的信息来源引用标号,可对应至相应信源,包括公开网址或上传的文件名。同时在文末有完整的引用信源列表。
可通过在界面右上角的按钮,直接下载报告至本地。
其他功能
除支持报告生成外,还支持的对话能力包括:
- 简单问答。对于简单query,支持通过大模型本身能力,或简单的搜索链路进行回答
- 文档问答。基于上传文件可实现内容总结摘要、全文翻译、文章润色等功能
