备注:什么是倒排索引 倒排索引也常被称为反向索引,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。下面用一个简单的例子来介绍倒排索引: 假设我们有以下两篇短文本: a. 文档1: apple banana b. 文档2: banana cherry 我们的目标是创建一个倒排索引,使得我们可以快速找到包含特定词的文档。
在弹层中可以输入数据源的名称及描述,并能点击「选择文件」来上传本地 xlsx 或 csv 后缀的文件,目前上传最大文件限制是 100M,对于大于 10M 的文件推荐使用 CSV 格式,如果上传 Excel 发现不符合预期也推荐先转成 CSV 格式。
通过压缩包上传时,需注意: 压缩包内的一个文本文件将作为一个样本上传。压缩包格式为.zip格式,压缩包内文件类型支持txt,编码仅支持UTF-8。 每组数据的字数建议不超过512个字符,超出将被截断。 通过Excel文件上传时,需注意: Excel文件内首行为表头,每行为一个样本,每个样本字符数不得超过512个字符,超出将被截断 文件格式支持xlsx格式,单次可上传100个文件。
压缩包格式为.zip格式,压缩包内文件类型支持txt,编码仅支持UTF-8 每组数据的数建议不超过512个字符,超出将被截断 通过TXT文本上传时,需注意: 文本文件内数据格式要求为 文本内容\n (即每行一个样本,使用回车换行),每一行表示一组数据,每组数据的数建议不超过512个字符,超出将被截断 文本文件类型支持txt,编码仅支持UTF-8,单次上传限制100个文本文件,最多可上传100万个文件
建议仅传一个部署集ID,即此列表长度不能大于1。部署集ID通过 部署集列表接口 获取。 ReplicationMap 参数名称 类型 描述 availabilityZone String 可通过调用获取可用区列表接口查询可用区列表。
最多支持 64 个字符。 备注 (可选) 输入备注信息,例如针对该数据归档任务的用途描述。 策略 选择数据归档任务的策略,此处选择 仅归档 或 归档+清理 。支持如下三种: 仅归档 :对目标数据执行归档任务,将源库需要归档的数据复制到目标库保存。 归档+清理 :先对目标数据执行归档,然后再删除源库中已归档的数据。 仅清理 :该操作仅删除目标数据,不做归档处理。
可视化建表 1.基本信息 字段名称 字段描述 表名称 填写表名称,以英文开头, 支持英文、数字、下划线,不超过32个字符 类型 包括管理表、外部表、映射表三种类型: 物理表指数据存储于EasyDAP的数据湖中的表,由EDAP进行统一的存储路径管理和元数据管理,包括外部表和管理表。管理表可以删除元数据和数据,外部表只能删除元数据,不能删除数据。
供应商 S:00220 长短信的子短信没有收齐 建议确认长短信是否发送完全 供应商 S:00221 长短信的子短信数量过多 建议减少长短信的子短信数量 供应商 S:00222 长短信某个子短信的编号大于子短信总个数 建议修改长短信格式 供应商 S:00223 长短信内容不全 建议核查短信内容 供应商 S:00224 长短信拼接超时 建议确认长短信格式 供应商 S:00225 长短信拼接失败 建议检查长短信格式
当模型生成结果以stop中某个元素结尾时,停止文本生成。说明: (1)每个元素长度不超过20字符。 (2)最多4个元素 user_id string 否 表示最终用户的唯一标识符 响应头域 除公共头域外,无其它特殊头域。 响应参数 名称 类型 描述 id string 本轮对话的id object string 回包类型。
否 array[] 文档版面信息数组,包含表格、图、段落文本、标题等标签;标签的坐标位置;段落文本和表格内文本内容对应的行序号ID + layout 否 string 版面分析的标签结果。