数据处理及使用 生命周期管理 BOS支持用户对Bucket设置生命周期规则,以自动将过期的文件清除,节省存储空间。针对不同前缀的文件,用户可以同时设置多条规则。
对于数据量小或关注抓取结果实时性的建议使用同步模式,异步模式不需要等待,适用不需要实时查看抓取结果的场景,可以后续再对抓取结果进行查询。默认值为sync。 该参数可以放到querystring里。
用户可以通过ListObjectsResponse中的getContents方法获取所有Object的描述信息。 默认情况下,如果Bucket中的Object数量大于1000,则只会返回1000个Object,并且返回结果中IsTruncated值为True,并返回NextMarker做为下次读取的起点。 若想获取更多的Object,可以使用Marker参数分次读取,请参考 扩展查询 。
通常与delimiter配合在 查询模拟文件夹 中使用。 - delimiter 是一个分隔符,用来对objectKey进行分层。 通常与prefix配合在 查询模拟文件夹 中使用。 从prefix开始到第一次出现delimiter字符之间的objectKey称为:commonPrefixes。 - marker 是一个字符串,用来设定返回结果的起始位置。
用户可以通过BOSListObjectsResponse中的contents属性获取所有Object的描述信息。 默认情况下,如果Bucket中的Object数量大于1000,则只会返回1000个Object,并且返回结果中isTruncated值为YES,并返回nextMarker做为下次读取的起点。 若想获取更多的Object,可以使用marker参数分次读取,请参考 扩展查询 。
Message ( msg ) answer = query_decomposition ( msg ) print ( Answer: \n{} . format ( answer . content ) ) 参数说明 初始化参数说明 model (str|None): 模型名称,用于指定要使用的千帆模型。
步骤 在对应数据集的操作列中选择“发布”。 数据集发布成功后,该数据集的发布状态为变为“已发布 。 已发布的数据集不允许任何编辑操作 。 处理数据 训练数据集的数据在未发布前可以进行数据的清洗和增强。 数据清洗:可以对数据集中的文本进行繁体转简体、大写转小写、删除异常字符等操作。详细可查看 数据清洗操作 。 数据增强:通过数据增强策略,对数据本身进行一定程度的扰动和扩充,从而产生 新 数据。
每页显示数据大小,默认为 10 响应 响应头域 除公共响应头域外,无其它特殊头域。
无其它特殊头域。
响应参数 无 错误码 除了通用的错误码,还可能出现如下错误码: 错误码 错误消息 描述 HTTP状态码 FastQueryNotFound FastQuery [fastQueryName] not found 该 FastQuery 不存在 404 注:错误消息中 [fastQueryName] 部分会用具体的名称来替换 示例 请求示例 DELETE /v1/fastquery/demo HTTP