列表形式,每个元素为一个layout的位置信息 ++ pageno int 对应文档页码 ++ layout_index int layout在文档当前页中的索引 ++ box list layout在文档当前页中的外接矩形的坐标[x, y, w, h] 返回示例 成功返回示例: JSON 复制 1 { 2 log_id : 23596597899286921761579365582373
开启后,将智能分析图片中的文档区域,如标题、段落,并按照正常的阅读顺序输出结果。 可选 useChartRecognition boolean 图表识别。 默认值为 false。 开启后,可以自动解析文档中的图表,如柱状图、饼图等,并转换为表格形式,方便查看和编辑数据。 可选 layoutNms boolean NMS后处理。 开启后,会自动移除重复或高度重叠的区域框。
use_doc_preprocessor :{ type : boolean , description : 是否启用文档预处理子产线。 }, use_layout_detection :{ type : boolean , description : 是否启用版面检测模块。
gt; 2 <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" 3 android:layout_width="match_parent" 4 android:layout_height="match_parent" 5 android:orientation
修改activity_main_test.xml文件 将 android.support.constraint.ConstraintLayout 修改为androidx.constraintlayout.widget.ConstraintLayout D.
layout_analysis=true时返回 layouts 否 array[] 每个「栏:section」里面的文档版面模块数组,包含表格、图、段落文本、段落标题、表标题、图标题、文档标题、目录、印章等9个模块;每个模块的坐标位置;段落文本和表格内文本内容对应的行序号id。layout_analysis=true时返回 + layout 否 string 版面分析的标签结果。
contentFormat为rawText时需填写 可选 显示子属性 隐藏子属性 parser object {1} 文档解析配置 可选 显示子属性 隐藏子属性 choices array 解析方法,可选值为: (文字提取默认启动,参数不体现) layoutAnalysis:版面分析 ocr:光学字符识别 pageImageAnalysis:文档图片解析 chartAnalysis:图表解析 tableAnalysis
备注:contentFormat为rawText时需填写 可选 显示子属性 隐藏子属性 parser object {1} 文档解析配置 可选 显示子属性 隐藏子属性 choices string 解析方法,可选值为: (文字提取默认启动,参数不体现) layoutAnalysis:版面分析 ocr:光学字符识别 pageImageAnalysis:文档图片解析 chartAnalysis:图表解析
parser :{ type : array , items :{ type : string }, description : 解析算子:\n* `layout`:版面分析\n* `ocr`:图片文字识别(OCR)\n* `table`:表格深度解析\n* `formular`:文档公式解析\n* `vlm`:图片理解(VLM)\n* `chart`:文档图表解析\n* `asr`:音频解析
核心概念 文档转码 DOC将源文档文件转换成适合PC、WAP、APP等多终端环境在线浏览的HTML5文件的计算服务称为文档转码。 文档存储 DOC存储源文档文件、转码后的文件,以备在线浏览使用,称为文档存储。 缩略图 为满足文档预览需求,从文档中截取一页内容生成图片,称为缩略图。