支持对千页级doc、xlsx和pdf等16种格式文档进行解析,输出文档的版面、表格、阅读顺序、标题层级、旋转角度等信息,将非结构化数据转化为易于处理的结构化数据,识别准确率可达 90% 以上
在版式分析、表格识别、标题层级提取、阅读顺序识别等关键功能上,指标均为行业领先
支持文本内容识别、版式分析、表格解析、标题层级划分、阅读顺序识别、角度矫正、水印擦除等功能
支持pdf、doc、图片等16种主流文档格式,可处理多达1000页文件页数和50M文件大小,轻松实现多类文档文本内容解析
解析文档的格式、内容和结构,提供标题层级信息