无需提前进行手动分类处理,上传图片即可完成自动分类、识别及信息提取 增值税发票识别 结构化识别增值税普票、专票、电子发票、卷票的所有关键字段,包括发票基本信息、销售方及购买方信息、商品信息、价税信息等,其中四要素识别准确率超过99% iOCR自定义模板文字识别 支持自助创建识别模板和分类器,实现对固定版式卡证、票据的自动分类及结构化识别
一键导出转换结果 立即使用 公有云-接口调用 提供图文转换的在线接口,可直接调用API或使用HTTP SDK对文件进行转换,接入便捷,快速集成 立即使用 接口文档 私有化部署 可部署至本地服务器或专有云,在内网/局域网中实现图文转换功能,保障数据私密性,支持主流国产化操作系统部署 方案详情 应用场景 文档格式转换 线下文档电子化 文档格式转换 将图片或PDF格式的论文、教辅、行业报告等文件快速转换为
该接口实际能力的图片格式及大小要求以接口文档为准 Request Params image= 图片的Base64编码 Post https://aip.baidubce.com/rest/2.0/image-classify/v1/gesture?
识别准确率超过99% iOCR自定义模板文字识别 提供识别模板及图像分类器的自定义功能,并整合多种预置能力,可快速实现对各类卡证、票据的自动分类及结构化识别
5个关键字段进行结构化识别,识别准确率超过99%
包括视频创作、智能写作等多模态创作能力,能够极大地提高内容生产效率 PPT转视频 一键解析PPT素材,自动编排文字和图片信息,并加入配音及字幕,配以各类转场动画,形成生动有趣的图文解说视频 图文素材转视频 输入图文素材,一键自动生成视频,适用于企业宣传、营销推广、知识科普等场景,帮助创作者快速实现图文转视频
该接口实际能力的图片格式及大小要求以接口文档为准 识别结果 序号 内容 1 543543777555638 宽度: 268 高度: 23 左间距: 606 上间距: 345 2 17600987577 宽度: 215 高度: 30 左间距: 953 上间距: 453 3 15798448856 宽度: 213 高度: 29 左间距: 953 上间距: 657 Request Params image
表格文字识别 支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。
相关推荐 菜品识别 识别超过9千种菜品,支持客户创建属于自己的菜品图库,可准确识别图片中的菜品名称、位置,并获取百科信息 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 图像搜索 以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品、相似商品推荐等场景
该接口实际能力的图片格式及大小要求以接口文档为准 请求参数 JSON结果 是否返回每行识别结果的置信度 是 否 是否返回文字四角点坐标 是 否 Params image= 图片的Base64编码 type=https://aip.baidubce.com/rest/2.0/ocr/v1/meter probability=false poly_location=false Post image=