接口描述 iOCR 全场景识别采用 MoE 混合专家架构, 无需分类调用、无需定制训练,一个接口实现全场景结构化识别 。基于意图识别模型,自动将同一任务中的不同类型文件分发至对应专家模型,已预置 10 余种 OCR 识别模型与通用抽取大模型,同时支持自定义文档抽取模型,不限类型与版式,轻松提取复杂文档关键字段。
通用场景文字识别 通用文字识别(标准版) 已完成实名认证的用户,登录进入文字识别控制台,即可自动获取所需接口的免费测试资源。 个人认证 1,000 次/月,企业认证 2,000 次/月。 免费测试资源用尽后按照如下价格进行计费。
Python语言 表格文字识别(同步接口) 自动识别表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容。
PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 请求代码示例 提示一 :使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
框选表格识别区 如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。
框选表格识别区 如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。
使用产品 行驶证识别 驾驶证识别 银行卡识别 身份证识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 证件识别助力车辆智能化定损 价值成果 宝莲灯科技在其研发的“车主卫士”APP中接入百度大脑OCR行驶证识别、驾驶证识别、银行卡识别、身份证识别技术后,实现拍照上传证件图片后自动识别重要信息,并通过将数据写入数据库,为实现智能化定损提供了准确的数据保障。
仪器仪表盘读数识别 接口描述 适用于不同品牌、不同型号的仪器仪表盘读数识别,广泛适用于各类血糖仪、血压仪、燃气表、电表等,可识别表盘上的数字、英文、符号,支持液晶屏、字轮表等表型。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
C#语言 表格文字识别同步接口 自动识别表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容。
网络图片文字识别 接口描述 针对网络图片进行专项优化,支持识别艺术字体或背景复杂的文字内容。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。