接口说明 通用文字识别 用户向服务请求识别某张图中的所有文字。
语音翻译 接口描述 语音翻译API集成语音识别、文本翻译、语音合成三大技术能力,可以将60秒以内的语音识别成文字并翻译成目标语言,支持译文语音播报。 接口限制 翻译语种方向支持 中 -> 英 英 -> 中 中/英 -> 其他 其他 -> 中/英 需要上传完整的音频数据,不支持实时音频流,需使用base64编码,编码后的大小不能超过4MB。
运行步骤如下: 在 官网 下载iOS SDK 压缩包 解压缩,双击打开 AipOcrDemo/AipOcrDemo.xcodeproj 在 管理控制台 中新建文字识别应用,配置BundleId为AipOcrDemo的BunldeId(默认为 com.baidu.AipOcrDemo ) 在AipOcrDemo工程中 AipOcrDemo/ViewController.m viewDidLoad 方法中配置相应
可选值包括: true :检测朝向,输入非正向图片时建议开启 false:不检测朝向 words_type 否 string handprint_mix/handwring_only 识别文字类型,默认为手写印刷混排识别,即:handprint_mix。
Cipher import AES 9 import binascii 10 11 ak = ak 12 # 文字识别应用的API Key 13 sk = sk 14 # 文字识别应用的Secret Key 15 16 aes = 'res' 17 # aes key 从控制台 文字识别-应用列表-应用管理 获取 18 19 class AESCipher : 20 def __init__
办公文档识别 接口描述 支持对各类办公文档进行版面分析和文字识别,输出图、表、印章、标题等元素及位置信息,并分版块输出文字识别结果。可支持中、英、日、韩、法等 20+ 语言类型,印刷、手写、混排等多种场景。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
车牌识别 接口描述 支持识别中国大陆机动车蓝牌、黄牌(单双行)、绿牌、大型新能源(黄绿)、领使馆车牌、警牌、武警牌(单双行)、军牌(单双行)、港澳出入境车牌、农用车牌、民航车牌、非机动车车牌(北京地区,不支持临时牌)的地域编号和车牌号,并能同时识别图像中的多张车牌。
二维码识别 接口描述 对图片中的二维码、条形码进行检测和识别,返回存储的文字信息及其位置信息 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
案例故事 核心诉求 APP内置『翻译助手』功能,用户在出境旅途中对外文内容直接的拍摄,扫描识别,并进行中文翻译;自行开发OCR识别功能,成本非常高,且识别效果不理想,直接导致用户体验受影响。希望可以帮助旅客在出境游的旅途中,对外文的路牌、菜单等直接拍摄来进行识别及翻译,打造私人翻译助理。识别及准确的翻译是基于精准、快捷的文字扫描功能来实现。
通用票据识别 该接口已停止更新且即将下线,如需更好的识别效果,请使用 智能财务票据识别 ,此服务支持财务场景中13种常见票据的分类及结构化识别,支持多张不同种类票据在同一张图片上的混贴场景,可返回每张票据的位置、种类及票面信息的结构化识别结果。您也可以选择使用 通用文字识别(高精度版) ,提供更高精度的识别服务,同时支持多语种识别。