识别准确率超过99% iOCR自定义模板文字识别 提供识别模板及图像分类器的自定义功能,并整合多种预置能力,可快速实现对各类卡证、票据的自动分类及结构化识别
API调用集成 立即下载 > 社区交流 丰富的技术版块和精华内容,与数以万计的开发者在线交流,快速上手 立即加入 > 即刻免费获得AI能力 公有云API最高可享5 QPS无限量免费调用 立即使用 相关推荐 人脸识别 提供人脸属性识别、关键点定位、人脸1:1比对、人脸1:N识别、活体检测等能力 车辆分析 提供车型识别、车辆检测、车流统计、车辆属性识别、车辆外观损伤识别、车辆分割等能力 图像识别
拳头、比心、点赞、数字等24种常见手势,支持自拍、他人拍摄、各种拍摄角度 人体检测与属性识别 检测图像中所有人体,识别人体的20余种属性,包含性别年龄、服饰佩戴、行为动作等 3D肢体关键点 SDK 输出人体16个核心关键点的三维坐标信息,在设备端实时跟踪并精准估算人体三维姿态 人脸检测与属性分析 检测人脸并返回人脸框位置,输出人脸150个关键点坐标,准确识别多种属性信息
输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 结合多项图像处理技术,对各类票据卡证自动分类,并实现结构化识别 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化
结构化识别各类定额发票中的发票代码、发票号码、金额等7个关键字段 了解详情 通用机打发票识别 结构化识别国家/地方税务局发行的横/竖版通用机打发票,可识别23个关键字段 了解详情 差旅报销票据识别 对财务报销场景所涉及的差旅票据进行结构化识别,包括火车票、出租车票等7种常见票据 了解详情 银行单据识别 支持识别各类不同版式的银行金融单据,包括银行回单、支票、汇票3类金融票据 了解详情 应用场景 财税报销
支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
统计图像中的人体个数和流动趋势,以头肩为主要识别目标统计人数,无需正脸、全身照 人像分割 识别人体的轮廓范围,与背景进行分离,适用于拍照背景替换、照片合成、人体特效等场景 手势识别 识别OK、拳头、比心、点赞、数字等24种常见手势,支持自拍、他人拍摄、各种拍摄角度 驾驶行为分析 针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手脱离方向盘等违规行为
该接口实际能力的图片格式及大小要求以接口文档为准 识别结果 请求参数 JSON结果 1 票据类型 增值税发票 宽度 1659 高度 1174 左边距 3 上间距 6 内容 发票名称 山东增值税电子普通发票 发票代码 037002000311 发票号码 46915250 发票代码的辅助校验码 037002000311 校验码 85696928040078102310 开票日期 2021年03月30日
支持扫描和拍照场景,支持印刷、手写文字分类与识别,支持公式识别 了解详情 词典笔文字识别 面向词典笔场景,主要用于扫描文字并识别,是词典笔的基本功能之一。
包括账号认证、应用创建与管理、鉴权机制、常见问题等 查看详情 技术文档 针对使用API或SDK的开发者,提供百度文字识别技术开发文档 查看详情 SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 了解详情 即刻免费体验数字识别能力 公有云API最高可享2000次/月免费测试资源 立即使用 相关产品 手写文字识别 支持对图片中的手写中文、