拳头、比心、点赞、数字等24种常见手势,支持自拍、他人拍摄、各种拍摄角度 人体检测与属性识别 检测图像中所有人体,识别人体的20余种属性,包含性别年龄、服饰佩戴、行为动作等 3D肢体关键点 SDK 输出人体16个核心关键点的三维坐标信息,在设备端实时跟踪并精准估算人体三维姿态 人脸检测与属性分析 检测人脸并返回人脸框位置,输出人脸150个关键点坐标,准确识别多种属性信息
开始分析 分析结果: 应用场景 快递单据识别 解析并提取快递单据中的文本信息,标准规范的输出结构化信息,包含姓名、电话、地址,帮助快递或电商企业提高单据处理效率 合作案例 技术特色 应用效果出色 基于语义分析构建的智能算法与场景策略相配合,平均准召率可达95%,让企业更智能、让用户更便利 地图数据支持 融合百度地图权威数据,识别并生成标准规范的地址信息,识别准召率可达到88% 实体识别准确 融合词法分析技术
试卷分析与识别 对试卷、教材等内容进行整页识别,输出其中的图、表、标题、文本等元素的文字信息和位置信息。支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别和手写竖式识别。
识别准确率超过99% iOCR自定义模板文字识别 提供识别模板及图像分类器的自定义功能,并整合多种预置能力,可快速实现对各类卡证、票据的自动分类及结构化识别
输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 结合多项图像处理技术,对各类票据卡证自动分类,并实现结构化识别 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化
统计图像中的人体个数和流动趋势,以头肩为主要识别目标统计人数,无需正脸、全身照 人像分割 识别人体的轮廓范围,与背景进行分离,适用于拍照背景替换、照片合成、人体特效等场景 手势识别 识别OK、拳头、比心、点赞、数字等24种常见手势,支持自拍、他人拍摄、各种拍摄角度 驾驶行为分析 针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手脱离方向盘等违规行为
支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
支持扫描和拍照场景,支持印刷、手写文字分类与识别,支持公式识别 了解详情 词典笔文字识别 面向词典笔场景,主要用于扫描文字并识别,是词典笔的基本功能之一。
出/入院科别、住院次数等15个关键字段 了解详情 出院小结识别 支持识别全国出院小结的科室、姓名、出/入院日期、出/入院诊断、出院医嘱等关键字段 了解详情 入院小结识别 可识别各版式入院小结,包含姓名、入院时间、现病史、既往史等关键字段信息 技术文档 门诊病历识别 识别全国各个医院门诊病历,返回姓名、诊断、检查、主诉、现病史等关键字段 技术文档 诊断证明识别 结构化识别各类诊断证明的9个关键字段,
支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、门诊号、病例号、姓名、性别、社保卡号、金额大/小写、收款单位、省市等关键字段 医疗费用明细识别 支持识别全国医疗费用明细的姓名、日期、病人ID、总金额等关键字段,支持识别费用明细项目清单 医疗费用结算单识别 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段 通用文字识别 提供多场景、多语种