通用文字识别

基于业界领先的深度学习技术
为您提供多场景、多语种、高精度的整体文字检测和识别服务

获取API Key

功能介绍

支持多场景下整体文字检测识别。多项ICDAR指标世界第一,支持任意场景、复杂背景、任意版面识别,支持10多种语言的识别
在图片文字清晰,小幅度倾斜、无明显背光等情况下识别率高达90%以上

功能演示

编号 识别结果
文字 left top width height

提示:可支持PNG、JPG、BMP图片文件,不支持GIF图片,图片大小不超过2M,长边不超过2048像素。为保证正常识别效果,请保证需要识别部分为图片主体部分。

技术特色

准确性高

国内首个公有云OCR产品,基于百度深度学习研究院(IDL)强大的深度学习算法和中文检测识别技术,整图中文识别准确率达85%以上,英文91%以上

成熟稳定

经过手机百度、百度翻译、涂书笔记、百度糯米等多款重量级产品实践检验,产品成熟稳定。支持实时文字识别能力、弹性灵活的高并发承载及99.95%的可用性保证

简单易用

提供符合RESTful规范的API访问接口及服务端SDK,使用便捷

应用场景

通用自然场景

印刷文档识别,翻译文字识别,搜索识别,涂抹识别等通用自然场景

图片反作弊

识别图像和视频中的违规文字,进行违规处理和风险管控

医疗场景

提供医疗行业的票据识别功能,减少人工输入过程,提高输入效率

金融场景

用于企业证照、年报、财报等识别

视频场景

用于视频字幕识别,视频标题识别,视频反作弊,头像反作弊,评论反作弊等

立即获取免费API Key

现在试用,获取免费API Key,免费调用各项开放能力API

免费试用