图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。 优惠 人工智能品类特惠,图像主体检测接口低至1折!
提供百度文字识别服务的开发文档 查看详情 > SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 立即下载 > 即刻免费体验OCR文字识别能力 注册即可一键领取免费测试资源 立即使用 相关推荐 医疗发票识别 支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、门诊号、病例号、姓名、性别、社保卡号、金额大/小写、收款单位
应用创建与管理、鉴权机制、常见问题等 查看详情 > 技术文档 针对使用API或HTTP SDK的开发者,提供百度文字识别服务的开发文档 查看详情 > SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 立即下载 > 即刻免费体验OCR文字识别能力 注册即可一键领取免费测试资源 立即使用 相关推荐 医疗发票识别 支持识别全国各地门诊
提供百度文字识别技术开发文档 查看详情 > SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 前往下载 > 即刻免费体验OCR文字识别能力 公有云API最高可享2000次/月免费测试资源 立即使用 相关推荐 通用文字识别 基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务 通用票据识别 对医疗票据
拉伸图像恢复 自动识别过度拉伸的图像,将图像内容恢复成正常比例
iOCR自定义文字识别 基于业界领先的图像处理和文字识别技术,提供自定义模板、自定义分类器、自定义场景等多种功能,并整合多种预置模型,支持高效、低成本地对固定及非固定版式的文件进行自动分类及全场景结构化识别 优惠 人工智能品类特惠,iOCR低至3折!
实名专区 新人特惠 OCR共享资源包 支持OCR多接口共用(包括通用、卡证、交通、医疗等场景文字识别) 产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 9.9 元 原价元 立即抢购 确定 首购特惠 行驶证识别 结构化识别机动车行驶证主页及副页所有22个字段。
活动规则 实名专区 新人特惠 OCR共享资源包 支持OCR多接口共用(包括通用、卡证、交通、医疗等场景文字识别) 产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 9.9 元 原价元 立即抢购 确定 首购特惠 身份证识别 结构化识别身份证正反面所有字段,支持质量及风险校验。
私有化部署 部署至本地服务器或专有云,在内网/局域网中使用文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案 申请免费试用 方案详情 即刻免费体验OCR文字识别能力 注册即可一键领取免费测试资源 立即使用 相关推荐 OCR图文转换器 识别图片/PDF文档版面布局,提取文字内容,并转换为保留原文档版式的Word、Excel文档,方便二次编辑和复制 文档图像处理 对文档图片进行方向矫正
图像内容理解 图像理解视觉大模型,可多维度识别与理解图片内容,包括人、物、行为、场景、文字等,支持输出对图片内容的一句话描述,同时返回图片的分类标签、文字内容等信息 优惠 人工智能品类特惠,图像内容理解接口低至5折!