解决方案 该物流平台通过使用百度通用文字识别技术,轻松实现了上述诉求,具体实现过程如下: 步骤一:用户在该物流网内将钢材标签进行拍照上传,网站会先通过图像质量检测对图片质量进行分类,筛选出符合条件的图片; 步骤二:系统再将这些图片进行分类,先对有固定版式的图片直接使用通用文字识别; 步骤三:对于不是固定版式的图片将通过iOCR自定义模板文字识别+NLP文本矫正,对非标准文档进行结构化输出; 步骤四:
指尖检测(邀测) 接口描述 对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的手部,定位食指指尖、及4个辅助关键点的坐标位置, 模型针对儿童学习机点读场景进行专项调优,可用于点读搜题、自动跟读等应用 。 当前接口主要适用于图片中单个手部的情况,图片中同时存在多个手部时,识别效果可能欠佳。
attr 接口文档: https://ai.baidu.com/ai-doc/BODY/Ak3cpyx6v 指尖检测接口上线邀测 接口能力:检测图片中的手部,定位食指指尖、及4个辅助关键点的坐标位置,模型针对 儿童学习机点读场景 进行专项调优,可用于点读搜题、自动跟读等应用 在线体验: https://ai.baidu.com/tech/body/fingertip 接口文档: https://ai.baidu.com
规避用户在品牌名称上的文字输出障碍,而通过图片/拍照获取品牌名称代替; 2. 准确获取品牌信息,且提升品牌信息获取速度。 解决方案 Step1 :进入拍照识股界面,选择上传品牌logo或其产品图片方式:拍照or从手机相册选择; Step2 :图片上传后,进行图像识别; Step3: 品牌或其产品图像识别成功后,即刻匹配到对应的品牌百科页面,获取品牌相关资料数据。
支持毫秒级的识别响应能力、弹性灵活的高并发承载及99.99%的可靠性保障。 应用场景 人脸检测、追踪,活体检测,可用于安防监控。 人脸关键点检测,像素级人脸解析,可用于图片编辑、人脸美化等移动应用场景,比如百度魔图。 人脸属性识别如种族、性别、年龄等,可用于机器智能。
更多精选案例 点击下载 使用产品/方案 VR虚拟现实 人脸识别云服务 VR营销购物一站式解决方案 相关案例 卓思 新石器 客户痛点 作为全国率先开展全国购的二手车电商业务的公司,一直追求用技术为用户提供最好的买车体验,提供真实的车源,大幅降低用户的成本,VR项目是最有效的途径之一。比起图片来说,它能让用户具有身临其境的感觉,可以帮助用户360度无死角查看车辆的真实信息,甚至帮助用户直接做出决策。
解决方案 针对客户搜索鞋品时使用不便、效率低下的行业痛点,“革圭助理”引入百度相似图片搜索服务,用户上传鞋品图即可一键搜索到相同或相近款式的商品,无需输入鞋材编码,显著提升了检索效率和使用体验。
文字识别完成后,BOS 会将识别结果以特定 json 文件的形式,推送到用户设定的接收 URL。 通用物体识别 百度通用物体识别服务为用户提供了图片内容分析、提取、标签化输出的能力,对于有图片聚类、图片识别等场景的上层应用,有非常重要的作用。 当触发通用物体识别应用时,BOS 将上传到 Bucket 中的数据自动推送到百度通用物体识别服务。
音轨分离及音量调节 在视频中实现分离音轨,可独立设置原声、背景音的音量、静音 音乐裁剪 可拖动设置音乐的入点 字幕编辑 多段字幕 一次制作可添加多个字幕,并支持多行文字 字幕入出点设定 设定每一个字幕在视频上出现和消失时间 字幕画面位置 设定字幕在画面上的显示位置 字幕样式 可设置字幕样式,包括:字体、字号、描边(粗细、透明度、颜色)、阴影(距离、透明度、颜色)等 编辑特效 转场特效 实现片段间过渡
查看详细说明 点击进入 手写文字识别 手写文字识别 (HandwriteOCR),图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。 查看详细说明 点击进入 二维码识别 二维码识别 (QRcodeOCR) 可对图片中的二维码、条形码进行检测和识别,返回存储的文字信息及其位置信息。