语音识别极速版API 接口描述 将60秒以内的完整音频文件识别为文字,专有GPU服务集群,识别响应速度较标准版API提升2倍及识别准确率提升15%。适用于近场短语音交互,如手机语音搜索、聊天输入等场景。 支持上传完整的录音文件,录音文件时长不超过60秒,实时返回识别结果。
方案架构参考下图: 2.1 准备工作 2.1.1 申请license 人脸SDK License :此license用于SDK离线功能使用,在您的申请人脸SDK的后台页面,全局->产品服务->人脸识别->客户端SDK申请 人脸控制台路径如下: 点击客户端SDK管理,弹出如下图:创建应用(这里创建应用是为了使用离线SDK,上面创建应用为了使用人脸在线接口,如注册、识别等) 在弹出的框中输入授权标识,选择应用类型
注: 「接口选择」过程中,还 需勾选「文字识别」中的「身份证识别」接口 ,用于实现身份核验流程中的身份证识别功能。如下图所示。 Step3:创建项目 进入 控制台-人脸实名认证 页面,选择 『项目管理』 页面,点击 『新建项目』 ,进行项目创建,如下图所示。 创建项目前,请确保您在应用控制台已创建应用,若您未创建应用,请参考 Step2 创建应用后,再进行项目创建.
解决方案 风火递通过接入百度大脑OCR通用文字识别(标准版)技术,实现结构化提取商家上传的订单图片的收/发件人信息,并自动填入相应的快递信息输入框内,完成发货信息的准确录入。同时,通过百度大脑语音识别技术,也可快速将商家的语音信息精准地转化为文字信息,并自动填写至快递信息输入框中。
使用产品 图像审核 支持与交流 AI社区 教学视频 文档中心 SDK下载 识别违法色情图片,百度大脑为你审核把关 价值成果 接入百度大脑图像审核接口后,在对违法有害的图片质量上有了把控,可及时识别图片中的文字以及各种有害信息,第一时间将其扼杀在摇篮中,从根源上减少危害。同时,可自动筛选70%的数据且不用人工干预,整体效率提升近三倍。
错误码 请参考 人脸识别错误码
第2步:通过应用百度OCR的 ”通用文字识别”、“通用文字识别(高精度版)”和“网络图片识别”技术,可快速识别出用户图片中的文案内容,再结合网站内丰富的违禁词库,并利用Elastic Search进行分词搜索,可将文案中的违禁词以不同类型标注颜色分类,精准的反馈给用户。
可以集成到单台硬件设备中,实现人脸检测、人脸追踪、人脸采集、人脸比对、小型人脸库(3万人以内)的快速查找。 说明文档 SDK下载 此产品适用于小人脸库、低并发场景。 私有化部署方案 私有化方案是能够在本地部署、离线使用的模型服务,离线部署的模型可以实现在线API的全部功能。
人脸活体检测实现方式 实现方式请参考如下时许图 10.1 活体检测(SDK) 包含本地活体加云端活体,本地活体分静默活体、炫瞳活体、动作活体三种,云端活体可以判断图片中的人脸是否为二次翻拍以及是否为合成图攻击。实现二次验证采集图片是否存在假体攻击破绽的情况。 如您的业务场景核心为人脸实名认证(权威源),请直接参考 7. 人脸实名认证实现方式 。
解决方案 薄荷健康在了解到百度大脑提供的图像识别服务可以轻松实现智能化识图能力,果断在其研发的“薄荷健康”App的“餐前拍一拍”功能中接入了百度菜品识别技术,用户只需打开App扫一扫食用菜品,即可结合健康目标准确计算出摄入食物的合理量。