人脸检测 能力介绍 接口能力 本文档为人脸识别V3接口使用文档,人脸识别V3接口能识别出人脸位置、人脸关键点、人脸属性值、人脸质量信息。 人脸检测 :检测图片中的人脸并标记出位置信息。 人脸关键点 :展示人脸的核心关键点信息,及150个关键点信息。 人脸属性值 :展示人脸属性信息,如年龄、性别等。 人脸质量信息 :返回人脸各部分的遮挡、光照、模糊、完整度、置信度等信息。
将你的测试图片test.jpg 放入assets目录。
图像融合 :将检测到的两张人脸图片进行融合,输出一张融合后的人脸 黄反识别 :利用图像识别能力,判断图片中是否存在色情、暴恐血腥场景、政治敏感人物 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
实时语音识别-websocket API 接口描述 实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。可以将音频流实时识别为文字,也可以上传音频文件进行识别;返回结果包含每句话的开始和结束时间,适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。 WebSocket简介 WebSocket 是基于TCP的全双工协议,即建立连接后通讯双方都可以不断发送数据。
短语音识别标准版API 接口描述 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。 调用流程 创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音识别极速版” 能力。
语音识别极速版API 接口描述 将60秒以内的完整音频文件识别为文字,专有GPU服务集群,识别响应速度较标准版API提升2倍及识别准确率提升15%。适用于近场短语音交互,如手机语音搜索、聊天输入等场景。 支持上传完整的录音文件,录音文件时长不超过60秒,实时返回识别结果。
bash PHP Java Python Cpp C# 人体关键点识别 curl -i -k 'https://aip.baidubce.com/rest/2.0/image-classify/v1/body_analysis?
1.1 功能介绍 此版SDK所包含的能力如下: 离线动作活体检测 :通过让用户做出指定人脸配合式的交互动作,识别当前操作者是否为活体,此功能为离线使用,可设定指定动作是否使用及应用顺序。动作包含:眨眨眼、张闭嘴、向左摇头、向右摇头、向上抬头,向下低头6个。可有效抵御高清图片、3D建模、视频等攻击。
相当于在多个人脸的图片中,先分别找出所有人脸,然后分别在待查找的人脸集合中,分别做1:N识别,最后将识别结果汇总在一起进行返回。
注: 「接口选择」过程中,还 需勾选「文字识别」中的「身份证识别」接口 ,用于实现身份核验流程中的身份证识别功能。如下图所示。 2.3 输入应用包名 在「文字识别包名」处选择「需要」 ,并根据您的APP应用信息填写包名。此处为必要操作,否则将无法顺利下载集成文件。 至此应用创建完成。