常见问题
基础问题
Q:人体分析可以直接分析视频流吗?
A:目前除危险行为识别接口外,其余在线接口仅支持对静态图片进行识别分析,即将陆续开放离线SDK、软硬一体方案,以满足视频流的处理分析需求。
Q:人体分析对摄像头有要求么?图片质量会影响识别效果吗?
A:人体分析服务对摄像头选型无特殊要求,市面上主流枪机、球机、IPC、USB摄像头拍摄的图像均支持。
如果图片质量较差,会一定程度上影响模型效果。对于超高清图片建议压缩后识别,对于图片质量差的图片,建议提升图片清晰度,推荐分辨率720 P以上的图片,更低分辨率的图片也能识别,只是效果可能有差异,模糊、遮挡严重、光线暗等情况下,识别效果肯定不理想。
Q:人体分析可以识别夜间红外监控图片么?
A:红外图片缺少颜色特征,识别效果与可见光图片相比,有一定差异;当前人体检测与属性识别、驾驶行为分析这2个服务已扩展支持红外图片,但识别效果需实测评估,其余服务暂不支持红外场景。
价格问题
Q:人体分析在线接口如何收费?未上线计费的接口能否申请提额?
A:目前人体分析在线服务已上线标准计费功能,各个接口的免费调用额度(调用量和QPS并发),以及产品价格说明,请参考产品价格文档。
未上线计费功能的接口,若免费限额不够,可以提交工单、或加入官方QQ群(860337848)联系群管申请提额。
Q:人体私有化部署方案如何收费?
A:人体分析私有化部署包为付费产品,可自用或集成为客户使用,需具备基本的IT能力进行部署使用。
- 免费测试:人体分析的各个部署包,均提供免费测试,最高可获得3个月免费测试权限。
- 正式购买:按照授权数量计费(具体授权方式见授权说明),不同功能的部署包分别计费,支持按年授权、永久授权两种购买方式,具体价格请联系客户经理沟通。
场景可行性
Q:人体分析可以识别吸烟、打电话行为吗?
A:人体检测与属性识别、驾驶行为分析2个服务均可识别吸烟、打电话行为。
- 如果是普通室内外监控场景,请使用人体检测与属性识别服务,可直接在线测试识别效果:https://ai.baidu.com/tech/body/attr,支持服务器端私有化部署(本地服务器和专有云服务器均支持),详细说明请参考:https://ai.baidu.com/tech/body/private
- 如果是车载场景,请使用驾驶行为分析服务, 可直接在线测试识别效果:http://ai.baidu.com/tech/body/driver,该服务预计2020年2月推出离线SDK,可集成到车载硬件设备中,在设备端离线使用,如有需求,可提交工单或者合作咨询联系我们,以便后续及时对接测试。
Q:人体分析可以识别人员在岗/离岗/睡觉行为吗?
A:可使用人体检测与属性识别服务、或人体关键点识别服务,上述2个服务均可判断画面中是否有人、并返回每个人体的坐标位置,基于接口返回的上述信息,在摄像头画面中设定识别区域,即可实现在岗/离岗的业务判断逻辑 。
同时,百度近期推出的一站式视频监控系统配置平台EasyMonitor,已经预置了“离岗检测”、“睡岗检测”等业务技能,可直接接入视频流,进行技能配置,查看监控分析结果,零开发门槛,欢迎使用。
Q:人体分析可以识别人员是否穿戴工作服/佩戴安全帽吗?
A:可使用人体检测与属性识别服务,通过返回字段“是否戴帽子”及“服饰颜色”、“服饰纹理特征”结果,辅助判断。
同时,百度近期推出的一站式视频监控系统配置平台EasyMonitor,已经预置了“安全帽佩戴合规检测”等业务技能,可直接接入视频流,进行技能配置,查看监控分析结果,零开发门槛,欢迎使用。
Q:人体分析可以识别摔倒或打架行为吗?
A:可以,百度近期推出的危险行为识别服务支持识别摔倒、砸东西、打架等行为,可以提交工单、或加入官方QQ群(860337848)联系群管申请开通权限,进行试用。
Q:人体分析可以通过图片得到身高、三围、脚长等具体信息吗?
A:通过人体关键点信息推算肩宽、身高等信息不可行,图片中人体远近、大小有区别,不能进行比例估算。
人体关键点识别目前可识别的21个关键点位置如下:头顶、左耳、右耳、左眼、右眼、鼻子、左嘴角、右嘴角、脖子、左肩、右肩、左手肘、右手肘、左手腕、右手腕、左髋部、右髋部、左膝、右膝、左脚踝、右脚踝。
Q:手势识别可以识别手势的方向么?我需要自定义手势动作
A:目前没有动态的手势识别,可以用静态的手势做个替代方案,比如点赞手势(拇指向上)代表向上,diss手势(拇指向下)代表向下,具体支持的手势类别可以参考文档说明:https://ai.baidu.com/ai-doc/BODY/4k3cpywrv
新推出的手部关键点识别服务,可精准定位手部21个主要骨节点坐标,可用于自定义手势识别,可在线测试体验:https://ai.baidu.com/tech/body/hand
私有化部署
Q:人体分析支持内网环境使用、服务器私有化部署么?
A:支持,本地服务器或者专有云服务器(需GPU)均可一键部署,支持人体检测、人体属性识别、人体关键点定位、人流量统计、手势识别、人像分割等功能;完成企业认证,即可在控制台提交测试申请,最高可获得3个月免费测试权限:https://console.bce.baidu.com/ai/?fromai=1#/ai/body/package/index,工作人员会在3个工作日内处理对接。私有化部署方案详细介绍请参考:https://ai.baidu.com/tech/body/private
Q:基于企业本地服务器私有化部署的人体识别对服务器GPU有什么要求?
A:人体分析私有化部署的硬件配置选型推荐,请参考:https://ai.baidu.com/ai-doc/BODY/Ak3cpyw50#硬件配置
Q:人体分析的本地私有部署是否还需要访问公网?
A:人体分析本地私有部署不需要访问公网,无外部网络依赖,在局域网内使用,数据无需上传至第三方服务器或云端,可有效保障企业核心生产数据的私密性和安全性。
离线 SDK
Q:人体分析支持在设备端离线使用吗?
A:人体关键点识别、手势识别、动态人流量统计Android端的离线SDK已在邀测中,其他开发环境暂未支持,如有需求,请提交工单或者合作咨询联系我们申请试用。
同时,近期推出3D肢体关键点 SDK,如有需求,可在页面上点击申请试用。
Q:人体分析服务的离线SDK对硬件及摄像头的要求如何?
A:离线SDK硬件推荐rk3399或者同等算力以上的芯片;对于摄像头无特殊要求,720P以上即可。其中:
- 手势识别:主要适用于3米以内的自拍、他人拍摄,1米内识别效果最佳,拍摄距离太远时,手部目标太小,无法准确定位和识别。图片中有多个手势时,也能识别,但该情况下,单个手势的目标可能较小,且角度可能不好(例如存在倾斜、遮挡等),识别效果可能受影响。建议针对单个手势进行识别,效果最佳。
- 动态人流量统计:适用于各种出入口,摄像头高度3m左右为佳,垂直俯拍或大角度斜拍,需要拍到人体头部和肩部,人群过于密集会影响识别效果。抽祯频率需>2fps,否则无法有效跟踪,建议5~10fps。
人流量统计
Q:人流统计接口可以实现对单位时间内去重的进出人数统计吗?
A:请使用人流量统计(动态版)接口,技术文档:https://ai.baidu.com/ai-doc/BODY/wk3cpyyog。
Q:人流统计对摄像头的高度、角度有什么要求吗?
A: 静态人流量统计的摄像头架设的建议:高度3m以上,5m以上为佳,垂直俯拍或者大角度斜拍,需要能拍全区域内的人头,适应人群密集场所。
动态人流量统计的摄像头架设的建议:适用于各种出入口,摄像头高度3m左右为佳,垂直俯拍或斜拍,需要拍到人体头部和肩部,人群过于密集会影响识别效果。
Q:人流统计可以实现指定区域的识别与统计吗?
A:目前接口已支持图片特定框选区域的人数统计,最多可同时支持10个区域,调用接口时设置area参数即可,技术文档:https://ai.baidu.com/ai-doc/BODY/7k3cpyy1t。
对于环境中存在干扰识别结果的物体,也可以通过设定区域来排除干扰,提升识别效果。
Q:人流量统计接口,目前只返回数量和渲染图片,能返回具体人头的坐标集合吗?
A:人流量统计模型暂时不支持返回坐标。
如需要人体坐标信息,可使用人体检测与属性识别、或人体关键点识别,上述2个服务均可检测识别画面中的所有人,并返回每个人体的坐标位置。但人群密集、或拍摄距离过远时不适用,因为遮挡严重、目标太小,无法有效检测到人体目标。
Q:人流统计目前在什么场景下效果比较好?我测试效果感觉不够理想
A:目前在室内场景,例如机场、商场、教室、展馆等效果都比较好,室外场景,如交通场景、工地场景等,由于场景差异较大,建议先实测评估识别效果。若效果不理想可以提交工单、或加入官方QQ群(860337848)联系群管进行反馈。
Q:动态人流量分析时,图片与图片之间间隔的最小时间差是多少?是否时间相隔越近,识别正确率越高?
A:不限制最小时间差,最大时差不超过500ms,即:抽祯频率需要大于2fps,建议帧率5~10fps,也就是每100ms~200ms抽一帧。
驾驶行为分析
Q:人体分析在车载场景识别效果好吗?
A:百度推出了驾驶行为分析服务,可以识别驾驶员打手机、抽烟、不系安全带等违规行为,详情参见:https://ai.baidu.com/tech/body/driver
该服务预计2020年2月推出离线SDK,可集成到车载硬件设备中,在设备端离线使用,如有需求,可提交工单或者合作咨询联系我们,以便后续及时对接测试。
Q:驾驶行为分析的score和threshold代表什么含义?如何使用?
A:score表示属性的置信度,比如抽烟属性的score如果是0.9,说明很大程度上在抽烟;threshold是基于内部测试结果,给出的score阈值建议,假设抽烟属性的threshold是0.5,则表示“建议score≥0.5时,代表抽烟,score<0.5时,代表没抽烟”。
threshold只是内部给出的建议阈值,仅作为参考,不同业务场景的测试结果可能有差异,需要根据实际测试结果选取合适的阈值,比如您测试了200张抽烟的图片,发现score >0.6时,真实准确率为80%,score>0.8时,真实准确率为90%,那么看看业务上需要多高的准确率,再选择一个合理的score阈值。