接入 MCP Server 后,您的应用将直接具备以下文字识别能力: 功能类型 MCP Server 地址 工具能力 通用文字识别 https://aip.baidubce.com/mcp/ocr_general/sse 通用文字识别、网络图片文字识别、办公文档识别、表格文字识别、手写文字识别、智能结构化、文件检测分类、二维码识别、数字识别、印章识别、仪器仪表盘读数识别 文档解析 https://aip.baidubce.com
使用产品 人脸识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 人脸识别开启智能云考勤 价值成果 天津威腾软件技术有限公司通过使用人脸识别考勤机,实现实时云平台数据的管理分析,考核评定。极大地提升了企业考勤的管理效率。在使用过程中,人脸识别速度约为1s左右、准确率达到99%。完全满足高峰时段考勤高效应用,轻松实现智能化的考勤管理和日常考核功能,降低了企业的运营成本。
非法捕鱼识别算子 非法捕鱼识别算子 请求Url POST /v1/fishing/detect HTTP/1.1 Request参数 参数 可选 类型 说明 image_base64 必选 String 图片base64编码,iamge_base64和image_url二选一即可,优先使用image_base64 image_url 必选 String 图片url,只有当image_base64为空时才会使用
共支持4个语种 ,语种请在 ASR_START输入事件中的language参数中设置 中文普通话 (全部场景) 中文四川话(离线命令词及语义不支持) 粤语(离线命令词及语义不支持) 英语(离线命令词及语义不支持) 识别输入事件 以下参数均为SpeechConstant类的常量,如SpeechConstant.ASR_START , 实际的String字面值可以参见SpeechConstant类或自行打印
人体关键点识别 对于输入的一张图片(可正常解码,且长宽比适宜), 检测图片中的所有人体,输出每个人体的21个主要关键点,包含头顶、五官、脖颈、四肢等部位,同时输出人体的坐标信息和数量 。 支持多人检测、人体位置重叠、遮挡、背面、侧面、中低空俯拍、大动作等复杂场景。
通用文字识别OCR算子 通用文字识别OCR算子 请求Url POST /v1/ocr/detect HTTP/1.1 Request参数 参数 可选 类型 说明 image_base64 必选 String 图片base64编码,iamge_base64和image_url二选一即可,优先使用image_base64 image_url 必选 String 图片url,只有当image_base64
4.1 比对源设置 比对源选择 : 权威人脸库比对 :核验时需传入姓名及身份证号,实时采集人脸图片,与权威数据源进行一致性比对。 自建人脸库比对 :无需传入姓名或身份证号,实时采集人脸图片,与预先通过 对比图片上传API 上传的指定人脸图进行1:1比对。 仅活体检测 :无需传入姓名或身份证号,实时采集人脸图片进行真人检测,底层使用 在线图片活体V4 接口判断。 非大陆数据源 :默认不使用。
数据标注 由于需训练一个目标检测模型,检测图片中的烟火,所以标注时需选择目标检测模版进行标注,标注时注意所有图片中出现的烟雾、火种都需要被框出(框可以重叠),检测框应包含整个识别对象,且尽可能不要包含多余的背景。 提示:由于烟火检测干扰样本多,极容易造成误检,生活中有很多物体和烟火是非常接近的,很难区分(比如:云朵、红色的灯光等),容易造成模型误检,所以建议也采集一定数量的数据作为负样本。
功能介绍 产品概述 人脸离线识别SDK,包含人脸采集、活体检测、人脸对比/识别、人脸库管理等能力,并全部离线化、本地化。此SDK一经授权激活,可完全在无网环境下工作,所有数据皆在设备本地运行处理,可根据业务需要进行灵活的上层业务开发。核心能力分布如下图所示,后文会详细介绍。 适用场景特点 网络 :无网、局域网等情况,无法连接公网。如政府单位、金融保险、教育机构等。
解决方案 1、图书馆人脸识别闸机 通过与江苏感创电子科技合作,接入百度人脸识别技术,打造图书馆人脸识别闸机,改变了原本需要刷卡准入的图书馆机制,提升安全性及便捷性。 图1:进入图书馆前人脸识别 图2:人脸识别后闸机通行 2、自助借还图书机 湖州师院通过与江苏感创电子科技合作,接入百度人脸识别技术,实现人脸自助借、还图书功能。设备采用动态、非配合方式进行人脸验证通过,更加方便及安全。