手势识别

识别图片中的手部位置和手势类型，可识别24种常见手势，包括拳头、OK、比心、作揖、作别、祈祷、我爱你、点赞、Diss、Rock、竖中指、数字等

查看详情

匡威识别视频内容精选

配置长视频审核策略 - 内容审核平台 | 百度智能云文档
配置长视频审核策略使用前须知如果您还未阅读长视频审核接口简介建议先阅读，本章节将会指导您如何在内容审核平台配置长视频审核策略。因产品能力升级，在2026年2月27日前接入的客户，在「策略管理」页面部分审核维度下能同时看到新旧两个版本的标签配置，建议尽快全量使用新版标签能力，旧版也可继续使用，如需技术指导，可提交工单，将有专人指导您使用。
查看更多>>
扩充实例步骤 - 文字识别OCR
扩充实例步骤下文将以通用文字识别GPU版为例，详细展开说明应用服务实例扩容步骤。
查看更多>>

匡威识别视频更多内容

核心概念 - 视频创作分发平台VideoWorks | 百度智能云文档
缩略图从原视频中截取一帧或多帧画面，并根据用户指定的大小和伸缩策略生成图片，满足视频快速预览、视频封面展示等需求。转码任务（Job）任务是音视频转码中最基本的执行单元，每个任务将一个原始的音视频资源转码成目标规格的音视频资源。
查看更多>>
文档解析 - 文字识别OCR
文档解析接口描述文档解析支持对doc、pdf、图片、xlsx等18种格式文档进行解析，输出文档的版面、表格、阅读顺序、标题层级、旋转角度等信息，支持中、英、日、韩、法等20余种语言类型，可返回Markdown格式内容，将非结构化数据转化为易于处理的结构化数据，识别准确率可达 90% 以上。
查看更多>>
标准模型部署 - 文字识别OCR
二、场景与名词场景说明（无环境）全新部署：服务器环境为第一次部署，该服务器之前没有部署过百度文字识别产品的任何模型。（有环境）升级模型：是指用户之前部署过老版本的百度文字识别产品模型，需要对模型进行升级操作。
查看更多>>
媒资库操作 - 视频创作分发平台VideoWorks | 百度智能云文档
媒资库操作普通素材用户上传音频/视频/图片到素材库，创作视频时可从素材中心导入上传素材使用如下代码可以上传一个视频/音频/图片到媒资库。
查看更多>>
批量修改设备绑定的识别任务的识别间隔 - 边缘服务器ECS | 百度智能云文档
批量修改设备绑定的识别任务的识别间隔接口描述批量地设置设备绑定的识别任务的识别间隔。请求结构 PUT /console/api/v1/device/ai/elapse 请求头域请求头名称描述示例 Authorization 认证头。
查看更多>>
文档矫正增强 - 文字识别OCR
PDF文件的对应页码，当 pdf_file 参数有效时，识别传入页码的对应页面内容，若不传入，则默认识别第 1 页 scan_type int32 否选择是否对图片内主体内容进行四角点增强或矫正，可选值如下： - scan_type = 1：只做检测，不对主体进行矫正，返回主体四角点坐标，可用作前端页面展示 - scan_type = 2：只做矫正，需传入主体四角点坐标，使用传入的坐标值对主体进行扣取及矫正
查看更多>>
[AI行业案例]-从无感人脸识别考勤开启智能化校园管理
同时该解决方案也基于人脸离线识别SDK、EasyMonitor视频监控开发平台为校园人脸识别访客登记、人脸识别宿舍就寝情况统计、校园黑名单及危险区域预警等功能提供了完整的管理系统，从而更加全面的解决校园安全防控管理存在的各种问题，真正做到校园环境全面感知。
查看更多>>
增值税发票验真 - 文字识别OCR
同时可直接与同平台的发票识别能力对接，完成发票识别的同时进行自动化验真。视频教程请参见智能财务票据识别+增值税发票验真使用教程在线调试您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
查看更多>>

手势识别

配置长视频审核策略 - 内容审核平台 | 百度智能云文档

扩充实例步骤 - 文字识别OCR

核心概念 - 视频创作分发平台VideoWorks | 百度智能云文档

文档解析 - 文字识别OCR

标准模型部署 - 文字识别OCR

媒资库操作 - 视频创作分发平台VideoWorks | 百度智能云文档

批量修改设备绑定的识别任务的识别间隔 - 边缘服务器ECS | 百度智能云文档

文档矫正增强 - 文字识别OCR

[AI行业案例]-从无感人脸识别考勤开启智能化校园管理

增值税发票验真 - 文字识别OCR

热门活动

新闻动态

最新活动

相关主题

热门产品