视频等多种场景,最快15分钟完成 人流量统计 统计图像中的人体个数和流动趋势,以头肩为主要识别目标统计人数,无需正脸、全身照 人像分割 识别人体的轮廓范围,与背景进行分离,适用于拍照背景替换、照片合成、人体特效等场景 手势识别 识别OK、拳头、比心、点赞、数字等24种常见手势,支持自拍、他人拍摄、各种拍摄角度 驾驶行为分析 针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手脱离方向盘等违规行为
申请试用,请提交 合作咨询 开始分析 分析结果 分析中 应用场景 语音播报 智能写作 新闻展示和推送 语音播报 语音播报场景往往有严格的字数要求,新闻摘要能够自动生成符合字数规范且表达通顺的信息,在提升用户体验的同时,也提升了播报效率 合作案例 特色优势 技术领先 基于深度学习和篇章分析技术,自动抽取新闻中富含信息的重要部分,已实际服务多个产品 效果可靠 在信息充分性、简洁性、连贯性、通顺性等方面经过严格评估
审核员可以在平台上高效地审核图像、文本等各类媒体内容 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成
关键词提取 基于语音识别和文本识别技术,针对视频语音、字幕、标题、弹幕等内容获取内容关键词信息。 应用场景 视频个性化推荐 内容检索 内容创作 场景概述 短视频App、视频客户端等。 我们能提供 增加视频曝光,实现业务转化:通过自动抽取视频内容的结构化标签,有效解决新视频冷启动的推荐问题,实现个性化的精准推荐。
适用于手机语音输入、语音搜索、人机对话等语音交互场景 呼叫中心音频文件转写 基于呼叫中心专属模型,可大批量低成本的将8k采样率电话录音文件识别为文本。
合成图 图片文件支持PNG、JPG、JPEG、BMP,图片大小不超过2M。
查看详情 相关产品 智能外呼 基于NLP、语音技术和百度大数据,精准识别客户意图,打造真实互动语音体验,助力企业智能高效发展。多行业细分领域深耕经验,智能外呼懂客户、懂场景、懂业务。 号码隐私保护服务 为用户或企业分配隐私号码,通话过程中号码信息不被泄露。可对通话进行录音,提升服务安全性及服务质量。同时可在信息隔离的使用场景中,做流量的监控。
云数据库 Redis 为小度科技提供实时识别语音数据,高效的消息传递机制,多场景毫秒级语音数据识别,助力搭建高效可靠的分布式语音识别系统。 萝卜快跑 萝卜快跑是国内知名自动驾驶出行服务平台,主要为用户提供无人驾驶服务。云数据库Redis可以帮助无人驾驶处理大量传感器数据,包括摄像头数据、雷达数据等。支持无人驾驶实时数据的获取和处理。 爱奇艺 爱奇艺是国内领先的在线视频平台。
基于语音识别、声纹检测,精准识别色情、娇喘、辱骂等违规语音 图像内容安全 准确识别图片和视频中的涉黄、违禁、广告、恶心等内容 通用文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 内容审核平台 针对图像、文本、语音、短视频等多媒体内容,整合提供全方位的审核能力 语言处理应用技术
支持自定义黑白名单及策略配置,更贴合业务需求 文档内容安全 基于文档解析技术和图像、文本综合审核能力,准确过滤文档中的色情、广告、恶心、违禁、辱骂、灌水等违规内容,支持多种文档格式,支持轮询、推送两种获取结果模式 音频内容安全 语音识别结合文本分析,检测色情、违禁、辱骂、广告等违规内容,同时利用声纹检测进行娇喘声识别,高效过滤不良语音信息 视频内容安全 基于图像、文本、语音技术综合审核能力,准确过滤视频文件