语音搜索、智能语音对话等场景 了解详情 短语音识别极速版 将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景 了解详情 实时语音识别 将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景 了解详情 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
标注能力 全面支持无人驾驶、语音识别、人脸识别、地图数据等多种数据标注场景。 数据交付方式 根据客户需求,支持公有化、私有化两种数据交付方式。 公有化交付 客户可直接在开放云提交需求或者上传待处理数据,项目执行完毕后,下载结果数据,交付过程方便快捷。 私有化交付 根据需求,在客户公司内网部署数据客户端,客户可通过公司内网批量提交需求并获取结果数据,数据隐私性更高、安全性更强。
可配合EasyDL零售版商品检测API一起使用,保障排面数、分销率等商品识别结果真实有效 立即使用 产品价格 技术文档 功能介绍 应用场景 特色优势 产品定价 相关推荐 功能介绍 货架陈列翻拍识别 支持识别对屏幕翻拍的商品货架陈列图片,比如各类超市和夫妻老婆店内的货架、端架、立式冰柜等陈列场景 特殊场景翻拍识别 支持识别快消品牌线下促销时的商品特殊场景图片是否为手机翻拍图片,比如门脸、促销陈列/物料等场景
手部关键点与手势识别 精准定位手部21个关键点及4个辅助关键点,并返回坐标信息。可检测图片中所有手部,并识别24种常见手势,如:拳头、点赞、数字等。支持自拍、他人拍摄等各种拍摄角度。 驾驶行为分析 精准定位车载场景中驾驶员坐标并返回位置参数,可支持在夜间红外监控模式下识别。可准确识别驾驶员属性行为,包括使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方、闭眼等9种典型行为姿态。
企业智能搜索引擎 基于百度核心的知识图谱、NLP、视频理解等技术,借助百度搜索引擎的建设经验,将搜索与知识提炼工具相结合,盘活企业数据资产,实现员工搜的快、搜的准、展现直观和主动推荐的需求,从而大幅提高企业业务人员的检索效率,为企业的业务端赋能。
多种特色音库让每一个故事都能找到合适的音色,为用户带来更极致的阅读体验 合作案例 技术特色 支持多语言多音色 支持中文、英文、中英文混读合成,提供基础音库和精品音库共14种音库供您选择,让您的产品拥有个性化的声音 语速音调可调节 支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求 支持多音字标注 中文多音字可通过标注拼音、音调自行定义发音,例如“轻舟已过万重(chong2
EasyDL自定义图像审核 通过EasyDL平台定制图像分类、物体检测等模型,自定义识别标签,满足定制化审核需求 应用场景 视频直播图像审核 社交应用图像审核 社区论坛图像审核 实名社交头像审核 视频直播图像审核 采用百度色情识别、图文审核等技术,对视频、直播的截帧图像进行实时自动审核,快速高效,过滤违规内容的同时保证良好的用户体验 合作案例 特色优势 识别准确率高 依托百度的海量数据积累和领先的视觉技术
我们能提供 千帆平台 与文心一言进行对话交互,包含内容创作与辅助、智能客服问答、数据分析、创意营销、文档校对等能力,适用于电商、短视频、教育、游戏、医疗、金融等行业的多种业务场景 人脸识别 包含实名认证、人脸对比、人脸搜索、人脸属性分析等能力,可灵活应用于金融、泛安防等行业,满足身份核验、人脸考勤、闸机通行、互动美颜、人脸注册登录等业务场景 OCR文字识别 多场景、多语种、高精度的文字检测与识别服务
热销规格限时1折 人脸识别 稳定服务保障,算法世界领先,人脸识别热销产品低至1折 语音识别 自助训练专属模型,将语音快速准确识别为文字,语音识别热销产品限时1折购 热门应用限时抢购 丰富的智能创作产品,激发营销创意,全面提升效率 AI作画API-基础版 支持文字生成图片,16种图片风格支持,3种图片尺寸支持,单次可生成1-6张图片 产品首购专享 规格 有效期 并发支持 数量 50点 1年 1并发
应用价值 提供快速的识别响应 降低视频/图片的传输带宽成本 客户案例 苏州智能环卫 英特尔携手百度,通过人工智能和边缘计算解决方案,对苏州的环卫渣土车进行实时画像收集与分析,能在第一时间通知车辆、人员对垃圾抛洒滴露等问题进行处理,全面监管保洁作业效果。