近场中文普通话识别准确率达98% 多语种识别 支持普通话和略带口音的中文识别;支持英文识别 智能语言处理 使用大规模数据集训练语言模型,对识别中间结果进行智能纠错,并根据语音的内容理解和停顿智能匹配合适的标点符号,。!?
图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。
API调用 可通过入参自由选择需要的垂类识别服务,一次传图,多垂类同时识别 使用方式 公有云服务 提供各项图像识别能力的在线接口,可直接调用API或使用HTTP SDK进行识别应用 立即使用 API文档 私有化部署 可部署至本地服务器,在内网中使用图像识别模型服务,支持GPU环境及国产化操作系统部署 方案介绍 合作咨询 软硬一体方案 提供搭载各类图像技术AI模型的GPU服务器,可选通用型或国产化环境的多种配置
定位手部的21个主要骨节点,可用于自定义手势检测、AR特效、人机交互等场景 人像分割 识别人体轮廓边界,与图像背景进行分离,返回分割后的二值图、灰度图、前景人像图 驾驶行为分析 针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手脱离方向盘等违规行为 功能演示 手部关键点识别 手势识别 指尖检测 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,
总量10次 企业认证:总量20次 QPS配置:1QPS限额 价格 0 元 免费使用 资源包 适用于调用量可预估的企业/个人 并发支持: 2QPS 有效期:12个月 客服响应 7 * 24小时 1千次 80 元 立即购买 按量后付费 适用于需灵活付费的企业/个人 付费调用量 无限制 并发支持 2QPS 客服响应 7 * 24小时 价格 100 元/千次 开通付费 价格说明 本产品可领取免费测试资源,使用完毕后可选择预付费资源包或按量后付费两种计费方式
人脸关键点 对图片中的人脸进行关键点定位,并返回常用的72、150、201人脸关键点坐标位置,包括人脸轮廓、眼睛、眉毛、嘴唇以及鼻子轮廓等,可应用于美颜拍摄、视频贴纸等场景,丰富用户玩法 商用 支持次数包预付费和按量后付,价格低至 0.005/次 > 立即使用 技术文档 产品价格 功能介绍 应用场景 产品定价 技术特色 相关推荐 功能介绍 多人脸支持 支持单人脸或多人脸的精准定位,返回常用的
合作案例 特色优势 支持超长文本 最高支持10万字文本一次性合成,无需拆分文本和拼接音频,调用便捷,并支持下载到本地,大幅节省开发文本 合成速度快 5万字文本最快仅需5分钟 ,合成速度业界领先水平,助力提升音频生产效率 极致听觉体验 率先使用业界领先的WaveRNN合成算法,为您提供极致拟人、情感饱满的语音合成效果 产品定价 购买字符包 按调用量后付费 选择产品 基础音库 基础音库提供基础版本度逍遥
车型识别 识别车辆的具体车型,以小汽车为主,输出图片中主体车辆的品牌、型号、年份、颜色、百科词条信息;可识别三千款常见小汽车车型 车型识别QPS叠加包火热开售 > 立即使用 技术文档 产品价格 私有化部署 软硬一体 功能介绍 功能演示 应用案例 产品价格 使用方式 相关推荐 功能介绍 识别车辆品牌型号 检测图片中的主体车辆位置,识别车辆品牌型号(如宝马X3)、年份、颜色信息,可识别3000款常见车型
最高支持10万字文本一次性合成,提供多种优质音库选择,广泛应用于阅读听书、新闻播报等场景 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成
图像增强与特效 对质量较低的图片进行去雾、对比度增强、无损放大等多种优化处理,重建高清图像;并提供黑白图像上色、图像风格转换、人像动漫化等多个图像特效API能力,满足网络营销、广告活动等多种业务需求 立即使用 技术文档 产品价格 产品列表 应用场景 相关推荐 产品列表 图像增强 对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 了解详情 图像特效 包含黑白图像上色