有声阅读解决方案 提供高度拟人、自然流畅的文本转语音服务,打通人机交互闭环,支持多角色、多情感的音色选择与个性化音库定制,全面解决传统有声制作成本高、效率低等问题,满足泛阅读、智能播报、人机交互等各类场景的语音合成需求 特惠 首购专享,语音合成低至 6.5折 ,立即抢购 > 立即使用 商务咨询 产品价格 技术文档 API在线调试 HOT 快速调试语音合成效果 私有化部署 HOT 支持多种配置选择
200 /次起 立即购买 语音转文字服务 语音转文字服务按照音频总时长定价,分为10小时、50小时、100小时三种规格。 ¥ 200 /次起 立即购买 文字转语音服务 文字转语音服务按照字符数量定价,每次服务10万字以内。 ¥ 500 /次起 立即购买 服务流程 相关产品 重大活动保障服务 针对不同保障目标和保障级别要求,专项定制化实施保障,协助确保客户活动期间业务稳定。
关键词提取 基于语音识别和文本识别技术,针对视频语音、字幕、标题、弹幕等内容获取内容关键词信息。 应用场景 视频个性化推荐 内容检索 内容创作 场景概述 短视频App、视频客户端等。 我们能提供 增加视频曝光,实现业务转化:通过自动抽取视频内容的结构化标签,有效解决新视频冷启动的推荐问题,实现个性化的精准推荐。
适用于手机语音输入、语音搜索、人机对话等语音交互场景 呼叫中心音频文件转写 基于呼叫中心专属模型,可大批量低成本的将8k采样率电话录音文件识别为文本。
提升业务领域识别准确率 呼叫中心语音解决方案 呼叫中心场景端到端语音技术解决方案,包括专属8K采样率语音识别、语音合成
查看详情 相关产品 智能外呼 基于NLP、语音技术和百度大数据,精准识别客户意图,打造真实互动语音体验,助力企业智能高效发展。多行业细分领域深耕经验,智能外呼懂客户、懂场景、懂业务。 号码隐私保护服务 为用户或企业分配隐私号码,通话过程中号码信息不被泄露。可对通话进行录音,提升服务安全性及服务质量。同时可在信息隔离的使用场景中,做流量的监控。
云数据库 Redis 为小度科技提供实时识别语音数据,高效的消息传递机制,多场景毫秒级语音数据识别,助力搭建高效可靠的分布式语音识别系统。 萝卜快跑 萝卜快跑是国内知名自动驾驶出行服务平台,主要为用户提供无人驾驶服务。云数据库Redis可以帮助无人驾驶处理大量传感器数据,包括摄像头数据、雷达数据等。支持无人驾驶实时数据的获取和处理。 爱奇艺 爱奇艺是国内领先的在线视频平台。
短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景 短文本在线合成 基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性 通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言 翻译私有化部署
基于语音识别、声纹检测,精准识别色情、娇喘、辱骂等违规语音 图像内容安全 准确识别图片和视频中的涉黄、违禁、广告、恶心等内容 通用文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 内容审核平台 针对图像、文本、语音、短视频等多媒体内容,整合提供全方位的审核能力 语言处理应用技术
支持自定义黑白名单及策略配置,更贴合业务需求 文档内容安全 基于文档解析技术和图像、文本综合审核能力,准确过滤文档中的色情、广告、恶心、违禁、辱骂、灌水等违规内容,支持多种文档格式,支持轮询、推送两种获取结果模式 音频内容安全 语音识别结合文本分析,检测色情、违禁、辱骂、广告等违规内容,同时利用声纹检测进行娇喘声识别,高效过滤不良语音信息 视频内容安全 基于图像、文本、语音技术综合审核能力,准确过滤视频文件