配音用语音合成  内容精选
  • [AI行业案例]-萝卜书摘秒级精准识别书本文档信息

    相关案例 白描 软件工具 准确率高到没朋友的OCR APP 熊猫看书 软件工具 借力语音合成,熊猫看书让阅读更加智能 查看更多案例 > 合作咨询 售前咨询 填写您的业务需求,专属客户经理会尽快联系您,提供1对1咨询服务 售后智能助手 智能诊断,快速解决使用问题 联系销售 更多咨询,请拨打 400-920-8999 转 1 体验AI Web端 前往 AI能力体验中心 移动端 打开百度APP“扫一扫

    查看更多>>

  • 提示词使用指南 - 秒哒公有云MIAODA | 百度智能云文档

    这几个小要点或许能帮到你: 补充上下文——说明动机、约束与受众,并给出原因以便模型泛化( “应用将在做菜时使用,需离线可用与语音播报;用户常单手操作,请提供大按钮与逐步计时提示”优于“做移动端适配”) 把需求写清写具体,写明 应用里包含哪些功能模块,怎么使用 ,如果你希望节省思考的时间,可以写的不用过于复杂,只挑选重要的需求进行详细描述,否则现有的模型能力难以将您的需求全部实现。

    查看更多>>

配音用语音合成  更多内容
  • [AI行业案例]-以图搜商品,精准货源、一键直达

    使用产品 商品图片搜索 支持与交流 AI社区 教学视频 文档中心 SDK下载 以图搜商品,精准货源、一键直达 价值成果 1.商品检索更便捷、精准:以图搜图的检索方式,有效解决了家纺商品图案难以文字准确描述特征,而导致检索准确率低的问题。 1秒内即可从百万级商品图片库中找到相同/相似产品,助力平台实现“精准货源,一键直达”。

    查看更多>>

  • SDK隐私政策总览 - AI开放能力通用参考 | 百度智能云文档

    SDK隐私政策总览 百度AI开放平台旗下软件开发工具包(SDK)隐私政策总览 语音识别SDK隐私政策 语音合成SDK隐私政策 人脸安全采集SDK隐私政策 人脸离线识别SDK隐私政策 通用文字识别离线SDK隐私政策 车牌识别离线SDK隐私政策 身份证识别离线SDK隐私政策 银行卡识别离线SDK隐私政策 行驶证识别离线SDK隐私政策 驾驶证识别离线SDK隐私政策 营业执照识别离线SDK隐私政策 文字识别在线

    查看更多>>

  • 百度数据湖管理与分析平台

    查看更多>>

  • 功能列表 - 机器人开放平台 | 百度智能云文档

    功能列表 语音 包括远场语音识别、情感语音合成语音唤醒、声源定位、回声消除、多角度声音抑制、噪声抑制等功能。 人脸 包括1:N人脸识别、1:1人脸识别、属性检测、人脸跟踪、人脸库管理等功能。 运动 百度Boteye双目视觉导航方案,支持建图、定位、导航和避障功能。 智能知识库 基于FAQ构建知识库,支持图片、视频等富媒体知识,可通过单条新增和批量导入的方式维护知识。

    查看更多>>

  • 机器人配置 - 百度智能外呼

    机器人配置 外呼机器人说明 外呼机器人是智能外呼产品人工智能模块的载体,通过绑定语音语音识别与语音合成模块,创建适配于不同业务场景的机器人。通过这些机器人,创建呼叫任务,实现客户高效智能的拨打诉求。 新增机器人 1.点击“+新增机器人”,在新增机器人页面,可完成机器人名称编辑,选择所属行业,同时为该机器人配置对应语音识别模型、对话核心名称、发音人模型。

    查看更多>>

  • 百度智能云学堂知一

    -百度AI高级大模型工程师 11 章节 企业级AI智能体实战指南 1 章节 MCP:AI领域的“万能插头”——探索模型上下文协议的今天与未来 1 章节 大模型智能客服运营工程师 10 章节 大模型提示词工程技巧与应用 1 章节 高级RAG优化与Agent技术前沿 1 章节 DeepSeek魔法:AI

    查看更多>>

  • 简介 - 机器人开放平台 | 百度智能云文档

    如果机器人使用的是百度麦克风阵列,还可获取唤醒角度,实现声源定位 语音识别 通过自定义语音模块,可支持除内置麦克风和百度麦克风阵列之外的第三方麦克风接入的语音识别功能 语音合成 离在线TTS默认支持标准男、标准女、情感男、情感女、米朵和鸽子六种音色 语音对话 语音识别+语义理解+语音合同可实现语音对话功能,通过 管理控制台 可编排对话逻辑、管理知识库和训练对话模型 ,含语音指令的解析 人脸检测 人脸特征

    查看更多>>

  • SDK介绍 - 百度千帆·大模型服务及Agent开发平台

    查看详细说明 点击进入 短语音识别-极速版 短语音识别(ASR)可以将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于手机语音输入、语音搜索、人机对话等语音交互场景。 查看详细说明 点击进入 短文本在线合成 短文本在线合成(TTS)提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,精品音库听感更逼真。

    查看更多>>