开源tts语音合成训练工具  内容精选
  • 热门产品排行榜

    语音识别及语音在线合成能力及解决方案 语音合成 高精准 语音识别 流畅拟真 ¥ 商务咨询 查看详情 立即咨询 TOP 4 热卖指数 3501 智能外呼 免费试用 精准识别客户意图,打造真实互动语音体验 智能中控 支持多轮对话 真人语音 真人互动体验 ¥ 0 30天全功能免费体验 查看详情 立即申请 TOP 5 热卖指数 2638 号码认证服务AI_PNVS 适用于一切APP的注册登录场景 调用量

    查看更多>>

  • 百度千帆视频 AI 笔记插件五大研究方向:技术深化与场景拓展 千帆社区

    研究方向包括:基于 Qianfan-VL 的动态分块处理机制,实现音频(语音内容)、视频(画面帧、PPT 切换)、文本(字幕、公式)的毫秒级时间轴对齐,确保笔记中 “语音摘要 - 画面截图 - 公式解析” 三位一体的精准关联;针对动态演示类视频(如软件操作教程、实验步骤演示),研究帧间动作识别与关键步骤提取技术,自动生成 “操作步骤 + 对应画面 + 要点说明” 的结构化笔记,解决动态内容难以文字化沉淀的痛点

    查看更多>>

开源tts语音合成训练工具  更多内容
  • 介绍 - 百度百舸 · AI计算平台 | 百度智能云文档

    模型加速能力 面向社区开源热门模型,百舸通过模型预置与训推加速提供开箱即用的产品能力,降低模型开发与部署成本。 80+热门模型预置,覆盖:大语言模型(LLM)、多模态模型、智驾模型(自动驾驶)、具身智能模型等。 训推加速效果:LLM训练加速20%+、多模态加速30%、智驾模型加速100%+。

    查看更多>>

  • 同济大学

    智慧教育 人工智能 国内首例生成式AI大模型重构科研范式应用 百度智能云助力上海交通大学构建了AI for Science 科学数据开源开放平台,在国内率先实现生成式人工智能与科研场景的结合。

    查看更多>>

  • 百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台

    平均下单时间由3分钟缩短至15秒,用户体验提升 使用产品: 通用文字识别 地址识别 查看详情 智收银:AI语音合成技术,让移动支付更便捷 百度AI语音合成技术的引入,使用户在进行支付操作时,因有更好的听觉体验加持,有效地帮助用户节省时间, 为通联支付越来越多的商户提供了更轻松、便捷的支付服务和体验 使用产品: 语音合成 查看详情 OCR 助力机票购买更便捷 误填购票信息的旅客仅需上传身份证照片,即可进行身份信息比对

    查看更多>>

  • 新闻资讯

    首批开源数据集已在百度百舸AI计算平台同步上线,支持一键启动分布式具身模型训练,将为更多具身智能企业及开发者提供标准化的数据及AI基础设施,助力具身智能机器人多场景泛化落地。

    查看更多>>

  • [AI行业案例]-AI助力轻松自测日语五十音

    全部客户案例 - 哇哦科技(北京) 哇哦科技(北京) 日语助手是一款由哇哦科技(北京)有限公司研发的,集合了听读写各项入门级学习内容和各种辅助工具的小程序,有效地辅助日语初学者学习。

    查看更多>>

  • 版本更新记录 - 机器人开放平台 | 百度智能云文档

    1.增加语音识别角度抑制功能:只识别正前方特定角度的语音 2.增加语音合成动态打断控制功能:服务端控制打断时机,实现更自然的打断 3.增加语音识别纠错干预功能:在管理控制台配置干预词条,实现语音识别纠错 4.增加语音合成二合一功能:降低语音对话端到端时延 5.升级人脸检测/识别功能,优化人脸检测,离线人脸识别性能,支持离线口罩检测 6.修复已知BUG 2.0.0 2020-3-10 1.SDK功能框架升级

    查看更多>>

  • 作业帮

    人工智能助力在线教育 百度云以开源开放的智能大数据平台-天算助力作业帮进行数据统计分析,为线上决策提供参考,经过ETL处理后的数据可以方便地连接报表系统,支撑数据统计分析、定时报表产出、A/B Test实验效果评估等业务,对线上决策有着重要的参考价值。

    查看更多>>

  • 百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台

    平均下单时间由3分钟缩短至15秒,用户体验提升 使用产品: 通用文字识别 地址识别 查看详情 智收银:AI语音合成技术,让移动支付更便捷 百度AI语音合成技术的引入,使用户在进行支付操作时,因有更好的听觉体验加持,有效地帮助用户节省时间, 为通联支付越来越多的商户提供了更轻松、便捷的支付服务和体验 使用产品: 语音合成 查看详情 OCR 助力机票购买更便捷 误填购票信息的旅客仅需上传身份证照片,即可进行身份信息比对

    查看更多>>