application/x-www-form-urlencoded Response 查看接口文档 > 应用场景 学习机点读 指尖特效 学习机点读 学习平板、陪伴机器人等儿童学习设备,基于食指指尖检测,精准定位书本上的内容模块,实现自动跟读、点读搜题等效果,让学习机变得更“
产品列表 大模型声音复刻 录制数秒音频,即可极速复刻音色,广泛应用于内容配音、情感陪伴、语音助手等场景 了解详情 流式语音合成 支持文本、语音双向流式,输入文本同时就可以近乎同步听到合成的语音 了解详情 短文本在线合成 提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性 了解详情 长文本在线合成 将超长文本快速转换成稳定流畅、饱满真实的音频,最高支持10万字文本一次性合成 了解详情
识别 覆盖中/英/法/俄/西/葡/德/意/日/韩 支持中英混合识别 支持中/英/日/韩类型检测 高精度含位置版 高精度识别+位置信息返回 便于版式还原与二次排版处理 标准含位置版 标准识别基础上+位置信息返回 便于版式还原与二次排版处理 应用场景 拍照/截图识别 使用通用文字识别技术
小说 NEW 资讯 配音 对话助手 NEW 全部年龄 全部性别 全部版本 度逍遥-情感男声 度悠然-旁白男声 度云萱-旁白女声 度清豪-逍遥侠客 度清柔-温柔男神 度雨楠-元气少女 度雨萌-邻家女孩 度书古-情感男声 度书严-沉稳男声 度书道-沉稳男声 度书宁-亲和女声 度小萌-软萌妹子 度丫丫-童声 度小夏-甜美女声 语速 x5 音调 5 音量 5 播放 应用场景 阅读听书 资讯播报 阅读听书 使用语音合成技术的阅读类
模型保护 大模型部署过程中可能受到对抗性攻击的威胁、以及攻击云服务器来窃取模型及其数据 部署的模型在传输和存储过程中可能被篡改 如何建立访问控制机制,确保可信用户/系统访问模型和相关资源。 AICG内容合规 用户输入的prompt存在违规、恶意引导等内容安全问题 大模型生成内容存在违法违规、偏见歧视、违反社会价值观、个人隐私、恐怖/极端主义等多模态内容安全问题。
备份归档解决方案 互联网时代,企业有大量数据需要备份或者长期归档。依托完整的数据上云方案和国内领先的 分级存储体系,百度智能云对象存储BOS为数据备份和归档业务保驾护航。
翻译定制化训练 在大规模通用翻译模型基础上,基于开发者提供的领域数据,快速构建出一套面向特定领域的定制化翻译系统,更精准地满足开发者对垂类场景的翻译需求
可实现图文并茂的展示、划词直达百度百科、智能追问生成,并配备全链路的安全检测机制。
据版式,所见即所得,全字段输出 准确率高 分类及识别准确率高,分类准确率在95%以上、识别准确率在90%以上 医疗票据质量普遍不高,在褶皱、倾斜等情况下识别率表现好 方案领先 多模态语义理解结构化解析,构建医疗知识库 医保三目录匹配,审核理算自动化端到端服务 落地性强 支持公有云调用和私有化部署
小说 NEW 资讯 配音 对话助手 NEW 全部年龄 全部性别 全部版本 度逍遥-情感男声 度悠然-旁白男声 度云萱-旁白女声 度清豪-逍遥侠客 度清柔-温柔男神 度雨楠-元气少女 度雨萌-邻家女孩 度书古-情感男声 度书严-沉稳男声 度书道-沉稳男声 度书宁-亲和女声 度小萌-软萌妹子 度丫丫-童声 度小夏-甜美女声 语速 x5 音调 5 音量 5 播放 功能介绍 提供多场景音库 提供70余种风格多样的发音人供您选择