核心概念
1. 语音语义相关概念
语音识别 (Automatic Speech Recognition, 简称ASR)
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
语义解析 (Understanding and Interaction Technology, 简称为UNIT)
语义解析(Semantic Parsing)属于自然语言处理(Nature Language Processing),针对语音识别生成的文本内容,返回机器人理解与应答的信息。度家-AIOT语音语义平台(后续称度家平台)为了让客户更加简单直观地调用语义解析技术,将百度智能对话定制与服务平台(Understanding and Interaction Technology, 简称为UNIT)的技能直接提供给使用者,所以度家平台中与语义解析相关的介绍和接口,都以UNIT为代称。
技能(Skill)
技能是指在某一个对话场景下的对话能力(例如,点歌、查询天气都是一种技能)。目前度家平台支持百度侧预置的多种技能,是百度提供的通用场景对话能力。关于技能详情参见附录-语义解析技能清单。
机器人(Robot)
机器人是指在一个完整对话场景下的对话能力,通常按行业垂类划分。度家AIOT语音平台以技能包含关系定义机器人。目前平台支持百度预置的通用技能机器人,每个通用机器人内可包含多种技能。
对话意图 (Intent)
对话意图是对话技能要理解的用户需求。定义对话技能下的对话意图时还需要设置与对话意图关联的词槽(满足对话意图的必须条件),以及技能理解对话意图后给用户的回应。
- 例如,用户说"换到中央台",对应电视控制技能下的对话意图就是[换台]
- 例如,用户说"北京天气",对应查询天气技能下的对话意图是[查询天气]
词槽 (Slot)
是满足用户对话意图时的关键信息或限定条件,可以理解为用户需要提供的筛选条件。
- 例如: 在查询天气时,词槽是[地点]和[时间]。
- 例如:"换到中央台"中的[中央台]就是一个电视台词槽,它会一定程度上影响系统对换台这个对话意图的执行。
词典
每个词槽都需要对应一套词典,技能的专名词识别服务会结合词槽绑定的词典来识别用户问话中的词槽。您可以自行导入词典,对话技能进行词槽识别时,会优先考虑自定义词典中的词汇。
词典中的值可分为两类:
- 归一词典值: 多个同义词对应的唯一一个归一值,即系统返回给客户的值。
- 同义词典值: 同一个词的不同表达方法,体现用户说法的多样性。
归一词典值 | 同义词典值 |
---|---|
奔跑吧兄弟 | #跑男, #奔跑吧 |
中央一台 | #CCTV1, #中央一套,#中央一频道, #综合频道 |
招商银行 | #中国招商银行, #招行 |
100 | #一百,#100%,#最大,#满分 |
星期日 | #周日, #周天, #星期天 |
语音合成(Text To Speech, 简称TTS)
将语义解析结果返回的文字信息合成为音频,包含短音频和长音频。度家平台的语音合成基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务。
链式语音服务 (Chain Voice Service)
基于WebSocket协议的语音服务,通过一次请求即可调用语音识别(ASR)、语义解析(UNIT)、语音合成(TTS)三种技术,一次性返回对话交互结果。服务具备流式传输能力,支持上传音频文件。
2.设备管理相关概念
以下概念主要用于设备管理和服务鉴权环节,用户只有在创建了厂商(fc),产品(pk),成功导入设备(ak,sk)后,用户的设备才能成功调用度家AIOT语音平台的链式或单项语音服务,以及对特定的设备进行计费、管控。设备管理具体操作参见快速入门。
Factory code (fc)
fc代表厂商,是设备管理中的第一层级。一个客户可以创建多个厂商。例如,一个方案商需要给多个厂商做项目,就可以根据不同的需求在设备管理控制台创建多个厂商。客户创建厂商后,获取唯一的六位字符厂商编码(例如,fc为abc123)。
Product Key (pk)
pk代表产品类型,是设备管理中的第二层级,表示具备同样功能的设备集合(SKU)。一个客户在同一厂商下,可根据设备的型号功能创建多个产品。客户在设备管理控制台创建产品后,获取唯一的八位字符产品编码(如 xyz123ab)。
Access key (ak)
ak代表唯一的单个设备,是设备管理中的第三层级。ak字段为客户自定义提供,不可重复,建议使用设备sn编码。该字段用于设备请求服务时鉴权及对单个设备进行禁用/启用等多种操作。设备ak仅支持英文大小写,数字,横杠及下划线,长度为1-64字节。
Secret key (sk)
sk是与设备ak对应的设备密钥,由客户自定义提供。该字段用于设备请求服务时鉴权。设备sk仅支持英文大小写,数字,横杠及下划线,长度为1-64字节。
说明:设备管理控制台中涉及的ak,sk与用户在百度智能云鉴权身份时提供的AK(Access Key Id)和SK (Secret Access Key Id)不同,请注意区分。