场景方案·客服对话标签
一、案例背景
快餐公司对自身客服系统构建了复杂的标签体系,从六大业务【基础会员、券、高级会员、自助、配送优惠、礼品卡】分别构建三层的标签体系,示例如下:
1.1 小模型方案的现状和挑战
该项目起初是使用NLP小模型进行落地,在项目推进过程中,NLP小模型的方案遇到如下几个困难:
困难 一 | 困难 二 | 困难 三 |
---|---|---|
NLP小模型标签准确率水平保持在接近80%,业务希望能够进一步提高。 | NLP小模型需要的标注数据较多,人工成本消耗较大,目前小模型每个标签至少300个标注数据。 | 除了样本量要求较多的问题外,NLP小模型对标签体系还会有较强的依赖,一旦业务的标签体系发生较大的变化(例如:三层标签扩展到四层标签、大规模调整标签等),标注和训练工作需要大规模重复建设。 |
1.2 大模型的目标和实现效果
该场景作为百胜大模型考察的典型性场景,客户希望大模型在准确率上能在80%以上,并降低标注数据的量(注:准确率为单标签准确率,即一个标签正确即为打标正确)。
二、案例方案:
整体方案:
1. prompt调优
假设你有一套客户意图分类以及该分类下属的原因标签。
请根据给定的客服对话内容,判断最有可能的客户意图以及对应的原因标签,意图和原因标签需要严格控制给定的范围之内;一个意图可能对应多个原因,但一个原因只会对应一个意图;如果均不匹配则回答无明确客户意图;回答请使用json的格式,示例:{“意图": "xxx","原因”: "xxx"}
客户意图的分类
客户意图 | 原因标签 |
---|---|
为什么我的餐点不对 | 餐厅配错 |
我要取消订单 | 想下外送到家下错了 |
我要取消订单 | 餐厅出餐太慢 |
某活动我如何能买到or得到or参与 | 咨询活动机制 |
某产品太咸太软太硬等口感差 | 餐品品质口感差 |
我要加备注配酱料 | 配酱料顾客要定制餐厅服务 |
我要改取餐方式 | 自取改外卖 |
投诉餐厅服务态度差 | 餐厅态度差 |
怎么评价 | 未收到评价链接 |
我要取消订单 | 顾客下错餐厅 |
对话内容
正在为您转接人工服务中,目前人工繁忙,如需继续等待请输入:继续
☎ 孟咪咪M(00301) 2023年01月03日 20:28:23
{"cmd":65,"content":"欢迎进入人工客服通道,00301很高兴为您服务对话过程中以及完成后,您会收到评价提醒,希望您能对我个人本次服务做个评价,您的反馈和建议也是我努力的方向哦,感谢~"}
☺ Guest629756 2023年01月03日 20:28:23
继续
☎ 孟咪咪M(00301) 2023年01月03日 20:28:29
快餐全国客服中心,很高兴为您服务,我先查看一下您反馈的问题哦~
可以预留吗
☺ Guest629756 2023年01月03日 20:29:00
明星组合的明信片
☎ 孟咪咪M(00301) 2023年01月03日 20:29:21
您好,2023年1月9日起,通过本平台APP或小程序【到店自取】或【外送到家】点餐,在点餐页点购指定的产品可得明星组合的新春明信片一套(8张),数量有限,售完即止哦~,欢迎您的参与~
☎ 孟咪咪M(00301) 2023年01月03日 20:29:26
服务小记已提交
☎ 孟咪咪M(00301) 2023年01月03日 20:29:48
{"evaluation":1,"satisfactionName":"不满意","time":1672748988775,"userId":62629756}
☎ 孟咪咪M(00301) 2023年01月03日 20:30:30
亲亲,您还在线吗?我还在快马加鞭处理中,如果您还有问题,也及时回应哦~
2. few shots调优
假设你有一套客户意图分类以及该分类下属的原因标签。
请根据给定的客服对话内容,判断最有可能的客户意图以及对应的原因标签,意图和原因标签需要严格控制给定的范围之内;一个意图可能对应多个原因,但一个原因只会对应一个意图;如果均不匹配则回答无明确客户意图;回答请使用json的格式,示例:{“意图": "xxx","原因”: "xxx"}
您可参考客户的意图分类查阅以下示例:
示例1
输入:工作人员态度差,骂人
输出:{“意图": "投诉餐厅服务态度差","原因”: "餐厅态度差"}
对话内容
正在为您转接人工服务中,目前人工繁忙,如需继续等待请输入:继续
☎ 孟咪咪M(00301) 2023年01月03日 20:28:23
{"cmd":65,"content":"欢迎进入人工客服通道,00301很高兴为您服务对话过程中以及完成后,您会收到评价提醒,希望您能对我个人本次服务做个评价,您的反馈和建议也是我努力的方向哦,感谢~"}
继续
快餐店全国客服中心,很高兴为您服务,我先查看一下您反馈的问题哦~
可以预留吗
☺ Guest629756 2023年01月03日 20:29:00
明星组合的明信片
您好,2023年1月9日起,通过本平台APP或小程序【到店自取】或【外送到家】点餐,在点餐页点购指定的产品可得明星组合的新春明信片一套(8张),数量有限,售完即止哦~~欢迎您的参与~~
☎ 孟咪咪M(00301) 2023年01月03日 20:29:26
服务小记已提交
☎ 孟咪咪M(00301) 2023年01月03日 20:29:48
{"evaluation":1,"satisfactionName":"不满意","time":1672748988775,"userId":62629756}
☎ 孟咪咪M(00301) 2023年01月03日 20:30:30
亲亲,您还在线吗?我还在快马加鞭处理中,如果您还有问题,也及时回应哦~
3. SFT调优&LORA调优
当前平台精调样板已接入客服对话多标签生成内容,您可至样板间查看详细内容。
三、案例成果:
第一波效果验证,数据集(10个标签,每个标签150组客服对话),仅利用prompt工程准确率较低(个别标签准确率小于10%),单个标签(“我要改取餐方式”)在few shots支撑下,准确率可以到60%。
每个标签使用100组对话进行SFT之后,剩余50组对话进行测试,大模型准确率提升到了86%,且json结构体返回十分稳定。
仅基础大模型+Prompt工程 |
剩余50条对话做验证 |
|||||||||
序号 | 意图 | 原因 | 准确率 | 正确数 | 错误数 | 总数 | 准确率 | 正确数 | 错误数 | 总数 |
1 | 我要取消订单 | 顾客下错餐厅 | 39% | 59 | 91 | 150 | 94% | 47 | 3 | 50 |
2 | 我要取消订单 | 餐厅出餐太慢 | 75% | 112 | 38 | 150 | 80% | 40 | 10 | 50 |
3 | 我要取消订单 | 想下宅急送下错了 | 37% | 55 | 95 | 150 | 94% | 47 | 3 | 50 |
4 | 为什么我的餐点不对 | 餐厅配错 | 45% | 68 | 82 | 150 | 94% | 47 | 3 | 50 |
5 | 某活动我如何能买到or得到or参与 | 咨询活动机制 | 14% | 21 | 129 | 150 | 96% | 48 | 2 | 50 |
6 | 某产品太咸太软太硬等口感差 | 餐品品质_口感差 | 12% | 18 | 132 | 150 | 94% | 47 | 3 | 50 |
7 | 出餐太慢了 | 餐厅出餐慢 | 3% | 5 | 145 | 150 | 78% | 39 | 11 | 50 |
8 | 投诉餐厅服务态度差 | 餐厅_态度差 | 45% | 68 | 82 | 150 | 78% | 39 | 11 | 50 |
9 | 我要改取餐方式 | 自取改外卖 | 61% | 91 | 59 | 150 | 74% | 37 | 13 | 50 |
10 | 为什么我的订单还没有取消or没有退款 | 催取消_餐厅未及时处理 | 1% | 2 | 148 | 150 | 80% | 40 | 10 | 50 |
总体: |
33% | 499 | 1001 | 1500 | 86% | 431 | 69 | 500 |
第二波效果验证,数据集扩充到了30个标签(实际有数据的是27个标签),通过SFT和LORA分别训练之后,准确率如下,整体效果相当,考虑LORA训练的成本较下,建议该类场景未来均可优先考虑LoRA。
序号 | 意图 | 原因 | 准确率 | 正确数 | 错误数 | 总数 | 准确率 | 正确数 | 错误数 | 总数 |
1 | 怎么评价 | 未收到评价链接 | 94% | 48 | 3 | 51 | 92% | 47 | 4 | 51 |
2 | 某产品你们有吗 | 产品是否有_餐厅断货_临时or永久 | 92% | 47 | 4 | 51 | 100% | 51 | 0 | 51 |
3 | 我要加备注配酱料 | 配酱料_顾客要定制餐厅服务 | 90% | 46 | 5 | 51 | 96% | 49 | 2 | 51 |
4 | 餐厅电话是多少 | 丢东西 | 98% | 50 | 1 | 51 | 100% | 51 | 0 | 51 |
5 | 做好了吗确认 | 取餐时间or出餐进度 | 90% | 46 | 5 | 51 | 92% | 47 | 4 | 51 |
6 | 售后_为什么看不到我的订单了 | 历史订单确认订单内容 | 100% | 51 | 0 | 51 | 100% | 51 | 0 | 51 |
7 | 我要取消订单 | 取消订单_无原因 | 86% | 44 | 7 | 51 | 90% | 46 | 5 | 51 |
8 | 为什么我的卡包没有这张券 | 卡包未到账 | 100% | 51 | 0 | 51 | 98% | 50 | 1 | 51 |
9 | 为什么我的券orV金没有返还 | 券orV金未返还_系统处理中_15分钟 | 98% | 124 | 3 | 127 | 95% | 121 | 6 | 127 |
10 | 某产品变小了or配料放的少 | 餐品品质_分量少 | 82% | 42 | 9 | 51 | 90% | 46 | 5 | 51 |
11 | 我要加备注加or不加冰 | 加or不加冰_顾客定制产品 | 99% | 200 | 2 | 202 | 98% | 197 | 5 | 202 |
12 | 餐品烤焦烤糊了 | 餐品品质_烤糊 | 96% | 49 | 2 | 51 | 98% | 50 | 1 | 51 |
13 | 餐厅电话是多少 | 错漏餐 | 86% | 44 | 7 | 51 | 84% | 43 | 8 | 51 |
14 | 某活动在哪里能买到or得到or参与 | 咨询活动地点 | 92% | 47 | 4 | 51 | 90% | 46 | 5 | 51 |
15 | 券怎么用 | 三方平台券 | 82% | 42 | 9 | 51 | 75% | 38 | 13 | 51 |
16 | 我要取消订单 | 顾客选错时间 | 94% | 48 | 3 | 51 | 84% | 43 | 8 | 51 |
17 | 某产品什么口味 | 辣不辣 | 98% | 50 | 1 | 51 | 98% | 50 | 1 | 51 |
18 | 我要取消订单 | 不想要了换别家 | 90% | 46 | 5 | 51 | 88% | 45 | 6 | 51 |
19 | 我要开发票 | 订单超90天 | 88% | 45 | 6 | 51 | 90% | 46 | 5 | 51 |
20 | 某产品里怎么有头发or血丝等异物 | 餐品品质_有异物or血丝 | 94% | 48 | 3 | 51 | 96% | 49 | 2 | 51 |
21 | 我要开发票 | 未到开票时间 | 67% | 34 | 17 | 51 | 80% | 41 | 10 | 51 |
22 | 我要取消投诉 | 取消投诉 | 96% | 49 | 2 | 51 | 96% | 49 | 2 | 51 |
23 | 我要修改发票 | 修改抬头or税号 | 98% | 50 | 1 | 51 | 98% | 50 | 1 | 51 |
24 | 赠品or周边质量有问题 | 赠品or周边品质问题 | 100% | 51 | 0 | 51 | 100% | 51 | 0 | 51 |
25 | 我要合并开票 | 顾客合并开票 | 78% | 40 | 11 | 51 | 73% | 37 | 14 | 51 |
26 | 某产品都坏了or变质 | 餐品品质_变质 | 78% | 40 | 11 | 51 | 82% | 42 | 9 | 51 |
27 | 我要开发票 | 开发票_无原因 | 83% | 167 | 34 | 201 | 92% | 185 | 16 | 201 |
总体: |
91% | 1599 | 155 | 1754 | 92% | 1621 | 133 | 1754 |
客服对话大模型打标场景POC总结:
场景成本(仅计算公有云费用,不包含服务)预估:
本平台公有云可以按训练/推理token用量和算力单元进行收费,预计每个品牌每年在25w元左右,具体计费明细可查看训练计费和模型部署推理计费。