7
重磅发布!文心旗舰大模型ERNIE 4.0 Turbo现可支持精调
大模型开发/产品动态
- 文心大模型
- 大模型训练
- SFT
8月21日7879看过
文心大模型最新旗舰版ERNIE 4.0 Turbo现可支持精调,企业可邀测体验
百度智能云千帆大模型平台现已支持对ERNIE 4.0 Turbo进行精调
企业可点击链接进行邀测体验:https://cloud.baidu.com/survey/ernie.html
百度智能云千帆平台在此前已支持ERNIE 3.5、ERNIE Speed、ERNIE Lite、ERNIE Tiny、ERNIE Character进行模型精调,截止当前已共计6款文心大模型可在千帆平台进行精调使用,累计精调出2.1万个模型,服务超过千家企业核心业务场景,拥有众多成功效果案例。
》〉关于模型精调
模型精调让企业可以根据自身的业务需求和业务数据,训练出更适合企业的大模型,极大的提升模型在业务中的使用效果。同时模型精调还拥有以下四点优势:
-
任务特定性能提升:预训练语言模型通过大规模的无监督训练学习了语言的统计模式和语义表示。然而,它在特定任务上的性能可能不如在大规模无监督数据上表现出的性能。通过在任务特定的有标签数据上进行SFT,模型可以进一步学习任务相关的特征和模式,从而提高性能。
-
提高领域适应性:预训练语言模型可能在不同领域的数据上表现不一致。通过在特定领域的有标签数据上进行SFT,可以使模型更好地适应该领域的特殊术语、结构和语义,提高在该领域任务上的效果。
-
解决数据稀缺性:某些任务可能受制于数据的稀缺性,很难获得大规模的标签数据。SFT可以通过使用有限的标签数据来训练模型,从而在数据有限的情况下取得较好的性能。
-
防止过拟合:在SFT过程中,通过使用有标签数据进行有监督训练,可以减少模型在特定任务上的过拟合风险。这是因为SFT过程中的有标签数据可以提供更具体的任务信号,有助于约束模型的学习,避免过多地拟合预训练过程中的无监督信号。
》〉文心大模型精调优质案例
1、百度文库
在论文大纲、PPT生成等复杂场景,经过ERNIE 4.0 Turbo模型精调后,优质内容率提升高达15%,内容生成效果显著提升。
2、百度电商
在教师IP人设的慧播星数字人主播回复问答场景中,经过ERNIE 4.0 Turbo模型精调后,问答优质率(对标行业头部讲师)较精调前效果提升45%,同时直播间用户观看时长、成单转化率均有显著增益!
3、杭州全诊医学
全诊医学基于自身业务数据对ERNIE Speed进行了模型精调,打造出“听、说、读、写”全方位功能的AI医生助理;精调后的ENRIE Speed在满足业务“逻辑性、专业性、准确性、满意度”均有显著提升;目前,AI医生助理已经覆盖45家三甲医院,105个区县超1.5万家诊所,每日生成门诊病历草稿多达15万份,病历质量提升超过45%,患者服务数量因此提升了1.5倍!
》〉更多模型精调指引
评论