整体介绍
简介
Hi,您好,欢迎使用百度EasyDL定制化训练和服务平台。
定制文本分类的模型,是基于自建分类体系的机器学习方法,可实现文本按内容类型做自动分类。平台目前提供的文本分类模型包括:文本分类(单标签)和文本分类(多标签)两种模型类型,请您根据自己的业务场景来选择合适的模型。本文介绍的是关于文本分类(单标签)的模型介绍。
文本分类(单标签)场景:如您对网络文章进行舆情分析,判断舆情是正向评价还是负向评价,即每条文本仅有一个分类标准,此问题属于单标签的文本分类场景;
文本分类(多标签)场景:如您对网络文章进行板块划分,即每条文本有两个及以上分类标准,文章可能属于娱乐、国际、生活等多个标签,则可使用多标签的文本分类模型;
更多详情访问:EasyDL自然语言处理方向
应用场景
1、投诉信息分类:训练客服投诉信息的自动分类,将每个用户投诉的内容进行分类管理,节省大量客服人力
2、媒体文章分类:训练网络媒体文章的自动分类,进而实现各类文章的自动分类
3、文本审核:定制训练文本审核的模型,如训练文本中是否含有违规/偏激性质的描述
4、其他:尽情脑洞大开,训练你希望实现的文本分类(单标签)模型
技术特色
文本分类模型内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。
文心大模型是百度发布的产业级知识增强大模型,是千行百业AI开发的首选基座大模型。文心大模型既包含基础通用的大模型,也包含了面向重点领域和重点任务的大模型,还提供丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。“知识增强”是文心的核心特色,文心能够同时从大规模知识和海量多元数据中持续学习,如同站在巨人的肩膀上,训练效率和理解准确率都得到大幅提升,并具备了更好的可解释性。
使用流程
训练模型的基本流程如下图所示,全程可视化简易操作,在数据已经准备好的情况下,最快15分钟即可获得定制模型。