整体介绍
简介
Hi,您好,欢迎使用百度EasyDL定制化训练和服务平台。
定制文本分类的模型,是基于自建分类体系的机器学习方法,可实现文本按内容类型做自动分类。平台目前提供的文本分类模型包括:文本分类(单标签)和文本分类(多标签)两种模型类型,请您根据自己的业务场景来选择合适的模型。本文介绍的是关于文本分类(多标签)的模型介绍。
文本分类(单标签)场景:如您对网络文章进行舆情分析,判断舆情是正向评价还是负向评价,即每条文本仅有一个分类标准,此问题属于单标签的文本分类场景;
文本分类(多标签)场景:如您对网络文章进行板块划分,即每条文本有两个及以上分类标准,文章可能属于娱乐、国际、生活等多个标签,则可使用多标签的文本分类模型
更多详情访问:EasyDL自然语言处理方向
应用场景
1、新闻分类:定制训练媒体文章文本的自动分类,识别文章所属的一个或多个领域标签
2、商品名称分类:定制训练商品名称的分类模型,识别商品所属的一个或多个品类
3、其他:尽情脑洞大开,训练你希望实现的文本分类多标签的模型
技术特色
文本分类模型内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。
文心大模型是百度发布的产业级知识增强大模型,是千行百业AI开发的首选基座大模型。文心大模型既包含基础通用的大模型,也包含了面向重点领域和重点任务的大模型,还提供丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。“知识增强”是文心的核心特色,文心能够同时从大规模知识和海量多元数据中持续学习,如同站在巨人的肩膀上,训练效率和理解准确率都得到大幅提升,并具备了更好的可解释性。
使用流程
训练模型的基本流程如下图所示,全程可视化简易操作,在数据已经准备好的情况下,最快15分钟即可获得定制模型。