logo
3

百度千帆大模型零基础开箱初体验

在当今这个数字化、智能化的时代,人工智能已经成为我们生活中不可或缺的一部分。当下是各厂大模型井喷的时代,作为互联网头部企业——百度推出了自己的千帆大模型,面向企业开发者的一站式大模型开发及服务运行平台。千帆不仅提供了包括文心一言底层模型(ERNIE-Bot)和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。
支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务,被广泛应用于各个行业的大数据分析和决策支持中。最近我有幸使用了千帆大模型,下面我将分享一下我的体验。

1、登录到千帆大模型的平台

在使用“千帆大模型”之前,首先需要通过其官方网站进行注册。注册过程十分简单,只需填写一些基本信息即可。完成注册后,我就可以登录到后台,开始使用这款产品。若有百度账号,则可以直接登录。
可以看到左侧清晰的提供了七个模块:数据服务、大模型训练、大模型管理、大模型服务、Prompt工程、插件应用、平台管理。

2、开发流程体验

千帆大模型平台覆盖从数据管理、数据标注、模型开发、模型纳管、部署上线的AI能力研发与应用全生命周期建设和管理。面对这么多模块,作为小白肯定不知道从何处下手,而千帆就提供了一个特别好的开发流程。那么就先按照这个流程来小试牛刀。
2.1、数据服务
1、创建数据集
在这里选择的标准类型是文本对话,标注模板是非排序
2、导入数据集
这里支持导入的格式有JSONL、TXT、CSV、XLSX、压缩包。如不知道格式写成什么样,下面都会有相应的数据样例。在这里我选择的导入格式是TXT
同时这里预置了很多数据集,可以直接被用于模型训练和模型评估任务。
3、数据标注
选择刚创建的数据集
先创建一个应用
点击自动生成,然后保存标注。
更多的自动生成需要开通付费功能。不再使用的时候可以终止付费。
标注完成。
2.2、模型训练
创建SFT任务,行业选择其他
开通BLOOMZ-7B大模型的付费。
确认之前创建的数据集已经发布。
在创建的SFT任务中选择该数据集。
备注:若数据量小于32条,该模型无法启动训练
开始训练。
查看训练日志
训练流程可视化
经过16分钟之后运行完成。
评估报告如下:
2.3、模型管理
发布我创建的模型。
在大模型管理——模型仓库 中可以看到我创建的模型。
也可以在这里新增模型版本。
2.4、模型服务
在大模型服务——服务管理,创建服务。私有资源池,当前的配置1小时28元,1天350元,1月8400元,可以根据自己的需求自行选择。发布服务到私有资源池,通过API接口调用模型。
2.5、在线测试
需要开通ERNIE-Bot。
输入问题在线测试。
调用量统计。

3、其他功能

管理和查看prompt模板,支持在服务调用时组合prompt输入推理,包括大量预置模板和自制模板。
Prompt在线优化。
插件编排。
天气插件,输入地名就可以生成出当地天气。
计费管理可以看到正在使用的服务,若在不使用服务时可以选择终止付费,用的时候可以再开通。

3、体验总结

首先,千帆大模型提供了一种非常直观和可视化的数据分析方式。通过使用千帆大模型,我可以轻松地将复杂的数据集导入进行自动化的标注。也支持提交标注人力服务的需求发布至百度众测。
其次,千帆大模型还具备高度的扩展性和灵活性。它支持各种数据源的接入,包括JSONL、Excel、文本文件等,使我能够方便地将不同来源的数据进行整合和分析。同时,千帆大模型还提供了丰富训练模型,可以根据不同的需求选择不同的训练方法。
最后,千帆大模型的学习和使用并不复杂。它提供了友好的用户界面和详细的操作指南,使我能够快速上手。同时,千帆大模型还有一个活跃的社区,可以在社区中与其他用户交流经验和分享技巧。这种学习和交流的机会让我不断提升自己的数据分析能力,并且在实际应用中取得更好的效果。
总的来说,我对千帆大模型的体验非常良好。它为我提供了一种高效、直观和灵活的自建大模型的方式,使我能够更好地理解和利用数据。千帆大模型的强大功能和易用性让我在数据分析和决策支持方面受益匪浅。我相信,在未来的工作中,千帆大模型将成为我不可或缺的利器,帮助我更好地应对各种数据挑战。
评论
用户头像