logo
5

百度文心千帆大模型平台的试用体验

自从我注册了 ChatGPT 3.5 和 ChatGPT 4 的账号之后,打开 Google 的次数比以前大为减少。不过最近 ChatGPT 偶尔会做出"抱歉,我无法满足你的要求"这种小小的任性行为:
然后就是最近我在 ChatGPT 网页版输入了 Prompt 之后,会弹出这种校验窗口,搞得我有点心烦意乱:
最近笔者在某技术社区上收到了百度文心千帆大模型平台的20元代金券。抱着试一试的心态,在这个平台上创建了一些简单的应用体验了一下。
今年除了 OpenAI 的 ChatGPT 之外,国内大厂们也纷纷推出了自己的大语言模型,比如百度的文心一言大模型,在 2C 领域的代表作就是百度的文心一言,这个 App 发布没多久,我就劝说老婆安装在了她的手机上。而文心一言大模型在 2B 领域的应用,则是本文介绍的文心千帆大模型平台,这个平台不仅支持百度自家的文心一言大模型,也支持第三方的大模型,如下图所示:
这好比 SAP Business Technology Platform 上,不仅支持 SAP 完全具有自主知识产权的 ABAP 环境,同时也支持第三方开源的 Cloud Foundry 和 Kyma 环境一样。
千帆大模型平台的 cockpit:https://cloud.baidu.com/survey/qianfan.html

点击模型广场,可以看到平台预置了很多大模型。这个模型广场,类似 SAP Business Technology Platform 的 Service Marketplace. 在平台上创建应用,能够消费的大模型,都罗列在这里了。
随便看一个,比如 ERNIE-Bot,这是百度⾃⾏研发的⼤语⾔模型,覆盖海量中⽂数据,具有更强的对话问答、内容创作⽣成等能⼒。
想要消费这些大模型的话,首先得在平台上创建一个应用。点击模型服务区域下面的应用接入,然后点击创建应用按钮,创建新的应用,并为应用分配想要消费的模型。
将想要消费的模型分配给应用。其实在这些 PaaS 平台上的操作,虽然具体菜单位置,操作细节有差异,但思路都大致相同,大同小异,只要用过之前的 SAP Cloud Platform 和现在 SAP Business Technology Platform 的试用者,很快就能上手。
当然,作为 2B 解决方案,这些模型都有自己的计费模式,比如 ERNIE-Bot 的价格为 ¥0.012元/千tokens,也就是按照实际使用量收费。
点击体验中心(如下图图例1),在选择服务和选择应用(下图图例2和3)的下拉菜单里,分别选择自己刚刚创建的应用和给应用分配的服务,就可以在网页上对这些服务进行测试了。
在我之前的文章每日一个 ChatGPT 使用小技巧系列之3 - 利用角色扮演提高 ChatGPT 回复的质量,我曾经介绍过使用 ChatGPT 的小技巧:让其在答题之前,先施加一个角色扮演的 buff 效果。
这个技巧同样在百度 ERNIE-Bot 模型的使用里扮演了非常重要的作用,甚至专门给其设计了一个字段,如上图图例4 所示。
在图例5 里输入 Prompt 的内容,这里我给 ERNIE-Bot 模型施加的人设是扮演一位资深的 ABAP 技术专家,提出的问题是:请介绍 ABAP 的强项和弱项,每一点请举具体的例子加以说明。
回答的结果算是中规中矩吧。
其实现在对于 ChatGPT Prompt 的使用是越来越内卷了,网络上有非常多的教授如何优化 Prompt 的付费教程:
不过我想对于这个公众号的绝大多数读者来说,我们的目标不是成为一名正式的 Prompt Enginner,所以一般的 ChatGPT Prompt 编写技巧就足够了。
在维护 Prompt 的输入框里,输入 / 就能激活 Prompt 模版,每条模版通过数字编号,键入对应的数字就能快速将模版文本带出来。点击下图图例4 所示的 Prompt 模版超链接,还能看到平台预制的开箱即用的模版库。
千帆大模型预制的模版,按使用场合划分成数据分析,营销文案,生活助手,教育培训等多个种类。
不少模版的文本内还包含有大括号包裹的占位符(Placeholder),这些占位符在实际使用时,会被用户提供的实际内容所替换:
下面是一个具体的例子:
同样,百度文心千帆大模型里也能通过类 Stable-Diffusion 模型,完成简单的基于文字生成图片的任务。
下图我同样选择的是百度文心千帆大模型平台里预制的 Stable-Diffusion-XL 服务,可以免费使用 500 次。这里 Prompt 只支持用英文指定,所以我使用了下面这段文字:
an experienced ABAP developer, with 75 years old, is setting in front of a laptop, concentrating on writing a piece of ABAP codes.
生成的图片如上图所示。其实我脑子里是下面这张图片:
千帆大模型平台还支持 Supervised Finetuning Training,简称 SFT,即根据用户准备好的训练数据,及平台提供的预训练大模型,来训练自己专属领域的大模型。
SFT 的一个实际应用场景的流程是,百度千帆大模型已经提供了基于大型数据集预训练好的一个通用模型。这个模型已经学习到了一些通用的、高级的特征或模式,例如在图像中识别边缘或颜色块,在文本中理解语法或句子结构等等。
接下来就是 SFT 发挥作用的时候了。我们会基于这个预训练模型,用它作为一个初始模型,然后在特定的任务上进行训练。这个任务有可能是图像分类,也可能是文本情感分析,等等。这个阶段就是所谓的 Supervised Finetuning,我们使用有标签的数据集进行训练,模型会学习到,如何将学到的通用特征应用到特定的任务上。
例如,我们可以在 ImageNet 上预训练一个 CNN 模型,这个模型会学习到如何识别边缘、颜色块、纹理等基础特征。然后,我们可以在一个医学图像数据集上对这个模型进行 Supervised Finetuning,这个数据集包含了一些医学图像(例如 CT 或 MRI 图像),以及这些图像对应的诊断结果(例如是否有肺炎或者脑瘤)。在这个阶段,模型会学习到如何将前面学到的基础特征应用到医学图像诊断这个特定任务上。
训练完毕后,SFT 输出的模型,就可以用来作为影像科的医生进行病情诊断的辅助手段。
本文介绍的功能只是千帆大模型平台的冰山一角,因为时间和精力限制我不会去深入研究,毕竟自家的 SAP Business Technology Platform 还有很多等待我去学习。
如果大家对百度千帆大模型平台感兴趣,可以通过这个链接申请试用账号。感谢阅读。
评论
用户头像