应用发布 调试好应用之后,就可以发布啦。 如需获取更多应用开发资源,请 联系我们
模型测试 在模型测试模块,可上传测试集(图片或视频)来测试训练好的模型的效果,该模块的操作与模型训练模块相似。 在【测试结果】页点击“查看详情”,可多维度查看、评估模型测试的效果指标,同时支持下载结果指标明细。在查看模型测试结果时,将检测效果不好的图像导入到训练集中进行迭代,可提升模型效果。
我们选择百度基于 ERNIE-Bot 4.0 自研的代码解释器 这样我们的小助手就创建完了,接着我们来测试一下它到底好不好使。 在测试之前我们需要上传一篇作文 上传完成之后,我们在输入框输入以下内容进行测试: 请从主题是否明确、内容是否丰富、逻辑清晰度、创意和新颖性、深度和见解等多个角度来给上传的文件打个分,0-100分,并给出理由。 来看一下小助手是怎么说的。 它到底是怎么做到的呢?
我们选择百度基于 ERNIE-Bot 4.0 自研的代码解释器 这样我们的小助手就创建完了,接着我们来测试一下它到底好不好使。 在测试之前我们需要上传一篇作文 上传完成之后,我们在输入框输入以下内容进行测试: 请从主题是否明确、内容是否丰富、逻辑清晰度、创意和新颖性、深度和见解等多个角度来给上传的文件打个分,0-100分,并给出理由。 来看一下小助手是怎么说的。 它到底是怎么做到的呢?
还可在详细评估中查看不同标签的识别结果,针对于效果表现不好的标签类别进行专项优化:删除干扰数据、补充典型数据、配置数据增强策略等措施。 对于像电商零售这样的场景,经常会有增加需要识别的商品SKU的情况,这种场景推荐使用EasyDL的免训练迭代模式。免训练迭代模式下,新增标签数据时,无需重新发起训练,可直接快速添加数据来完成模型迭代,可将模型服务快速投产。具体使用方式如下:首先,训练完成模型。
检查操作会耗费一点时间,若您网络状况不好或期望能快速执行函数,可以勾选此项。
模型版本详情 模型训练好后,可以在模型列表中看到SKU的F1-score分布情况,如果需要了解更为详细的模型效果表现,可以在模型列表中点击「 查看版本详情 」。
点击一键解析知识库就生成好了,非常的方便。注意网页需要时静态页面动态加载出来的数据好像抓不下来。 特别注意:这种模式的应用不要直接把知识库放到能力扩展里面 这样经常性的遇到几个问题 :首先,即用户输入与 答题不相关 时,大模型仍会将其解读为关键词并 检索 知识库。这要求我们不断完善知识库的 描述 与指令,但也不好完全解决这个问题。
安装过程比较简单,但如果网络不好,下载过程会非常慢🐢。 下载完成后,您可能会问:“这货到底装好了没?” 别急😅,直接打开可执行文件即可。 如果一切顺利,打开终端💻,执行 ollama -h 能看到说明,就大功告成💪。 📦 下载和运行模型 使用 ollama pull 下载模型 一旦 Ollama 安装完成,您可以通过 ollama pull 命令来下载所需的模型。
5、模型调用对比示例 针对于上述DPO训练后表现不好的输出,在RLHF后有了好的表现,以下是在同样Prompt下分别使用ERNIE 4.0、ERNIE-Lite-8K-0308 DPO、ERNIE-Lite-8K-0308 RLHF的调用结果对比。