登录/注册
个人中心
消息中心
退出登录
1
已经有SFT、Prompt tuning、LoRA了,为什么还要有奖励模型训练和强化学习训练?
大模型开发
/
互助问答
文心大模型
SFT
P-tuning
2023.08.28
3551看过
这几个方式会有什么差别么?实在是训练方法太多,不知道如何选择了
评论
相关推荐
支持ERNIE-Bot模型在线推理
百度智能云千帆社区
2023.08.28
7849
7
0
【教程】百度智能云千帆大模型平台使用指南-V1.0版本(上)
百度智能云千帆社区
2023.11.09
39715
20
12
快速上手SFT(一):识别应用场景
十万个为什么呢
2023.10.17
8726
11
1
冰与火之歌113
关注
已关注
相关文章
需要训练一个100亿参数量的模型,怎么预估所需要的计算资源?
千帆大模型平台的强化学习机制是怎样的?
大模型有没有反编译能力?
热点话题
看到就是赚到!「千帆杯-教育生态行业赛」官方参赛攻略秘籍首次泄露...
百度智能云千帆社区
2282 看过
【旅行规划专家】如何实现
AppBuilder
660 看过
「AppBuilder应用探索有奖征文」颁奖公示
百度智能云千帆社区
694 看过
千帆appbuilder是否可通过接口创建不同的应用
*******3885
623 看过