登录/注册

用户头像

2

人类反馈强化学习的反馈数据怎么来的？

大模型开发/互助问答

数据集
大模型训练
大模型推理

2023.08.255524看过

如果是人工标注的话，大概的流程、人工、规模，减轻标注负担的方法是什么样的？还有就是reward模型用的哪个？

评论

用户头像

相关推荐

千帆大模型平台6月能力升级
- 百度智能云千帆社区
- 2023.08.28
- 8087
- 5
- 0
千帆大模型平台不会用？来看看官方「操作指引」
- 百度智能云千帆社区
- 2023.10.23
- 7676
- 9
- 4
百度智能云千帆大模型平台应用开发挑战赛开赛啦
- 百度智能云千帆社区
- 2023.10.11
- 5921
- 13
- 0

作者头像

十万个为什么呢

相关文章

热点话题