登录/注册
个人中心
消息中心
退出登录
2
17
人类反馈强化学习的反馈数据怎么来的?
大模型开发
/
互助问答
数据集
大模型训练
大模型推理
2023.08.25
5524看过
如果是人工标注的话,大概的流程、人工、规模,减轻标注负担的方法是什么样的?还有就是reward模型用的哪个?
评论
相关推荐
千帆大模型平台6月能力升级
百度智能云千帆社区
2023.08.28
8087
5
0
千帆大模型平台不会用?来看看官方「操作指引」
百度智能云千帆社区
2023.10.23
7676
9
4
百度智能云千帆大模型平台应用开发挑战赛开赛啦
百度智能云千帆社区
2023.10.11
5921
13
0
十万个为什么呢
关注
已关注
相关文章
快速上手SFT(一):识别应用场景
大模型的训练方法
2023 年百度智能云千帆大模型 Node.Js 本地测试 / 微信机器人详细教程(更新中)
热点话题
千帆杯·赛事直播回放汇总
百度智能云千帆社区
684 看过
千帆杯-Workflow常规赛(上期)开赛!自定义编排组件,拓展应用能力边界
百度智能云千帆社区
823 看过
Test123123
小熙哟yooo
68 看过
Test1111111111111111111
*******8841
43 看过