产品使用相关
Q:我用网页版的文心一言和调用文心大模型API,同样的问题为什么回复不一样?
A: 网页版基于文心大模型API进行了深度工程优化,增强了整体处理能力,拓展了应用场景的边界,实现了更丰富的交互可能性。
Q:预置服务的付费方式那么多,我应该如何选择?
A: 1. 首先初步结合业务场景自行估算TPM/RPM/QPS的速率要求,如果预置服务默认的速率限制满足业务需求,则可以首选按tokens计费,更为经济;如果速率要求超出了默认的速率配额,则可以购买TPM&RPM包,从而实现速率提升。
2. 如果选择按tokens用量计费,可以进一步灵活选择预付费还是后付费,按照经验来看如果业务比较稳定,首选预付费,折扣力度更大;如果仅仅是前期试用,后付费即可,随用随停。需要注意的是,购买预付费的Tokens资源包,只是多Tokens可用量进行了扩容,并未对调用速率进行扩容。
3. 如果选择购买TPM&RPM配套扩容速率限制,建议购买一定数量的基础预付费TPM&RPM配额,更加经济实惠。如果需要应对业务场景中偶发的突增峰值流量,建议按需搭配灵活数量的后付费配额以应对突增流量。
Q:为什么我开启的训练任务一直在无法提交,我应该怎么做才能推动模型训练的进度?
A:当前训练任务一直无法提交,一般由于未通过实名认证引起,需要您进入用户中心,完成实名认证后再正常提交任务。
Q:我在多轮对话的SFT中,有部分轮次的对话效果不符合预期,因为模型并未按照指定要求回答问题,此时如果我使用全部轮次的数据进行精调,模型效果会受到影响,应该怎么办?
A:您可能遇到以下情况:
[{"prompt":"可以请你用热情的语气回答我的问题吗?", "response":"当然可以,请说出你的问题"},
{"prompt":"法国的首都是哪里", "response":"巴黎"},
{"prompt":"请你用热情的语气认真回答", "response":"哦!是巴黎,浪漫之都,那儿有很多漂亮的建筑,有机会你一定要去看看!"}]
其中在第二轮,模型并未按照指定要求热情地回答问题。
此时,您可以在数据集中配置weight
字段,在SFT精调时选择性跳过特定轮次的模型回答,使之不参与损失函数(loss)的计算过程,避免模型在训练过程中学习到错误信息。
取值:0或1,0表示该轮对话不参与SFT loss计算,默认值为1
格式示例
[{"prompt":"可以请你用热情的语气回答我的问题吗?", "response":"当然可以,请说出你的问题", "weight":1},
{"prompt":"法国的首都是哪里", "response":"巴黎", "weight":0},
{"prompt":"请你用热情的语气认真回答", "response":"哦!是巴黎,浪漫之都,那儿有很多漂亮的建筑,有机会你一定要去看看!", "weight":1}]
注意:含weight字段的数据仅在ERNIE Tiny、ERNIE Character、ERNIE Lite 0308、ERNIE Lite128K-0419和ERNIE Speed模型精调SFT中可用,该字段对其他模型开放的情况,请您时刻关注官方说明。
模板可查看文档指导
Q:我在调用Stable-Diffusion-XL服务的时候,总出现请求超时的情况,应该怎么办?
A:建议使用以下方式调用:
(1)如果未部署该服务,需要您部署本模型为服务,再调用部署好的服务。发布服务流程可参考说明文档,详细计费可查看价格文档。
(2)如果您已经部署过此服务,可在部署资源中进行复购。
Q:我可以在已购买后付费配额的前提下,继续扩充或者缩小配额吗?
A:平台支持您支持灵活变更配额,可在已购买后付费配额的前提下,扩增TPM额度或降低TPM额度。(Tips提示:两次降配TPM额度操作至少间隔60分钟),同时私有资源池AI加速卡Ⅰ型支持按分钟后付费,低于15分钟按15分钟计算。
Q:千帆ModelBuilder现在有临期续购提醒吗?我应该如何配置?
A:百度智能云提供专属消息类型配置和消息接收人配置,具体使用方法,可查看帮助文档。
Q:我已将ERNIE-Lite-8K-0922的预置服务QPS切换为TPM和RPM,如果1分钟内请求数量大于RPM数值会有什么影响?
A:假设API服务RPM=60,如果客户在1分钟之内发送100个请求,只会有60个请求成功,剩余40个请求直接失败。
Q:我已将ERNIE-Lite-8K-0922的预置服务QPS切换为TPM和RPM,RPM数值为60,可以1秒直接发送60个请求么?
A:不可以。建议用户均匀的发送API请求,较短时间内发送过多的请求,会导致部分请求会进入排队队列,排队请求会按照一定周期重新发送,直到请求成功或排队超时。
Q:我在创建知识库的导入配置时,数据库配置时选择BES,为什么连接不到了呢?
A:当前仅支持选择北京区域的BES,且只能通过Http协议连接您的自建BES。
Q:我的Embedding-V1和bge-large-zh公有云在线体验服务都已经开通付费了,余额也充足,命中测试提醒我请求数量已达上限?
A:当前命中测试有上限限制,每日请求量限制不超过100次,每分钟请求量限制不超过20次。
Q:我在提交模型训练运行的时候,提醒我模型数量已达上限?
A:SFT任务、奖励模型训练、强化学习训练任务。每种任务的运行(包含新创建的、排队中的、运行中的)不能超过5个。
Q:我在文生文任务SFT时,LoRA训练后的模型,为什么增量训练的时候选不到?
A:当前平台仅支持训练方式为全量更新的文生文基准模型,开启增量训练。
Q:我上传自己的数据集会不会被其他用户调用去训练他们的大模型?
A:您的上传的数据集是属于您账号下的专属数据,未经您的许可不会被其他人员查看到,更加不会被其他用户在大模型训练时调用。
Q:我将预置模型发布为服务以后,调用接口报错误码17,这是怎么回事?
A:以上情况出现,是因为您发布了API服务,但是并未进行API付费,需要您根据提示进行在线API付费。
Q:我在调用文心系列大模型服务时,模型返回:“我是文心一言”,是否对百度造成侵权?
A:出现以上情况不会对百度造成侵权,请您放心使用。
Q:模型训练过程中,手动终止训练任务的话,还会计费吗?
A:任务终止,计费也将会终止。一旦任务终止,将无法重启,请您谨慎终止训练任务。
Q:为什么版本更新完成后,体验中心的模型输出调用token为0了?而且我在调用千帆ModelBuilder api时,遇到error code=06,是为什么?
A:版本更新后,需要您在应用接入中,选择指定应用的“编辑”按钮,完成“更新”操作。注:未创建应用的情况下使用在线测试功能,也会遇到此现象,需先创建应用。