计费说明
概述
百度智能云千帆AppBuilder(以下简称为AppBuilder),结合百度多年技术沉淀,通过云智一体化的服务,为开发者提供一站式的大模型应用开发体验。点击立即前往使用。
大模型服务
AppBuilder为开发者提供高效的应用开发工具链,同时百度智能云千帆大模型平台为应用开发者提供应用依赖的大模型服务,以及完善的大模型开发工具链。在AppBuilder进行应用开发时,可根据实际需求,选择以下两种类型的大模型服务:
- 思考模型:用于任务规划和选择组件,适用于规划任务和调用能力环节,思考模型可选择ERNIE-4.0-8K、ERNIE-4.0-Turbo-8K、ERNIE-3.5-8K、ERNIE Speed-AppBuilder和ERNIE-Lite-AppBuilder-8K,ERNIE-4.0-8K效果最好,ERNIE-Lite-AppBuilder-8K思考耗时最短,综合考虑效果、耗时、成本,推荐使用ERNIE Speed-AppBuilder模型,性价比高。
- 问答模型:用于总结生成回复结果,适用于知识问答环节,问答模型支持ERNIE系列模型和开源模型,选择更适合特定场景的模型,推荐使用ERNIE Speed- AppBuilder模型,性价比高。您可以在千帆大模型平台查看各个模型的介绍和版本说明。
token消耗规则
当前token消耗分为3个部分:用户问题,角色指令 和 系统预置。
用户问题和角色指令的消耗由其长度决定,可使用计算器计算 token计算器
系统预置(以下计算仅为平均值参考,实际中根据业务场景的不同,会有上下浮动):
-
单次调用:预计消耗 1300 tokens。
- 单次组件调用
- 单次知识库调用
-
多次调用 (如图所示):
在单次的基础上,每多增加一次,则多消耗 2500 tokens。
免费资源
平台对新用户将赠送100万tokens、有效期3个月的免费资源,可用于抵扣应用请求。在使用模型服务时,模型消耗遵循以下原则:
- 您的账户中的免费资源,会优先被消耗,当存在多个免费资源时,将优先抵扣最先失效的资源;
- 当免费资源消耗完毕后,如果您开启【模型付费状态自动切换】且当前在使用模型已开通付费,则自动切换至「付费资源」;
- 当免费资源消耗完毕后,如果您关闭【模型付费状态自动切换】,则无法继续调用模型,需要回到平台重新选择付费模型服务,更新发布才能重启应用服务。
注意:
- 您可以在资源额度中设置【模型付费状态自动切换】状态,以及查看您的资源配额详情。您也可以通过积极参加平台运营活动,获取更多免费资源。
- 控制台应用配置页调试、发布分享demo体验、API调用都将消耗开发者的模型服务资源。
- 百度智能云千帆大模型平台ModelBuilder中ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列模型预置服务支持免费开放使用,具体包括ERNIE-Speed-8K、ERNIE-Speed-128K、ERNIE-Speed-AppBuilder专用版、ERNIE-Lite-8K、ERNIE-Lite-8K-0922、ERNIE-Lite-128K(即将上线)、ERNIE-Tiny共计7款模型的预置服务。
付费资源
如果您的免费资源消耗完毕,您可以前往百度智能云千帆大模型平台【开通付费】,然后回到千帆AppBuilder平台选择需要的模型服务,以下为详细操作步骤。
开通付费模型/购买配额 在百度智能云千帆大模型平台在线推理页面点击【开通付费】,选择需要开通的服务名称,并确认订单即可成功开通,开通后您可以查看订单明细了解具体付费情况。
此外,在开通ERNIE-4.0-8K模型时,你需要单独购买模型的服务包,以便更好的使用模型服务。你可以点击【购买配额】功能,进入ERNIE-4.0-8K模型的服务包配置页进行配置。
付费模式详解 按照付费的时间来看,可以分为两种预付费和后付费,预付费是指先付费后使用,后付费是指先使用后付费。按照购买的内容来看,购买方式可以分为按Token付费和按TPM付费。
目前默认计费方式为按量后付费,部分预置服务支持购买配额(TPM和Tokens量包),同一时刻只能有一种生效中的配额,生效顺序为TPM > Tokens量包。
• TPM(Tokens Per Minute):每分钟处理tokens数(输入+输出)
如果用户使用的服务RPM和TPM速率限制较低,无法满足业务需求,可以通过购买TPM实现扩容。
应该如何选择预置服务的付费方式?
- 首先初步结合业务场景自行估算TPM/RPM/QPS的速率要求,如果预置服务默认的速率限制满足业务需求,则可以首选按tokens计费,更为经济;如果速率要求超出了默认的速率配额,则可以购买TPM&RPM包,从而实现速率提升。
- 如果选择按tokens用量计费,可以进一步灵活选择预付费还是后付费,按照经验来看如果业务比较稳定,首选预付费,折扣力度更大;如果仅仅是前期试用,后付费即可,随用随停。需要注意的是,购买预付费的Tokens资源包,只是多Tokens可用量进行了扩容,并未对调用速率进行扩容。
- 如果选择购买TPM&RPM配套扩容速率限制,建议购买一定数量的基础预付费TPM&RPM配额,更加经济实惠。如果需要应对业务场景中偶发的突增峰值流量,建议按需搭配灵活数量的后付费配额以应对突增流量。
欠费处理
目前所使用的调用服务功能均为按Tokens量后付费。根据实际的输入及输出总和tokens数量,系统每小时会对您的百度智能云账户进行扣费。其余支付方式均为可选项。
余额不足提醒 根据您历史的账单金额,判断您的账户余额(含可用代金券)是否足够支付未来的费用,若不足以支付,系统将在欠费前三天、两天、一天发送续费提醒短信,请您收到短信后及时前往控制台财务中心充值。
欠费处理
- 后付费账单时间是北京时间整点,出账单时间是计费周期结束后1小时内。我们将每小时生成一次后付费账单,账单生成时,会检查您的账户余额是否足以支付本次账单的费用。例如:10:00~11:00的账单费用会在12:00之前生成,具体以系统出账时间为准。若不足以支付,即为欠费,欠费时系统会发送欠费通知。
- 欠费后您开通付费的产品将进入欠费状态,请求系统将不再响应。
余额/账单查看及充值 (1)点击右上角【财务】按钮,快速查看余额,同时进入财务中心页面
(2)在财务中心页面,左侧菜单选择【账单中心-账单明细】可查看系统每小时自动生成的账单情况(仅有调用服务的时间段才生产账单)
(3)点击账单明细的【查看】按钮,进入到此账单的详情页面,可查看该账单所调用的服务类型以及用量情况
(4)账单确认无误后,可点击右上角【财务】,点击【充值】按钮,根据您账户的实际情况进行充值
组件服务
1、通过SDK调用组件
AppBuilder-SDK提供了完整的AI原生应用开发套件,包括丰富的开发组件和应用示例代码,SDK和组件调用需要先开通组件服务。
组件分类 | 组件名称 | 计费说明 |
---|---|---|
大模型组件 | 多轮改写、相似问生成、自然语言转pandas、标签抽取、会话小结、口语化Query生成、复杂Query分解、复杂Query判定、风格转写、风格写作、问答对挖掘、阅读理解问答、playground空应用、GBI 选表、GBI 问表、Excel转图表、幻觉检测 | 计费说明 |
AI能力组件 | 文本翻译-通用版 | 计费说明 |
AI能力组件 | 文生图 | 计费说明 |
AI能力组件 | 通用物体和场景识别、菜品识别、地标识别、动物识别、植物识别 | 计费说明 |
AI能力组件 | 通用文字识别、表格文字识别、手写文字识别、二维码识别、身份证混贴识别、文档矫正增强 | 计费说明 |
AI能力组件 | 短语音识别、短文本在线合成 | 计费说明 |
AI能力组件 | 语义匹配、语义向量计算 | 计费说明 |
AI能力组件 | 文档解析、文档切分、表格抽取 | 免费使用,限额5QPS |
基础云组件 | 百度Elasticsearch、向量检索 | 计费说明 |
软硬一体组件 | 多模态AI模组LUCA系列 | 计费说明 |
AI能力组件 | 图像内容理解 | 领取免费额度后可用,免费额度用完后可提工单扩容 |
2、通过应用配置组件
创建agent应用时,可以通过配置组件,增强应用能力。AppBuilder提供了丰富的组件供开发者限时免费试用。
组件名称 | 状态 | QPS限制 |
---|---|---|
WebPilot | 限时免费中 | 限额1qps |
Wolfram Alpha | 限时免费中 | 限额1qps |
电商商品查询-tb | 限时免费中 | 限额1qps |
电商商品查询-jd | 限时免费中 | 限额1qps |
快递查询 | 限时免费中 | 限额1qps |
必应图片搜索 | 限时免费中 | 限额1qps |
航班动态查询 | 限时免费中 | 限额1qps |
Arxiv | 限时免费中 | 限额1qps |
头条新闻 | 限时免费中 | 限额1qps |
天气查询 | 限时免费中 | 限额1qps |
热门视频 | 限时免费中 | 限额1qps |
文生图 | 限时免费中 | 限额1qps |
文本翻译-通用版 | 限时免费中 | 限额1qps |
通用物体和场景识别-高级版 | 限时免费中 | 限额1qps |
通用文字识别-高精度版 | 限时免费中 | 限额1qps |
短语音识别-极速版 | 限时免费中 | 限额1qps |
短文本在线合成 | 限时免费中 | 限额1qps |
Excel转图表 | 即将下线 | 限额1qps |
图像内容理解 | 限时免费中 | 限额1qps |
手写文字识别 | 限时免费中 | 限额1qps |
动物识别 | 限时免费中 | 限额1qps |
植物识别 | 限时免费中 | 限额1qps |
表格文字识别 | 限时免费中 | 限额1qps |
二维码识别 | 限时免费中 | 限额1qps |
身份证混贴识别 | 限时免费中 | 限额1qps |
文档矫正增强 | 限时免费中 | 限额1qps |
百度搜索 | 限时免费中 | 限额1qps |
Code interpreter | 限时免费中 | 限额1qps |
文档格式转换 | 限时免费中 | 限额1qps |
网页内容总结 | 限时免费中 | 限额1qps |
周公解梦大师 | 限时免费中 | 限额1qps |
彩票开奖结果 | 限时免费中 | 限额1qps |
百度小说 | 限时免费中 | 限额1qps |
体育赛事信息 | 限时免费中 | 限额1qps |
健康小助手 | 限时免费中 | 限额1qps |
长文档内容理解 | 限时免费中 | 限额1qps |
百度图搜 | 限时免费中 | 限额1qps |
百度视频 | 限时免费中 | 限额1qps |
百度汽车 | 限时免费中 | 限额1qps |
百度高考 | 限时免费中 | 限额1qps |
百度旅游 | 限时免费中 | 限额1qps |
百度文库 | 限时免费中 | 限额1qps |
百度音乐 | 限时免费中 | 限额1qps |
百度热剧 | 限时免费中 | 限额1qps |
百度电影 | 限时免费中 | 限额1qps |
百度股票 | 限时免费中 | 限额1qps |
百度基金 | 限时免费中 | 限额1qps |
百度汇率 | 限时免费中 | 限额1qps |
卡证信息抽取 | 限时免费中 | 限额1qps |
百度地图路线规划 | 限时免费中 | 限额1qps |
百度地图周边搜索 | 限时免费中 | 限额1qps |
3、通过API调用百度AI搜索组件
**组件介绍:**百度AI搜索组件为百度领先的搜索能力结合大模型技术,提供结合全网实时信息进行智能回复的问答功能,可支撑各行业丰富的场景应用。该组件支持丰富标准化能力,如:自定义人设、模型选择、问题改写(包括时效和多轮两种方式,以增强搜索效果)、搜索范围配置(可选择搜索的模态、站点范围和发布时间)、自定义参考链接条数等等,此外,该API拥有优秀的性能表现和高可用性,以及全面的内容安全审核,保证处于合规红线之上。调用方式详见百度AI搜索
**计费方式:**百度AI搜索组件每日结算,可选择按使用量或qps配额两种计费方式,支持预付费或后付费。
计费组成:
- 服务类型使用次数:百度AI搜索组件一次接口返回中,根据召回模态不同分为网页版、多模态版(网页、图像、视频)两种服务类型。即一次请求返回结果使用某服务类型,该类型服务计费一次。
- 额外tokens消耗费用:使用该组件可能会产生大语言模型额外tokens消耗费用,
计费项:
前1000次调用限时免费,默认限流1qps,申请更多资源请提交表单 ,工作人员将主动联系您进行开通
组件名称 | 服务类型 | 服务说明 | 调用方式 | 限流 | 付费模式 | 价格(日结计费按照所属档次收费 | |
---|---|---|---|---|---|---|---|
百度AI搜索 | 网页版 | 通过百度搜索引擎实时搜索互联网公开域——网页相关内容。支持大模型高时效性问题解答,并提供网页来源信息供渲染卡片,支持多轮对话、自定义人设。同时提供特定场景效果优化服务,灵活配置可支撑各行业落地应用。 | API调用 | 1qps 60rpm | 按量计费后付费(按量日结) | 0<调用次数≤2.5w | 0.032元/次 |
2.5w<调用次数≤5w | 0.017元/次 | ||||||
调用次数>5w | 0.0085元/次 | ||||||
预付费(按qps) | 调用次数不限 | 425元/qps/天 | |||||
多模态版 | 通过百度搜索引擎实时搜索互联网公开域——网页、图片、视频相关内容。支持大模型高时效性问题解答,并提供多模态来源信息供渲染卡片,支持多轮对话、自定义人设。同时提供特定场景效果优化服务,灵活配置可支撑各行业落地应用。 | API调用 | 1qps 60rpm | 按量计费后付费(按量日结) | 0<调用次数≤2.5w | 0.046元/次 | |
2.5w<调用次数≤5w | 0.025元/次 | ||||||
调用次数>5w | 0.0125元/次 | ||||||
预付费(按qps) | 调用次数不限 | 625元/qps/天 |