数据管理
更新时间:2024-04-12
数据管理计费明细
数据管理是模型训练的基础来源,数据标注、增强、知识库相关和FAQ挖掘,均涉及计费。
功能模块 | 调用服务 | 说明 | 单价 |
在线标注·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.004元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.003元/千tokens | |
在线标注·产出标注 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.008元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.006元/千tokens | |
数据增强·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.004元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.003元/千tokens | |
数据增强·产出数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.008元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.006元/千tokens | |
知识库索引 |
|
基于百度文心大模型技术的文本表示模型,可以将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 | 0.002元/千tokens |
|
智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。 | 0.002元/千tokens | |
命中测试 |
|
基于百度文心大模型技术的文本表示模型,可以将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 | 0.002元/千tokens |
|
智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。 | 0.002元/千tokens | |
FAQ挖掘·上传文件 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.004元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.003元/千tokens | |
FAQ挖掘·产出应答 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 | 0.012元/千tokens |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | 0.12元/千tokens | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | 0.008元/千tokens | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | 0.006元/千tokens |
当您在新建推理结果集,推理模型为ERNIE-4.0-8K或ERNIE-3.5-8K-0205时,需要按照批量推理内容计费,具体可查看示例内容,其他模型限时免费。
价格费用举例
大模型服务调用支持使用计算工具计算(输入输出)tokens数。 以ERNIE-3.5-8K大模型为例:
春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。
以上共计20tokens。
示例1:在线标注·自动生成
将以上信息认定为自动标注的标注输出内容,则大模型输出tokens的费用
- 假设自动标注共计有 20 tokens
- 以上示例标注所需费用为 = 0.02 千tokens x 0.012(单价) = 0.00024 元
示例2:知识库·索引模式(Embedding-V1服务)
单次导入文档至知识库仅收取一次调用费: 上传文档tokens x Embedding-V1调用单价
- 假设上传的文档中有 27 tokens
- 则所需的费用为 = 0.027 千tokens x 0.002(单价) = 0.000054 元
示例3:插件应用·知识库
当插件应用中安装了知识库插件,服务上线后,客户端调用将按照以下进行计费:
输入tokens x
Embedding-v1接口的单价 +
(输入tokens+输出tokens) x
基础服务接口的单价
特别注意:
大模型会判断客户端的问题是否需要通过知识库应答,如无需知识库进行应答,费用计算可参考服务调用计费。
- 假设上线的插件选择的预置服务为ERNIE-3.5-8K,输入tokens为7tokens,输出tokens为20tokens
- 以上示例标注所需费用为 = 0.007千tokens x 0.012(单价) + 0.027千tokens x 0.012(单价) = 0.000408 元
相关文档
使用知识库插件,建设方法及流程可查看插件中的知识库。