数据管理
更新时间:2024-09-23
数据管理计费明细
数据管理是模型训练的基础来源,数据标注、增强、知识库相关和FAQ挖掘,均涉及计费。
以下为数据管理中所涉及的计费内容,其计费均照调用按量后付费形式进行,具体价格可查看按量后付费。
功能模块 | 调用服务 | 说明 |
在线标注·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
在线标注·产出标注 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
数据增强·读取数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
数据增强·产出数据 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
知识库索引 |
|
基于百度文心大模型技术的文本表示模型,可以将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 |
|
智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。 | |
命中测试 |
|
基于百度文心大模型技术的文本表示模型,可以将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 |
|
智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。 | |
FAQ挖掘·上传文件 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 | |
FAQ挖掘·产出应答 |
|
百度自研产业级知识增强大语言模型,长了上下文窗口,支持5K输入+2K输出。 |
|
百度文心系列中效果强大的⼤语⾔模型,理解、生成、逻辑、记忆能力达到业界顶尖水平。 | |
|
百度2024年2月5日发布的初始版本,支持8K上下文长度。 | |
|
2024年3月8日发布版本,优化模型效果,支持8K上下文长度 |
价格费用举例
大模型服务调用支持使用计算工具计算(输入输出)tokens数。 以ERNIE-3.5-8K大模型为例:
春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。
以上共计20tokens。
示例1:在线标注·自动生成
将以上信息认定为自动标注的标注输出内容,则大模型输出tokens的费用
- 假设自动标注共计有 20 tokens
- 以上示例标注所需费用为 = 0.02 千tokens x 0.012(单价) = 0.00024 元
示例2:知识库·索引模式(Embedding-V1服务)
单次导入文档至知识库仅收取一次调用费: 上传文档tokens x Embedding-V1调用单价
- 假设上传的文档中有 27 tokens
- 则所需的费用为 = 0.027 千tokens x 0.0005(单价) = 0.0000135 元