查询cache
更新时间:2026-01-07
GET
https://qianfan.baidubce.com/v2/caching/{cache_id}
查询指定缓存ID的上下文缓存信息,获取缓存的详细内容和状态。
权限说明
调用本文API,需使用API Key鉴权方式。使用API Key鉴权调用API流程,具体调用流程,请查看认证鉴权。
请求参数
Headers 参数
除公共头域外,无其它特殊头域
URL 参数
cache_id
string
缓存的唯一标识,用于查询指定的上下文缓存信息。
必选
请求结构
GET /v2/caching/{cache_id} HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: Bearer <API Key>
示例代码
基础调用
curl -X GET "https://qianfan.baidubce.com/v2/caching/{cache_id}" \
-H "Authorization: Bearer bce-v3/ALTAK-******ZftZDTn7/125eeb1c5e9ddc8cf3edf18ef6d03f1517ec9408"
返回响应
Headers 参数
除公共头域外,无其它特殊头域
返回参数
id
string
缓存的唯一标识,用于标识此次请求的cache ID。
可选
model
string
大模型ID,本次请求使用的大模型标识。
可选
mode
string
上下文缓存的类型,本次请求创建的缓存模式。
可选
ttl
integer
缓存过期时长,单位为秒。信息在创建后即开始计时,每次使用则重置为0。计时超过ttl,信息会被从缓存中删除。每次调用chat均根据ttl更新过期时间。过期时间可以设置的范围在1小时到7天,即[3600, 604800]。
可选
usage
object {3}
Token统计信息,包含输入、输出和总计的token数量。
可选
显示子属性
隐藏子属性
prompt_tokens
integer
输入的prompt token数量。
可选
completion_tokens
integer
模型生成的token数量。
可选
total_tokens
integer
本次请求消耗的总token数量(输入 + 输出)。
可选
expire_at
integer
缓存最后一次使用的时间,格式为Unix时间戳(秒),时区为UTC。未使用过时为null。
可选
成功查询缓存信息
{
"id": "cache_123456",
"model": "ernie-bot",
"mode": "common_prefix",
"ttl": 86400,
"usage": {
"prompt_tokens": 10,
"completion_tokens": 20,
"total_tokens": 30
},
"expire_at": 1717228800
}
