查询cache

查询cache

更新时间：2026-01-07

GET

https://qianfan.baidubce.com/v2/caching/{cache_id}

查询指定缓存ID的上下文缓存信息，获取缓存的详细内容和状态。

权限说明

调用本文API，需使用API Key鉴权方式。使用API Key鉴权调用API流程，具体调用流程，请查看认证鉴权。

请求参数

Headers 参数

除公共头域外，无其它特殊头域

URL 参数

cache_id string

缓存的唯一标识，用于查询指定的上下文缓存信息。

必选

请求结构

GET /v2/caching/{cache_id} HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: Bearer <API Key>

示例代码

基础调用

curl -X GET "https://qianfan.baidubce.com/v2/caching/{cache_id}" \
  -H "Authorization: Bearer bce-v3/ALTAK-******ZftZDTn7/125eeb1c5e9ddc8cf3edf18ef6d03f1517ec9408"

返回响应

Headers 参数

除公共头域外，无其它特殊头域

返回参数

id string

缓存的唯一标识，用于标识此次请求的cache ID。

可选

model string

大模型ID，本次请求使用的大模型标识。

可选

mode string

上下文缓存的类型，本次请求创建的缓存模式。

可选

ttl integer

缓存过期时长，单位为秒。信息在创建后即开始计时，每次使用则重置为0。计时超过ttl，信息会被从缓存中删除。每次调用chat均根据ttl更新过期时间。过期时间可以设置的范围在1小时到7天，即[3600, 604800]。

可选

usage object {3}

Token统计信息，包含输入、输出和总计的token数量。

可选

显示子属性隐藏子属性

prompt_tokens integer

输入的prompt token数量。

可选

completion_tokens integer

模型生成的token数量。

可选

total_tokens integer

本次请求消耗的总token数量（输入 + 输出）。

可选

expire_at integer

缓存最后一次使用的时间，格式为Unix时间戳（秒），时区为UTC。未使用过时为null。

可选

成功查询缓存信息

{
  "id": "cache_123456",
  "model": "ernie-bot",
  "mode": "common_prefix",
  "ttl": 86400,
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 20,
    "total_tokens": 30
  },
  "expire_at": 1717228800
}

百度智能云

千帆AI应用开发者中心-API参考 qianfan-api

千帆AI应用开发者中心-API参考 qianfan-api

权限说明

请求参数

示例代码

返回响应