查询服务调用概览
本接口用于查询服务调用情况。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 只读访问千帆大模型平台的权限:QianfanReadAccessPolicy
- 只读访问千帆大模型平台预测服务的权限:QianfanServiceReadAccessPolicy
鉴权说明
调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求参数
方法名称,固定值DescribeServiceMetric
服务ID,说明:
(1)不填写该字段,默认查询全部服务ID
(2)可以通过任一方式获取:
方式一:通过调用接口创建服务,返回参数serviceId获取
方式二:通过千帆控制台-在线推理-我的服务页面,点击某服务详情查看,如下图所示:
(3)该接口超时时间大约为5s,查询服务过多,调用接口可能会出错
显示子属性
隐藏子属性
应用ID,说明:
(1)不填写该字段,默认查询全部应用
(2)通过控制台-系统管理与统计-应用接入页面,查看AppID,如下图所示:

(3)该接口超时时间大约为5s,查询应用过多,调用接口可能会出错
显示子属性
隐藏子属性
查询起始时间,说明:
(1)格林威治时间,格式为2025-03-30T16:00:00Z,对应北京时间的2025-03-31 00:00:00,精确到分钟,如果填写秒数默认使用00替换
(2)该接口超时时间为5s,时间范围选择太大,调用接口可能会出错
查询终止时间,说明:
(1)格林威治时间,格式为2025-03-31T15:59:00Z,对应北京时间的2025-03-31 23:59:59,精确到分钟,如果填写秒数默认使用59替换
(2)该接口超时时间为5s,时间范围选择太大,调用接口可能会出错
服务版本,可选值如下: · 1,默认1 · 2。可选值: 1, 2
POST /v2/service?Action=DescribeServiceMetric HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json
{
"serviceId": ["svcp-b20bb95xxxxx"],// 对应ernie-4.5-turbo-128k模型
"appId": ["11****009"],
"startTime": "2025-03-30T16:00:00Z",//对应北京时间的2025-03-31 00:00:00
"endTime": "2025-03-31T15:59:00Z" //对应北京时间的2025-03-31 23:59:59
}
示例代码
curl --location 'https://qianfan.baidubce.com/v2/service?Action=DescribeServiceMetric' \
--header 'Authorization: bce-auth-v1/047ab241bad24xxx28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/eae9855604cxxxxe03cfcbaff' \
--header 'x-bce-date: 2024-01-10T08:37:40Z' \
--header 'Content-Type: application/json' \
--data '{
"serviceId": ["svco-tv5t4zpxxxxx"],
"appId": ["148341xxxx"],
"startTime": "2024-04-23T00:00:00Z",
"endTime": "2024-04-24T23:00:00Z"
}'
返回响应
请求ID
显示子属性
隐藏子属性
查询起始时间
查询终止时间
服务列表
显示子属性
隐藏子属性
显示子属性
隐藏子属性
服务ID
服务名
显示子属性
隐藏子属性
显示子属性
隐藏子属性
appID
监控指标,返回入参指定的指标结果
显示子属性
隐藏子属性
输入token数
输出token数
总token数
调用成功次数
调用失败次数
调用总次数
搜索触发次数,说明:模型触发此功能时,返回该字段
搜索膨胀Tokens数,说明:模型触发此功能时,返回该字段
Prompt cache触发次数,说明:模型触发此功能时,返回该字段
Prompt cache Tokens数,说明:模型触发此功能时,返回该字段
ChatfilePlus触发次数,说明:模型触发此功能时,返回该字段
ChatfilePlus触发tokens数,说明:模型触发此功能时,返回该字段
{
"requestId": "1bef3f87-c5b2-4419-936b-50f9884f10d4",
"result": {
"startTime": "2024-04-23T00:00:00Z",
"endTime": "2024-04-24T23:00:00Z",
"serviceList": [
{
"serviceId": "svco-tvxxxxda",
"serviceName": "sunxxxu0506",
"appList": [
{
"appId": "14xxx75",
"metric": {
"inputTokensTotal": 900,
"outputTokensTotal": 721,
"tokensTotal": 1621,
"succeedCallTotal": 575,
"failureCallTotal": 100,
"callTotal": 675
}
}
]
}
]
}
}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
| 名称 | 描述 |
|---|---|
requestId |
请求ID |
code |
错误码 |
message |
错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
{
"requestId":"6ba7b810-xxxc04fd430c8",
"code":"AccessDenied",
"message":"Access denied."
}
更多其他错误码,也可以查看错误码说明。
