文本生成

POST

https://qianfan.baidubce.com/v2/chat/completions

调试

调用本接口，发起一次对话请求。

支持模型列表

支持模型列表请查看千帆-模型列表-文本生成。

权限说明

调用本文API，需使用API Key鉴权方式。使用API Key鉴权调用API流程，具体调用流程，请查看认证鉴权。

请求参数

Headers 参数

除公共头域外，无其它特殊头域

Body 参数

model string

模型ID，说明：
（1）预置服务，可选值请参考千帆-模型列表-文本生成页，表格中model入参列
（2）平台训练模型或预置模型，可以通过查看服务详情获取该字段值，详情请查看千帆控制台-在线推理：model值为服务详情中对应的API名称，如下图所示：

必选

messages array

聊天上下文信息。说明：
（1）messages成员不能为空，1个成员表示单轮对话，多个成员表示多轮对话，例如：
· 1个成员示例，"messages": [ {"role": "user","content": "你好"}]
· 3个成员示例，"messages": [ {"role": "user","content": "你好"},{"role":"assistant","content":"需要什么帮助"},{"role":"user","content":"自我介绍下"}]
（2）message中的content总长度不能超过对应model的输入字符限制和输入tokens限制，请查看各模型上下文长度说明

必选

显示子属性隐藏子属性

items object {5}

显示子属性隐藏子属性

role string

当前支持以下：
· user: 表示用户
· assistant: 表示对话助手
· system：表示人设，当模型为GLM-Z1-Rumination-32B-0414时，不支持该字段值

必选

name string

可选

content oneOf {2}

多选一且必需“只能”符合其中一个

对话内容，说明：
（1）不能为空
（2）最后一个message对应的content不能为blank字符，如空格、"\n"、“\r”、“\f”等

必选

显示子属性隐藏子属性

content string

content array

显示子属性隐藏子属性

items string

tool_calls array

函数调用，function call场景下第一轮对话的返回，第二轮对话作为历史信息在message中传入

可选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

id string

function call的唯一标识，由模型生成

必选

type string

固定值function

必选

function object {2}

function call的具体内容

可选

显示子属性隐藏子属性

name string

函数名称

可选

arguments string

函数参数

可选

tool_call_id string

说明：
（1）当role为tool时，该字段必填
（2）模型生成的function call id，对应tool_calls中的tool_calls[].id
（3）调用方应该传递真实的、由模型生成id，否则效果有损

可选

stream boolean

是否以流式接口的形式返回数据，说明：
（1）可选值：
· true：是，按SSE协议逐块返回内容，以一条data: [DONE]消息结束
· false：否，默认false
（2）beam search模型只能为false

可选

stream_options object {2}

流式响应的选项，当字段stream为true时，该字段生效

可选

显示子属性隐藏子属性

include_usage boolean

流式响应是否输出usage，说明：
· true：是，设置为true时，在最后一个chunk会输出一个字段，这个chunk上的usage字段显示整个请求的token统计信息
· false：否，流式响应默认不输出usage

可选

chunk_include_usage boolean

流式响应每一包是否都带usage信息，说明：
· true：是，设置为true时，每一个chunk都带有截止目前chunk为止的usage信息。

可选

temperature number

说明：
（1）较高的数值会使输出更加随机，而较低的数值会使其更加集中和确定
（2）该参数支持模型及取值范围等，请参考千帆-模型默认参数说明

可选

top_p number

说明：
（1）影响输出文本的多样性，取值越大，生成文本的多样性越强
（2）该参数支持模型及取值范围等，请参考千帆-模型默认参数说明

可选

penalty_score number

通过对已生成的token增加惩罚，减少重复生成的现象。说明：
（1）值越大表示惩罚越大
（2）默认1.0，取值范围：[1.0, 2.0]
（3）不支持以下模型：
· DeepSeek-V3
· DeepSeek-Reasoner
· DeepSeek-R1-Distill系列
· QwQ-32B
· ERNIE X1 Turbo系列
· ERNIE 4.5系列：ERNIE-4.5-0.3B、ERNIE-4.5-21B-A3B、ERNIE-4.5-VL-28B-A3B

可选

max_tokens integer

指定模型最大输出token数。说明：
（1）对于支持深度思考的模型，该参数仅限制最终回答内容（content）的长度，不包含思维链内容。
（2）各模型默认的最大输出长度请查看千帆-模型列表-文本生成页，表格中最大输出列说明。

可选

max_completion_tokens integer

指定模型的总输出长度，包含回答内容和思维链内容。
（1）支持模型见上下文管理
（2）各模型默认的最大输出长度请查看千帆-模型列表-文本生成页，表格中上下文长度列说明。
注：若同时设置了max_tokens，则以本参数的长度限制为准。

可选

seed integer

说明：
（1）取值范围: （0,2147483647‌），会由模型随机生成，默认值为空
（2）如果指定，系统将尽最大努力进行确定性采样，以便使用相同seed和参数的重复请求返回相同的结果
（3）不支持以下模型：
· ERNIE X1 Turbo系列
· Qwen2.5
· Qianfan-Agent-Intent

可选

stop array

生成停止标识，当模型生成结果以stop中某个元素结尾时，停止文本生成。说明：
（1）每个元素长度不超过20字符
（2）最多4个元素
（3）不支持以下模型：ERNIE X1 Turbo系列

可选

显示子属性隐藏子属性

items string

frequency_penalty number

说明：
（1）正值根据新token在文本中的出现频率来对其进行惩罚，从而降低模型逐字重复的可能性
（2）该参数支持模型及取值范围等，请参考千帆-模型默认参数说明

可选

presence_penalty number

说明：
（1）正值根据新token到目前为止是否出现在文本中来对其进行惩罚，从而增加模型谈论新主题的可能性
（2）该参数支持模型及取值范围等，请参考千帆-模型默认参数说明

可选

repetition_penalty number

说明：
（1）控制模型生成文本时连续序列中的重复度，提高repetition_penalty可以降低模型生成的重复度
（2）该参数支持模型及取值范围等，请参考千帆-模型默认参数说明

可选

tools array

一个可触发函数的描述列表，支持模型请参考开始使用-模型-Function calling-支持模型范围。

可选

显示子属性隐藏子属性

items object {2}

显示子属性隐藏子属性

type string

工具类型，取值function

必选

function object {3}

函数说明

必选

显示子属性隐藏子属性

name string

函数名

必选

description string

函数描述

可选

parameters object {0}

函数请求参数，JSON Schema 格式，参考JSON Schema描述

可选

显示子属性隐藏子属性

暂无参数

tool_choice oneOf {2}

多选一且必需“只能”符合其中一个

说明：
（1）支持模型请参考开始使用-模型-Function calling-支持模型范围
（2）可选值如下：
· none：不希望模型调用任何function，只生成面向用户的文本消息
· auto：模型会根据输入内容自动决定是否调用函数以及调用哪些function
· required：希望模型总是调用一个或多个function。
· 通过 {"type": "function", "function": {"name": "my_function"}} 指定特定 tool，会强制模型调用该 tool。
（3）当为tool_choice类型，指在函数调用场景下，提示大模型选择指定的函数，指定的函数名必须在tools中存在

可选

显示子属性隐藏子属性

tool_choice string

说明：
· none：不希望模型调用任何function，只生成面向用户的文本消息
· auto：模型会根据输入内容自动决定是否调用函数以及调用哪些function
· required：希望模型总是调用一个或多个function

tool_choice object {2}

tool_choice说明

显示子属性隐藏子属性

type string

指定工具类型，固定值function

必选

function object {1}

指定要使用的函数

必选

显示子属性隐藏子属性

name string

指定要使用的函数名

必选

parallel_tool_calls boolean

说明：
（1）支持模型请参考开始使用-模型-Function calling-支持模型范围
（2）可选值：
· true：表示开启函数并行调用，默认开启
· false：表示关闭函数并行调用

可选

web_search object {7}

搜索增强的选项，说明：
（1）默认不传关闭
（2）支持模型请参考开始使用-模型-联网搜索-支持模型列表

可选

显示子属性隐藏子属性

enable boolean

是否开启实时搜索功能，说明：
（1）如果关闭实时搜索，角标和溯源信息都不会返回
（2）可选值：
· true：开启
· false：关闭，默认false

可选

enable_citation boolean

是否开启上角标返回，说明：
（1）enable为true时生效
（2）可选值：
· true：开启；如果开启，在触发了搜索增强的场景下，响应内容会附上角标，并带上角标对应的搜索溯源信息
· false：未开启，默认false
（3）如果检索内容包含非公开网页，角标不生效

可选

enable_trace boolean

是否返回搜索溯源信息，说明：
（1）enable 为 true时生效
（2）可选值：
· true：返回；如果为true，在触发了搜索增强的场景下，会返回搜索溯源信息search_results
· false：不返回，默认false
（3）如果检索内容为非公开网页，即使触发搜索也不返回溯源信息

可选

enable_status boolean

是否返回搜索信号，说明：
（1）enable 为 true时生效
（2）可选值：
· true：返回；如果为true触发搜索，会通过delta_tag:search_status表示这一包是信号包。
· false：不返回，默认false

可选

search_mode string

联网搜索模式：
· auto：大模型基于query判断意图是否需要进行搜索，默认不进行联网搜索
· required：强制进行联网搜索
ernie系列模型不支持该参数

可选

search_number integer

检索的文献数量，范围在[1~28]之间

可选

reference_number integer

用于给大模型总结的文献数量，范围在[1~28]之间（需≤search_number，若 reference_number > search_number 则将默认赋值 reference_number=search_number,如设置：search_number=6，reference_number=10，则search_number=10）

可选

response_format object {2}

指定响应内容的格式，说明：
（1）对于生成式人工智能大模型，可能会出现效果不满足的情况
（2）不支持以下模型：ERNIE X1 Turbo系列

可选

显示子属性隐藏子属性

type string

指定响应内容的格式，可选值：
· json_object：以json格式返回，可能出现不满足效果情况
· text：以文本格式返回，默认为text
· json_schema：以json_scheam规定的格式返回

可选

json_schema object {0}

json_schema格式，请参考JSON Schema描述；当type为json_schema时，该参数必填

可选

显示子属性隐藏子属性

暂无参数

metadata map<string,string>

给每条请求增加自定义标签，可以在日志挖掘环节精细化遴选推理日志；说明：
（1）元素个数最大支持16个
（2）key和value必须都是string类型

可选

thinking object {1}

是否开启思考模式，详情请参考深度思考-thinking参数

可选

显示子属性隐藏子属性

type string

思考模式类型，默认值为disabled。
可选值：

enabled：开启思考模式
disabled：关闭思考模式

可选

enable_thinking boolean

是否开启思考模式，说明：
（1）可选值：
· true：开启
· false：未开启，默认值为false
(2) 详情请参考深度思考-enable_thinking参数

可选

thinking_budget integer

思维链的最大长度，当模型思考过程生成的Token数超过thinking_budget时，推理内容会进行截断并立刻开始生成最终回复。说明：
（1）默认为16384，最小值为100，最大值为各模型支持的思维链长度，详情请参考千帆-模型列表-深度思考
（2）适用于部分深度思考模型，更多内容请参考深度思考

可选

thinking_strategy string

思考策略，主要用于减少思维链输出。说明：
（1）可选值：
· short_think ：简短思考
· chain_of_draft：Chain-of-Draft（草稿链）式思考
（2）更多内容请参考深度思考

可选

reasoning_effort string

控制模型的推理深度与计算强度。说明：
（1）可选值：
· high：默认值，标准推理强度，适用于大多数普通请求
· max：最大推理强度，适用于复杂Agent类请求
（2）支持模型请参考深度思考
（3）为保持向下兼容，传入 low 或 medium 将映射为 high；传入 xhigh 将映射为 max。

可选

user string

表示最终用户的唯一标识符

可选

请求结构

POST /v2/chat/completions HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
{
    "model": "deepseek-v3.1-250821",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "你好"
        }
    ]
}

示例代码

请求示例 function call（第一次请求） function call（第二次请求）

Shell

Python

curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
    "model": "deepseek-v3.1-250821",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "你好"
        }
    ]
}'

import requests
import json

def main():
    url = "https://qianfan.baidubce.com/v2/chat/completions"
    
    payload = json.dumps({
        "model": "deepseek-v3.1-250821",
        "messages": [
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你好"
            }
        ]
    })
    headers = {
        'Content-Type': 'application/json',
        'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    
    print(response.text)
    

if __name__ == '__main__':
    main()

curl

curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer your-api-key' \
--data '{
    "model": "deepseek-v3.1-250821",
    "messages": [
        {
            "role": "user",
            "content": "查一下上海和北京2025-8-21的天气"
        }
    ],
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "get_current_weather",
                "description": "天气查询工具",
                "parameters": {
                    "properties": {
                        "location": {
                            "description": "地理位置，精确到区县级别",
                            "type": "string"
                        },
                        "time": {
                            "description": "时间，格式为YYYY-MM-DD",
                            "type": "string"
                        }
                    },
                    "type": "object"
                }
            }
        }
    ],
    "stream": false,
    "tool_choice": "auto"
}'

curl

curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer your-api-key' \
--data '{
    "model": "deepseek-v3.1-250821",
    "messages": [
        {
            "role": "user",
            "content": "查一下上海和北京2025-8-21的天气"
        },
        {
            "role": "assistant",
            "content": "",
            "tool_calls": [
                {
                    "id": "04fed17840d34b1e99bf3cd6dc94150d",
                    "type": "function",
                    "function": {
                        "name": "get_current_weather",
                        "arguments": "{\"location\": \"上海市\", \"time\": \"2025-08-21\"}"
                    }
                },
                {
                    "id": "a37ee51b99a64723bcb7f2f4d8081770",
                    "type": "function",
                    "function": {
                        "name": "get_current_weather",
                        "arguments": "{\"location\": \"北京市\", \"time\": \"2025-08-21\"}"
                    }
                }
            ]
        },
        {
            "role": "tool",
            "tool_call_id": "04fed17840d34b1e99bf3cd6dc94150d",
            "name": "get_current_weather",
            "content": "{\"temperature\": \"25\", \"unit\": \"摄氏度\", \"description\": \"上海\"}"
        },
        {
            "role": "tool",
            "tool_call_id": "a37ee51b99a64723bcb7f2f4d8081770",
            "name": "get_current_weather",
            "content": "{\"temperature\": \"20\", \"unit\": \"摄氏度\", \"description\": \"北京\"}"
        }
    ],
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "get_current_weather",
                "description": "天气查询工具",
                "parameters": {
                    "properties": {
                        "location": {
                            "description": "地理位置，精确到区县级别",
                            "type": "string"
                        },
                        "time": {
                            "description": "时间，格式为YYYY-MM-DD",
                            "type": "string"
                        }
                    },
                    "type": "object"
                }
            }
        }
    ],
    "stream": false,
    "tool_choice": "auto"
}'

返回响应

Headers 参数

除公共头域外，还包含以下特殊头域

X-Ratelimit-Limit-Requests integer

一分钟内允许的最大请求次数

可选

X-Ratelimit-Limit-Input-Tokens integer

一分钟内允许的最大输入tokens消耗

可选

X-Ratelimit-Limit-Output-Tokens integer

一分钟内允许的最大输出tokens消耗

可选

X-Ratelimit-Remaining-Requests integer

达到RPM速率限制前，剩余可发送的请求数配额，如果配额用完，将会在0-60s后刷新

可选

X-Ratelimit-Remaining-Input-Tokens integer

达到TPM速率限制前，剩余可消耗的输入tokens数配额，如果配额用完，将会在0-60s后刷新

可选

X-Ratelimit-Remaining-Output-Tokens integer

达到TPM速率限制前，剩余可消耗的输出tokens数配额，如果配额用完，将会在0-60s后刷新

可选

返回参数

id string

本次请求的唯一标识，可用于排查问题

可选

object string

回包类型 chat.completion：多轮对话返回

可选

created integer

时间戳

可选

model string

说明：
（1）如果是预置服务，返回模型ID
（2）如果是sft后部署的服务，该字段返回model:modelversionID，model与请求参数相同，是本次请求使用的大模型ID；modelversionID用于溯源

可选

choices oneOf {2}

多选一且必需“只能”符合其中一个

可选

显示子属性隐藏子属性

choices object {5}

stream=false时，返回该内容，返回类型为choices

显示子属性隐藏子属性

index integer

choice列表中的序号

可选

message object {6}

响应信息，当stream=false时返回

可选

显示子属性隐藏子属性

role string

当前支持以下：
· user: 表示用户
· assistant: 表示对话助手
· system：表示人设

可选

name string

message名

可选

content string

对话内容

可选

tool_calls array

函数调用，function call场景下第一轮对话的返回，第二轮对话作为历史信息在message中传入

可选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

id string

function call的唯一标识，由模型生成

可选

type string

固定值function

可选

function object {2}

function call的具体内容

可选

显示子属性隐藏子属性

name string

函数名称

可选

arguments string

函数参数

可选

tool_call_id string

说明：
（1）当role=tool时，该字段必填
（2）模型生成的function call id，对应tool_calls中的tool_calls[].id
（3）调用方应该传递真实的、由模型生成id，否则效果有损

可选

reasoning_content string

思维链内容，支持深度思考模型。

可选

finish_reason string

输出内容标识，说明：
· stop：模型自然停止或命中提供的停止序列
· length：达到了最大的token数
· content_filter：输出内容被截断、兜底、替换为**等
· tool_calls：函数调用

可选

flag integer

安全细分类型，说明：
当stream=false，flag值含义如下：
· 0或不返回：安全
· 1：低危不安全场景，可以继续对话
· 2：禁聊：不允许继续对话，但是可以展示内容
· 3：禁止上屏：不允许继续对话且不能上屏展示
· 4：撤屏

可选

ban_round integer

当flag 不为 0 时，该字段会告知第几轮对话有敏感信息；如果是当前问题，ban_round = -1

可选

choices object {6}

stream=true时，返回该内容，返回类型为see_choices

显示子属性隐藏子属性

index integer

choice列表中的序号

可选

delta object {3}

响应信息，当stream=true时返回

可选

显示子属性隐藏子属性

role string

仅在流式第一帧返回

可选

content string

流式响应内容

可选

tool_calls array

由模型生成的函数调用，包含函数名称，和调用参数

可选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

id string

function call的唯一标识，由模型生成

可选

type string

固定值function

可选

function object {2}

function call的具体内容

可选

显示子属性隐藏子属性

name string

函数名称

可选

arguments string

函数参数

可选

delta_tag string

响应信息标识，search_status：触发搜索信号

可选

finish_reason string

可选

flag integer

安全细分类型，说明：当stream=true时，返回flag表示触发安全

可选

ban_round integer

当flag 不为 0 时，该字段会告知第几轮对话有敏感信息；如果是当前问题，ban_round = -1

可选

usage object {4}

token统计信息，说明：
（1）同步请求默认返回
（2）流式请求默认不返回，当开启stream_options.include_usage=true时，会在最后一个chunk返回实际内容，其他chunk返回null

可选

显示子属性隐藏子属性

prompt_tokens integer

问题tokens数（包含历史QA）

可选

prompt_tokens_details object {2}

问题token详情，说明：当调用对话Chat API返回此参数

可选

显示子属性隐藏子属性

search_tokens integer

触发检索增强以后膨胀的token；用户可以通过usage.prompt_tokens_details.search_tokens>0判断是否触发了检索增强，并且计算出发检索增强的次数

可选

cached_tokens integer

触发上下文缓存后，命中缓存的token数量；说明：
· 用户可通过usage.prompt_tokens_details.cached_tokens>0判断是否触发了上下文缓存，并且计算出触发缓存的数量
· 该字段仅支持模型版本为ERNIE-4.0-Turbo-8K

可选

completion_tokens integer

回答tokens数

可选

total_tokens integer

总tokens数

可选

search_results object {3}

搜索结果列表

可选

显示子属性隐藏子属性

index integer

序号

可选

url string

搜索结果URL

可选

title string

搜索结果标题

可选

响应示例 function call（第一次响应） function call（第二次响应）

JSON

{
    "id": "as-qsp8w7ppnv",
    "object": "chat.completion",
    "created": 1755938117,
    "model": "deepseek-v3.1-250821",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "你好！很高兴和你交流。请问有什么我可以帮助你的吗？"
            },
            "finish_reason": "stop",
            "flag": 0
        }
    ],
    "usage": {
        "prompt_tokens": 11,
        "completion_tokens": 15,
        "total_tokens": 26
    }
}

JSON

{
    "id": "as-32tdstad6t",
    "object": "chat.completion",
    "created": 1755938222,
    "model": "deepseek-v3.1-250821",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "",
                "tool_calls": [
                    {
                        "id": "04fed17840d34b1e99bf3cd6dc94150d",
                        "type": "function",
                        "function": {
                            "name": "get_current_weather",
                            "arguments": "{\"location\": \"上海市\", \"time\": \"2025-08-21\"}"
                        }
                    },
                    {
                        "id": "a37ee51b99a64723bcb7f2f4d8081770",
                        "type": "function",
                        "function": {
                            "name": "get_current_weather",
                            "arguments": "{\"location\": \"北京市\", \"time\": \"2025-08-21\"}"
                        }
                    }
                ]
            },
            "finish_reason": "tool_calls",
            "flag": 0
        }
    ],
    "usage": {
        "prompt_tokens": 356,
        "completion_tokens": 87,
        "total_tokens": 443
    }
}

JSON

{
    "id": "as-pkzw67m1ti",
    "object": "chat.completion",
    "created": 1755938381,
    "model": "deepseek-v3.1-250821",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "根据查询结果，上海和北京2025年8月21日的天气情况如下：\n\n**上海市**：\n- 温度：25摄氏度\n- 天气描述：上海\n\n**北京市**：\n- 温度：20摄氏度  \n- 天气描述：北京\n\n看起来北京的天气相对凉爽一些，比上海低5摄氏度。如果您需要更详细的天气信息（如湿度、风向等），请告诉我。"
            },
            "finish_reason": "stop",
            "flag": 0
        }
    ],
    "usage": {
        "prompt_tokens": 495,
        "completion_tokens": 83,
        "total_tokens": 578
    }
}

错误码

如果请求错误，服务器返回的JSON文本包含以下参数。

名称	描述
code	错误码
message	错误描述信息，帮助理解和解决发生的错误
type	错误类型

更多相关错误码，请查看模型错误码说明。

百度智能云

千帆AI应用开发者中心-API参考 qianfan-api

千帆AI应用开发者中心-API参考 qianfan-api

支持模型列表

权限说明

请求参数

示例代码

返回响应

错误码