预置模型服务输入和输出限制
以下模型在本平台已经提供接口访问方式,无需用户部署模型即可访问。
ERNIE系列模型
-
模型版本说明:
-preview
:表示预览版接口,指向最新版本的模型。preview接口滚动升级不会提前通知用户,用户可以在文档上查看当前最新指向日期。
-MMDD
:带日期版本接口,模型不再更新,会定期退役,退役下线前会通知用户。
- 主线接口:不带日期版本为主线接口,主线接口模型版本滚动升级,在模型版本升级之前会提前通知用户。
- 抢占式接口:抢占式接口版本与主线版本保持一致
- ERNIE模型有默认输出长度和最大输出长度,可以通过入参
max_output_tokens
控制输出长度,取值范围见下述表格,-
表示不支持max_output_tokens
入参。
- 接口地址统一前缀为
https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop
, 拼接上接口地址后缀就是完整接口地址
模型 |
输入字符 |
最大输入Tokens |
默认最大输出Tokens |
输出区间 |
接口地址后缀 |
接口文档 |
ERNIE-4.0-Turbo-8K |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-4.0-turbo-8k |
查看 |
ERNIE-4.0-8K-Preview |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-4.0-8k-preview |
查看 |
ERNIE-4.0-8K-Preview-0518 |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/completions_adv_pro |
查看 |
ERNIE-4.0-8K-0329 |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-4.0-8k-0329 |
查看 |
ERNIE-4.0-8K(指向0329) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/completions_pro |
查看 |
ERNIE-4.0-8K-0104 |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-4.0-8k-0104 |
查看 |
ERNIE-4.0-8K(抢占式) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/completions_pro_preemptible |
查看 |
ERNIE-3.5-8K-Preview(指向0524) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-3.5-8k-preview |
查看 |
ERNIE-3.5-8K-0329 |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-3.5-8k-0329 |
查看 |
ERNIE-3.5-8K(指向0329) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/completions |
查看 |
ERNIE-3.5-8K-0205 |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-3.5-8k-0205 |
查看 |
ERNIE-3.5-8K-1222(05月30日退役) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/ernie-3.5-8k-1222 |
- |
ERNIE-3.5-4K-0205(05月30日退役) |
8000 |
2048 |
1024 |
[2, 2048] |
/chat/ernie-3.5-4k-0205 |
- |
ERNIE-3.5-8K(抢占式) |
20000 |
5120 |
1024 |
[2, 2048] |
/chat/completions_preemptible |
查看 |
ERNIE-3.5-128K(预览版) |
516096 |
126976 |
4096 |
[2, 4096] |
/chat/ernie-3.5-128k |
查看 |
ERNIE-Speed-8K |
24000 |
6144 |
1024 |
[2, 2048] |
/chat/ernie_speed |
查看 |
ERNIE-Speed-128K(预览版) |
516096 |
126976 |
4096 |
[2, 4096] |
/chat/ernie-speed-128k |
查看 |
ERNIE-Speed-AppBuilder-8K |
11200 |
7168 |
1024 |
- |
/chat/ai_apaas |
查看 |
ERNIE-Lite-8K(指向0308) |
24000 |
6144 |
1024 |
[2, 2048] |
/chat/ernie-lite-8k |
查看 |
ERNIE-Lite-8K-0922 |
11200 |
7168 |
1024 |
[2, 1024] |
/chat/eb-instant |
查看 |
ERNIE-Tiny-8K |
24000 |
6144 |
1024 |
[2, 2048] |
/chat/ernie-tiny-8k |
查看 |
ERNIE-Character-8K |
24000 |
6144 |
1024 |
[2, 1024] |
/chat/ernie-char-8k |
查看 |
ERNIE-Functions-8K |
24000 |
6144 |
1024 |
[2, 2048] |
/chat/ernie-func-8k |
查看 |
开源模型
序号 |
模型 |
输入字符 |
输出Tokens |
接口地址后缀 |
接口文档 |
1 |
bloomz7b1 |
4800 |
1500 |
/chat/bloomz_7b1 |
查看 |
2 |
llama2-7b |
4800 |
1500 |
/chat/llama_2_7b |
查看 |
3 |
llama2-13b |
4800 |
1024 |
/chat/llama_2_13b |
查看 |
4 |
llama2-70b |
4800 |
500 |
/chat/llama_2_70b |
查看 |
5 |
chatglm2_6b_32k |
32500 |
1024 |
/chat/chatglm2_6b_32k |
查看 |
6 |
aquilachat_7b |
8000 |
1024 |
/chat/aquilachat_7b |
查看 |
7 |
qianfan_chinese_llama_2_7b |
4800 |
1500 |
/chat/qianfan_chinese_llama_2_7b |
查看 |
8 |
qianfan_bloomz_7b_compressed |
4800 |
1500 |
/chat/qianfan_bloomz_7b_compressed |
查看 |
9 |
stable-diffusion-xl-base-1.0 |
1024 |
- |
/text2image/sd_xl |
查看 |
10 |
fuyu-8b |
8000 |
768 |
/image2text/fuyu_8b |
查看 |
11 |
gemma-7b-it |
11200 |
1000 |
/chat/gemma_7b_it |
查看 |
12 |
Yi-34B-Chat |
8000 |
768 |
/chat/yi_34b_chat |
查看 |
13 |
Mixtral-8x7B-Instruct-v0.1 |
11200 |
500 |
/chat/mixtral_8x7b_instruct |
查看 |
14 |
Qianfan-Chinese-Llama-2-13B-v1 |
8000 |
1000 |
/chat/qianfan_chinese_llama_2_13b |
查看 |
15 |
sqlcoder-7b |
8000 |
1000 |
/completions/sqlcoder_7b |
查看 |
16 |
CodeLlama-7b-Instruct |
8000 |
1000 |
/completions/codellama_7b_instruct |
查看 |
17 |
xuanyuan_70b_chat |
11200 |
1000 |
/chat/xuanyuan_70b_chat |
查看 |
18 |
ChatLaw-v2 |
8000 |
768 |
/chat/chatlaw |
查看 |
19 |
Llama-3-8b |
8000 |
1000 |
/chat/llama_3_8b |
查看 |
20 |
Llama-3-70b |
8000 |
1000 |
/chat/llama_3_70b |
查看 |
向量模型
序号 |
模型 |
输入字符 |
输入Tokens |
最大批次 |
接口地址后缀 |
接口文档 |
1 |
Embedding-V1 |
1000 |
384 |
16 |
/embeddings/embedding-v1 |
查看 |
2 |
bge-large-zh |
2000 |
512 |
16 |
/embeddings/bge_large_zh |
查看 |
3 |
bge-large-en |
2000 |
512 |
16 |
/embeddings/bge_large_en |
查看 |
4 |
tao-8k |
28000 |
8192 |
1(只支持1) |
/embeddings/tao_8k |
查看 |
重排模型
序号 |
模型 |
query长度 |
documents长度 |
documents批次 |
接口地址后缀 |
接口文档 |
1 |
bce-reranker-base |
1600字符,400tokens |
4096字符,1024tokens |
64 |
/reranker/bce_reranker_base |
查看 |
计费
计费参考:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7
![]()