模型列表
更新时间:2025-06-05
推荐模型
旗舰模型 | ERNIE-X1-Turbo-32K | ERNIE-4.5-Turbo-128K | ERNIE-4.5-Turbo-VL-32K | DeepSeek-R1 |
---|---|---|---|---|
使用场景 | 核心定位:深度思考模型,具备更强的理解、规划、反思、进化能力。 适用场景: 在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。 |
核心定位:更好的满足多轮长历史对话处理、长文档理解问答任务。 适用场景: 1)复杂语义理解:支持中文知识问答、文学创作,尤其擅长文档理解(如DocVQA任务)。 2)数学推理:在中文数学问题(CMath基准)表现突出。 |
核心定位:多模态基础模型,支持文本、图像跨模态输入与生成。 适用场景:结合图文生成营销文案、视频脚本设计等。 |
核心定位:专业优化推理模型,聚焦数学与逻辑任务。 适用场景: 复杂数学问题:如高等数学题求解、科学计算模拟。 逻辑拆解与规划:业务流程自动化、学术研究中的假设验证。 STEM领域应用:物理建模、金融量化分析等需高精度推理的场景。 |
上下文长度 (Token数) |
32k | 128k | 32k | 96k |
最大输出长度 (Token数) |
16k | 12k | 12k | 16k 默认4k |
原生多模态
更多模型,请参考:千帆ModelBuilder-模型列表-原生多模态
模型名称 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
默认流控 |
---|---|---|---|---|---|
ERNIE 4.5 Turbo VL | ernie-4.5-turbo-vl-32k | 32k | 27k | [2,12288] 默认 2k |
RPM = 1000 TPM = 200000 |
ERNIE 4.5 | ernie-4.5-8k-preview | 8k | 5k | [2,2048] 默认 2k |
RPM = 100 TPM = 100000 |
Llama-4-Maverick | llama-4-maverick-17b-128e-instruct | 128k | 131072字符 | [2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
Llama-4-Scout | llama-4-scout-17b-16e-instruct | 128k | 131072字符 | [2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
文本生成
更多模型,请参考:千帆ModelBuilder-模型列表-文本生成
ERNIE系列-旗舰模型
模型名称 | model参数 接入点ID |
上下文长度 (token) |
最大输入 (token) |
最大输出 (token) |
默认流控 |
---|---|---|---|---|---|
ERNIE 4.5 Turbo | ernie-4.5-turbo-128k | 128k | 123k | [2,12288] 默认 2k |
RPM = 5000 TPM = 400000 |
ERNIE 4.5 Turbo | ernie-4.5-turbo-32k | 32k | 27k | [2,12288] 默认 2k |
RPM = 5000 TPM = 400000 |
ERNIE系列-主力模型
模型名称 | model参数 接入点ID |
上下文长度 (token) |
最大输入 (token) |
最大输出 (token) |
默认流控 |
---|---|---|---|---|---|
ERNIE Speed | ernie-speed-128k | 128k | 124k | [2,4096] 默认 4k |
RPM = 500 TPM = 200000 |
ERNIE Speed | ernie-speed-8k | 8k | 6k | [2,2048] 默认 1k |
RPM = 500 TPM = 200000 |
ERNIE Speed | ernie-speed-pro-128k | 128k | 124k | [2,4096] 默认 4k |
RPM = 10000 TPM = 800000 |
ERNIE Lite | ernie-lite-8k | 8k | 6k | [2,2048] 默认 1k |
RPM = 500 TPM = 200000 |
ERNIE Lite | ernie-lite-pro-128k | 128k | 124k | [2,4096] 默认 4k |
RPM = 10000 TPM = 800000 |
ERNIE系列-轻量模型
模型名称 | model参数 接入点ID |
上下文长度 (token) |
最大输入 (token) |
最大输出 (token) |
默认流控 |
---|---|---|---|---|---|
ERNIE Tiny | ernie-tiny-8k | 8k | 6k | [2,2048] 默认 1k |
RPM = 10000 TPM = 800000 |
ERNIE系列-垂直场景模型
模型名称 | model参数 接入点ID |
上下文长度 (token) |
最大输入 (token) |
最大输出 (token) |
默认流控 |
---|---|---|---|---|---|
ERNIE Character | ernie-character-8k | 8k | 7k | [2,2048] 默认 1k |
RPM = 60 TPM = 60000 |
ERNIE Character | ernie-character-fiction-8k | 8k | 8k | [2,2048] 默认 1k |
RPM = 300 TPM = 300000 |
DeepSeek系列
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 (token) |
最大输出 (token) |
默认流控 |
---|---|---|---|---|---|---|
DeepSeek-V3 | DeepSeek-V3-250324 | deepseek-v3 | 128k | 128k | 16k 默认4k |
RPM = 5000 TPM = 1000000 |
其他
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
默认流控 |
---|---|---|---|---|---|---|
GLM-4 | GLM-4-32B-0414 | glm-4-32b-0414 | 32k | 16k | [2,8192] 默认 4k |
RPM = 120 TPM = 60000 |
Llama-4-Maverick | Llama-4-Maverick-17B-128E-Instruct | llama-4-maverick-17b-128e-instruct | 128k | 131072字符 | [2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
Llama-4-Scout | Llama-4-Scout-17B-16E-Instruct | llama-4-scout-17b-16e-instruct | 128k | 131072字符 | [2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-235B-A22B | qwen3-235b-a22b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-30B-A3B | qwen3-30b-a3b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-32B | qwen3-32b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-14B | qwen3-14b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-8B | qwen3-8b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-4B | qwen3-4b | 32k | 30k | [2,8192] 默认4k |
RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-1.7B | qwen3-1.7b | 32k | 30k | [2,8192] 默认4k |
RPM = 60 TPM = 60000 |
Qwen3 | Qwen3-0.6B | qwen3-0.6b | 32k | 30k | [2,8192] 默认4k |
RPM = 60 TPM = 60000 |
Qwen2.5 | Qwen2.5-7B-Instruct | qwen2.5-7b-instruct | 32k | 24k | [2,8192] 默认4k |
RPM = 60 TPM = 60000 |
图像理解
更多模型,请参考:千帆ModelBuilder-模型列表-图像理解
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
默认流控 |
---|---|---|---|---|---|---|
Qianfan Llama VL | Qianfan-Llama-VL-8B | qianfan-llama-vl-8b | 32k | 32k | 16k 默认 2k |
RPM = 120 TPM = 150000 |
Llama-4-Maverick | Llama-4-Maverick-17B-128E-Instruct | llama-4-maverick-17b-128e-instruct | 128k | 131072字符 | 2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
Llama-4-Scout | Llama-4-Scout-17B-16E-Instruct | llama-4-scout-17b-16e-instruct | 128k | 131072字符 | 2,8192] 默认 4k |
RPM = 120 TPM = 150000 |
DeepSeek-VL2 | DeepSeek-VL2 | deepseek-vl2 | 4k | 12000字符 | 2k 默认2k |
RPM = 60 TPM = 60000 |
DeepSeek-VL2 | DeepSeek-VL2-Small | deepseek-vl2-small | 4k | 38400字符 | 2k 默认2k |
RPM = 60 TPM = 60000 |
Qwen2.5-VL | Qwen2.5-VL-32B-Instruct | qwen2.5-vl-32b-instruct | 32k | 64000字符 | 8k 默认2k |
RPM = 60 TPM = 60000 |
Qwen2.5-VL | Qwen2.5-VL-7B-Instruct | qwen2.5-vl-7b-instruct | 16k | 38400字符 | 4k 默认2k |
RPM = 60 TPM = 60000 |
InternVL2_5 | InternVL2_5-38B-MPO | internvl2.5-38b-mpo | 32k | 64000字符 | 4k 默认2k |
RPM = 60 TPM = 60000 |
深度思考
更多模型,请参考:千帆ModelBuilder-模型列表-深度思考
ERNIE系列
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
思维链长度 (token) |
默认流控 |
---|---|---|---|---|---|---|---|
ERNIE X1 Turbo | ERNIE-X1-Turbo-32K | ernie-x1-turbo-32k | 32k | 24k | [2,16384] 默认 2k |
16k | RPM = 900 TPM = 300000 |
ERNIE X1 | ERNIE-X1-32K | ernie-x1-32k | 32k | 24k | [2,16384] 默认 2k |
16k | RPM = 900 TPM = 300000 |
ERNIE X1 | ERNIE-X1-32K-Preview | ernie-x1-32k-preview | 32k | 24k | [2,16384] 默认 2k |
16k | RPM = 300 TPM = 100000 |
DeepSeek系列
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
思维链长度 (token) |
默认流控 |
---|---|---|---|---|---|---|---|
DeepSeek-R1 | DeepSeek-R1-250528 | deepseek-r1-250528 | 96k | 64k | 16k 默认 4k |
32k | RPM = 5000 TPM = 1000000 |
DeepSeek-R1 | DeepSeek-R1 | deepseek-r1 | 96k | 64k | 16k 默认 4k |
32k | RPM = 5000 TPM = 1000000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qianfan-70B | deepseek-r1-distill-qianfan-70b | 32k | 16k | [2,8192] 默认 8k |
16k | RPM = 1000 TPM = 60000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qianfan-8B | deepseek-r1-distill-qianfan-8b | 32k | 16k | [2,8192] 默认 8k |
16k | RPM = 1000 TPM = 60000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qianfan-Llama-70B | deepseek-r1-distill-qianfan-llama-70b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qianfan-Llama-8B | deepseek-r1-distill-qianfan-llama-8b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Llama-70B | deepseek-r1-distill-llama-70b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Llama-8B | deepseek-r1-distill-llama-8b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qwen-32B | deepseek-r1-distill-qwen-32b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qwen-14B | deepseek-r1-distill-qwen-14b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qwen-7B | deepseek-r1-distill-qwen-7b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
DeepSeek-R1-Distill | DeepSeek-R1-Distill-Qwen-1.5B | deepseek-r1-distill-qwen-1.5b | 32k | 64000字符 | 8k 默认 4k |
32k | RPM = 1000 TPM = 10000 |
Qwen系列
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
思维链长度 (token) |
默认流控 |
---|---|---|---|---|---|---|---|
Qwen3 | Qwen3-235B-A22B | qwen3-235b-a22b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-30B-A3B | qwen3-30b-a3b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-32B | qwen3-32b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-14B | qwen3-14b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-8B | qwen3-8b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-4B | qwen3-4b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 120 TPM = 150000 |
Qwen3 | Qwen3-1.7B | qwen3-1.7b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 60 TPM = 60000 |
Qwen3 | Qwen3-0.6B | qwen3-0.6b | 32k | 16k | [2,8192] 默认 4k |
16k | RPM = 60 TPM = 60000 |
QWQ-32B | QWQ-32B | qwq-32b | 32k | 65536字符 | 8k 默认 4k |
32k | RPM = 120 TPM = 100000 |
其他
模型名称 | 版本 | model参数 接入点ID |
上下文长度 (token) |
最大输入 | 最大输出 (token) |
思维链长度 (token) |
默认流控 |
---|---|---|---|---|---|---|---|
GLM-Z1-32B-0414 | GLM-Z1-32B-0414 | glm-z1-32b-0414 | 32k | 16k | [2,8192] 默认 4k |
16k | RPM=120 TPM=60000 |
GLM-Z1-Rumination-32B-0414 | GLM-Z1-Rumination-32B-0414 | glm-z1-rumination-32b-0414 | 128k | 64k | [2,8192] 默认 4k |
32k | RPM = 120 TPM = 150000 |
图像生成
更多模型,请参考:千帆ModelBuilder-模型列表-图像生成
模型名称 | 版本 | model参数 接入点ID |
最大输入(字符) | 默认流控 |
---|---|---|---|---|
ERINE iRAG | ERNIE-iRAG-1.0 | irag-1.0 | 200字符 | 6RPM |
Stable-Diffusion-XL | stable-diffusion-xl-base-1.0 | -- | 1024字符 | 180RPM |
图像编辑
更多模型,请参考:千帆ModelBuilder-模型列表-图像编辑
模型名称 | 版本 | model参数 接入点ID |
最大输入(字符) | 默认流控 |
---|---|---|---|---|
ERINE iRAG Edit | ERNIE-iRAG-Edit-1.0 | enrie-irag-edit | 220字符 | 6RPM |
向量
更多模型,请参考:千帆ModelBuilder-模型列表-向量
模型名称 | 版本 | model参数 接入点ID |
最大输入文本数量 | 每个文本上下文长度 (token) |
默认流控 |
---|---|---|---|---|---|
Embedding-V1 | Embedding-V1 | embedding-v1 | 1 | 384 | RPM = 1800 TPM = 800000 |
tao-8k | tao-8k | tao-8k | 16 | 8192 | RPM = 1800 TPM = 800000 |
bge-large-zh | bge-large-zh | bge-large-zh | 16 | 512 | RPM = 1800 TPM = 800000 |
bge-large-en | bge-large-en | bge-large-en | 16 | 512 | RPM = 1800 TPM = 800000 |
重排序
更多模型,请参考:千帆ModelBuilder-模型列表-重排序
模型名称 | 版本 | model参数 接入点ID |
最大输入 | 默认流控 |
---|---|---|---|---|
bce-reranker-base | bce-reranker-base | bce-reranker-base | query:400 tokens/1600字符 document:1K tokens/4000字符 |
RPM = 1800 TPM = 800000 |
视频生成
模型名称 | 操作 |
---|---|
可灵 | 申请试用 |
Vidu 1.0 | 申请试用 |
语音技术
语音识别:将语音识别为文字。识别模式丰富,既支持识别短语音,快速返回识别结果;也支持将大量语音文件异步识别为文字。
语音合成:支持将文字转换为语音。众多音色可选择,更有基于大模型升级的音色,发音更自然,情绪更灵动。音色试听请前往能力体验。
完成实名认证可领取免费测试额度,领取到的额度可在资源列表查看。
模型名称 | 模型领域 | 默认并发数 | 免费额度 | 定价 |
---|---|---|---|---|
短语音识别-中文普通话 | 语音识别 | 个人认证:5并发 企业认证:10并发 | 个人认证:5万次 企业认证:10万次 | 查看 |
短语音识别-英文 | 语音识别 | 个人认证:3并发 企业认证:5并发 | 个人认证:3万次 企业认证:5万次 | 查看 |
短语音识别-粤语 | 语音识别 | 个人认证:3并发 企业认证:5并发 | 个人认证:3万次 企业认证:5万次 | 查看 |
短语音识别-四川话 | 语音识别 | 个人认证:3并发 企业认证:5并发 | 个人认证:3万次 企业认证:5万次 | 查看 |
短语音识别极速版-中文普通话 | 语音识别 | 个人认证:5并发 企业认证:5并发 | 个人认证:5万次 企业认证:5万次 | 查看 |
音频文件转写 | 语音识别 | 异步接口,动态调整并发 | 10小时 | 查看 |
短文本在线合成-基础音库 | 语音合成 | 个人认证:3并发 企业认证:5并发 | 个人认证:5万次 企业认证:10万次 | 查看 |
短文本在线合成-精品音库 | 语音合成 | 个人认证:3并发 企业认证:5并发 | 个人认证:5万次 企业认证:10万次 | 查看 |
短文本在线合成-臻品音库 | 语音合成 | 个人认证:3并发 企业认证:5并发 | 个人认证:1万次 企业认证:2万次 | 查看 |
长文本在线合成 | 语音合成 | 异步接口,动态调整并发 | 个人认证:5万字符 企业认证:10万字符 | 查看 |