Qwen3-4B-Instruct-2507

更新时间：2026-03-16

模型介绍

Qwen3-4B-Instruct-2507 是通义千问系列推出的轻量级指令微调模型。该模型采用了先进的 Dense（稠密）架构，总参数量仅 40 亿。该模型定位为“小而精”的全能型助手，旨在以极低的部署成本提供接近更大规模模型的综合能力，特别适用于端侧部署、低资源环境以及对响应速度要求较高的应用场景。

模型特性

显著提升了通用能力，包括指令执行、逻辑推理、文本理解、数学、科学、编程和工具使用。
在多种语言中的长尾知识覆盖方面取得了重大进展。
在主观和开放式任务中与用户偏好更好地对齐，使响应更加有用，生成的文本质量更高。
提升了256K长上下文理解的能力。

API调用

服务部署成功后，可在服务列表查看调用信息

调用示例

Plain Text

1curl -X POST "<访问地址>/v1/chat/completions" \
2-H "Content-Type: application/json" \
3-H "Authorization: Bearer <TOKEN>" \
4-d '{
5    "model": "Qwen3-4B-Instruct-2507",
6    "messages": [{"role": "system", "content": "你是一名天文学家,请回答用户提出的问题。"}, {"role": "user", "content": "人类是否能登上火星?"}],
7    "max_tokens": 1024,
8    "temperature": 0.7
9}'

评价此篇文章

有帮助没帮助

百度智能云

百度百舸 · AI计算平台

百度百舸 · AI计算平台

Qwen3-4B-Instruct-2507

模型介绍

模型特性

API调用