Qwen3-4B-Instruct-2507
更新时间:2026-03-16
模型介绍
Qwen3-4B-Instruct-2507 是通义千问系列推出的轻量级指令微调模型。该模型采用了先进的 Dense(稠密) 架构,总参数量仅 40 亿。该模型定位为“小而精”的全能型助手,旨在以极低的部署成本提供接近更大规模模型的综合能力,特别适用于端侧部署、低资源环境以及对响应速度要求较高的应用场景。
模型特性
- 显著提升了通用能力,包括指令执行、逻辑推理、文本理解、数学、科学、编程和工具使用。
- 在多种语言中的长尾知识覆盖方面取得了重大进展。
- 在主观和开放式任务中与用户偏好更好地对齐,使响应更加有用,生成的文本质量更高。
- 提升了256K长上下文理解的能力。
API调用
- 服务部署成功后,可在服务列表查看调用信息

- 调用示例
Plain Text
1curl -X POST "<访问地址>/v1/chat/completions" \
2-H "Content-Type: application/json" \
3-H "Authorization: Bearer <TOKEN>" \
4-d '{
5 "model": "Qwen3-4B-Instruct-2507",
6 "messages": [{"role": "system", "content": "你是一名天文学家,请回答用户提出的问题。"}, {"role": "user", "content": "人类是否能登上火星?"}],
7 "max_tokens": 1024,
8 "temperature": 0.7
9}'
评价此篇文章
