查看模型压缩任务列表 接口描述 本接口用于查看模型压缩任务列表。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
Action=DescribeModelCompTasks 本接口用于查看模型压缩任务列表。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
使用产品 语音合成 支持与交流 AI社区 教学视频 文档中心 SDK下载 语音合成技术让您可以随时随地“听”文档 价值成果 百度语音合成技术可对大篇幅文档进行语音播放,支持多种情感化朗读方式、语速设置等,合成体验清晰、流畅、自然,带来非常好的用户体验。 案例故事 核心诉求 随着科技的不断进步,移动阅读因其便捷性逐渐成为主流阅读方式,满足用户在不同时间与空间中的阅读需求。
比如:当cache显存占用较小时,C8相比C16的显存减少并不明显。 Cache量化的作用是减少显存占用,并不能保证提升推理性能。性能提升来源为显存占用减少(即cache低比特最直观的作用是降显存而不是加速),在相同推理资源的情况下可以增加批量处理数据量,从而进一步提升推理性能。 建议在输入输出较长的情况下使用kv cache量化,否则可能带来性能退化。
Action=CreateModelCompTask 本接口用于创建模型压缩任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
Action=DeleteModelCompTask 本接口用于删除模型压缩任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
创建模型压缩任务 接口描述 本接口用于创建模型压缩任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
停止模型压缩任务 接口描述 本接口用于停止模型压缩任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
介绍千帆大模型平台查看用量流程
获取模型压缩任务详情 接口描述 本接口用于获取模型压缩任务详情。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。