模型版本升级及退役机制
更新时间:2024-09-19
一、概述
1. 服务介绍
随着我们推出更安全、更强大的模型,我们定期淘汰较旧的模型。依赖于本平台预置模型服务能力的客户可能需要偶尔更新以保持正常运作。受影响的客户将始终通过短信、邮件、官方文档等方式得到通知,以获取更多的变更信息。 本页面列出了所有预置服务API对应模型版本的滚动升级方案、退役方案以及退役模型的推荐替代方案。
2. 术语定义
-
带preview预览版本模型:
- 表示预览版,指向最新版本的模型。
- preview模型滚动升级不会提前通知用户,用户可以在文档上查看当前最新指向日期。
-
未带日期主线版本模型:
- 未带日期版本模型,其对应的模型版本会滚动升级更新,会指向一个具体带日期版本的模型。比如,ernie-3.5-8k模型指向ernie-3.5-8k-0205。
- 未带日期版本模型在滚动升级之前,会提前1~2周发送通知给到用户。
- 如果不想体验模型版本滚动升级,可以提前将业务请求指向带日期版本模型。比如提前将请求指向ernie-3.5-8k-0205,则ernie-3.5-8k未来滚动升级至ernie-3.5-8k-0405新版本,客户有业务将不受影响。但是需要在带日期版本模型退役之前将请求流量指向一个不带日期版本模型,或者指向未退役的带日期版本。
-
带日期版本模型:
- 指代有日期标记的模型,这类模型版本将不再更新,接口地址也保持不变。比如ernie-3.5-8k-0205模型,带有日期标签,则该模型版本以及接口地址(/chat/ernie-3.5-8k-0205)将不再更新。
- 带日期版本预置服务,其生命周期一般为3~6个月。
-
模型版本退役:
- 指代将在指定时间退役的模型版本和接口服务地址。比如2024年3月1日,ernie-3.5-8k-1222被打上【退役】,指定退役日期为:2024年4月1日,替代模型为ernie-3.5-8k-0205。则ernie-3.5-8k-1222模型版本及接口地将在2024年4月1日下线。
- 如果有模型版本被退役,将在模型版本退役记录当中新增一条记录,示例如下:
登记日期 | 退役模型版本 | 价格 | 模型退役日期 | 推荐替换模型 |
---|---|---|---|---|
2024-3-1(示意,非真实) | ernie-3.5-8k-1222 | 0.012元/千tokens | 2024-4-1(示意,非真实) | ernie-3.5-8k-0205 |
- 新模型版本上线,已有模型版本退役,都会提前以短信、站内信等方式通知到用户。
3. 滚动更新模式简介
3.1 规范
百度已经发布ERNIE-3.5、ERNIE-4.0、ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列多个版本模型。
- 每个模型版本都会带有一个-MMDD后缀,如ernie-3.5-8k-1222、ernie-3.5-8k-0205等。
- 每个模型系列都会带有一个不带日期版本的模型,如ernie-3.5-8k,ernie-speed-128k等。
- 随着大模型的不断迭代升级,大模型平台会不断上线新版本的模型,比如2月5日上线ernie-3.5-8k-0205,用户可以提前体验带日期的新版本模型,以决定是否接受滚动更新至该版本。
- 未带日期版本模型(如ernie-3.5-8k)将在一段时间以后滚动更新升级,指向该最新版本模型,例如ernie-3.5-8k在ernie-3.5-8k-0205上线一个月以后指向该最新版本。
- 在未带日期版本模型滚动升级至最新版本之前,本平台会提前1~2周以短信、邮件站内信等方式提前告知用户。
- 在推出新版本后,旧版本通常会在3~6个月后退役。例如2023年上线ernie-3.5-8k-1222,预计在2024-4-1弃用该版本。
3.2 滚动更新机制时间线
下面以不带日期版本模型ernie-3.5-8k为例,说明模型版本滚动更新机制及时间线。
假定ernie-3.5-8k当前最新版本为ernie-3.5-8k-1222,ernie-3.5-8k指向ernie-3.5-8k-1222。
- T0:线上ernie-3.5-8k(接口地址为/chat/completions)默认版本为ernie-3.5-8k-1222。
- T1:上线试用接口ernie-3.5-8k-0205,短信、邮件告知用户,可提前体验。
- T2:模型版本滚动升级预通知,提前告知客户ernie-3.5-8k模型(接口地址为/chat/completions)将在指定时间升级至ernie-3.5-8k-0205版本,接口地址不变。
- T3:线上ernie-3.5-8k(接口地址为/chat/completions)模型版本正式滚动升级至ernie-3.5-8k-0205,短信、邮件告知用户ernie-3.5-8k滚动升级完成,并公布ernie-3.5-8k-1222模型版本退役时间。
- T4:上线试用接口ernie-3.5-8k-0308,短信、邮件告知用户,可提前体验。
- T5:模型版本滚动升级预通知,提前告知客户ernie-3.5-8k模型(接口地址为/chat/completions)将在指定时间升级至ernie-3.5-8k-0308版本,接口地址不变。
- T6:线上ernie-3.5-8k(接口地址为/chat/completions)模型版本正式滚动升级至ernie-3.5-8k-0308,短信、邮件告知用户ernie-3.5-8k滚动升级完成,并公布ernie-3.5-8k-0205模型版本退役时间。
- T7: ernie-3.5-8k-1222正式退役, 不可访问。
二、完整模型退役历史记录
参考上述3.2当中的滚动升级时间线,给出模型退役历史记录示例
登记日期 | 退役模型版本 | 价格 | 模型退役日期 | 推荐替换模型 |
---|---|---|---|---|
2024-6-7 | ERNIE-Lite-8k-0922 | 免费 | 2024-7-4 | ERNIE-Lite-8k-0308 |
2024-5-16 | ERNIE-4.0-8K(抢占式) | 输入:0.048元/千tokens 输出:0.048元/千tokens |
2024-6-13 | ERNIE-4.0-8K |
2024-5-16 | ERNIE-3.5-8K(抢占式) | 输入:0.0048元/千tokens 输出:0.0048元/千tokens |
2024-6-13 | ERNIE-3.5-8K |
2024-5-8 | ERNIE-3.5-4K-0205 | 0.012元/千tokens | 2024-5-30 | ERNIE-3.5-8K |
2024-5-8 | ERNIE-3.5-8K-1222 | 0.012元/千tokens | 2024-5-30 | ERNIE-3.5-8K |