access 数据库技术及应用教程  内容精选
  • 时延优化 - 千帆AI应用开发者中心-开始使用qianfan-docs | 百度智能云文档

    时延优化 针对大模型时延问题,我们提供几个推荐原则,您可以应用这些原则来改善大模型请求中遇到的时延问题 时延核心指标 主要观测指标: 首Token时延(FirstTokenLatency) :从发送请求,到返回首字(或首句)的时延 IntervalLatency :流式场景包间时延,指的是2个chunk之间的时间间隔 OTPS :Output Tokens Per Second: 每秒输出token

    查看更多>>

  • 登录实例 - 轻量应用服务器LS | 百度智能云文档

    登录实例 使用用户名密码验证连接实例 前提条件 使用SSH登录Linux实例时,请确认您的轻量应用服务器已开放22端口(Linux实例创建时已默认开放22端口)。 操作步骤 登录轻量应用服务器LS控制台,进入实例列表页面。查看轻量应用服务器的概要信息,查看公网IP。 在轻量应用服务器的状态处于运行中时,启动客户端进行连接。

    查看更多>>

access 数据库技术及应用教程  更多内容