2024-05 新增AI加速套件,整合AIAK训练、推理加速镜像及训推加速过程中所需的一系列工具,轻松一键获取。 推理服务支持实例反亲和部署,避免单节点故障导致服务不可用。 推理服务实例弹性伸缩,在业务负载出现波峰或波谷时,可以根据业务流量自动调整实例数量,实现动态管理线上服务的计算资源,从而保障业务平稳运行并提高资源利用率。 推理服务支持设置防抢占策略,开启后实例不会被训练任务抢占。
配置域名动态加速规则 Method Path 说明 PUT /v2/domain/{domain}/config?
aiak-inference-llm AIAK-LLM 是百舸异构计算平台的核心组件之一,专为大模型推理加速打造的一站式高性能推理引擎。它深度集成百度自研软硬件技术栈,旨在解决大模型在高并发、低延迟、高吞吐场景下的部署效率与成本难题。 是百度自研深度定制版,支持NVIDIA、昆仑芯等多种算力。支持 Hugging Face 生态模型格式,可零代码或少量配置完成模型迁移与加速。
操作部署 如果您还没有开通CFC服务,请参考 函数计算概览 开通;如果您已开通,则可以跳过该步骤。
带宽计费用量查询 带宽计费用量查询 功能支持用户查询带宽计费用量,并且支持用户查看计费量趋势图和下载计费量明细。用户只需执行简单的选择按钮即可查看到选定时间内的计费用量。目前支持用量查询的带宽计费方式有日峰值带宽计费、月95峰值带宽计费(总量)和月95峰值带宽计费(分城市级别)。 日峰值带宽计费 日峰值带宽 计费量查询
查询SNAT规则列表 table td { white-space:nowrap; } 接口描述 本接口用于查询BEC NAT网关SNAT规则列表。 请求结构 JSON 复制 1 GET /v 2 /nat/ { natId } /snatRule?marker= { marker } &maxKeys= {
创建异构机密计算实例 产品介绍 百度智能云第七代异构机密虚拟机,引入了 NVIDIA 提出的 Protect PCIe 加密模式。该模式支持将多块 GPU 直通到同一虚拟机,并能通过 NVLink 或 NVSwitch 构建高速互连集群,显著拓展了机密计算在更大规模、更高性能场景下的应用边界。
创建即时转码任务 基本介绍 MCP提供了业界全新的视频即时转码接口,支持通过设置url参数的方法实时转换视频的码率,实现h264,h265两种码率的互转。 操作方法 注意事项 使用前需开通 百度智能云音视频处理服务(MCP) ; 建议的转码视频分辨率:不超过1080P; 建议的转码视频大小:小于1GB。 规则和限制 目前仅支持北京、苏州、广州使用。
查看实例信息 在任务详情下方的实例信息栏,您可以查看角色、实例名称、状态、重启次数、实例IP、Host IP和创建时间。
这里假设您已经创建了一个名为 kafkatrigger 的函数,以下内容以此为前提,将引导您在 CFC 控制台在函数管理页面中为函数配置百度消息服务触发器。接下来,我们将通过以下步骤来完成一个触发器的设置。 编写处理函数 登录管理控制台,选择“产品服务>云函数计算 CFC”,进入“函数列表”页面 在“函数列表”页面。点击名称为 kafkatrigger 的函数,进入函数详情页面。