创建和管理资源队列 概述 托管资源池资源队列是算力资源分配调度的单元,所有使用托管资源池算力的工作负载都需要提交到对应的资源队列中才能获得算力分配。本文将介绍如何创建和管理资源队列。 创建资源队列 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择托管资源池,进入托管资源池页面,选择 资源队列 ,点击 新建资源队列 。 在创建资源队列页面,根据实际需求完成相关参数配置。
基本设置 置信度设置 通过置信度的设置,可调节触发意图示例、意图模型、意图澄清、问答、问答澄清、闲聊的语句匹配程度,同时也可以调整意图置信度区分度。 注:该部分为全局设置,建议在开发人员指导下更改。 点击“去配置”,在滑块中拖动滑块进行全局置信度设置。 在新画布版本,通过置信度的设置,可触发问答、问答澄清、表格问答、表格问答推荐问、关键词澄清、关键词澄清区分度的语句匹配程度。
第一阶段覆盖4大类场景任务下的12项技能,总时长950小时、片段数39761个、存储大小3.45TB。
Job(任务) Job(任务)是音视频转码中最基本的执行单元,每个任务将一个原始的音视频资源转码成目标规格的音视频资源。因此,任务和转码的目标是一一对应的,也就是说如果用户需要将一个原始多媒体文件转换成三种目标规格,比如从AVI格式转码成FLV/MP4/HLS格式,那么用户将会需要创建三个任务。 任务接口的各参数含义和取值方法参考 Job Transcoding API 。
显卡选型建议 NVDIA Tesla P4/GTX系列 :P4、P40、1060、1070、1070Ti、1080、1080Ti 推荐使用 P4 卡(单张P4卡最多支持50QPS) 注:P40显存大但运行模型的计算单元并不多,因此运行人脸识别模型的性能与P4基本没差别。
由于GTX的计算单元比P4更多,因此单卡支持的QPS数量也会更多,但因为GTX并非服务器专用显卡,请大家基于自身业务需求进行选择。
技能管理 技能描述 技能由单元组合得到。用户可以基于现有单元,进行灵活的编排组合,生成多样技能,满足不同的边缘业务需求。 技能编辑完成后可以生成对应的业务模版,用户可以将业务模版部署至节点,生成多个应用。 单元串联 单元可以通过拖拉拽的方式组合成一个技能。画布右侧支持修改单元特定的属性。 符合什么条件的单元可以串联 : 目前单元因为针对场景设计,有些单元需要按照指定的个数数据进行输入输出。
产品定价 名词解释 分区:分区是基本吞吐量单位,一个分区提供1MB/秒数据输入和2MB/秒输出通量。您可根据通量要求指定数据流所需的分区数量,并按小时对每个分区付费。运行时间不足1小时不收费。 记录:Kafka数据流的计费单元,以25KB有效载荷计算,以每百万记录收费,不足百万按照实际使用量收费。例如,5KB消息按照一个记录收费,49KB消息按照两个记录收费,1MB消息按照40个记录收费。
Transcoding-Job转码任务 Transcoding Job(任务)是音视频转码中最基本的执行单元,每个任务将一个原始的音视频资源转码成目标规格的音视频资源。因此,任务和转码的目标是一一对应的,也就是说如果用户需要将一个原始多媒体文件转换成三种目标规格,比如从AVI格式转码成FLV/MP4/HLS格式,那么用户将会需要创建三个任务。
Agent管理 企业版基于多租户体系打造,租户是平台内最基础的组织单元,租户和租户之间数据、权限隔离;平台超级管理员按需可为不同企业或者业务创建不同的租户,便于分组织、业务进行管理。 功能上支持租户的创建、编辑、删除、资源配置修改、租户的导入、导出等 创建租户分2步进行,第1步配置租户的基本信息,第2步配置产品授权的信息,用于授权此租户可以使用的功能集合以及资源能力。