AgentRuntime
更新时间:2025-11-17
概述
AgentRuntime用于托管使用LangChain、LangGraph、CrewAI等框架构建的Agent应用,为用户的Agent工作负载提供强会话隔离、弹性的资源使用、快速部署,用户可以专注于Agent工作负载核心逻辑的开发。
注意事项
- AgentRuntime当前处于内测阶段,功能限时免费,但AgentRuntime依赖于bci(容器实例)的镜像缓存功能,所以bci(镜像缓存处)可能产生额外的计费
使用前提
- 用户需要开通bci(容器实例)
- 用户需要开通ccr(容器镜像服务)企业版
使用限制
| 配额类型 | 默认配额 |
|---|---|
| 单账号创建的agent数量 | 1000 |
| 每个Agent的版本数量 | 100 |
| 单账号活跃的Agent/会话数量 | 5 |
| Agent镜像大小 | 3G |
说明:内测期间,用户同时活跃的Agent/会话数量为5、创建Agent时配置的镜像大小3G以内,避免镜像缓存失败。
操作步骤
创建Agent
- 进入CFC控制台点击创建Agent

- 设置Agent基本信息(名称、vpc、子网、安全组)

- 填写运行配置信息(容器镜像、内存、超时时间)


说明:当前请选择ccr中public namespace中的镜像,且ccr实例需要配置上一步中选定的vpc的访问控制,否则会造成Agent部署失败
- API配置(监听端口、健康检查端点、调用入口、健康检查超时时间)

说明:根据用户的镜像进行相关配置
- 访问配置(当前只支持http协议)

- 环境变量(用户按需配置环境变量)

- 点击确定

发布Agent新版本
- 选择制定agent,点击编辑按钮

- 同创建Agent,填写好相关参数


Agent详情
- 点击Agent名称


- 点击版本,获取对应版本Agent的详情


Agent调用
- 复制调用地址(或者进入详情页复制制定版本的调用地址)

- 使用调用地址进行调用

说明:CFC会透传用户的请求体到Agent应用、透传Agent应用返回的结果,所以具体的请求体,请符合容器中部署的Agent应用的接收格式,

- 使用同一个sessionId进行调用
使用第一次调用时返回的sessionId,响应头为X-Cfc-Session-Id

后续请求中携带请求头X-Cfc-Session-Id


说明:使用同一个X-Cfc-Session-Id的请求会路由到同一个Agent实例
额外说明
-
用户镜像要求
- 用户的镜像需要提供两个端点,一个调用端点(POST)、一个健康检查端点(GET),健康检查端点返回正常的状态码200即可,端点的URI用户可以自定义,在创建Agent时,务必保证端口、端点等配置与用户的镜像内应用一致
-
超时时间
- 当前Agent超时时间最大为24h,从用户第一次调用时开始计算,当前默认存在15min的空转时间,如果用户15min内没有任何调用,系统将自动释放实例,实例的释放时间取决于Agent设置的超时时间以及空转时间,以其中的较小值为准,例:超时时间设置为300,则300s后实例将被系统回收。
-
Agent状态
- 部署中: Agent创建时的默认状态
- 部署失败: Agent部署失败
- 运行中: 只有处于运行中的Agent才能执行调用
-
会话
- 用户第一次调用时,响应头中会返回一个X-Cfc-Session-Id,用户可以使用该Id执行后续的调用,所有的请求都会路由到同一实例
- 用户也可以在第一次调用时自己配置X-Cfc-Session-Id,要求至少长度为20个ASCII字符
