AgentRuntime

更新时间：2026-02-06

概述

AgentRuntime用于托管使用LangChain、LangGraph、CrewAI等框架构建的Agent应用，为用户的Agent工作负载提供强会话隔离、弹性的资源使用、快速部署，用户可以专注于Agent工作负载核心逻辑的开发。

注意事项

AgentRuntime当前处于公测阶段，功能限时免费，但AgentRuntime依赖于bci(容器实例)的镜像缓存功能，所以bci(镜像缓存处)可能产生额外的计费

使用前提

用户需要开通bci(容器实例)
用户需要开通ccr(容器镜像服务)企业版

使用限制

配额类型	默认配额
单账号创建的agent数量	1000
每个Agent的版本数量	100
单账号活跃的Agent/会话数量	5
Agent镜像大小	3G

说明：公测期间，用户同时活跃的Agent/会话数量为5、创建Agent时配置的镜像大小3G以内，避免镜像缓存失败。

操作步骤

创建Agent

进入CFC控制台点击创建Agent

设置Agent基本信息（名称、vpc、子网、安全组）

填写运行配置信息（容器镜像、内存、超时时间）

说明：当前请选择ccr中public namespace中的镜像，且ccr实例需要配置上一步中选定的vpc的访问控制，否则会造成Agent部署失败

API配置（监听端口、健康检查端点、健康检查超时时间）

说明：根据用户的镜像进行相关配置

访问配置（支持sse等流式响应）

环境变量（用户按需配置环境变量）

点击确定

发布Agent新版本

选择制定agent，点击编辑按钮

同创建Agent，填写好相关参数

Agent详情

点击Agent名称

点击版本，获取对应版本Agent的详情

Agent调用

进入agent详情页面，选择端点或者创建端点，并将端点绑定到想要调用的agent版本

查看端点详情，复制端点调用域名

说明：CFC会透传用户的请求体到Agent应用、透传Agent应用返回的结果，所以具体的请求体，请符合容器中部署的Agent应用的接收格式，对于调用uri，用户可以自定义，例如/invoke、/invocation等。

使用同一个sessionId进行调用

使用第一次调用时返回的sessionId，响应头为X-Cfc-Session-Id

后续请求中携带请求头X-Cfc-Session-Id

说明：使用同一个X-Cfc-Session-Id的请求会路由到同一个Agent实例，当前支持的sessionId请求头为X-Cfc-Session-Id、X-Session-Id、Session.id。

额外说明

用户镜像要求
- 用户的镜像需要提供一个健康检查端点(GET)，可以支持多个调用端点。健康检查端点返回正常的状态码200即可，端点的URI用户可以自定义，在创建Agent时，务必保证端口、端点等配置与用户的镜像内应用一致，用户镜像内应用的监听host为0.0.0.0。
超时时间
- 当前Agent超时时间最大为24h，从用户第一次调用时开始计算，当前默认存在15min的空转时间，如果用户15min内没有任何调用，系统将自动释放实例，实例的释放时间取决于Agent设置的超时时间以及空转时间，以其中的较小值为准，例：超时时间设置为300，则300s后实例将被系统回收。
Agent状态
- 部署中: Agent创建时的默认状态
- 部署失败: Agent部署失败
- 运行中: 只有处于运行中的Agent才能执行调用
会话
- 用户第一次调用时，响应头中会返回一个X-Cfc-Session-Id/X-Session-Id/Session.id，用户可以使用该Id执行后续的调用，所有的请求都会路由到同一实例
- 用户也可以在第一次调用时自己配置X-Cfc-Session-Id/X-Session-Id/Session.id，要求至少长度为20个ASCII字符，不超过64位.

服务条款

Agent可观测

百度智能云

函数计算 CFC