提供面向主机、容器、域名/IP等基础设施的通用监控数据采集能力
产品功能
产品特性
-
智能化
基于大规模服务运维的检验,覆盖百度100+产品,实践标准化运维流程,深耕智能化运维场景。
-
一站式运维
统一账号、认证、权限体系,统一服务模型打通监控、部署变更、任务执行等多种运维场景。
-
高可用
单实例、单集群容灾数据采集和运维操作快速生效,支持根据运维规模架构横向扩展。
-
开放融合
开放API,开发框架,支持业务根据定制场景二次开发,支持业务系统集成。
产品架构
面向混合云架构、大规模数据中心复杂运维环境,采用化繁为简的设计理念,提供了多维度立体化运维监测管理服务。为满足不同运维人员的多样化监测场景需求,其具备优秀伸缩性及扩展性,可显著降低运维成本,提高运维效率,保障服务质量,是大规模混合云数据中心的运维利器

使用场景


满足分省、运营商、分机房等不同维度的业务健康状态监控和可视化分析需求
我们能提供
通过进程、端口、日志监控、自定义监控等方式获取流水、PV、平响等业务监控数据。
灵活强大的数据多维度可视化分析能力。

内置全面的物理服务器、物理网络的事件告警,故障分析和常规运维操作
我们能提供
功能强大的自动化操作平台安全快捷的完成线上变更操作。
通过标准ITIL流程,规范运维操作流程,将所有运维操作和解决方案沉淀至平台形成运维知识。

降低鱼尾成本的同时,提高运维效率
我们为您解决
成千上万的指标阈值如何设定、业务变化是否影响阈值、基础设施故障影响哪些业务。
业务异常是否和基础设施有关等高频发生但处理复杂的运维操作。
客户案例
某互联网金融机构
某传统金融机构
某证券机构
某游戏集团
客户背景:
国内头部互联网金融机构,包括消费金融、支付、互联网理财、互联网保险、互联网证券等多个板块,基本覆盖金融服务的各个领域。
需求痛点:
✓ 业务模型复杂,混合云架构使得云上云下运维更加困难; ✓ 数据来源类型多、结构复杂、体量大,实时数据更新快,数据接入能力要求高。 无法对数据进行分层管理,建立数据关联关系,识别指标重要程度 难以实现业务与IT运维数据的统一建模,以及多场景下的数据消费
解决方案:
✓ 完整的服务管理模型实现业务与IT运维数据的统一建模; ✓ 全栈监控自底层基础设施到操作系统、中间件、数据库、网络质量、业务进行全面监控告警,使异常秒级发现; ✓ 自动化操作平台,实现线上变更、任务执行安全可控,历史可追溯。
客户背景:
某国内知名金融机构,下辖几十分公司,覆盖全国所有的地级以上城市,覆盖率达100%,全辖员工超万人,服务特约商户千万家。
需求痛点:
业务系统众多且上线需求快,引入私有云环境基础设施,为保证云上业务的稳定性和可靠性,需要对私有云进行全面监管运维,包括平台侧和租户侧业务的安全与稳定。
解决方案:
✓ 设备的全生命周期管理模型,简便的操作接口硬件资产信息数据库资产变更可追溯; ✓ 覆盖基础设施到上层应用的全栈监控和多场景的异常检测。 强大的分级发布与回滚技术保障了服务可用性 深入整合底层依赖服务,提供网络自动化配置和操作系统安装功能 丰富的可视化组件和灵活的仪表盘布局,用户可自定义可视化视图
客户背景:
某领先的综合性金融服务提供商,共设有36家分公司、492家营业部,分布在全国179个地级以上城市,员工近万人。
需求痛点:
✓ 海量数据的阈值设定成本高,准确性无法保证; ✓ 排查大量的监控数据、报警事件来定位问题,耗时长,线上服务无法及时止损。
解决方案:
✓ 构建智能化运维平台,着力解决故障管理痛点; ✓ 多元数据支持,基于已有运维平台构建智能运维体系; ✓ 智能异常检测根据业务特征匹配最佳算法和参数,进行阈值设定和异常检测; ✓ 故障根因推荐全面扫描业务指标和机器指标,寻找可疑指标进行推荐。
客户背景:
国内领先的互联网游戏开发和运营商,覆盖主流新媒体和视频媒体平台近60家。
需求痛点:
✓ 业务复杂,20000+个业务指标10+个混合云机房,监控配置和维护成本居高不下; ✓ 海量告警影响故障定位; ✓ 网络情况复杂,网络故障影响范围无法准确判定。
解决方案:
✓ 黄金指标异常检测实现阈值自动配置和持续更新; ✓ 告警关联分析自动对海量告警信息进行合并,降低告警数量的同时提升告警有效性; ✓ 网络质量异常分析应用多维度分析手段,快速定位核心异常已经影响范围。