HAS-agent组件安装与升级
介绍
硬件感知服务(Hardware-Aware Service,或称HAS)是一款线上硬件故障监控修复、功耗和资源管理工具,主要功能包括故障感知、功耗感知、资源感知、性能感知四大部分,提供了一系列的线上硬件的配置/状态监控,故障检测与修复,健康预警,功耗、擦除及相关硬件自动化管理功能,并提供统一的硬件资源状态查询、推送和管理接口。
在云服务器BCC、百度太行·弹性裸金属服务器BBC上,我们会在实例上默认部署HAS-Agent。当用户需要手动升级新版本的HAS-Agent,或者用户因为部分错误操作删除了HAS-agent后,我们建议您按照本文档下述指引重新安装,以获取到完整的、全方位的硬件感知能力,帮助您提高系统可用性,并能够顺利使用BCM事件监控、维修中心的完整能力。
安装(升级)HAS-agent
环境确认
- 在安装或升级之前,您需要确认实例当前的操作系统是否符合要求。当前Has-agent可适配的操作系统主要面向linux os,包括Redhat、Centos、Ubuntu、Fedora、Debian、Slackware、欧拉。
- 检查域名has-master-a.sdns.baidu.com是否通,使用方法:ping has-master-a.sdns.baidu.com
升级组件
- 在/tmp目录下执行:
curl -sm10 http://has-master-a.sdns.baidu.com/download/qa_packages/bbc/has-agent-installer-first.sh | bash 升级
执行输出如下:有个" ERROR: BIO_new_file ........ " ,告警可忽略,不影响升级
结果检测
- 部署后等待10min,has会部署成功,目前是1.1.3.92版本。
- 后续has升级后会自动升级,版本号的第一位或最后一位比现在的版本高都是新版,均符合预期。
- 检查自升级进程,单机上执行如下命令:
ps -ef|grep -v grep |grep "/opt/avalokita/bin/avalokita --update-url=http://has-master-a.sdns.baidu.com/download/qa"
出现保活、自升级进程:
/opt/avalokita/bin/avalokita --update-url=http://has-master-a.sdns.baidu.com/download/qa_packages/bbc//has-agent-installer.sh --signature-url=http://has-master-a.sdns.baidu.com/download/qa_packages/bbc//has-agent-installer.sh.sig --certificate=/home/opt/has-agent/cert.pem --update-interval=3600 --max-executable-size=1000000000 /home/opt/has-agent/has-agent-installer.sh
- 检查has版本和主进程:
curl -s 127.0.0.1:428/self/basic
ps -ef|grep has_client
- 查看资源版本:
- 部署完成在/home/opt下会出现:has和has-agent。
- 查看部署后包的版本如下:
使用cat /home/opt/has/VERSION |head -1