公有云厂商 阿里云
安装云监控插件

一、为什么要安装阿里云监控插件

阿里云监控是阿里云原厂为中小网站提供各种应用和服务器的第三方监控服务,任何系统异常都能及时通知到用户,及时处理异常,从而提高用户产品的可用性。

阿里云监控插件则是上述产品的具体形态,支持Windows和Linux平台。默认情况下,阿里云主机不会安装云监控插件,此时阿里云的云监控服务仅提供云主机的CPU使用率、网络流入及流出速率、网络出入流量等监控数据,在安装云监控插件后,云主机将获得内存使用率、平均负载、磁盘IO写、磁盘使用率、TCP连接数、进程总数等监控数据。

如果您打算在行云管家中使用阿里云监控来监控主机性能,那么必须确保已经安装了阿里云监控插件。

您可以继续阅读下文内容,也可以到阿里云官网翻阅有关云监控插件的进一步介绍:阿里云云监控插件官网介绍

二、阿里云监控插件安装指南

2.1、选择合适的代理节点

插件下载是通过http proxy完成的,默认代理节点在杭州,如果下载时网络不通可根据机器所在地域手工调整下载地址;

区域 代理地址 端口
杭州 hzcmsproxy.aliyun.com 3128
北京 bjcmsproxy.aliyun.com
青岛 qdcmsproxy.aliyun.com
深圳 szcmsproxy.aliyun.com
上海 shcmsproxy.aliyun.com
香港 hkcmsproxy.aliyun.com
美国硅谷 mgcmsproxy.aliyun.com
新加坡 xjpcmsproxy.aliyun.com
日本 jpcmsproxy.aliyun.com 8080
德国 decmsproxy.aliyun.com
迪拜 dbcmsproxy.aliyun.com
张家口 cmsproxy-cn-zhangjiakou.aliyun.com
澳洲 aucmsproxy.aliyun.com
吉隆坡 cmsproxy-ap-southeast-3.aliyun.com
呼和浩特 cmsproxy-cn-huhehaote.aliyun.com
印度孟买 cmsproxy-ap-south-1.aliyuncs.com
印尼雅加达 cmsproxy-ap-southeast-5.aliyuncs.com

2.2、设置代理

如果是Windows服务器,请将浏览器http proxy修改为上一步所选的代理地址,下面以IE为例说明设置代理方式:

2.3、安装

(1)Linux 监控插件安装说明

  • 安装:(其中,第一行脚本中的“hzcmsproxy.aliyun.com:3128”为代理节点地址和端口,请注意根据您的云主机所在区域,修改位合适的代理节点地址和端口)

64位:

sudo bash -c 'CMS_HOME="/usr/local/cloudmonitor" CMS_VERSION="1.2.22" CMS_ARCH="linux64" CMS_PROXY="hzcmsproxy.aliyun.com:3128"; \ 
if [ -f $CMS_HOME/wrapper/bin/cloudmonitor.sh ] ; then $CMS_HOME/wrapper/bin/cloudmonitor.sh remove; rm -rf $CMS_HOME; fi ; \ 
mkdir -p $CMS_HOME && \ 
wget -e "http_proxy=$CMS_PROXY" -O "$CMS_HOME/cloudmonitor.tar.gz" "http://cms-download.aliyun.com/release/$CMS_VERSION/$CMS_ARCH/agent-$CMS_ARCH-$CMS_VERSION-package.tar.gz" && \ 
tar -xf $CMS_HOME/cloudmonitor.tar.gz -C $CMS_HOME && \ 
rm -f $CMS_HOME/cloudmonitor.tar.gz && \ 
chown -R root:root $CMS_HOME && \ 
$CMS_HOME/wrapper/bin/cloudmonitor.sh install && \ 
$CMS_HOME/wrapper/bin/cloudmonitor.sh start' 

32位:

sudo bash -c 'CMS_HOME="/usr/local/cloudmonitor" CMS_VERSION="1.2.22" CMS_ARCH="linux32" CMS_PROXY="hzcmsproxy.aliyun.com:3128"; \ 
if [ -f $CMS_HOME/wrapper/bin/cloudmonitor.sh ] ; then $CMS_HOME/wrapper/bin/cloudmonitor.sh remove; rm -rf $CMS_HOME; fi ; \ 
mkdir -p $CMS_HOME && \ 
wget -e "http_proxy=$CMS_PROXY" -O "$CMS_HOME/cloudmonitor.tar.gz" "http://cms-download.aliyun.com/release/$CMS_VERSION/$CMS_ARCH/agent-$CMS_ARCH-$CMS_VERSION-package.tar.gz" && \ 
tar -xf $CMS_HOME/cloudmonitor.tar.gz -C $CMS_HOME && \ 
rm -f $CMS_HOME/cloudmonitor.tar.gz && \ 
chown -R root:root $CMS_HOME && \ 
$CMS_HOME/wrapper/bin/cloudmonitor.sh install && \ 
$CMS_HOME/wrapper/bin/cloudmonitor.sh start'
  • 查看运行状态:
sudo /usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh status
  • 重启:
sudo /usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh restart
  • 卸载:
sudo bash -c "/usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh remove && rm -rf /usr/local/cloudmonitor"

(2)Windows 32位 监控插件安装说明

  • 安装:

a)下载监控插件

b)在“C:\Program Files\Alibaba”路径下新建文件夹“cloudmonitor”;

c)解压到C:\Program Files\Alibaba\cloudmonitor;

d)运行在CMD下运行以下命令:

C:\"Program Files"\Alibaba\cloudmonitor\wrapper\bin\AppCommand.bat install 
C:\"Program Files"\Alibaba\cloudmonitor\wrapper\bin\AppCommand.bat start
  • 查看运行状态:

在CMD下运行以下命令:

C:\"Program Files"\Alibaba\cloudmonitor\wrapper\bin\AppCommand.bat status
  • 卸载:

在CMD下运行以下命令:

C:\"Program Files"\Alibaba\cloudmonitor\wrapper\bin\AppCommand.bat remove 
rd/s/q C:\"Program Files"\Alibaba\cloudmonitor

三、其它问题

3.1、阿里云监控插件如何升级?

当用户需要将阿里云旧版插件进行升级时,直接重新安装即可,新版插件进程名称cloudmonitor,升级新版插件时会删除旧版阿里云监控插件,如果您使用了自定义监控且脚本放在/usr/local/aegis/aegis_quartz/libexec/user下启动定时任务,请升级新插件前先将脚本移出aegis_quartz并采用其他调度方式。

3.2、安装阿里云监控插件后,为何有部分监控项仍无法启用?

如果您在安装阿里云监控插件后,无法启用部分监控项,可以尝试通过以下方式来解决:

a)由于阿里云服务器未及时返回监控项数据,导致行云管家认为某些监控项无法启用,请手动获取最新监控项;

b)特别针对TCP连接数,由于当TCP连接过多时,会消耗比较多的CPU时间。因此在旧版监控插件中默认关闭,而在1.1.x版本监控插件中,只会默认采集总连接数(TCP_TOTAL)、活跃连接数(ESTABLISHED)和非活跃连接数(NON_ESTABLISHED)三个指标。如需采集每种状态下TCP连接数,请根据操作系统类型进行以下操作:

对于Linux操作系统,请将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false。

对于Windows操作系统,在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false。

修改配置后请重启Agent。

3.3、安装云监控成功,云监控显示没数据如何处理?

首先确认云监控是否正确运行

sudo /usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh status
  • 正常运行
cloudmonitor is running: PID:14253, Wrapper:STARTED, Java:STARTED 
  • 未运行
cloudmonitor is not running.

查看云监控日志确认数据提交成功

sudo tail -100 /usr/local/cloudmonitor/logs/cloudmonitor.log 
  • 正确
提交指标完成,耗时:435ms 
  • 错误
提交指标错误:xxxxxxxx  

3.4、插件状态变为已停止该如何处理?

云监控判断停止的标准是15分钟没有心跳,停止状态代表两种可能:

(1)云监控插件进程停止;

(2)云监控插件无法与服务器通讯。

可以通过登录机器运行ps aux|grep cloudmonitor来判断进程是否还在,windows用户可以通过查看cloudmonitor服务的状态来判断。如果进程还在,可以查看/usr/local/cloudmonitor/logs/cloudmonitor.log来确定具体原因。