FAQ 主机使用
主机监控问题

1、监控数据存放在哪里,是否会占用主机磁盘空间?

问题解答:

(1)行云管家监控数据是存放在行云管家数据库里的;

(2)行云管家监控数据不会占用用户的磁盘空间;

2、监控数据清理周期是多久?

问题解答:

监控数据只会保留30天的数据,超出时间的数据会进行清理;

3、CPU告警设置里的CPU User、IOWait、System分别是什么意思?

问题解答:

请参照Linux系统top命令里的%Cpu(s)

us:us, user : time running un-niced user processes 用户空间占用CPU百分比;

sy, system:time running kernel processes 内核空间占用CPU百分比;

wa, IO-wait:time waiting for I/O completion 等待输入输出的CPU时间百分比;

4、监控告警会通知多少次?

问题解答:

在该告警问题清理前,监控告警会通知一次;

5、网卡流量如何监控?

问题解答:

(1)行云管家是对每块网卡单独对应一个IP进行监控的,单独监控该网络流量;

(2)通过映射得到的公网IP不能进行监控的,流量是走的内网,无法进行区分;

6、行云管家Agent监控如何计算Linux内存使用率?

问题解答:

(1)内存的使用率计算公式如下:

(mem_total - (mem_free + mem_buffer + mem_cache)) /mem_total

(2)可以在服务器里使用 cat /proc/meminfo命令检查mem_free, mem_buffer , mem_cache的使用量。

7、关于阿里云查询监控数据API月调用量超额的说明

我们注意到,从2018年4月开始,陆续有行云管家用户反馈,经常收到来自阿里云的一封主题为“【云监控】资源使用超过配额提醒”的邮件。这封邮件中提到的问题是由于阿里云云监控服务已经于2018年4月2日正式商用,针对云监控的各项服务都有相关的配额限制,其中可能影响到行云管家用户的一项配额是“查询监控数据API月调用量”,对于免费使用阿里云云监控的用户而言,每个月的云监控API调用次数配额为100万次/月;

在行云管家中,如果您的阿里云主机使用云厂商监控模式,那么主机的监控数据将通过阿里云API来获取,行云管家对阿里云API调用的逻辑规则如下:

  • 云主机的监控数据获取频率是基础版团队是5分钟/次,收费版本是2分钟/次;

  • 一个云账户每次获取监控数据时,并不是每台主机分开查询,而是整个云账户批量查询,这样有效降低了查询API的次数,不论您的云账户中有多少台云主机,查询的次数都是一样的;

  • 行云管家目前支持的阿里云监控项是30个,由于阿里云API的限制,每次监控数据的查询,监控项都会去调用一次API;

  • 阿里云监控API的调用会有相当的失败概率,行云管家有相应的补偿机制会对缺失的相关数据进行再次查询,这也增加了调用次数;

  • CDN、OSS等云资源的监控和云主机是分开查询的,如果您同时在行云管家中管理CDN和OSS,那么相应的API调用次数也会增加;

根据上述规则,我们可以计算出,基础版团队一个云账户每月请求阿里云查询监控数据API的次数至少是:30次/5分钟x12次/小时x24小时x30天=259200次,如果是收费版团队,每月调用次数至少是:259200次x2.5倍=648000次,这对于一个月100万次的免费额度是不一定够的 ;

那么对于已经收到阿里云相关邮件的用户来说,我们建议,您可以考虑以下处理方式:

(1)如果您不关心主机监控数据的获取,可以不理会阿里云的配额提醒,并且可以在行云管家门户网页里的“基础运维”->“通用设置”->“云账户管理”->“基本信息”->“云厂商监控”进行关闭;

(2)如果您非常关注主机监控,同时又希望继续在行云管家中使用阿里云官方的监控服务,可以考虑按照阿里云的提示购买相应的服务,以提升API调用量配额;

(3)考虑使用行云管家提供的Agent进行监控,这需要为每台主机都安装Agent,我们提供了批量安装的功能(阅读:了解行云管家Agent)。