主机主机监控
行云管家如何提供主机监控服务

在行云管家中,我们为用户提供了两种模式的监控服务:云厂商监控和行云管家Agent监控(需要在主机上安装行云管家Agent);

对于公有云主机而言,行云管家通过API集成了各大云厂商监控服务,用户可直接在行云管家中查看云厂商的监控数据。同时,如果云主机上已经安装了行云管家Agent,也可采用行云管家Agent监控;

而对于局域网主机,只能通过安装行云管家Agent来获得监控服务。

监控模式对比

受限于公有云厂商API的限制,云厂商监控模式存在诸如监控项过少、监控数据丢失、监控频率过低等问题。行云管家Agent监控模式,由安装在主机上的行云管家Agent插件直接向服务器汇报监控数据,有着稳定性高、频率高的优点,下面表格展示了两种监控模式的差异:

对比项 云厂商监控 行云管家Agent监控
数据来源 云厂商监控Agent 行云管家Agent
监控项数量 不同云厂商,监控项数量不一致 10项
监控频率 5分钟/次(收费版团队阿里云主机2分钟/次) 1分钟/次
稳定性和准确性 依赖于云厂商Agent和API
监控模式切换

所谓监控模式的切换,是指公有云主机监控可在公有云厂商监控和行云管家Agent监控模式之间进行切换。

在主机详情的监控概览中,点击“监控模式设置”图标,打开“设置主机监控模式”窗口。

根据您的需求,选择您要采用的监控模式,点击“确定”后保存设置。

自定义监控项

不论用户采用何种监控模式,行云管家都将默认提供一些基础监控项(如CPU),若用户需要更丰富的监控项,请进入主机详情页面,点击添加按钮增加监控项。需要注意的是,云主机某些监控项依赖于云厂商的监控Agent(延伸阅读:安装阿里云监控插件安装腾讯云监控插件),否则将无法获取监控数据;

同样,您也可以删除不关心的监控项。

查看监控数据及告警设置

您可以通过点击云主机任意一个监控项的图形界面进入到该监控项的监控详情,下图以内网流量监控为例;

根据监控项的不同,行云管家提供了相应的告警设置,您可以依据真实情况修改告警的阈值或停用部分告警,下图以CPU监控的告警项设置为例;

当云主机某项负载达到告警阈值时,将产生告警记录;

同时,在主机图标中,将标记告警状态,提示用户当前云主机的异常状态;

关于阿里云查询监控数据API月调用量超额的说明

我们注意到,从2018年4月开始,陆续有行云管家用户反馈,经常收到来自阿里云的一封主题为“【云监控】资源使用超过配额提醒”的邮件。这封邮件中提到的问题是由于阿里云云监控服务已经于2018年4月2日正式商用,针对云监控的各项服务都有相关的配额限制,其中可能影响到行云管家用户的一项配额是“查询监控数据API月调用量”,对于免费使用阿里云云监控的用户而言,每个月的云监控API调用次数配额为100万次/月;

在行云管家中,如果您的阿里云主机使用云厂商监控模式,那么主机的监控数据将通过阿里云API来获取,行云管家对阿里云API调用的逻辑规则如下:

  • 云主机的监控数据获取频率是基础版团队是5分钟/次,收费版本是2分钟/次;
  • 一个云账户每次获取监控数据时,并不是每台主机分开查询,而是整个云账户批量查询,这样有效降低了查询API的次数,不论您的云账户中有多少台云主机,查询的次数都是一样的;
  • 行云管家目前支持的阿里云监控项是30个,由于阿里云API的限制,每次监控数据的查询,监控项都会去调用一次API;
  • 阿里云监控API的调用会有相当的失败概率,行云管家有相应的补偿机制会对缺失的相关数据进行再次查询,这也增加了调用次数;
  • CDN、OSS等云资源的监控和云主机是分开查询的,如果您同时在行云管家中管理CDN和OSS,那么相应的API调用次数也会增加;

根据上述规则,我们可以计算出,基础版团队一个云账户每月请求阿里云查询监控数据API的次数至少是:30次/5分钟*12次/小时*24小时*30天=259200次,如果是收费版团队,每月调用次数至少是:259200次*2.5倍=648000次,这对于一个月100万次的免费额度是不一定够的 ;

那么对于已经收到阿里云相关邮件的用户来说,我们建议,您可以考虑以下处理方式:

1、如果您不关心主机监控数据的获取,可以不理会阿里云的配额提醒;

2、如果您非常关注主机监控,同时又希望继续在行云管家中使用阿里云官方的监控服务,可以考虑按照阿里云的提示购买相应的服务,以提升API调用量配额;

3、考虑使用行云管家提供的Agent进行监控,这需要为每台主机都安装Agent,我们提供了批量安装的功能(阅读:了解行云管家Agent)。