主机行云管家Agent介绍
什么是行云管家Agent

通过前面的章节,我们已经了解到在行云管家中,我们通过API来实现云主机的管理,通过Proxy来实现局域网主机的管理,但不论是云主机还是局域网主机,背后所管理的资源都是主机。

在默认情况下,云主机通过API已经能够获得大部分管理功能。而局域网主机由于缺乏监控手段,无法实现监控功能。另外在自动化运维场景中,我们除了SSH快捷方式这一种执行方式外,还需要一种更稳定更可靠的执行方案。

在这种需求下,我们推出行云管家Agent这一产品,将其部署在目标主机上,以完成局域网主机监控、自动化运维等高级特性。

行云管家Agent工作原理

需要注意的是,行云管家Agent是通过内网安装和工作的,也就是说它需要依托于内网访问助手或Proxy,如果您要在云主机上安装Agent,请先在网络中安装内网访问助手来启用内网访问,局域网主机天然已经具备了内网访问能力。而行云管家Agent工作过程中的监控数据汇报、自动化运维脚本和命令执行、文件分发,都是通过内网访问助手或者Proxy来与门户进行通信的。

行云管家Agent安装
安装行云管家Agent前置条件

了解了行云管家Agent工作原理,我们可以知道行云管家Agent在工作时,只会与内网络中的Proxy(局域网)/内网访问助手(公有云)进行通信,所汇报的数据统一由Proxy/内网访问助手提交给行云管家门户,行云管家Agent成功安装的前提有以下几点:

  • 内网中的Proxy(局域网)/内网访问助手(公有云)工作正常;
  • 安装Agent的主机能够访问Proxy/内网访问助手宿主机的8326端口;
  • 安装Agent的主机能够通过内网创建会话,远程桌面/终端能够正常访问;
  • 安装Agent时,需要使用系统管理员身份安装;
单台主机安装行云管家Agent

如果您只需在单台主机上安装行云管家Agent,请进入主机详情页,在主机基本信息Agent状态处,点击“未安装”,将打开Agent安装对话框。

行云管家为您提供了自动安装和手动安装两种方式。

如果您选择自动安装,您只需要输入这台主机的登录凭证,系统将会登录这台主机,自动为您执行安装操作;

如果您选择手动安装,请根据您的操作系统类型,登录到主机的远程桌面/终端,执行这段脚本进行安装,如果安装脚本无法执行,您可以尝试 手动下载安装包

批量安装行云管家Agent

1、进入“网络”栏目,将列出您名下所有云账户及其下的区域和专有网络(以下简称VPC);

2、找到您需要主机所在的区域/VPC并进入,如果内网访问助手或Proxy运行正常,那么可以看到右侧的主机列表下方的“批量安装主机Agent”是可点击的。

3、点击打开Agent批量安装向导,首先需要选择主机操作系统,如果您的主机既有Windows也有Linux,请分批安装,下面以Linux为例来介绍安装过程;

4、接下来设置主机的安装信息,为了方便您快速便捷的安装,如果您的主机SSH连接信息都是标准化的,建议您通过批量设置功能设置安装信息(也可以指定SSH快捷方式);

5、点击“批量设置”,在弹出的窗口中填写主机的SSH端口、账户、登录凭证后,点击“设置”,请注意:如果使用非root身份安装,请确保该用户能够执行sudo;

6、设置完成后,勾选相应的主机,点击“下一步”按钮,开始安装;

7、显示安装过程,列表中将列出每台主机的安装进度;

8、安装完成后,自动显示最终安装结果,如果有安装失败的情况,将在这里统一展示,您可以将错误信息发送给我们的在线客服进行排查。

行云管家Agent安装常见错误处理

如果您在Agent安装过程中出现失败的情况,您可以根据错误信息对照以下情况尝试自助处理:

1、错误信息:连接超时,目标主机端口可能未开放或者防火墙拦截

错误原因:内网访问助手或Proxy无法访问到目标主机,无法将安装包下发到目标主机;

解决方式:您可以通过在宿主机telnet目标主机的远程访问端口(默认为3389或22)来测试,如果无法访问,请修改您的防火墙设置,确保目标主机通过内网IP访问是正常的;

2、错误信息:认证错误,请检查密码或者密钥文件是否正确

错误原因:行云管家Agent安装时,需要指定目标主机的管理员用户名密码,但由于您使用了错误的用户名密码,导致无法安装;

解决方式:使用正确的目标主机用户名密码安装;

3、错误信息:用于执行脚本的快捷方式必须包含登录密码

错误原因:您采用了自动安装Agent的方式,并选择通过快捷方式来连接主机,但该快捷方式中并未设置密码,导致无法登录到该主机上;

解决方式:为所选的快捷方式设置密码或选择其它可用的快捷方式;

4、错误信息:脚本执行暂不支持包含密码的私钥

错误原因:您在采用自动安装Agent的方式时,使用一个key登录目标Linux主机,但该key的私钥已被加密,目前行云管家暂不支持这种类型的密钥;

解决方式:使用一个未加密的SSH密钥登录目标主机;

5、错误信息:无可用的内网访问助手或行云管家Proxy

错误原因:行云管家Agent安装,需要依赖于内网访问助手(专指云主机)或Proxy(专指局域网主机),如果它们运行不正常或者由于防火墙的原因导致无法正常访问,都将引起安装失败;

解决方式:在安装Agent之前,请确保您的内网访问助手(内网访问助手异常处理)或Proxy运行正常(Proxy异常处理);

6、错误信息:主机不存在或已删除

错误原因:当前安装Agent主机已经从团队中删除,可能团队其他成员已将该台主机移除;

解决方式:请确保该主仍然存在团队中,如果已被移除,请重新导入;

7、错误信息:多次重试仍无法执行脚本

错误原因:该问题通常出现在Windows下,问题产生的根本原因在于我们采用了模拟RDP登录的方式来自动安装Agent,因此如果远程桌面干扰因素太多,将导致无法成功模拟安装操作,例如:用户名密码错误导致无法登录、需要人工干预的操作窗口(确认框等)、系统响应不及时等;

解决方式:如果是用户名密码错误,请使用正确的用户名密码重新安装即可;如果是其它原因,建议您使用手动安装;

8、错误信息:没有使用系统管理员身份执行

错误原因:行云管家Agent需要通过系统管理员进行安装,您当前使用的安装身份非系统管理员;

解决方式:如果是Windows,请使用Administrator管理员安装;如果是Linux/Unix,请尽量使用root身份安装,如果不使用root身份安装,则要求所设置的账户能够执行sudo,且必须填写sudo密码;

9、错误信息:下载工具wget和curl均不可用

错误原因:您安装Agent的主机操作系统为Linux,我们需要通过wget或curl来下载Agent安装包,由于您的主机上的wget和curl均不可用,导致无法下载Agent安装包;

解决方式:根据您的操作系统类型,先安装wget或curl下载工具(任意一个)后再执行本操作,例如:在centos下,您可以通过sudo yum -y install wget命令来安装wget工具;

10、错误信息:安装脚本不完整

错误原因:该现象通常出现在手动安装时,如果复制的安装脚本不完整,将会出现这个错误;

解决方式:您在将安装脚本复制到目标主机上执行时,请确保脚本复制完整;

11、错误信息:目标主机无法访问Proxy或内网访问助手

错误原因:行云管家Agent安装,目标主机需要能够访问到内网访问助手或Proxy的8326端口;

解决方式:您可以通过在目标主机telnet宿主机的8326端口来测试,如果无法访问,请修改您的防火墙设置;

12、错误信息:下载安装包失败

错误原因:由于网络超时等原因,Agent安装包无法从内网访问助手或Proxy中下载到目标主机;

解决方式:请确保内网访问质量或重试安装操作;

13、错误信息:解压安装包失败

错误原因:由于系统原因,目标主机在使用tar命令解压安装包时发生异常;

解决方式:建议重试安装操作;

14、错误信息:Agent未正确卸载,无法安装

错误原因:当前主机可能之前已经安装过行云管家Agent,在系统中会有一个名为“CloudbilityAgentConsoleService”的系统服务,如果用户采用了非标准的方式卸载,例如:手工删除了Agent安装目录,该服务将遗留在系统中,导致无法安装新的Agent;

解决方式:请通过正确的方式卸载Agent,如果未正确卸载,请针对不同的操作系统,采取相应的策略,卸载名为“CloudbilityAgentConsoleService”的系统服务;

15、错误信息:系统错误以及未知错误

解决方式:系统错误和未知错误是一组错误类型,包含有各种错误信息,例如:无法开启RTunnel、中转服务器断开连接,该类异常请联系我们的在线客服排查;

行云管家Agent异常处理

当行云管家Agent运行出现异常时,会导致您的主机体检、主机监控、作业中心等功能受影响,如下图示例:

一旦出现此类现象,说明您的Agent没有正常工作,您可以尝试以下方式进行修复:

1、检查Proxy/内网访问助手是否运行正常:Agent工作依赖于Proxy/内网访问助手,当这两者未正常运行时,会导致Agent处于异常状态,阅读:排查Proxy问题排查内网访问助手问题

2、重启行云管家Agent:当行云管家Agent由于自身原因出现异常时,建议先尝试重启解决,如果是Linux,请直接输入以下命令进行重启:

/etc/init.d/YunAgent restart

如果是Windows,请进入安装目录(默认是:C:\Program Files (x86)\Cloudbility\YunAgent\bin)执行以下命令:

stopYunAgent.bat
startYunAgent.bat

3、重装行云管家Agent:请按照前文所述行云管家Agent安装方式进行重装,无需先卸载,可直接覆盖;

4、联系客服排查:将Agent的日志文件夹打包,发送给我们的行云管家客服在线与您排查问题。

  • Windows日志默认地址:C:\Program Files (x86)\Cloudbility\YunAgent\logs
  • Linux日志地址:/usr/local/YunAgent/logs
手动下载安装包安装行云管家Agent

如果您的服务器环境,Powershell和Bat脚本都无法执行(一般出现在Windows2003操作系统),那么您可以通过下载安装包的方式来安装行云管家Agent,但请注意以下两点:

  • 这种方式仅适用于Windows服务器,Linux请通过脚本安装;
  • 这种方式依旧需要确保Proxy的8326端口已经向目标主机开放;
下载行云管家Agent

根据您的操作系统类型从以下地址将行云管家Agent安装包下载到目标主机上(如果是私有部署版,请将域名https://dl.cloudbility.com修改成您的实际行云管家门户地址):

32位:https://dl.cloudbility.com/downloads/cloudGateway/YunAgent-windows32-latest.zip

64位:https://dl.cloudbility.com/downloads/cloudGateway/YunAgent-windows64-latest.zip

解压文件

在目标主机上手工创建目录:C:\Program Files (x86)\Cloudbility\(32位系统目录是:C:\Program Files\Cloudbility\),并将安装包解压到这个目录中;

获取安装信息

打开行云管家Agent的安装窗口,切换到“Windows主机”,按照下图中的2,找到安装脚本中这段信息,将其复制下来,第一段是导入key,第二段信息是一个ip地址列表,表示一个或多个IP,用逗号连接,IP之间无空格;

修改配置文件

用文本编辑器打开解压目录下的文件:\wrapper\conf\parameter_file.conf,将上一步拷贝的信息,粘贴到文件末尾最后一行,并保存。如图所示:

安装并启动服务

使用管理员身份打开CMD命令提示行,根据操作系统32位或64位来选择执行以下命令:

32位:"C:\Program Files\Cloudbility\YunAgent\wrapper\bin\AppCommand.bat" installstart
64位:"C:\Program Files (x86)\Cloudbility\YunAgent\wrapper\bin\AppCommand.bat" installstart

如果结果如下图所示,则表示行云管家Agent安装成功。