一、访问网址

行云管家门户访问URL:http://xxx.xxx.xxx.xxx

行云管家管理控制台访问URL:http://xxx.xxx.xxx.xxx/console

二、日常巡检

2.1、门户服务器检查

门户服务器的IP为xxx.xxx.xxx.xxx,日常巡检时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到门户服务器),然后对照下表进行巡检检查:

检查项目 检查要求 命令行 执行权限
磁盘空间 查看门户服务器磁盘空间 df -hT root权限
服务端口 查看门户服务器磁盘空间 /opt/cloudbility/bin/status.sh root权限
门户模块日志 /opt/cloudbility/logs/cloudbility-ortal.log有无错误信息 grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-portal.log root权限
其他模块日志 /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log root权限
收集日志 收集门户服务器的日志 执行以下行命令,然后依照命令执行后的提示,取得日志文件
/opt/cloudbility/bin/log_collect.sh
root权限

2.2、中转服务器检查

  • 注意:如果没有部署独立中转,可以跳过这一步检查。

中转服务器的IP为xxx.xxx.xxx.xxx,日常巡检时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到中转服务器),然后对照下表进行巡检检查:

检查项目 检查要求 命令行 执行权限
磁盘空间 查看中转服务器磁盘空间 df -hT root权限
服务端口 中转服务端口是否正常监听 ss -ntpl |grep 8021 root权限
中转模块日志 /opt/cloudbility/logs/cloudbility-transit.log有无错误信息 grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-transit.log root权限
其他模块日志 /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log root权限
收集日志 收集中转服务器的日志 执行以下行命令,然后依照命令执行后的提示,取得日志文件
/opt/cloudbility/bin/log_collect.sh
root权限

2.3、应用宿主机检查

  • 注意:如果没有部署应用宿主机,可以跳过这一步检查。

应用宿主机的IP地址为xxx.xxx.xxx.xxx,建议使用administrator用户远程登录至应用宿主机桌面,对应用宿主机进行检查。

检查项目 检查要求 操作 执行权限
磁盘空间 查看应用宿主机磁盘空间 打开“我的电脑”进行磁盘空间检查 管理员权限
应用宿主机服务 查看应用宿主机服务是否正常运行 打开“Windows管理工具”-“服务”,查看“Cloudbility AppManager Service”服务的运行状态 管理员权限
AppManager日志 C:\Program Files (x86)\Cloudbility\AppManager\logs\AppManager.log有无错误信息 以文本编辑器查看和检索AppManager.log,查看是否存在异常或错误 管理员权限
其他模块日志 /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log 管理员权限
Tools日志 C:\tools\logs文件夹下日志文件有无错误信息 以文本编辑器查看和检索日志文件,查看是否存在异常或错误 管理员权限

三、恢复操作

3.1、门户服务

门户服务器的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到门户服务器),再以root权限执行操作。

执行以下命令,可查看行云管家所有组件服务是否正常运行:

/opt/cloudbility/bin/status.sh

执行以下命令,可重启行云管家服务:

/opt/cloudbility/bin/restart.sh

门户服务依赖于MySQL、MongoDB、InfluxDB及Redis的正常运行,启动门户服务时需先确认MySQL、MongoDB、InfluxDB及Redis已正常运行。

3.1.1、MySQL检查

执行以下命令,可查看MySQL是否正常运行:

lsof -i:3306

如果看到有3306端口处于监听状态,则说明MySQL运行正常。

如果MySQL没有正常运行,可执行以下命令,可启动(重启)MySQL:

systemctl restart mysqld

3.1.2、MongoDB检查

执行以下命令,可查看MongoDB是否正常运行:

lsof -i:27017

如果看到有27017端口处于监听状态,则说明MongoDB运行正常。

如果MongoDB没有正常运行,可执行以下命令,可启动(重启)MongoDB:

systemctl restart mongod

3.1.3、InfluxDB检查

执行以下命令,可查看InfluxDB是否正常运行:

lsof -i:8086

如果看到有8086端口处于监听状态,则说明InfluxDB运行正常。

如果InfluxDB没有正常运行,可执行以下命令,可启动(重启)InfluxDB:

systemctl restart influxdb

3.1.4、Redis检查

执行以下命令,可查看Redis是否正常运行:

lsof -i:6379

如果看到有6379端口处于监听状态,则说明Redis运行正常。

如果Redis没有正常运行,可执行以下命令,可启动(重启)Redis:

systemctl restart redis

3.1.5、Nginx检查

执行以下命令,可查看Nginx是否在正常运行:

systemctl status nginx

执行以下命令,可以检查Nginx配置是否正确:

nginx -c /etc/nginx/nginx.conf -t

执行以下命令可以启动(重启)nginx:

systemctl restart nginx

3.2、中转服务

  • 注意:如果没有部署独立中转,可以跳过这一步检查。

中转服务器的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到中转服务器),再以root权限执行操作。

3.2.1、Nginx检查

执行以下命令,可查看Nginx是否在正常运行:

systemctl status nginx

执行以下命令,可以检查Nginx配置是否正确:

nginx -c /etc/nginx/nginx.conf -t

执行以下命令可以启动(重启)nginx:

systemctl restart nginx

3.3、应用宿主机

  • 注意:如果没有部署应用宿主机,可以跳过这一步检查。

应用宿主机的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,请使用administrator用户登录至该服务器,再以管理员权限执行操作。

以管理员权限运行并打开cmd终端,并进入到 “C:\Program Files (x86)\Cloudbility\AppManager\bin”目录,然后:

(1)执行以下命令,可以停止应用宿主机服务

stopAppManager.bat

(2)执行以下命令,可以启动应用宿主机服务

startAppManager.bat

(3)如需重启应用宿主机服务,则依次执行以下两行命令

stopAppManager.bat
startAppManager.bat

四、备份、还原配置

请参考行云管家备份还原指引