一、访问网址
行云管家门户访问URL:http://xxx.xxx.xxx.xxx
行云管家管理控制台访问URL:http://xxx.xxx.xxx.xxx/console
二、日常巡检
2.1、门户服务器检查
门户服务器的IP为xxx.xxx.xxx.xxx,日常巡检时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到门户服务器),然后对照下表进行巡检检查:
检查项目 | 检查要求 | 命令行 | 执行权限 |
---|---|---|---|
磁盘空间 | 查看门户服务器磁盘空间 | df -hT | root权限 |
服务端口 | 查看门户服务器磁盘空间 | /opt/cloudbility/bin/status.sh | root权限 |
门户模块日志 | /opt/cloudbility/logs/cloudbility-ortal.log有无错误信息 | grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-portal.log | root权限 |
其他模块日志 | /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 | grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log | root权限 |
收集日志 | 收集门户服务器的日志 | 执行以下行命令,然后依照命令执行后的提示,取得日志文件 /opt/cloudbility/bin/log_collect.sh |
root权限 |
2.2、中转服务器检查
- 注意:如果没有部署独立中转,可以跳过这一步检查。
中转服务器的IP为xxx.xxx.xxx.xxx,日常巡检时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到中转服务器),然后对照下表进行巡检检查:
检查项目 | 检查要求 | 命令行 | 执行权限 |
---|---|---|---|
磁盘空间 | 查看中转服务器磁盘空间 | df -hT | root权限 |
服务端口 | 中转服务端口是否正常监听 | ss -ntpl |grep 8021 | root权限 |
中转模块日志 | /opt/cloudbility/logs/cloudbility-transit.log有无错误信息 | grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-transit.log | root权限 |
其他模块日志 | /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 | grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log | root权限 |
收集日志 | 收集中转服务器的日志 | 执行以下行命令,然后依照命令执行后的提示,取得日志文件 /opt/cloudbility/bin/log_collect.sh |
root权限 |
2.3、应用宿主机检查
- 注意:如果没有部署应用宿主机,可以跳过这一步检查。
应用宿主机的IP地址为xxx.xxx.xxx.xxx,建议使用administrator用户远程登录至应用宿主机桌面,对应用宿主机进行检查。
检查项目 | 检查要求 | 操作 | 执行权限 |
---|---|---|---|
磁盘空间 | 查看应用宿主机磁盘空间 | 打开“我的电脑”进行磁盘空间检查 | 管理员权限 |
应用宿主机服务 | 查看应用宿主机服务是否正常运行 | 打开“Windows管理工具”-“服务”,查看“Cloudbility AppManager Service”服务的运行状态 | 管理员权限 |
AppManager日志 | C:\Program Files (x86)\Cloudbility\AppManager\logs\AppManager.log有无错误信息 | 以文本编辑器查看和检索AppManager.log,查看是否存在异常或错误 | 管理员权限 |
其他模块日志 | /opt/cloudbility/logs/cloudbility-xxx.log有无错误信息 | grep -i -e error -e exception /opt/cloudbility/logs/cloudbility-xxx.log | 管理员权限 |
Tools日志 | C:\tools\logs文件夹下日志文件有无错误信息 | 以文本编辑器查看和检索日志文件,查看是否存在异常或错误 | 管理员权限 |
三、恢复操作
3.1、门户服务
门户服务器的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到门户服务器),再以root权限执行操作。
执行以下命令,可查看行云管家所有组件服务是否正常运行:
/opt/cloudbility/bin/status.sh
执行以下命令,可重启行云管家服务:
/opt/cloudbility/bin/restart.sh
门户服务依赖于MySQL、MongoDB、InfluxDB及Redis的正常运行,启动门户服务时需先确认MySQL、MongoDB、InfluxDB及Redis已正常运行。
3.1.1、MySQL检查
执行以下命令,可查看MySQL是否正常运行:
lsof -i:3306
如果看到有3306端口处于监听状态,则说明MySQL运行正常。
如果MySQL没有正常运行,可执行以下命令,可启动(重启)MySQL:
systemctl restart mysqld
3.1.2、MongoDB检查
执行以下命令,可查看MongoDB是否正常运行:
lsof -i:27017
如果看到有27017端口处于监听状态,则说明MongoDB运行正常。
如果MongoDB没有正常运行,可执行以下命令,可启动(重启)MongoDB:
systemctl restart mongod
3.1.3、InfluxDB检查
执行以下命令,可查看InfluxDB是否正常运行:
lsof -i:8086
如果看到有8086端口处于监听状态,则说明InfluxDB运行正常。
如果InfluxDB没有正常运行,可执行以下命令,可启动(重启)InfluxDB:
systemctl restart influxdb
3.1.4、Redis检查
执行以下命令,可查看Redis是否正常运行:
lsof -i:6379
如果看到有6379端口处于监听状态,则说明Redis运行正常。
如果Redis没有正常运行,可执行以下命令,可启动(重启)Redis:
systemctl restart redis
3.1.5、Nginx检查
执行以下命令,可查看Nginx是否在正常运行:
systemctl status nginx
执行以下命令,可以检查Nginx配置是否正确:
nginx -c /etc/nginx/nginx.conf -t
执行以下命令可以启动(重启)nginx:
systemctl restart nginx
3.2、中转服务
- 注意:如果没有部署独立中转,可以跳过这一步检查。
中转服务器的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,建议使用root用户SSH登录至该服务器(请不要通过堡垒机方式去连接到中转服务器),再以root权限执行操作。
3.2.1、Nginx检查
执行以下命令,可查看Nginx是否在正常运行:
systemctl status nginx
执行以下命令,可以检查Nginx配置是否正确:
nginx -c /etc/nginx/nginx.conf -t
执行以下命令可以启动(重启)nginx:
systemctl restart nginx
3.3、应用宿主机
- 注意:如果没有部署应用宿主机,可以跳过这一步检查。
应用宿主机的IP为xxx.xxx.xxx.xxx,如需执行恢复操作时,请使用administrator用户登录至该服务器,再以管理员权限执行操作。
以管理员权限运行并打开cmd终端,并进入到 “C:\Program Files (x86)\Cloudbility\AppManager\bin”目录,然后:
(1)执行以下命令,可以停止应用宿主机服务
stopAppManager.bat
(2)执行以下命令,可以启动应用宿主机服务
startAppManager.bat
(3)如需重启应用宿主机服务,则依次执行以下两行命令
stopAppManager.bat startAppManager.bat
四、备份、还原配置
请参考行云管家备份还原指引;