写shell脚本其实就是写逻辑——监控Nginx服务的Shell脚本

2018/11/28

概述

Nginx 虽然处理并发量比 apache 确实要强点,但它这种 php-cgi 模式不是太稳定,我们生产环境其中一台服务器,偶尔会出现以下情况的:php-cgi 进程突然消失了,造成PHP脚本无法访问;更奇怪的是明明是php-cgi 打开有两个端口在监听的,莫名其秒的突然有一个php-cgi 的端口被关闭了,造成所有请求全积在一个端口上, 结果造成PHP脚本访问异常。

基于这个情况,我之前写了个监控shell脚本的解决方案,不管以上出现那种情况,都自动恢复Nginx的服务.该脚本在生产环境上运行正常。

几种常用web服务器对比

#!/bin/bash

# filename: webservermonitor.sh

# Function:监控 nginx 的 php-cgi 是否正常

# Author:huangweibo

# Run: nohup ./webservermonitor.sh &

#

 

# php-cgi 监听的IP和端口

V_PHP_CGI_PORT="xx.xx.xx.xx:9000 xx.xx.xx.xx:9001"

 

# nginx重启的脚本

V_NGINX="/usr/local/nginx/sbin/restart.sh"

 

# 日志文件

V_LOG="/tmp/webservermonitor.log"

 

# 函数定义:重启nginx

function restart_nginx(){

echo "----- `date` -----" >> $V_LOG

echo "------------------" >> $V_LOG

echo "`ps aux |grep 'nginx'`" >> $V_LOG

echo "------------------" >> $V_LOG

echo "`ps aux |grep 'php-cgi'`" >> $V_LOG

echo "------------------" >> $V_LOG

echo "`netstat -nlpt | grep 'php-cgi'`" >> $V_LOG

echo "------------------" >> $V_LOG

$V_NGINX >> $V_LOG

}

 

# 循环执行,不采用 crontab ,主要是因为 crontab 最小单位是分钟,时间太长了

while :

do

 

# 1:先检测 nginx 主进程是否存在

V_NGINX_NUM=`ps axu |grep 'nginx' |grep -v 'grep' |wc -l`

if [ $V_NGINX_NUM -lt 1 ];then

restart_nginx

continue

fi

 

# 2:再检查php-cgi是否有进程存在

V_PHP_CGI_NUM=`ps axu |grep 'php-cgi' |grep -v 'grep' |wc -l`

if [ $V_PHP_CGI_NUM -lt 1 ];then

restart_nginx

continue

fi

 

# 3:再判断端口是否正常

for PORT in $V_PHP_CGI_PORT

do

V_NUM=`eval "netstat -nlpt | grep '${PORT}' | wc -l"`

if [ $V_NUM -lt 1 ];then

restart_nginx

continue

fi

done

 

# 休眠

sleep 10

done