欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

远程检测Linux服务器中内存占用情况的方法

程序员文章站 2022-07-07 19:13:01
这篇文章主要介绍了远程检测Linux服务器中内存占用情况的方法,依靠Nagios软件中的NRPE插件,需要的朋友可以参考下... 15-06-18...

我们要用的监控内存的脚本在nagios 市场上,在创建者的github仓库中也可以找到。

假设我们已经安装了nrpe,我们首先在我们想要监控的服务器上下载脚本。
准备远程服务器
在 debain/ubuntu 中:

   

复制代码
代码如下:
# cd /usr/lib/nagios/plugins/
# wget https://raw.githubusercontent.com/justintime/nagios-plugins/master/check_mem/check_mem.pl
# mv check_mem.pl check_mem
# chmod +x check_mem

在 rhel/centos 中: 

复制代码
代码如下:
# cd /usr/lib64/nagios/plugins/ (or /usr/lib/nagios/plugins/ for 32-bit)
# wget https://raw.githubusercontent.com/justintime/nagios-plugins/master/check_mem/check_mem.pl
# mv check_mem.pl check_mem
# chmod +x check_mem

你可以通过手工在本地运行下面的命令来检查脚本的输出是否正常。当使用nrpe时,这条命令应该会检测空闲的内存,当可用内存小于20%时会发出警告,并且在可用内存小于10%时会生成一个严重警告。 

复制代码
代码如下:
# ./check_mem -f -w 20 -c 10 </p> <p> ok - 34.0% (2735744 kb) free.|total=8035340kb;;;; used=5299596kb;6428272;7231806;; free=2735744kb;;;; caches=2703504kb;;;;

如果你看到像上面那样的输出,那就意味这命令正常工作着。

现在脚本已经准备好了,我们要定义nrpe检查内存使用率的命令了。如上所述,命令会检查可用内存,在可用率小于20%时发出警报,小于10%时发出严重警告。

   

复制代码
代码如下:
# vim /etc/nagios/nrpe.cfg

对于 debian/ubuntu:

   

复制代码
代码如下:
command[check_mem]=/usr/lib/nagios/plugins/check_mem -f -w 20 -c 10

对于 rhel/centos 32 bit:

   

复制代码
代码如下:
command[check_mem]=/usr/lib/nagios/plugins/check_mem -f -w 20 -c 10

对于 rhel/centos 64 bit:

   

复制代码
代码如下:
command[check_mem]=/usr/lib64/nagios/plugins/check_mem -f -w 20 -c 10

准备 nagios 服务器

在nagios服务器中,我们为nrpe定义了一条自定义命令。该命令可存储在nagios内的任何目录中。为了让本教程简单,我们会将命令定义放在/etc/nagios目录中。
对于 debian/ubuntu:

   

复制代码
代码如下:
# vim /etc/nagios3/conf.d/nrpe_command.cfg </p> <p> define command{
command_name check_nrpe
command_line /usr/lib/nagios/plugins/check_nrpe -h '$hostaddress$' -c '$arg1$'
}

对于 rhel/centos 32 bit:

   

复制代码
代码如下:
# vim /etc/nagios/objects/nrpe_command.cfg </p> <p> define command{
command_name check_nrpe
command_line /usr/lib/nagios/plugins/check_nrpe -h $hostaddress$ -c $arg1$
}

对于 rhel/centos 64 bit:

   

复制代码
代码如下:
# vim /etc/nagios/objects/nrpe_command.cfg </p> <p> define command{
command_name check_nrpe
command_line /usr/lib64/nagios/plugins/check_nrpe -h $hostaddress$ -c $arg1$
}

现在我们定义nagios的服务检查
在 debian/ubuntu 上:

   

复制代码
代码如下:
# vim /etc/nagios3/conf.d/nrpe_service_check.cfg </p> <p> define service{
use local-service
host_name remote-server
service_description check ram
check_command check_nrpe!check_mem
}

在 rhel/centos 上:

   

复制代码
代码如下:
# vim /etc/nagios/objects/nrpe_service_check.cfg </p> <p> define service{
use local-service
host_name remote-server
service_description check ram
check_command check_nrpe!check_mem
}

最后我们重启nagios服务
在 debian/ubuntu 上:

   

复制代码
代码如下:
# service nagios3 restart

在 rhel/centos 6 上:

   

复制代码
代码如下:
# service nagios restart

在 rhel/centos 7 上:

   

复制代码
代码如下:
# systemctl restart nagios.service

故障排除

nagios应该开始在使用nrpe的远程服务器上检查内存使用率了。如果你有任何问题,你可以检查下面这些情况。

  •     确保nrpe的端口在远程主机上是总是允许的。默认nrpe的端口是tcp 5666。
        你可以尝试通过执行check_nrpe 命令: /usr/lib/nagios/plugins/check_nrpe -h remote-server 手工检查nrpe操作。
        你同样可以尝试运行check_mem 命令:/usr/lib/nagios/plugins/check_nrpe -h remote-server –c check_mem
        在远程服务器上,在/etc/nagios/nrpe.cfg中设置debug=1。重启nrpe服务并检查这些日志文件,/var/log/messages (rhel/centos)或者/var/log/syslog (debain/ubuntu)。如果有任何的配置或者权限错误,日志中应该包含了相关的信息。如果日志中没有反映出什么,很有可能是由于请求在某些端口上有过滤而没有到达远程服务器上。

总结一下,这边教程描述了我们该如何调试nrpe来监控远程服务器的内存使用率。过程只需要下载脚本、定义命令和重启服务就行了。希望这对你们有帮助。