最近项目上由于 BUG 问题导致 Tomcat 程序在运行过程中经常内存泄漏,而本身监控系统之中没有更好的检测到 Tomcat 堆空间 (Head Memory) 的使用情况导致报警频发,这篇文章主要讲述,如何在 Zabbix 之中调用 jmx 监控服务器上 Tomcat 堆空间的使用情况并增加对应报警功能。
测试环境: CentOS 6.8 Zabbix 2.4 Tomcat 7.0
实验前提默认是各位已经安装 Zabbix Server 服务器,并且至少有一台 Zabbix agent 服务器正常监控。关于如何搭建 Zabbix 监控集群,会有专门文章描述。
zabbix-java-gateway 的工作机制
- 首先我们需要配置我们的 Tomcat 服务启用监控服务,这个是默认不启用的
- 之后需要在 Zabbix 的管理页面添加对应 Tomcat 服务器的 jmx 监控接口
- 最后 zabbix 端会自动获取 zabbix-java-gateway 的数据并根据相应模板进行展 示
- 工作流:[Zabbix-Server]-->(port:10053 on zabbix server)--> [zabbix-java-gateway] --(port:12345 on tomcatserver)--> [JMX enabled]
1. Install zabbix-java-gateway on Zabbix Server
因为我的 zabbix 是使用 zabbix 2.4 官方源安装,所以只需要用 yum 在安装即可:
[root@6 ~]# sudo yum install -y zabbix-java-gateway
如果你没有官方源可能先安装该源,注意我的服务器 zabbix 版本是 2.4 如果你是不同的版本,请到[这里] 查找对应版本。
# 查看zabbix server版本
[root@6 ~]# zabbix_server --version
Zabbix server v2.4.8 (revision 59539) (20 April 2016)
Compilation time: May 4 2016 01:32:12
在使用 yum 安装 zabbix-java-gateway 源时,会自动关联安装 openjdk,尽管这段程序没多大影响,如果你想保证系统 JAVA 环境不受到改变的话,可以在/etc/profile 文件最后,增加如下内容:
# add follows to the end
export JAVA_HOME=/usr/java/default
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
2. Confiure Tomcat host with enable jmx
首先在$tomcatdir/bin/catalina.sh 文件开头处增加如下:
#!/bin/sh
CATALINA_OPTS="-Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false \
-Dcom.sun.management.jmxremote.port=12345"
然后,启动 Tomcat,你会发现多了一个 12345 端口,这就是 jmx 的监听端口,请保证 zabbix-java-gateway 可以访问到这台服务器。
[root@6 ~]# /tomcat7/bin/startup.sh
Starting Tomcat7:
Using CATALINA_BASE: /tomcat7
Using CATALINA_HOME: /tomcat7
Using CATALINA_TMPDIR: /tomcat7/temp
Using JRE_HOME: /usr
Using CLASSPATH: /tomcat7/bin/bootstrap.jar:/tomcat7/bin/tomcat-juli.jar
Tomcat started.
[root@6 ~]# netstat -ntlp | grep 12345
tcp 0 0 :::12345 :::* LISTEN 8793/java
[root@6 ~]#
==fix 1 == : zabbix agent 与 server 存在复杂网络环境
这里疏忽了 1 个问题,如果您的 zabbix server 与 agent 端之间有防火墙规则,而按照我上面的所述只是增加了 12345 这个端口,那么很可能,您在/var/log/zabbix/zabbix_java_gateway.log 中会看到“No route to host”的报错,这是因为 JMX 不光开启了 12345 端口,还开启了另外两个随机端口,而在获取监控数据时会使用到其中一个,这就导致了无法通过固定的防火墙规则来开放该端口。其实有另外一个替代方式来使该监听端口固定下来——使用 Tomcat 提供的额外组件 catalina-jmx-remote.jar,这个组件是需要另外下载的:
# 查看当前Tomcat版本.
[root@6 bin]# ./catalina.sh version
Using CATALINA_BASE: /tomcat7
Using CATALINA_HOME: /tomcat7
Using CATALINA_TMPDIR: /tomcat7/temp
Using JRE_HOME: /usr
Using CLASSPATH: /tomcat7/bin/bootstrap.jar:/tomcat7/bin/tomcat-juli.jar
Server version: Apache Tomcat/7.0.64
Server built: Aug 19 2015 17:18:06 UTC
Server number: 7.0.64.0
OS Name: Linux
OS Version: 2.6.32-642.11.1.el6.x86_64
Architecture: amd64
JVM Version: 1.8.0_111-b15
JVM Vendor: Oracle Corporation
# 下载 catalina-jmx-remote.jar # 请注意下载版本不要高于当前tomcat版本.
wget http://mirror.bit.edu.cn/apache/tomcat/tomcat-7/v7.0.57/bin/extras/catalina-jmx-remote.jar -O lib/catalina-jmx-remote.jar
增加如下内容,在 conf/server.xml 中:
<Listener className="org.apache.catalina.mbeans.JmxRemoteLifecycleListener"
rmiRegistryPortPlatform="12345" rmiServerPortPlatform="12346" />
因为我们已经在conf/server.xml定义了rmiRegistryPortPlatform,所以要将bin/catalina.sh中CATALINA_OPTS的com.sun.management.jmxremote.port去掉,否则会因为jmxremote.port配置有优先级更高而导致配置失效。
CATALINA_OPTS="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false"
完成之后,重启 tomcat 这时会发现 jmx 默认端口已经固定为 12345 何 12346,而 server 依然可以正常获取监控数据。
3. Configure Zabbix Server
首先需要修改 zabbix_server.conf 启用 zabbix-java-gateway,让 zabbix 可以检测到服务,修改如下:
### Option: JavaGateway
# IP address (or hostname) of Zabbix Java gateway.
# Only required if Java pollers are started.
#
# Mandatory: no
# Default:
JavaGateway=10.211.55.4 # 设置为你的zabbixsever IP
### Option: JavaGatewayPort
# Port that Zabbix Java gateway listens on
#
# Mandatory: no
# Range: 1024-32767
# Default
JavaGatewayPort=10053 # 设置服务端监听接口
### Option: StartJavaPollers
# Number of pre-forked instances of Java pollers
#
# Mandatory: no
# Range: 0-1000
# Default
StartJavaPollers=5 # 设置多线程启动
然后修改 zabbix_java_gateway.conf 配置如下:
### Option: zabbix.listenIP
# IP address to listen on
#
# Mandatory: no
# Default
LISTEN_IP="10.211.55.4" # 配置监听IP
### Option: zabbix.listenPort
# Port to listen on
#
# Mandatory: no
# Range: 1024-32767
# Default
LISTEN_PORT=10053 # 配置监听端口
### Option: zabbix.pidFile
# Name of PID file
# If omitted, Zabbix Java Gateway is started as a console application
#
# Mandatory: no
# Default
# PID_FILE=
PID_FILE="/var/run/zabbix/zabbix_java.pid"
### Option: zabbix.startPollers
# Number of worker threads to start
#
# Mandatory: no
# Range: 1-1000
# Default
# 不能大于zabbix_server.conf的值,否则可能导致当连接Java gateway时没有多余的线程进行处理
START_POLLERS=5
最后启动启动 zabbix-java-gateway,并重启 zabbix-server
[root@6 ~]# service zabbix-java-gateway start
Starting zabbix java gateway: [ OK ]
[root@6 ~]# service zabbix-server restart
Stopping zabbix server: [ OK ]
Starting zabbix server: [ OK ]
我在尝试重启发现一问题,zabbix-java-gateway 通过 service 命令管理 stop 不能删除 pid 文件导致服务无法启动,如果你也碰到,解决办法如下:
[root@6 zabbix]# vim /etc/rc.d/init.d/zabbix-java-gateway
# line 97, 注释修改为如下
# kill `cat $PID_FILE` && rm $PID_FILE
rm -f $PID_FILE
4. Adding jmx host on Zabbix Web consloe
首先,上传 Template Tomcat Head Memory 模板,这个我做了一个简单的模板,只针对了堆内存空间的监控,并针对使用率超过 60% 以及 80%,不同的警报。需要的同学可以直接从我这里下载,然后在 Configuration-Templates 导入到 zabbix 模板库内。 下载请点击:Template App Tomcat Head Memory
然后,增加服务器的 jmx 监控
关联模板