返回

谈在线网站服务器监控之使用的必要性(三)

2010-12-06 13:26Chinaz用户投稿

俗语说“人心不足蛇吞象”,在上篇满足基本要求后,需要满足更高级的功能要求。

1、多个地点和线路同时监控

多个监控地点是指同时在不同地方对网站和服务器进行监控,如在广州、北京、重庆等多个点同时进行监控,任何一个点监控到故障都会告警。多线路是指用不同线路(电信、联通、铁通等)同时进行监控。地点和线路是组合一起使用,如广州电信、北京联通等。

中国互联网人为的划分为南北,南方主要是电信、北方主要是联通(以前的网通),还有其它教育网、铁通等。不同网络线路访问速度比同一网络线路的要慢和不稳 定,如电信访问联通要比电信访问电信慢几倍,并不时会出现互联不通的情况。再加上地点不同,情况更复杂。如在广州Ping广州电信一般是 10ms,Ping广州联通一般是30ms,Ping北京电信是20ms,Ping北京网通是60ms。我们在广州经常会监控到广州电信线路不能访问广州 联通线路的情况。

大部分站长和网管自己没条件进行多个地点和线路监控,在线监控轻而易举帮你解决这个问题。如你的网站服务器是面向全国的,更需要多地点和线路监控。

2、故障告警支持主要告警和次要告警

服务器一般同时开通多种服务,如网站服务、邮件服务、FTP服务、数据库服务等,网管们喜欢能同时监控这些服务是否正常。如果不分主次的话,当服务器出现网 络故障或者维护重启时候,你会立即收到网站故障告警、邮件服务告警、FTP服务告警,更惨是这台服务器短时不能恢复时候,告警消息源源不断发给你, 直到服务器恢复正常或者你崩溃为止。

对于监控同一台服务器的服务,需要定义一个主要监控对象,当主要监控对象出现故障,只发送主要监控对 象的告警,其它次要的监控对象暂停监控和告警。例如用Ping来做主要监控对象,如果Ping不通出现Timeout,表示服务器已经当机或者断网,这时 只发送服务器Ping告警持续监控Ping,因为再继续监控和告警其它服务已经没有必要。这样能大大减少告警消息数量,又让监控更加合理、更加有效率。

3、自定义告警条件

一 般的监控到的结果是成功或者失败,如Ping不通、访问网页出错、连接不到Socket,发生时这些称之为故障,故障是最优先的告警。除此之外,还能监控 到返回的延时、内容等,如Ping返回的延时、访问网页的时间、访问网页取到的内容等。利用返回的结果可以自定义告警条件,如Ping监控的返回延时一般 是10-30ms之间,当延时大于100ms时候,表示网络或者服务器可能出现问题,引起网络响应慢,需要立即检查是否流量过大或者服务器CPU太高等问 题。

自定义告警条件能更加细化监控内容,精确知道网站和服务器状态,在故障准备发生前争取到更多时间去解决问题。

4、自定义告警消息内容

告警消息内容非常多,如告警网站名、服务器IP、监控的线路、监控的服务、出错信息、发生时间等,自定义告警消息内容能自由选择收到的告警内容,修改为完全 适合自己的实际要求。这点对于用短信接受告警内容特别有意义,短信内容最多是70个字符,要在70个字符完全知道故障内容比较困难,更需要能自定义内容, 调整为在有限字符内容下也能知道故障时间、故障内容,如:“007电影网12:32电信线路监控第到1次失败”,清晰明了的知道故障信息。

5、通过邮件接收汇总报表

当网站和服务器没多大问题时候,大家都懒得登录到在线监控服务管理后台查看。如果每天能收到一封网站服务器监控的汇总报表邮件,花个两三分钟就大致了解网站和服务器状态。

6、被动监控

主动监控虽然能不需要安装代码和程序,非常安全和方便,但缺少很多细致的监控内容,如无法获取硬盘大小、CPU的使用率、网络的流量等,这些监控内容非常有用,如CPU太高表示有网站或者程序出问题,流量太高表示可能被攻击等。

被动监控常用的是SNMP(简单网络管理协议),通过SNMP能监控到大部分你感兴趣的内容。大部分操作系统支持SNMP,开通管理非常方便,也非常安全。SNMP缺点是比较占用带宽,会消耗一定的CPU和内存,在CPU太高和网络流量大情况下,无法有效进行监控。

【作者相关文章】

谈在线网站服务器监控之使用的必要性(一)

谈在线网站服务器监控之使用的必要性(二)

本文作者:中域互联应用与服务原创,转载留下文章出处。

相关文章 大家在看
网站服务器
1236篇文章
查看