2009-03-29
Some useful tools
This is a netflow monitor tool, you can capture, graph and store data.
Founded in 1992, the Distributed Management Task Force, Inc. (DMTF) is the industry organization leading the development of management standards and integration technology for enterprise and Internet environments.
Social Networking Meets Business, Concursive have CRM, online communitie, collaboration tools.
2008-09-13
NeDi - A Swiss Army Knife of network device management
There is a shot list of its feature
- Auto discovery network deivce
- Network Topology-Map
- SNMP based monitoring
- Network performance and inventory management
2008-02-02
Hyperic HQ 3.2 new features
If you'd like to check out release note, please click here. http://support.hyperic.com/confluence/display/DOC/HQ+3.2+Release+Notes
I had a quick install on RHEL 5. For some features what I saw, I took some screenshots as bellowing. I hope this helps you to understand what's new in 3.2 and save a little bit time for you if you do not wants to install it. I will describe in Chinese.
New Nav menu 新导航菜单
导航菜单的名称变成了:Dashboard -- Resources -- Analyze -- Administration 菜单的风格稍微有一点变化。Analyze下面可以进入Alert Center去查看报警信息。我觉得3.2毕竟是一个小的功能增进板,添加了支持MY SQL的支持。增强了对Nagios的集成。对Nagios的集成对它还是很有好处的,由于它自己是Agent Based的监控方法,而Nagios是Agentless的监控方法;集成之后通过它的web界面能统一管理,还是挺好的。不过和Nagios具体能集成到什么程度,我还没有试过。
Currently Down Resources当前宕机资源
如果所示:各种有问题的资源安装各种分类都显示出来,同实现时什么时间出的问题,持续了多久,点击放大镜后查看相关的报警信息。上图显示的是:HQ Agent在w2k3vm这一Windows服务器上没有启动的情况,它报告了包括hq agent自身以及所有相关资源的都宕机的情形。同时作为一个监控系统来说,管理员最需要看到的信息可能主要包括两种:1)有那些资源出了问题;2)当前有什么样的告警事件。这里对这两类信息提供了一个非常不错的访问入口。
Live Exec Data实时数据获取
HQ-agent本身只能周期性的采集matrix,在汇报给管理服务器。实时的数据采集对排错还是非常有帮助的。此功能我觉得是3.2版中的最好的增强。它应该是远程的让agent去执行一下命令在把最终结果返回到页面上:
- Cpuinfo CPU信息
- Cpuperc CPU利用率
- Df 磁盘利用率
- Ifconfig 网卡ip信息
- Netstat 网络端口信息
- Top
- Who
这些信息的获取通过agent完成所以和平台无关,即使是Window平台也能收到相同的信息。
HQ Health Check 管理服务器自身检查
一个真正的自监控功能最好能做到对相关指标的报警处理。能设置一些条件,在不正常情况发生的时候报告管理员说出管理服务器那里有问题了。上图可以看出,hq已经做出了第一步,能采集并且显示很多HQ服务器运行的状态信息。
Summary:
在3.2的发布说明中还提到它自身的扩展性也很大的增强,这一点对hq来说尤为重要。由于它的结构是基于代理的,当监控的设备和资源都非常多时,hq管理服务器自身的处理能理将会成为瓶颈,如果它的处理,存储和网络上的任何一个环节出现了问题,整个监控系统就失效了。由于事件有限,目前还留下了一些问题:
- Global Alert Disable是在那里设置的?
- 报警阀值的设置是否有全局设置的地方?(例如:对所有windows机器都设置一个CPU>80%的阀值)
如果您对以上两个问题有些答案请回复告诉我。关于HQ的其它文章,清在本blog中搜索。
2008-01-22
网管系统的测试工具
很多网络系统管理软件都有Trap管理的功能,在系统的安装和配置过程中;验证系统是否能正常处理Trap是很麻烦的事情。原因有很多,发送trap的设备没有,设备上的snmp没有启用,或者设备都正常,到网管系统的网络可能有防火墙吧snmp给堵住了。
为了方便的测试和配置网络管理监控系统,需要手工生产和验证trap的发送和接收。最近偶然在网上发现了这样几个免费(非OSS软件)软件工具,可以做这件事。
下载的网站是:http://www.ncomtech.com/ 下面吧我所下载和测试的软件做一个小结,希望对您有所帮助:
- Trap Receiver http://www.trapreceiver.com/ 是一个Windows程序非常小,安装了之后会在windows安装一个服务。程序的启动目录是C:\Program Files\Trap Receiver\TrapRcvr.exe 程序界面非常简单,如下图所示:
点击configure按钮后可以做一些配置:Action --当收到某些特定的trap是出发邮件、声音等动作;logging--把收到的trap信息按照某种格式记录在文件中;Mibs--导入目标设备的trap文件,让这个接收器能认识到另外的trap格式。还有其他配置信息也非常简单。
- TrapGen http://www.ncomtech.com/trapgen.html 顾名思义-这就是一个手工生产和发送trap的工具,是一个命令行工具。example: trapgen -d 192.168.2.3;上图中的第一条和第三条就是用这个命令发出的trap。欲知详细帮助信息,使用"trapgen -h"
- I/F Spy http://www.ncomtech.com/ifspy.html 是一个网络接口枚举工具,它通过snmp协议去访问目标设备的IFMIB信息,显示所有IFMIB相关信息。
- UDP Listen http://www.ncomtech.com/udplisten.html UDP协议的监听程序,是命令行工具,有linux和Solaris版,能用作一个debug工具。
- Thingy http://www.ncomtech.com/thingy.html是一个Windows下的GUI工具,能帮你监控三个SNMP指标,采集并做大于等于和小于的逻辑判断然后显示不同的信号灯。
这几个小工具都很小,都能在windows下安装和使用对网络系统监控软件的安装、配置和排错应该有一定的帮助。如果您有什好的小工具也请回复一下本文。