监控平台简介
用好监控,事半功倍
H5,H5页面制作工具
服务运维人员 提升运维能力
监控平台能做什么
CAPABILITY
生产调度
CPIC
- AIX的主机,还会通过Errpt监控硬件状态;HP服务器,也有专门的硬件监控;虚拟机,更是直接与虚拟化平台集成接收异常告警。
- 仅有ping监控肯定是远远不够的,我们默认还会监控操作系统的一些常规参数,比如CPU,内存,网卡流量,磁盘IO,文件系统或磁盘使用率,操作系统时间等。
- 首先,监控主机是否能ping的通是必须的,CMDB里已经投产的主机,都会自动监控Ping。
下面这些,都是最基本的。。。
基本监控
- 非标准应用
- 数据库
- 中间件,web
相对于操作系统本身,监控更加关注服务器上运行的各项功能。。。
功能监控
没有应用功能的服务器,不是好服务器
- 数据库团队的小伙伴们还根据运维经验,还自己定制了DG、DSG同步情况,TX锁,索引状态,Event wait、Sequence状态等有针对性的监控
- 用户连接数
- 表空间使用率
- 实例状态
数据库监控
- 如果觉得还不够,别着急,接着往下看
- 中间件连接数Heap 使用率队列长度
- 日志报错
- 实例状态端口状态连接池状态
中间件和应用监控
能用好监控的运维,才是好运维!
- 1. 文件监控 - 文件是否存在,文件大小,文件个数,文件存活时间。2. 进程监控 - 除了监控进程个数,还可以监控进程占用的CPU、内存3. window Event监控 - Windows服务器上,很多应用会将信息写入Event log,可以通过监控Event Log,做很多。。。4. 数据库查询值监控 - 如果需要监控的数据值已经在数据库里,我们可以直接运行数据库查询语句,根据查询返回结果进行监控。
监控进阶
- 2. 标准接口,告警接入。如果你的系统或平台已经有了自己的监控功能,可以直接调用我们的标准接口(SNMP,Msend),将告警发给集中告警平台,就有操作员可以帮你7*24监控派单了。
只要脚本写的好,没有监控做不了!
- 1. 系统好不好,能用才是真的好。如果你的系统有web入口,我们可以模拟用户去尝试打开网页,甚至可以按照你的要求,输入帐号密码,点击菜单按键,如果没得到我们预想的结果就会告警
终极大招
- Netcool - 安全监控网络监控OneAPM - 应用监控webgate - 应用监控龙控 - 机房环境监控Nbu - 备份管理平台Qmonitor - 数据库监控存储管理平台- 存储监控
以上这些,都已经接入了我们的集中监控平台!
监控家族的兄弟姐妹
- 内网地址:http://ITom.cpic.com.cn邮箱:Jkgly@cpic.com.cn
- 其实,我们还有很多别人都不知道的小诀窍,你来,我偷偷的告诉你。。。。
联系我们