时光匆匆,记录是对思维的沉淀.

也说说监控 - 思考

日期:2016.12.09

最近在用空闲时间看十月份就买的《SRE:Google运维解密》,说到IT监控就有了话题;

自从08年来到魔都,第一份工作就是运维监控,是中软的外派工,常驻太保南汇机房,对IT硬件、存储、网络、磁带机、大型机等硬件设备有了一个直观的认识;

金融保险行业的IT监控主要是从软硬两方面来做的,每天机房、机器巡检、空调温度、状态等这些都是硬件方面,此处不做过描述。

软件方面那会基本大部分是商业监控工具,时间太久名字都记不清了,总之会对服务器各个状态进行监控,根据状态阈值进行事件等级自动升级等等,比较完善; 1730978474.jpg

游戏行业就多了,各类开源工具,nagios、cacti、zenoss、zabbix等等,也有一些公司自己基于开源工具自己开发的,最近几年zabbix使用率比较高;

对于运维来说,不管是那个行业,监控是必不可少的,基本是运维的眼睛了,这点Google的SRE也不例外,不过他们更多的是把监控工具当作软件工程来做,精细化很高,基本成了业内的标杆,国内做到这点的公司不多;事故萌芽期、高峰期等等,是分析系统的瓶颈、故障的利器。

发表评论