《周易》曰:天行健,君子以自强不息。地势坤,君子以厚德载物。

高中读书的时候,老师最喜欢拿清华校训来激励我们,然而不争气的我,寒窗苦读三年,无奈于资质太差,止步大连某211学校。也许天生就有屌丝程序员的命运,大学填专业的时候,又阴差阳错学习了计算机专业,学校男女比例又是7:1,基佬的潜质暴露无疑,本以为和高中挚友能够一起在帝都「同呼吸,共命运」,当时不得不向现实低头。

今年大学毕业来到了北京,怀着高中时对帝都的憧憬,在一家互联网创业公司做运维工程师。时隔几年,北京早已物是人非,四年前北京空气还没有现在这么糟,地铁还没这么贵,交通还没这么差。高中时的挚友已经成为了金融界的新星力量,女朋友在我的眼里更算是「倾国倾城」(PS:我没见过几个女的)。但是,因为我工作的原因,我们常常聚少离多......

运维狗的北京爱情故事...... 技术分享 第1张

此时此刻,我正面对着成百台的服务器,敲着熟悉的命令行,祈祷着「祖宗们」周末不要出问题。加班到九点,确认了服务器运行稳定,离开了公司。点燃一根香烟,望着帝都没有星星的天空,思绪万千,意淫着「北漂能够成功,十年后出任CEO,迎娶白富美,走向人生巅峰的日子」,脑子中重复回想老板「面向未来编程」这句话。梦想的水晶瓶就是这么容易被打破,Foxmail 提示声音让我从二进制的赛博世界回到现实世界。打开邮件,「**服务器宕机了,持续时间一分钟」。扔掉手中烧掉一半的香烟,深吸一口气(我真的敢):「Fuck,老子这辈子就和你们过了!」

又是一个周六,可能是昨天折腾了很晚的原因(折腾服务器,别多想)。醒来已然是十一点多。人真是个容易满足的动物,至少我是这样,能睡的这么踏实,对运维工作者来说简直是最好的慰藉。不但证明了自己工作的高效性、可靠性,同时也给自己的身体一份满意的答卷。自己租房的小区景色还不错,然而最让我满意的是一睁眼就能看到远处高耸威严的大厦--网易大厦。对于北漂的人来说,需要这么一种信念来支撑、督促自己去奋斗,「比自己优秀的人比自己还努力」这句话,对任何一个有血性的男人来说都是那么的刺耳和不爽。

然而生活总是无时无刻不给你惊喜,不是收到网易的offer,不是床下面突然多出来的几百块钱,更不是老板的突然加薪通知。我只是发现 TMD 老子的信念不见了,远方的大厦湮没在了茫茫的大雾中。也许是自己没见过世面,但是这么大的雾霾还真是第一次遇到,也是第一次领略的北京雾霾天气。之前只是听说怎么怎么样,这次是真正的见识了。「好事永远是接连不断的」,生活又给了我第二个惊喜。看着手机 Foxmail 应用上那几十的数字,顿时有种要窒息的感觉。服务器又出什么问题了?怎么会有这么多的报警邮件?业务会不会受影响?Zabbix 监控坏掉了吗?心中一万条草泥马奔腾而过,最关键的是为啥我没有被手机提示音提醒到?????????如果影响了业务会不会离职???

运维狗的北京爱情故事...... 技术分享 第2张

怀着忐忑的心,一封封的打开未读的邮件,情况并没有想象中那么糟。大量重复的告警信息占据了大部分内容,看了大概三十多封意义不大的邮件,终于发现了一封非常严重的问题。「Tomcat服务挂了,持续10小时。」 一个箭步打开电脑,VPN 搞起,看 log,重启服务。不能影响业务....还好这个节点晚上流量少,但是这也是大事故啊,怎么办?老板会不会察觉呢? 接下来几天的心情和北京天气一样压抑,直到几天后天空放晴,服务器的事情并没有人追究,担心的事情并没有出现,默默叹口气。

一阵大风吹走了北京的雾霾,如果没有风,是否还会一直持续下去?将希望寄托于老天爷,人们却无能为力?难道每次遇到问题我们只能去祈祷吗?看着朋友圈晒雾霾过后的美丽夜空,虽然开心,但也想到了斯德哥尔摩综合征。我将这个现象和运维工作关联起来,我们天天被服务器的告警信息左右自己,习惯了告警风暴,更有甚者,喜欢上了告警风暴,如果哪天没有告警风暴还会觉得不适应。然而仔细想想,这样的工作方式、告警方式是非常不健康的,并没有真正的为工作者考虑,而且现有单一的告警方式并不能解决告警必达的问题。为了避免告警的遗漏,我们需要寻找一个多方式多通道的告警平台来解决现有问题,而且有可靠的多通道负载均衡机制保证告警消息的到达率,并且可以做到多用户的分派、告警升级的机制,甚至有告警压缩的功能。

也许是上天的垂青,勤奋的程序员为了解决运维同学遇到的问题,开发了一套功能强大的告警平台——OneAlert 。多通道的通知服务保证了告警消息的到达率,多用户通知和升级机制保障了告警消息不会遗漏,多方式告警压缩保护了运维同学不会被无用的消息阻碍了寻找真相的道路。此刻我的心中「内牛满面」,也许真的可以不用在忐忑不安,也许真的可以稳稳的睡个好觉了......

北京的大风天气过去了,感觉天空又像刚刚哭过的一样。不知道和服务器打交道的日子还有多久,但是能够每天看着他们安静的运行、能够保障公司业务的稳定性,对自己来说也应该是最好的安慰了吧。「业务程序慢了是我们的锅,服务不可用了是我们锅」,大多时候被老板指责的时候,真的想反驳一句话:也许是开发的程序写的有问题呢?也许是数据库处理的慢导致的呢?为什么不用 OneAPM 看看代码是不是有问题呢?生活还在继续!既然老板认为是我的问题,我的锅就是我的咯。

运维狗的北京爱情故事...... 技术分享 第3张

又是一个加班的夜晚,下班后穿梭在北京的大街小巷。叮、叮、叮,以为告警邮件又来了,紧张的拿起手机才发现是微信消息。生活总是会给你带来惊喜,追求两年的女神突然同意和笔者在一起了,她说:「我们在一起吧,原来做运维的都是这么有责任心、有情怀的人,之前是我不理解你」。不敢相信自己双眼,站在原地好久,才反应过来,今天逛朋友圈,转发了一篇文章叫《运维狗的北京爱情故事......》。

本文根据真实故事改编,如有雷同,那肯定是巧合!