最新文章

李欣

2016年01月21日

OneAlert 入门(一)——事件流

OneAlert 入门(一)——事件流 OneAlert 是国内首个 SaaS 模式的云告警...

宋立岭

2016年01月19日

告警分析:如何帮助运维团队快速做出最佳决策?

「路漫漫其修远兮,吾将上下而求索」,「转身」不见得华丽,但我必须「转身」,不要安逸于现在的运维...

宋立岭

2016年01月18日

MTTR 是什么?或者说为什么别给婴儿喝白兰地

在团队纷纷谈起工作效率的时候,对运维工作者,他们通常喜欢用「故障的平均解决时间」来衡量团队的工...

宋立岭

2016年01月14日

怎样创建合适的告警处理流程?

我们都知道监控对确保网站和应用的平稳运行是多么重要,但这只是一个方面。一旦发现错误,监控软件发...

李欣

2016年01月07日

「技术大牛」是如何缩短事件平均解决时间的?

前不久,我们讨论了运维不容错过的 4个关键指标,其中平均解决时间(MTTR)被认为是衡量业务的...

李欣

2016年01月06日

为什么「告警等级」对缩短平均修复时间如此重要?

互联网时代 IT 相关的衍生产品有很多,监控工具为其中的佼佼者。很多监控工具对于确保网站和应用...

陈伯龙

2015年12月16日

玩转AWS CloudWatch微信告警

做海外业务时大多使用亚马逊 AWS 服务,配套AWS 监控 CloudWatch 功能强大,如...

陈伯龙

2015年12月15日

如何让运维指标变得更有价值?

这是《运维不容错过的4个关键指标》的姐妹篇,上篇文章介绍了优秀运维团队需要关注的4个关键指标,...

刘欣柔

2015年12月09日

这样查看告警邮件要慢一点……

当然不是指像上图那样一边开着车听着歌,握着男/女朋友的手,一边查看告警邮件的时候要慢一点。...

刘欣柔

2015年12月07日

亲,根据二八定律,你的监控工具可能白装了哦

如果你在 IT 圈搬砖工作,那你一定对「帕累托法则」并不陌生(画外音:完全没听说过好么)。「帕...