众所周知公有云厂商多年前就开始推广 IaaS 服务了,但真正在 IT 工业生产线普及也是这几年随着[2B]业务的发展才刚刚落地。国内在 IaaS 领军地位的云厂商都是从消费类型企业转型到[2B]领域,对于企业级的产品理念与国外相比还有很大差距。

例如微软的 AD 产品,这样一个看似简单的产品在国内云平台还没有对标的服务,而这个产品正是 Azure 的一个杀手锏。我不想过多的谈论这次某云平台的事故,普通软件公司一款关乎安全的全新产品上线都会有重大风险,而在一个云平台更会被放大和广泛传播。这种问题就像自来水这种廉价、方便的公共资源,如果污水处理厂有些许差错,千家万户民众的生活都会被影响。但相信随着云平台的越来越普及,产品研发、运营规范不断优化,经过一个阶段的成熟期,云平台会越来越好。

事故过后,吐槽的吐槽、投诉的投诉,但一个关键问题:如何用好公有云这种廉价、方便、快捷的资源,才是关键! ‌

事故过后的思考: Could Insight 拨开云雾见月明 行业新闻 第1张

OneAPM 性能监控的强大功能就不冗述了,我们的客户尤其是云平台上的客户口碑都一一验证了 OneAPM 的巨大价值。我想介绍的是最近 OneAPM 在大力研发的一款重要产品 Cloud Insight(Ci)。

Could Insight ? 客户究竟能从云平台里看到什么呢?

前不久微软收购了 BlueStripe,他们的 FactFinder 是实时监控分散的应用比如数据库或应用服务器的各个组件,不论这些应用位于家中还是公共云上均可。如果某个组件出现问题或运行速度低于预期,FactFinder 就会向管理员发出警报。

关于这次云平台重大更新事故,其实这是一个已知事故,就客户而言对于业务的影响、损失统计比单纯的性能错误分析更具实际意义。Cloud Insight 就是这样一款 Killer 产品。假设这次事故影响了一个电商客户,客户下单出现问题,Cloud Insight Dashboard 展现的用户数据业务流可以帮助客户分析出业务流是在哪个数据服务组件出现了断路(Mysql、Redis、MongoDB、Memcache等)或是性能指标低于预期。如果这些组件正好位于受云平台更新影响的集群,客户可以尽快跟云厂商沟通,快速恢复或隔离基础设施,以最快速、最经济的方式帮助客户和云平台处理事故、评估实际业务损失。

事故过后的思考: Could Insight 拨开云雾见月明 行业新闻 第2张

另外,国内第一个 SaaS 模式的云告警平台 OneAlert 刚刚发布,集成多数主流的监控工具:目前已经支持国内外主流 10 多种工具告警接入,包括阿里云、腾讯云、VMWare 等云平台,以及监控宝、Solarwinds、ZabbixNagios性能监控工具,而且新的工具还在不断扩充中。OneAlert 跟 Cloud Insight 的深度集成,不仅会为客户提供面向 DevOps 的运维报警监控,更加会帮助客户实现业务流的实时报警监控。将 APM 监控提升到一个新的高度。

事故过后,需要的是沟通、思考、研究、总结,国内 2B 的 IaaS & SaaS 服务之路任重道远,OneAPM 会不断根据客户需求加速研发、丰富产品线,为各大云厂商优质地服务客户保驾护航。

OneAlert 是北京蓝海讯通科技有限公司旗下产品,是国内第一个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。想了解更多信息,请访问  OneAlert 官网,欢迎免费注册体验 。