在不断迭代的过程中,Cloud Insight 也很重视客户对产品的使用体验,这次我们拜访了晨芯时代,了解到他们在使用 Cloud Insight 过程中对产品的一些想法。

客户背景

晨芯时代是一家开发电视盒子等产品的公司,由外包公司为其产品进行服务器端开发,他们自身不在服务器开发和系统运维方面进行特别大的投入,因此选择使用我们的产品 Cloud Insight——即 Ci,进行服务器端的监控。

晨芯时代一共搭建了9台服务器(CentOS),部署有 MySQL、Memcached、Nginx、Redis,使用 CI 监控系统和除 Redis 外的其他三项服务。他们主要关注系统网络与进程的性能指标。在使用 CI 之前一直使用 OneAPM Servers 监控系统性能指标。

Cloud Insight 采用 StatsD 的采集技术,对接 MySQL、Redis、MongoDB,以及 CentOS、RedHat 操作系统,利用 Hbase 存储和 OpenTSDB 的数据聚合、切片等功能,最终流向 Cloud Insight 进行展现。从而帮助晨芯时代实现低成本、高效的自动化运维。

Cloud Insight 客户案例-晨芯时代科技有限公司 客户案例 第1张

面临问题

由于客户是初创团队,在人员和资源方面都比较不足,且暂时并不打算在服务器端开发和运维方面投入太大的人力成本,因此需要一款优秀的性能监控工具帮助其提高在运维方面的效率同时降低运维成本。

客户之前使用 OneAPM Server 监控主机服务器,帮助其在遇到网路性能瓶颈与内存占用率过高时更快的定位系统问题,提高解决问题的效率。现在使用 OneAPM Cloud Insight 来更好的实现这一点。

解决方案

首先 Cloud Insight 通过拓扑图让用户能够直观的看到集群结构,快速定位性能不佳的机器。上帝视角管理主机,逻辑清晰而且方便。

Cloud Insight 客户案例-晨芯时代科技有限公司 客户案例 第2张

通过平台列表可以大致了解各个 host 的基本性能情况,包括实时状态,CPU 占用率、I/O Wait、搭载的平台服务等信息。

由于客户主要关注 System Networking 这一块的性能,那么着重来看一下这一块,总览页可以看到某个主机的实时运行情况,包括 disk io, network、CPU 等数据。而通过仪表盘我们可以看到多台服务器的统计数据,Cloud Insight 通过对数据进行聚合与分组,让数据对客户来说更有意义。关于数据聚合与分组功能,可以参考文章  数据聚合 & 分组:新一代系统监控的核心功能

通过 Cloud Insight 监控 System Networking 截图如下:

Cloud Insight 客户案例-晨芯时代科技有限公司 客户案例 第3张

而通过 Memcached、Nginx、Mysql 三个平台各自的性能图表,我们可以锁定对系统性能产生影响的模块,从而更好地明确优化性能的方向。

Cloud Insight 客户案例-晨芯时代科技有限公司 客户案例 第4张

客户反馈

不足之处

  1. 仪表盘展现形式不够丰富,全部指标都是用折线图来展示,不如之前 OneAPM Server 的展现形式直接易懂。

  2. 指标单位使用不符合用户习惯,例如客户提到在网络传输上他们一般习惯使用 bits 而我们提供的是 bytes,导致使用时混乱。

  3. 安装平台服务时不够简化,希望安装能够实现命令行化。

  4. 指标参数太复杂导致其不会使用自定义仪表盘。

  5. 整体使用感受不如之前 OneAPM Server 简单易用,很多性能指标需要进行再次转化才能得到客户需要的结果,客户认为不够傻瓜化并没有减少运维人员的工作量。

而针对用户提出的这些,我们的想法是

  1. 我们会针对「System 总览」这个仪表盘,进行优化。添加排行榜、位移图、状态图、曲线图等多种展现形式,来提高可读性。而这些可视化的形式,未来会增加自定义的功能,满足不同用户的使用习惯。

  2. 我们会在六月份前后提供单位的自定义功能。除此之外,也将在自定义仪表盘中,提供指标的代数运算。从而可以通过加减乘除,来自行消除这样的问题。

  3. Cloud Insight 其实已经是一行命令就可以安装了,大部分用户都称赞我们的安装非常简单。

  4. 指标方面我们会提供自定义解释字段的功能,增加指标参数的解析引导帮助,将指标的单位修改为用户习惯使用的单位,改进用户体验,提升产品的易用性。也希望有需求的用户多阅读官方文件和我们的文档进行学习。

  5. Cloud Insight 之所以没有自动发现平台服务,是为了让用户通过配置,更加了解自己的技术栈从而实现更好的管理。

客户对 Cloud Insight 价值的认可

  1. Cloud Insight 能够更傻瓜化进行性能监控,监控数据全面,界面优美,极大地方便了对运维有需求却缺乏人力和资金的创业公司,是刚需产品。

  2. 能够监测平台服务的性能指标是产品的亮点。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。