企业级监控系统-监控摄像头企业级-监控级企业级
10 月 30 日,全球权威数据调研机构 IDC 正式发布了《中国云市场 2019,厂商评估》报告。京东云凭借其丰富的场景以及强大的实践能力,还有高质量的服务交付以及稳定的平台,取得了非常优异的成绩,从而跻身到“Major”(核心厂商)的位置。京东云能力源自自身的业务实践,针对京东集团的复杂业务场景进行打造。此能力经受住了多次 618、11.11 电商大促的严峻考验,从而保证了高效高质的交付,也能对变化进行灵活应对。它能够支持复杂场景的自动化运维需求,还能实现工具链产品与平台化产品的结合,帮助客户依据不同需求灵活定制方案。
为了让大家深入理解,我们要让大家了解京东云具体的落地实践,以及如何提升效率与保障稳定性,还要让大家进一步结合自身业务进行设计实施。我们第一期重点为大家介绍监控部分,通过了解京东云企业级监控的设计,能更好地理解监控系统的样貌。
监控目标
监控对于运维来说至关重要,它的目标在于能够迅速地察觉问题,准确地进行定位,及时地采取止损措施(从知晓到行动),以此来缩短异常的平均修复时间(MTTR)。为了实现这个目标,期望监控系统具备以下这些方面:
监控标准
https://img1.baidu.com/it/u=330428414,866910491&fm=253&fmt=JPEG&app=138&f=JPEG?w=1085&h=500
介绍完监控目标以及监控系统应具备的功能点之后,暂不探讨监控系统的实现方式,首先来回答一个问题,那就是如何确认监控已经加全了呢?是否存在遗漏呢?
很多同学可能会遇到此类问题,基于此,京东云制订了一套监控标准,引导用户进行监控添加操作,以保证监控能够“加全”,防止出现遗漏情况,具体详情可通过图来查看。
监控标准分为四层,从下往上看:
典型监控系统设计
了解监控目标并定义监控标准后,就对要解决的问题域有了一定的背景知识。接下来大概介绍一下典型的监控系统包含哪些功能模块。本文只是进行一个大概的介绍,后续会对不同模块方向进行一些专门的介绍。
https://img0.baidu.com/it/u=225547957,1912736817&fm=253&fmt=JPEG&app=138&f=JPEG?w=845&h=500
上图还是分为四层,从下往上我们依次来介绍:
最底层是数据抽象层。大家或许会看到较为熟悉的词语 CMDB。这一层将资源视角抽象为运维与运营视角。例如,你搭建了一个卖书的网站,使用了 nginx、mysql 等程序。在资源视角中,这些是一台台机器在互联的 idc 环境中运行。但可以将其抽象为这是一个卖书的产品,有 mysql、nginx 等应用。这样,你的监控数据自然能够附加这种属性(标签),并且在后续数据处理时能够发挥作用。
数据抽象层的存在,统一了我们对于监控实体的认知。基于这个抽象,上一层是数据采集层。在数据采集层,列举了众多采集方式,如进程采集、日志采集、自定义采集、接口 pull 采集以及产生数据后主动 push 采集等。整个数据采集的过程,是一个标准化的过程,通过各种手段将观测对象的数据收集上来,并转换为我们监控系统所定义的数据格式。
数据采集完毕后,就进入了加工的过程。我们回想一下,监控的目标在于发现问题、定位问题以及解决问题。所以必须对数据进行加工,而这又可以划分成以下这些处理流:
数据经过处理后,最终是供人使用的。最上层为数据的展示层,此层需展示对用户有效的数据。用户凭借这些数据能够迅速发现并定位问题,并且能通过数据分析及时采取止损操作。也就是说,要让数据更好地为用户服务。
综上,我们能了解到,监控系统是以数据为核心的。它在数据的基础上扩展了自身的处理能力。后续我们会对各个方向进行更深入的讲解。也欢迎各位与我们进行交流。
页:
[1]