阿里云冯诗淳:ACK容器服务生产及可观测体系的建设与实践"/>
阿里云冯诗淳:ACK容器服务生产及可观测体系的建设与实践
嘉宾 | 冯诗淳 整理 | 黄文勤
出品 | CSDN云原生
2022年第一季度,在Forrester发布的公共云容器平台分析师报告中,阿里云容器服务ACK进入领导者象限,ACK的可观测能力得到了分析师的高度肯定。由此可见,可观测性已经成为构建用户IT系统运维体系的重要能力。
2022年8月9日,CSDN云原生系列在线峰会第15期“Prometheus峰会”上,阿里云容器服务团队可观测体系负责人冯诗淳分享了阿里云ACK容器服务生产及可观测体系的建设与实践。
ACK可观测性体系
上图是ACK可观测体系的全景图金字塔,从上至下可以分为4层。
-
Business Monitoring业务监控,包括用户业务的前端流量、PV、前端性能、JS 响应速度等监控。通过容器服务的 Ingress Dashboard 来监测 Ingress的请求量以及请求的状态,用户可以定制业务日志,通过容器服务的日志监控实现业务的自定义监控。
-
Application Performance Monitoring应用监控,由ARMS APM产品提供用户Java Profiling和Tracing等能力,也支持OpenTracing和OpenTelemetric协议的多语言监控方案。
-
Container Monitoring容器监控,包括容器的集群资源、容器Runtime层、容器引擎以及容器集群的稳定性。使用阿里云Prometheus在一张Global View的大盘中展示不同集群层面的资源、应用、水位、云资源等,也包括事件体系和日志体系。
-
Infrastructure Monitoring基础资源监控,包括不同的云资源、虚拟化层、操作系统内核层等,容器层和基础架构层都可以使用基于eBPF的无侵入式架构和K8s监控能力做网络和调用的Tracing。
可观测体系的每一层都和可观测的三大支柱Logging、Tracing、Metrics有着不同程度的映射。
场景一:异常诊断场景的可观测能力实践
上图为用户的异常诊断案例&#x
更多推荐
阿里云冯诗淳:ACK容器服务生产及可观测体系的建设与实践
发布评论