服务器是一台 k8s 的 worker 节点,48 核 384G 内存,跑着大概 65 个容器(tomcat 的容器占 70%),最近经常负载突然拉高(30->80),但是 CPU 的各项指标没有异常,然后过不到 1 分钟就恢复了(后续从小米的 falcon 监控试图看的),看了一下当时的系统日志没有发现异常,k8s 层面当时该技术有一个容器自身探活失败被重启了(也就是一个 tomcat 工程),而且不能十分确定就是它重启导致的,因为重启个 tomcat 按理来说不该把负载拉高,而且 CPU 并没有被拉高。请问大家这种情况怎么定位出导致负载拉升的原因?或者说 CPU 使用率正常(system,user,iowait)的情况,负载突然高了如何定位问题?感谢🙏