1
huangsijun17 5 天前
1. null 值处理问题。
2. 能不能调低采集维度? 3. 告警按照时间段设置? |
2
Vraw5 OP @huangsijun17 #1 获取数据的操作是阿里云那边做的,我们只能配置监控报警规则的阈值,所以 1 和 2 都做不了。3 告警时间可以配置。
主要问题还是无法覆盖真实的 key miss 的情况,因为无 qps 会弄脏统计结果 |
![]() |
3
opengps 5 天前
计算公式里本身就藏着这么个问题,无访问时候的 qps 写成 0%或者 100%都有副作用。这时候确实得考虑写个定时循环每秒读取 1 次
|
4
Vraw5 OP @opengps #3 我是这么想的。如果设置成 100%时,监控上出现 100%,要么没有 QPS 要么都命中了,业务上是没出现问题的,不需要告警。即使会拉高命中率,也可以通过拉高报警规则的阈值或者降低周期去配置。如果设置成 0 ,完全无法区分到底是因为没有 QPS 造成还是因为 misses 过多造成的命中率低。
所以我难以理解为啥阿里云会变更这个规则 |
7
spritecn 5 天前
写个 job,每秒写个随机值进去读一下
|
![]() |
9
BenHunDun 4 天前
不知道有没有统计请求量, 感觉这个监控预警是不是应该要有一个最低请求量限制.
即其实在某个请求量下, 其实未命中 key , 访问数据库对业务方是能够接受. 不会对系统造成危害. 通过降低提示等级到 warn, info 提示用户. |