V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
CrazyMoon
V2EX  ›  问与答

系统监控方面有没有什么理论可以学习?

  •  
  •   CrazyMoon · 2020-07-28 17:13:25 +08:00 · 1443 次点击
    这是一个创建于 1360 天前的主题,其中的信息可能已经有所发展或是发生改变。
    背景:之前维护的系统快要下线了,为了不让楼主失业,领导让楼主学习系统监控,使用 Splunk 、Azure 等工具对其它的几个系统做监控。。简单试用了 Splunk,工具本身不难,但问题是自己对监控需求没有全面的想法,也不知道做什么事情会比较有价值。感觉是因为自己没有理论知识的错。

    求各位 v 友推荐一些读物,帮偶增长知识...
    5 条回复    2020-07-31 15:15:48 +08:00
    CrazyMoon
        1
    CrazyMoon  
    OP
       2020-07-28 17:42:46 +08:00
    求回复..
    hyperdak288
        2
    hyperdak288  
       2020-07-28 17:59:05 +08:00   ❤️ 2
    可以看看 可观测性的概念以及相关项目。


    关键词:apm,trace,metric,log,observability,可观测性
    规范:open-tracing,open-metric
    具体实现项目:skywalking,zipkin,pinpoint,prometheus,elastic stack,阿里鹰眼

    书:《 google SRE 》

    可观察性 文稿推荐: https://elasticsearch.cn/slides/232
    CrazyMoon
        3
    CrazyMoon  
    OP
       2020-07-28 18:03:48 +08:00
    @hyperdak288 看起来很好,感谢老哥~~
    594duck
        4
    594duck  
       2020-07-31 15:15:39 +08:00
    @hyperdak288 非常赞同。

    同时楼主要从上往下学,即为什么要监控,监控的目标是什么

    这涉及到 SLI,SLO,SLA 。有了这三个指标就知道怎么服务三个指标。
    594duck
        5
    594duck  
       2020-07-31 15:15:48 +08:00
    指标也在那本 SRE 书里了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1381 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 23:47 · PVG 07:47 · LAX 16:47 · JFK 19:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.