V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
oldboy627
V2EX  ›  程序员

有应用混沌工程的朋友吗?

  •  
  •   oldboy627 · 88 天前 · 1768 次点击
    这是一个创建于 88 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有在企业内应用了混沌工程的朋友吗?软件选型有什么推荐吗?
    目前看 CNCF 上有三款 Chaos Mesh ,Chaosblade(阿里巴巴出品的)和 Litmus 三款软件。要选用哪一款,有什么坑吗?
    16 条回复    2021-11-08 17:32:21 +08:00
    libook
        1
    libook  
       88 天前
    没有应用过,这方面做得最好的貌似是 Netflix ,你可以看看他们有什么最佳实践。
    sggggy
        2
    sggggy  
       87 天前
    找个测试环境先测吧,chaosblade 用过,后来和团队说了,想试试看要不要搞这个,大家都很慌,我们也久按住没动了。要做混沌工程,全链路监控要先做好才行。
    QAO
        3
    QAO  
       87 天前
    如果应用已经运行在 k8s 毫无疑问用 chaos mesh,如果还是裸跑在机器上的话就用 chaosblade 吧。

    另外搞混沌工程,对这些工具的使用只是一部分,如何做好观测、恢复、自动化等都是需要考虑的
    SmiteChow
        4
    SmiteChow  
       87 天前
    名字够玄乎
    yzbythesea
        5
    yzbythesea  
       87 天前
    @QAO

    chaos mesh 感觉是给 service mesh 准备的?
    oldboy627
        6
    oldboy627  
    OP
       87 天前
    @sggggy chaosblade 阿里巴巴出品的,不知道以后会不会突然就...看文档没有做国际化,感觉只是国内用户用的多
    oldboy627
        7
    oldboy627  
    OP
       87 天前
    @QAO 我们应用已经全部都跑在 k8s 上了,没有裸机的应用。你说的自动化我们已经完善了。 相比于 blade ,我也倾向于 chaos mesh ,但是 Litmus 似乎也还不错,有 redhat 等大厂的评价。 就想看看大家都怎么选型,生产中 /测试中有什么产品的实践方案。
    oldboy627
        8
    oldboy627  
    OP
       87 天前
    @yzbythesea 名字就是叫 ChaosMesh
    STRRL
        9
    STRRL  
       87 天前   ❤️ 4
    还是看应用的场景吧,如果需要做 JVM 相关的 Chaos 那肯定首选 chaosblade; 如果是应用已经在 kubernetes 上, 而且更多的是做 Pod 那层的故障注入, 网络啦, IO 啦, CPU 内存压力啦等等, 那更推荐 Chaos Mesh 或 Litmus;

    个人认为,Chaos Mesh 和 Litmus 最主要的区别还是在如何定义一个故障上,二者的风格不同;至于谁好那见仁见智了,建议可以都试试;

    另外这几个项目都还处于比较初期的发展阶段,都在比较快速的迭代中,未来的要走的路还有很长;

    > 另外搞混沌工程,对这些工具的使用只是一部分,如何做好观测、恢复、自动化等都是需要考虑的

    另外这个说的很对,基建比较好,混沌工程做起来也比较方便; 当然也可以先看看混沌工程,再去反观下自己的基建哪里做的不够;

    (利益相关: 俺是 Chaos Mesh Committer
    andj4cn
        10
    andj4cn  
       87 天前
    猴子军团整起来
    lei2j
        11
    lei2j  
       87 天前
    这名词感觉挺新颖
    superhack
        12
    superhack  
       87 天前
    Litmus 相对完善,不过也是各种坑
    oldboy627
        13
    oldboy627  
    OP
       86 天前
    @superhack 扫了一眼,Litmus 好像每一个 experiments 都要部署 rbac ,好像挺麻烦的
    superhack
        14
    superhack  
       86 天前
    @oldboy627 不用
    leeraya
        15
    leeraya  
       86 天前
    k8s 就上 chaos mesh 吧。 之前用 chaos mesh 构建过数据库日报系统。定时跑 podkill, podfail 任务,抓日志,画图,每天生成数据库运行报告。用起来还可以的,文档也全。
    yorelog
        16
    yorelog  
       76 天前
    最近也在调研准备内部应用混沌工程。初步想法是 chaos mesh ,chaosblade 两个结合使用。
    chaos mesh 本身也结合一部分 chaosblad 的功能进去了 如 jvm 注入
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3152 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 163ms · UTC 04:36 · PVG 12:36 · LAX 20:36 · JFK 23:36
    ♥ Do have faith in what you're doing.