8G 云服务器上启了个 clickhouse，它总会因为某些 SQL 挂掉，现在想监控它，在它挂掉时能自己启动。我对 clickhouse🐔毛不懂，时间有限，想了 1 个简单方案和 1 个复杂，求帮忙看看。。。

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 558 天前的主题，其中的信息可能已经有所发展或是发生改变。

如题。

简单方案：写个后台脚本，定时监测 clickhouse 进程是否寄了，寄了就启动，治标不治本，实现起来快

复杂方案：根据配置调优，或者扩大内存。收集最近导致服务挂掉的 SQL ，研究一下根本原因，这个方案可能花的时间会很多

另外请教，你们的 clickhouse 是怎么运维的...

第 1 条附言 · 2022-10-08 13:48:11 +08:00

谢谢各位大佬！打算用 docker 去弄了，还是 docker 省心

clickhouse

SQL

方案

🐔毛

15 条回复 • 2022-10-08 22:43:47 +08:00

foolvino

2022-10-08 10:26:14 +08:00

改为 supervisor 启动

zhenjiachen

2022-10-08 10:26:44 +08:00

用 docker 才是最快的，用 docker compose 的 health check ，定时检测服务器接口是否健康，如果接口调用失败会自动重启。

RangerWolf

2022-10-08 10:27:30 +08:00

我的生产环境就是用的 docker~ 在启动的时候 docker --restart always 就好了。。。

RangerWolf

2022-10-08 10:29:26 +08:00

另外在 clickhouse 里面，systems.query_thread_log 等相关表，有很详细的记录，推荐去找找看，看看能不能找到蛛丝马迹。但是如果是生产环境，8G 确实太小了。实在没办法，你可以修改配置文件，把允许的最大内存使用量降低。
我记得默认就是 8G ，但是系统里面还有其他的地方用了内存，就可能导致你的 Clickhouse 被干掉了