V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wh1isper
V2EX  ›  Kubernetes

Spaglim: PySpark 配置、Spark Connect Server On k8s 工具

  •  
  •   wh1isper · 2023-07-27 14:08:58 +08:00 · 921 次点击
    这是一个创建于 490 天前的主题,其中的信息可能已经有所发展或是发生改变。

    发现市面上基本没有对 PySpark 进行配置的工具,同时 Spark 3.4.0 引入了 server-client 模式,也没有比较好的解决方案,我这里开源了一个简单的模块,支持以下功能:

    • 通过环境变量配置 Spark ,参见 config spark
    • 在 IPython/Jupyter 中执行 Spark SQL 的 %SQL%%SQL magic
      • SQL 语句可分多行编写,支持使用 ; 分隔语句
      • 支持配置连接客户端
      • TODO: 可视化 SQL 语句的结果( Spark 数据框架)
    • sparglim-server用于 daemon Spark Connect Server ,并支持 on K8S 部署

    更多: https://github.com/Wh1isper/sparglim

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2548 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 15:59 · PVG 23:59 · LAX 07:59 · JFK 10:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.