V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zhxjdwh
V2EX  ›  问与答

使用 impala insert, hive insert 后 表查询性能出现巨大的差距?

  •  
  •   zhxjdwh · 2020-02-05 11:39:14 +08:00 · 1220 次点击
    这是一个创建于 1782 天前的主题,其中的信息可能已经有所发展或是发生改变。

    源数据表是a , 目标数据表是b, 格式:parquet-snappy

    insert sql: insert owerwrite table b select * from a

    1. 使用 impala 执行 insert sql , 再用 impala 对 b 表查询
    2. 使用 hive 执行 insert sql ,再用 impala invalidate metadata/ refresh table, 再用 impala 对 b 表查询

    用 impala 查询这两种方式 生成的表数据,性能会差别非常大,impala insert的方式 比 hive insert性能要几十倍??为什么会这样子,同一个表,一模一样的数据

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   881 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:48 · PVG 04:48 · LAX 12:48 · JFK 15:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.