toarya
V2EX  ›  Java

接口接收稿件数据批量入库,接口和数据库(类似 hbase)之间用什么做中转比较好

  •  
  •   toarya · Jun 8, 2021 · 2167 views
    This topic created in 1816 days ago, the information mentioned may be changed or developed.

    目前有个需求是提供一个稿件的入库接口,然后入到一个闭源的类似 hbase 的数据库中,由于某些原因,接口和入库过程要解耦,所以需要中转一下,一种方案是接口端把 json 写入文件,logstash 读取,然后 output 输出到一个 http 接口,然后入库。另一种是接口把稿件数据扔到 kafka 里,然后接口端拉数据入库。

    总体量大概一天 1~2w 篇,不算大,但是字段比较多,正文会大一点。领导要求尽量保证数据不丢失。 感觉走 logstash,如果 output 对应的接口挂掉,容易大量重试,比较麻烦。然后走消息队列,感觉作为消息体似乎有点大,而且不知道会不会被撑爆导致里面数据丢失(做持久化可解决?)

    想求教一下,哪种方案合适一点,或者说有啥更合适的方案更好。

    谢谢诸位。

    3 replies    2021-06-11 13:34:32 +08:00
    VonemSnake
        1
    VonemSnake  
       Jun 9, 2021
    kafka
    dayeye2006199
        2
    dayeye2006199  
       Jun 9, 2021
    消息队列
    SnailTest
        3
    SnailTest  
       Jun 11, 2021
    消息队列分批收
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1004 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 55ms · UTC 18:45 · PVG 02:45 · LAX 11:45 · JFK 14:45
    ♥ Do have faith in what you're doing.