V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
mon3
V2EX  ›  问与答

5000 多万的文章怎么做相关推荐??

  •  
  •   mon3 · 2017-05-05 12:20:13 +08:00 · 2041 次点击
    这是一个创建于 2786 天前的主题,其中的信息可能已经有所发展或是发生改变。

    以前单独建表,分词,但是 tag 已经有 1 亿多个了,导致网站运行很慢。

    还有其他办法么?

    9 条回复    2017-05-05 15:04:38 +08:00
    JasperYanky
        1
    JasperYanky  
       2017-05-05 12:29:42 +08:00
    现在采集站好做么
    mon3
        2
    mon3  
    OP
       2017-05-05 12:57:17 +08:00   ❤️ 1
    @JasperYanky 做了 4 个月,每天 50 刀左右。
    uuhp2009
        3
    uuhp2009  
       2017-05-05 13:10:34 +08:00
    @mon3 网站看可以看看不
    martyyyyy
        4
    martyyyyy  
       2017-05-05 13:16:31 +08:00
    @mon3 很厉害,网站可以看看不
    cevincheung
        5
    cevincheung  
       2017-05-05 13:17:25 +08:00
    上搜索引擎,缓存
    mon3
        6
    mon3  
    OP
       2017-05-05 13:50:22 +08:00
    @cevincheung 文章页调用 elasticsearch 的结果???
    cevincheung
        7
    cevincheung  
       2017-05-05 14:03:05 +08:00
    @mon3 #6 对啊。可以试试啊。
    mon3
        8
    mon3  
    OP
       2017-05-05 14:12:31 +08:00
    @cevincheung 我现在就是这样做的。我当时想了一上午想出了这个办法, 可是我感觉不是太好。 其他过亿数据量的站点也很多是这样做的?
    JasperYanky
        9
    JasperYanky  
       2017-05-05 15:04:38 +08:00
    @mon3 基本就是上 ES 后端直接渲染嫌慢的话 前端去 es 上查询;话说这样好像对 SEO 不太好

    对于这种采集类的网站,我的想法是上 ES 然后直接 每篇文章生成的时候就查询好相关文章 ,然后直接写到该数据里,简单粗暴;当然可以只保留 id 然后二次再查询。
    仅仅对采集站而言的,采集站有个特点是,用户浏览不多,但是搜索引擎爬的很厉害,所以简单粗暴也许更好点
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2719 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:34 · PVG 20:34 · LAX 04:34 · JFK 07:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.