V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
superisaac
V2EX  ›  分享创造

抽空弄了一个个性化互联网文摘网站。

  •  
  •   superisaac ·
    superisaac · 2012-06-21 16:46:58 +08:00 · 4042 次点击
    这是一个创建于 4562 天前的主题,其中的信息可能已经有所发展或是发生改变。
    网址在http://wehuibao.com

    总的来说,就是抓取多个微博home timeline(需要授权)中出现的url链接,然后脱水化成为可看的个性化的一个杂志。

    使用python + mongodb实现,期间自己写了个mongodb 的object mapping。也研究了readability的页面脱水化算法。总的来说还是试验作品。

    哦,智能手机也可以访问,使用backbone.js 框架。
    4 条回复    1970-01-01 08:00:00 +08:00
    INT21H
        1
    INT21H  
       2012-06-21 16:52:36 +08:00
    脱水化算法具体怎么做的?根据不同tag的权值还是怎么?能否详细介绍下?
    superisaac
        2
    superisaac  
    OP
       2012-06-21 16:56:32 +08:00
    @INT21H 其实就是根据实际情况处理各种例外。
    guotie
        3
    guotie  
       2012-06-21 17:04:03 +08:00
    挺不错的。
    赞!
    superisaac
        4
    superisaac  
    OP
       2012-06-21 17:06:53 +08:00
    @guotie 谢,用新浪微博授权的,一个星期后授权的token就失效了,需要到时候重新授权
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5780 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 01:41 · PVG 09:41 · LAX 17:41 · JFK 20:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.