V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
kebamt
V2EX  ›  问与答

迫于互联网上文章被删,求大家存档工具

  •  1
     
  •   kebamt · 105 天前 via iPhone · 3533 次点击
    这是一个创建于 105 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有一个烦恼,就是自己收藏下来的文章由于各种原因被原作者删除或修改,导致链接失效变成 404 。 有没有一个工具把网页文章内容存档并支持分享(最重要的是能分享),就是你给它输入「文章链接」它把这个链接打印到网页并返回一个可分享文章链接(内容跟原始网页一摸一样的那种),最好是基于 Web,可以为此付费。 试过 Telegraph 不过需要自己一个一个自己搬运,TG 上也看到一些机器人可以把文章打印到 Telegraph 返回链接的,但此原始文章中的图片都没打印出来,都消失了,只有文字。

    42 条回复    2021-08-26 11:44:31 +08:00
    yujiang
        1
    yujiang  
       105 天前 via Android
    Google/百度快照
    morisakitaku
        2
    morisakitaku  
       105 天前 via iPhone
    網頁存檔
    cco
        3
    cco  
       105 天前
    webarchive dot org
    4ark
        4
    4ark  
       105 天前 via iPhone
    web archive
    yanzhiling2001
        5
    yanzhiling2001  
       105 天前
    没遇到这么一劳永逸的工具.

    现在用欧鹏浏览器遇到好文档一键保存为 pdf
    gesse
        6
    gesse  
       105 天前
    一般一篇文章你用到的知识点、信息点应该不多, 可以试着复制到笔记软件里总结归类下。

    方便以后的查阅、学习。
    minikyu
        7
    minikyu  
       105 天前
    印象笔记、语雀、notion 之类的笔记软件都有剪藏功能的,直接保存在笔记里
    phony2r
        8
    phony2r  
       105 天前   ❤️ 1
    cmd + p 打印成 pdf 文件
    oddcc
        9
    oddcc  
       105 天前   ❤️ 1
    前两天刚自建了 https://github.com/ArchiveBox/ArchiveBox
    很强大
    webshe11
        11
    webshe11  
       105 天前
    著名的老牌
    https://web.archive.org/save

    或者
    https://archive.today/

    功能特性 用法各有千秋 个人比较喜欢后者
    kebamt
        12
    kebamt  
    OP
       105 天前
    @yujiang Google 快照好像早已下线了,输入搜索到的 Google 快照链接会自动重定向到 Google 首页。百度快照好像也死掉了
    kebamt
        13
    kebamt  
    OP
       105 天前
    @mokeyjay 试了一下这两个后面的插件很不错,唯一缺点是不能网页的形式分享。

    http://web.archive.org/ 这个存完发现部分图片丢失,不知道怎么回事儿
    kebamt
        14
    kebamt  
    OP
       105 天前
    @webshe11 谢谢,后者存档很完整几乎跟原网页一样,只是生成时间较长,不过可以接受
    v2ka
        15
    v2ka  
       105 天前   ❤️ 1
    特意研究了下几种保存网页的方法。

    1-保存为 PDF 。(打印-保存 PDF )

    2-保存为离线网页( SingleFile )

    3-云笔记剪藏(印象笔记、onenote )

    4-稍后阅读工具( Pocket,高级版可以保存网页)
    kebamt
        16
    kebamt  
    OP
       105 天前
    @v2ka 谢谢
    locoz
        17
    locoz  
       105 天前 via Android   ❤️ 2
    @gesse #6 其实这样还是不太好,因为一篇文章你在不同水平、不同时期看可能会看出不同的东西,理解深度和联想的广度都会不同,能在简单归纳的同时完整存下来原始内容是最合适的。
    webshe11
        18
    webshe11  
       105 天前
    @kebamt #14 archive.today 排队的话可能要一会,不排队的话一两分钟就存好了
    hjq632233317
        19
    hjq632233317  
       105 天前
    印象笔记剪藏 +1
    D3EP
        20
    D3EP  
       105 天前
    Pocket 付费
    lxxself
        21
    lxxself  
       105 天前
    保存为 pdf 、发送内容到邮件、保存到 notion 等等
    Kaiyuan
        22
    Kaiyuan  
       105 天前 via iPhone
    我现在用的是群晖 Note,完整剪藏。免强可用,主要是数据全在我自己手里踏实。然后群晖又有加密备份到云盘的功能。
    longtzw
        23
    longtzw  
       105 天前 via iPhone
    Devonthink 保存为 Web Archive,完美
    xarthur
        24
    xarthur  
       104 天前 via iPhone
    如果你用的是 macOS,可以试试 EagleFiler 。
    crab
        25
    crab  
       104 天前
    保存本地比如 mhtml pdf 再云备份才是可靠的。
    ThirdFlame
        26
    ThirdFlame  
       104 天前
    singlefile 保存成单 html
    zhanggong
        27
    zhanggong  
       104 天前
    Renven1
        28
    Renven1  
       104 天前
    这样是不是可以结合起来把 V 站每天最热榜给全部保留下来,错过那天就可以回看了~
    Salicylicacid
        29
    Salicylicacid  
       104 天前 via Android
    强推 onenote
    Maskeney
        30
    Maskeney  
       104 天前   ❤️ 2
    archive.today 系列,
    archive.today
    archive.is
    archive.ph
    archive.vn
    archive.fo
    archive.li
    archive.md

    目前墙内可直接访问的域名应该是只剩 archive.vn
    WildCat
        31
    WildCat  
       104 天前 via iPhone
    如果你用 iOS/macOS 的话,可以考虑下我们做的
    https://www.twilar.com/

    未来会出一个简化的 web 版本
    zyxk
        32
    zyxk  
       104 天前   ❤️ 1


    onenote chrome 插件
    xz
        33
    xz  
       104 天前 via iPhone
    有的,我记得有两款,把链接发过去就会复制一份副本,手机电脑还有 web 都有客户端
    一个叫 pocket,还有一个好像是什么 page 免费的
    kebamt
        34
    kebamt  
    OP
       104 天前 via iPhone   ❤️ 1
    @WildCat 试了一下,确实很优秀!不过非苹果设备全平台有些问题,iPadOS 就用这个了,期待网页版~
    LeoSUPERB
        35
    LeoSUPERB  
       104 天前
    SiteSucker Pro
    lio444
        36
    lio444  
       104 天前
    @kebamt 那就是你的使用方法不对,我正常使用
    kasusa
        37
    kasusa  
       104 天前
    从信息收集的角度来说,别人的文章不一定是最好的。
    最好的办法就是自己提取出来信息之后,自己整理一下语音然后再发布出去。比如放到 github.io 或者自己的博客。永远不会丢。
    而且这样回头看的时候也更容易看懂。毕竟是自己写的。
    jy02201949
        38
    jy02201949  
       104 天前
    hxys
        39
    hxys  
       104 天前
    劝你别用 webarchive, 它会被 DMCA 管制
    可以弄一个 tg 群或者某些群组,或者匿名版之类的,再或者 onion
    dzyou2007
        40
    dzyou2007  
       104 天前
    只要文章主体的,用笔记软件的剪藏

    要求网页完整性的,用 WebArchive 类工具

    注意,如果备份不是存储在自己手里,可能有再次被删的风险
    snowfuck
        41
    snowfuck  
       104 天前
    可以看看这个 https://github.com/go-shiori/shiori
    可以自建本地服务
    xingyuc
        42
    xingyuc  
       103 天前
    前段时间也遇到过,只能说中文互联网环境的体验很 sb
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2783 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 11:31 · PVG 19:31 · LAX 03:31 · JFK 06:31
    ♥ Do have faith in what you're doing.