V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
dizzylight
V2EX  ›  奇思妙想

1pb 数据保存 500 年无丢失

  •  
  •   dizzylight · 2023-02-06 11:05:59 +08:00 via iPhone · 8169 次点击
    这是一个创建于 690 天前的主题,其中的信息可能已经有所发展或是发生改变。

    手头很多资料包括视频、照片、文档。在想这些数据资产怎样保存才可以传世 现在有没有技术方案。有没有人打算花 1w 块钱去实现这个?

    90 条回复    2023-02-15 16:09:40 +08:00
    lailailee
        1
    lailailee  
       2023-02-06 11:08:30 +08:00   ❤️ 8
    刻在石头上
    neteroster
        2
    neteroster  
       2023-02-06 11:09:48 +08:00
    StuPYX
        3
    StuPYX  
       2023-02-06 11:09:56 +08:00 via iPhone
    咋这么大,这么大搞不了吧
    ltkun
        4
    ltkun  
       2023-02-06 11:12:50 +08:00 via Android
    1w 1pb 要知道现在存 1pb 至少要 10w 吧
    lhbc
        5
    lhbc  
       2023-02-06 11:14:35 +08:00
    你先算下 1 万块能买多大的硬盘,更不用说保存 500 年
    把预算提到一千万以上再来谈这个问题吧
    dizzylight
        6
    dizzylight  
    OP
       2023-02-06 11:14:40 +08:00 via iPhone
    @lailailee 老祖宗的智慧 石头最靠谱
    dizzylight
        7
    dizzylight  
    OP
       2023-02-06 11:15:26 +08:00 via iPhone
    @ltkun 以后硬盘肯定降价啊
    march1993
        8
    march1993  
       2023-02-06 11:15:57 +08:00   ❤️ 13
    找一个 250 光年之外的大黑洞,当作引力反射镜,把 1PB 调制到无线电波,打出去,500 年后能回收。500 年对宇宙来说 p 都不是
    finab
        9
    finab  
       2023-02-06 11:17:44 +08:00
    相当于一年花 20 块的 1pb 空间存储服务,谁干都亏本。短期存还行,长期至少要存 3 份拷贝,还得定期检查维护
    8355
        10
    8355  
       2023-02-06 11:20:37 +08:00
    咱们换一个思路先看看是否可行
    1 万块钱的预算能不能把任何一样东西原样保存 500 年不损坏
    或者往前导目前有没有挖到一个 500 年前的古董没有损坏的
    asmoker
        11
    asmoker  
       2023-02-06 11:20:40 +08:00   ❤️ 31
    那只能在雄-安建机房了,那边是千 年大 计
    dizzylight
        12
    dizzylight  
    OP
       2023-02-06 11:22:14 +08:00 via iPhone
    由此引出一个问题 现如今如此海量的数据是否具有可持续性? 人的大部分活动最终都会被历史遗忘。
    gabkfivyfbst
        13
    gabkfivyfbst  
       2023-02-06 11:26:04 +08:00
    记得三体里,地球毁灭前,人类发现最靠谱的方式还是刻在石头上
    perfectlife
        14
    perfectlife  
       2023-02-06 11:26:44 +08:00
    @dizzylight 这个逻辑不对,你是要现在实现,考虑以后硬盘的价格就不合适,况且硬盘保存 500 年感觉费劲,机械和固态都会受材质的物理特性影响
    Tilie
        15
    Tilie  
       2023-02-06 11:28:44 +08:00
    把 1pb 分散到重要的“互联网基础设施”里,代代相传
    luckbbs
        16
    luckbbs  
       2023-02-06 11:34:18 +08:00
    这些数据对后人有价值吗
    allenzhangSB
        17
    allenzhangSB  
       2023-02-06 11:34:49 +08:00
    @dizzylight 你都考虑以后硬盘降价了, 那你现在问个啥
    dizzylight
        18
    dizzylight  
    OP
       2023-02-06 11:35:24 +08:00 via iPhone
    @luckbbs 数据不是最宝贵的资产吗 商业 101
    dizzylight
        19
    dizzylight  
    OP
       2023-02-06 11:36:16 +08:00 via iPhone
    @allenzhangSB 提前准备,钱不是大问题。
    occupied
        20
    occupied  
       2023-02-06 11:38:13 +08:00
    1pb 的数据只对你有价值,如果能有 1kb 的数据对后人有价值的话就算厉害了
    dizzylight
        21
    dizzylight  
    OP
       2023-02-06 11:44:11 +08:00 via iPhone
    @occupied 先不谈价值问题 能否实现打个问号
    s127
        22
    s127  
       2023-02-06 11:52:18 +08:00 via iPhone
    jamosLi
        23
    jamosLi  
       2023-02-06 11:57:59 +08:00
    500 年后人存不存在都是两说。技术上就是最便宜磁带,然后硬盘,光盘。硬盘已经基本走到物理极限单盘十多 T 吧。然后就是建一座机房和存储介质的存储时效的物理特性做抗争了。
    光盘是塑料的打的坑,塑料应该比较难在数据级顶 500 年。磁带,磁盘都是掉电,消磁了。
    现在的磁带 10 刀 1T ,硬盘 1 万 100T 。
    剩下自己算吧。
    ExplodingFKL
        24
    ExplodingFKL  
       2023-02-06 12:02:01 +08:00
    @march1993 好家伙,这要多大功率才能将衰减降到可控范围内
    dianso
        25
    dianso  
       2023-02-06 12:02:35 +08:00
    我试过自己的需求,发现至少需要 N 万左右。

    后来放弃了,找人定制了 M2 板子,120W ,能插拔 16 根 M2 2280 固态。

    其中 8 个存数据 8 个备份。
    debuggerx
        26
    debuggerx  
       2023-02-06 12:04:48 +08:00
    怎么保证人类还能存续 500 年?
    dream10201
        27
    dream10201  
       2023-02-06 12:05:05 +08:00
    1w 块,说句不好听的,想屁吃。你去请个石匠把它刻在石头上也不止 1w 啊。
    mxT52CRuqR6o5
        28
    mxT52CRuqR6o5  
       2023-02-06 12:07:50 +08:00
    @dizzylight 那你可以等几百年后硬盘价格降下来再去做『 1pb 数据保存 500 年无丢失』的工作
    dizzylight
        29
    dizzylight  
    OP
       2023-02-06 12:10:56 +08:00 via iPhone
    @mxT52CRuqR6o5 降到 500G 能实现?
    piku
        30
    piku  
       2023-02-06 12:12:57 +08:00 via Android
    就事论事,数据长期存储不是寻找一种能长期保存的介质,而是采用一定的手段将数据存储延续。目前经济可靠的保存方法是磁带,假设一次备份可以保存至少 50 年,那么在 50 年内重新读取更换新的介质再重新保存一次就是了。也可能未来有更经济可靠的存储介质呢。
    存储不是问题,有人维护这些存储才是问题。
    lhbc
        31
    lhbc  
       2023-02-06 12:14:47 +08:00
    “以后硬盘肯定降价”
    你不如跟你老板说等过 500 年人均工资一千万一个月了再给你发工资
    dizzylight
        32
    dizzylight  
    OP
       2023-02-06 12:22:03 +08:00 via iPhone
    @piku 需要维护的存储代价大就是问题啊 以后数据必然越来越多 老的数据都要丢掉?
    piku
        33
    piku  
       2023-02-06 12:31:52 +08:00 via Android
    @dizzylight 老数据终究会泯灭在历史长河里 不说别的 前阵子要找一些老照片 就找不到
    blankmiss
        34
    blankmiss  
       2023-02-06 12:32:54 +08:00
    1w 块钱在做什么梦 买硬盘也买不起 买磁带虽然也便宜 但是好像也买不了 1PB 而且磁带机也贵的一批
    BeautifulSoap
        35
    BeautifulSoap  
       2023-02-06 12:37:39 +08:00 via Android   ❤️ 2
    lz 和 ls 很多人都在想怎么存,却没人去想怎么读。存是技术问题,而读不只是技术问题

    读涉及到软件和硬件。顺便跟你们说一下,一些老旧格式才几十年就基本没法读取了(因为系统淘汰,格式淘汰等各种原因)。比如说美国登月技术丢失这事,不去考虑阴谋论,很重要的一个原因应该和项目管理系统老旧,旧的文件格式无法读取有关。再比如看看一些公司的老项目,里面那些文档和附件,如果没有专门人维护的话,相关人员不在之后那基本就成黑盒了,可能怎么打开都没人知道(比如一个名为 data.bin 的文件没有说明你知道怎么开吗?)
    当然,你也许会说积极转码。但是转码这事搞过的的都知道有多坑,转码转到后来一片乱码,调参不好画质损失事小,遇到以前那种隔行扫描视频画面撕裂之类的你根本意料不到
    为了解决长时间尺度下格式读取问题,国家图书馆档案馆都是有专门人和公司来做的。而你的子孙别说孙子了,可能你儿子那一代开始就对电脑一窍不通是个电脑盲。让他们管理你那堆数据真的是不确定性太大。历史上几代人连个家谱都管理不好丢失的比比皆是,更何况是电子载体

    至于硬件方面的读,软驱就是给最好的例子,可能再过个十几二十年,图吧佬都组不出一个能驱动软驱的电脑了

    so ,几 pd 的事情真就别想了,挑出真心重要的照片打印出来,多打几份,挑个环境好点的地方放那,估计传给 50 年估计没问题
    whileFalse
        36
    whileFalse  
       2023-02-06 12:43:52 +08:00   ❤️ 2
    @dizzylight “以后硬盘肯定降价啊” 那你不如 500 年后再来问这个问题,哦不行,以后钱还贬值了呢
    yousabuk
        37
    yousabuk  
       2023-02-06 12:45:57 +08:00 via iPhone   ❤️ 2
    刻到王八壳上
    securityCoding
        38
    securityCoding  
       2023-02-06 12:47:23 +08:00
    年轻人思想很开阔的啊,500 年前是明武宗朱厚照 233
    yvkino
        39
    yvkino  
       2023-02-06 12:52:29 +08:00
    刻在稳定金属片上,多弄几份放到太空保存
    cue
        40
    cue  
       2023-02-06 12:57:15 +08:00 via iPhone
    一万块钱,给你老婆买个包都不够,而且最多背半年。
    wdhwg001
        41
    wdhwg001  
       2023-02-06 13:07:01 +08:00 via iPhone
    蓝光 m-disc 是玻璃碳,是号称千年存储,表面随便刮花暴晒高低温之后都可以简单修复,可以计算一下需要多少 m-disc 。
    xtreme1
        42
    xtreme1  
       2023-02-06 13:09:31 +08:00
    @BeautifulSoap
    第一个说到点子上的. 存纯文本还行, 其它的, 500 年以后的硬件根本跑不起来你存的这些玩意的解码器
    cnkuner
        43
    cnkuner  
       2023-02-06 13:25:07 +08:00
    1 万块钱都不够把“1 万块钱”保存 500 年的。
    meeop
        44
    meeop  
       2023-02-06 13:25:40 +08:00
    不考虑人为破坏的话,最简单和低成本方案是打印下来,打印成纯文本和照片,或者编码成 base64 打印下来(base64 解码方法也要打印)
    注意用激光打印或者碳粉油墨
    最后抽真空或者油浸保存在塑料罐子里
    zhaogaz
        45
    zhaogaz  
       2023-02-06 13:27:43 +08:00
    所以你啥资料值得存 500 年呢,我就好奇问问。。。
    jamosLi
        46
    jamosLi  
       2023-02-06 13:28:37 +08:00
    @xtreme1 500 年东西现在复制不了的东西可能有,但是不多。失传的主要原因是工艺失传,不是技术能力不足。nasa 那就是一个谜一样的问题,鬼知道互相的打算是什么。能存就能读。pb 级别没有纳米制程,那就是帝王工程,秦始皇也完成不了。
    Tengdw
        47
    Tengdw  
       2023-02-06 13:33:15 +08:00
    把信息保存一亿年左右的方法,他们强调,这是目前已知的唯一可行的方法,它就是——”罗辑把拐杖高举过头,白发长须舞动着,看上去像分开红海的摩西,庄严地喊道,“把字刻在石头上!”
    jamosLi
        48
    jamosLi  
       2023-02-06 13:33:15 +08:00
    @meeop 你猜猜看 1pb 的数据到底有多少。2000 到公元世纪前所有的书加起来也不一定有 100T 。1pb=1024tb
    goophy
        49
    goophy  
       2023-02-06 13:35:06 +08:00   ❤️ 1
    @march1993 这个靠谱,是不是该先对着太阳发,放大一下 :)
    justfindu
        50
    justfindu  
       2023-02-06 13:38:17 +08:00
    存档超大数据保存目前都是推的蓝光盘 然后 1w 实在是太少太少了
    justfindu
        51
    justfindu  
       2023-02-06 13:39:02 +08:00
    @justfindu #50 然后还需要定期几十年翻一次盘
    yukiww233
        52
    yukiww233  
       2023-02-06 13:43:48 +08:00
    1w 你买最便宜的存储介质都不一定够 1pb 的,还想要 500 年。。。
    “奇思妙想”节点也该基于现实吧,没经过思考的提问和讨论有啥意义
    max1
        53
    max1  
       2023-02-06 14:01:45 +08:00   ❤️ 1
    @lailailee 你是看过三体的
    cpstar
        54
    cpstar  
       2023-02-06 14:14:50 +08:00
    磁带,单盘 30TB ,价格 1000 。做好保存环境,500 年不是问题。但是一万的预算就有点。
    Planarians
        55
    Planarians  
       2023-02-06 14:29:36 +08:00 via Android
    磁带啊 埋到北极 忘了哪个 YouTuber 就这样做的
    moonkiller
        56
    moonkiller  
       2023-02-06 14:32:25 +08:00
    @lhbc 有比硬盘更便宜的存储介质,比如蓝光光盘,貌似光盘比硬盘保存寿命还久一些
    cedoo22
        57
    cedoo22  
       2023-02-06 14:34:12 +08:00
    有能把光困住的东西吗?
    人造黑洞? 造一个 微型黑洞, 把数据转换成光信号,把光信号困住, 需要的时候取, 理论上可以无限久?
    yufeng0681
        58
    yufeng0681  
       2023-02-06 14:37:20 +08:00
    再等等, 等蛋白质可以用于存储了,价格就能便宜下来, 存储量和存储时间都能达标。
    nicoljiang
        59
    nicoljiang  
       2023-02-06 14:38:12 +08:00
    如果重要的数据自然有人帮忙续命;
    如果是不重要的数据,那不叫丢失,叫淘汰。
    shuxhan
        60
    shuxhan  
       2023-02-06 14:40:33 +08:00
    @dizzylight 用现有硬件来思考未来是否能留存本身就是不合理的,未来必定会出现能更长久存储的容器这点事毋庸置疑的,就像秦朝时人能想到硬盘存东西吗?都是记录在竹简上。所以 op 不必担心,只需要注意短时间保存无措就行了,未来可以更新自己的存储方案,一劳永逸的方案是不存在的,顶多坚持二三十年
    libook
        61
    libook  
       2023-02-06 14:41:31 +08:00
    @dizzylight #12 当今绝大部分数据是没有保存价值的,有价值的数据自然会被保存和传承下去。比如国服魔兽的存档,永久关服了就会被丢弃了。
    esxlin
        62
    esxlin  
       2023-02-06 15:10:40 +08:00
    @libook 同意观点,有价值的东西除非天灾,都会被延续下来。优秀的技术积累、但判断是否有价值站在历史的进程上就不好说了
    ytmsdy
        63
    ytmsdy  
       2023-02-06 16:02:56 +08:00
    存不是问题,主要问题是读!
    回头看看当年的磁盘,磁盘里面的数据估计还是好的。但是找不到能够读取出来的设备!
    shibushi233
        64
    shibushi233  
       2023-02-06 16:08:19 +08:00
    蓝光还行,随着技术的进步。。可以考虑用这个
    wu67
        65
    wu67  
       2023-02-06 17:13:25 +08:00
    还 500 年? 绝大部分人在 50 年后就会想着要留清白在人间了
    meeop
        66
    meeop  
       2023-02-06 18:15:40 +08:00
    @jamosLi 按照目前打印机打印密度,一张 a4 大约能打印 8m 数据(黑白),1G 数据大约一本书的厚度,1pb 就是 1 百万本书
    这么算下来大约需要一个中型图书馆放资料,大概花费 100w 能搞定
    vipzhicheng
        67
    vipzhicheng  
       2023-02-06 18:20:45 +08:00
    大胆假设,小心求证,我觉得是可能的,但是先不要想 1pb ,先想 1kb, 1mb 怎么存500年,之后再慢慢迭代吧。

    我的方案是:和人工智能整合,人工智能负责读写,另外存储技术和压缩技术必须更新,目前有两个思路,一个是存储密度更大的材料,另一个是生物学方向比如记录在 DNA 上,如果是存储材料的方案,需要教会人工智能生产这种材料,也就是让AI来维护这份存储,当然还需要考虑能源问题,太阳能或者核能,如果是DNA的方案,那可以考虑让存储数据可以被遗传,当然遗传的是高度压缩的版本,解压解码还是需要AI来进行,另外考虑到人类繁衍特性,需要让全人类的基因参与存储,冗余备份,这样可以保证在人类群体数量不低于一个阈值之前,一定可以还原出原来的数据。
    work220602
        68
    work220602  
       2023-02-06 18:45:15 +08:00
    500 后现在的技术都过时了
    bjzhush
        69
    bjzhush  
       2023-02-06 18:50:37 +08:00
    500 年,从秦始皇到唐太宗,从成吉思汗到朱元璋,一直到皇太极,都没有你牛逼!!!
    因为他们开国也就维持了三百年!!
    孙猴子压在五行山下也就压了五百年!!
    就连韩磊,理想也就是向天再借五百年!!
    哈哈!
    HugoChao
        70
    HugoChao  
       2023-02-06 18:50:56 +08:00
    五百年这么久,一劳永逸是不可能的了,要安排好后人世世代代传下去
    netnr
        71
    netnr  
       2023-02-06 18:52:13 +08:00 via Android   ❤️ 1
    500 年格局小了,千年光盘 M-DISC
    passall
        72
    passall  
       2023-02-06 19:54:07 +08:00
    这不是很简单的事情吗? 给我 1W 我就可以帮你解决。
    xiangyuecn
        73
    xiangyuecn  
       2023-02-06 20:04:10 +08:00
    孙子:1MB 都嫌多 😂

    1GB 的零碎文件,自己看了都嫌弃
    FishGrazier
        74
    FishGrazier  
       2023-02-06 20:32:01 +08:00 via Android
    问 NASA ,他们把人类的资料存在了一张金制光盘上,跟着旅行者一号飞出了太阳系,数据至少能保存十亿年
    optional
        75
    optional  
       2023-02-06 21:38:53 +08:00
    @dianso 可以分享下吗,16 个 m2
    missqso
        76
    missqso  
       2023-02-06 21:56:32 +08:00
    1pb 此刻现在存下来,只是写下来,1 万能搞定吗?还 500 年,天文数字。
    HeyWeGo
        77
    HeyWeGo  
       2023-02-06 22:04:20 +08:00 via Android
    普通人,一辈子的数据,16tb 足够了
    vazo
        78
    vazo  
       2023-02-06 22:16:17 +08:00
    把数据喂给 AI
    w3cll
        79
    w3cll  
       2023-02-06 22:33:59 +08:00
    让数据自我“繁衍”,不迭代,假设这个“繁衍”周期 100 年 1 次,所以你只需要设定让它“繁衍”5 次即可。
    mxT52CRuqR6o5
        80
    mxT52CRuqR6o5  
       2023-02-06 23:27:04 +08:00 via Android
    @dizzylight 之前看到过一个靠区块链&矿工意图达到永续存储的项目,但具体有多可靠我也不好说
    Weixiao0725
        81
    Weixiao0725  
       2023-02-07 01:59:27 +08:00
    github 送到南极了已经,你可以参考下
    techmale
        82
    techmale  
       2023-02-07 08:40:16 +08:00
    可以了解下通过 DNA 存储数据
    - [Microsoft and UW demonstrate first fully automated DNA data storage](
    )
    - [How we can store digital data in DNA | Dina Zielinski](
    )
    techmale
        83
    techmale  
       2023-02-07 08:42:00 +08:00
    通过 DNA 是可见时间内 能实现你的目的,
    但对于「现在有没有技术方案」中的「现在」可能要再等很久啦
    Polyhedr0n
        84
    Polyhedr0n  
       2023-02-07 08:43:12 +08:00
    +1 Github 南极存储的方法。数据印在微缩胶片上
    sakujo
        85
    sakujo  
       2023-02-07 09:28:56 +08:00
    你是打算传给谁啊
    jamosLi
        86
    jamosLi  
       2023-02-07 09:48:18 +08:00
    @meeop #66 搞笑呢?你的书是几米厚的?即便是汉语这种一个字占两个字节的文字,你搜一下 1g 大概多少字行不行?但凡看过比尔盖茨微软软盘和书本的宣传画也不至于如此。
    1g 大约 5.3 亿汉字。。。
    acherkrau
        87
    acherkrau  
       2023-02-07 09:59:16 +08:00
    刻光盘,放北极
    wangyzj
        88
    wangyzj  
       2023-02-07 10:57:13 +08:00
    存成实体二维码
    PbCopy111
        89
    PbCopy111  
       2023-02-07 12:01:52 +08:00
    装一套,备份一套,每十年增加一次备份。
    Fxshiny
        90
    Fxshiny  
       2023-02-15 16:09:40 +08:00
    刻在石头上。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   968 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 20:24 · PVG 04:24 · LAX 12:24 · JFK 15:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.