V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Kirkcong
V2EX  ›  分享发现

又拍云实在太不靠谱了

  •  
  •   Kirkcong · 2014-08-20 06:13:06 +08:00 · 5724 次点击
    这是一个创建于 3752 天前的主题,其中的信息可能已经有所发展或是发生改变。
    服务器半夜宕机,居然几个小时没响应和恢复,这么大的事,难道没有运维盯着和报警?
    这已经不是一次两次了,实在没办法描述心情了,不吐槽不快
    22 条回复    2014-08-21 09:01:19 +08:00
    alexzhan
        1
    alexzhan  
       2014-08-20 07:08:17 +08:00
    同感。我都不知道怎么说了。
    moname
        2
    moname  
       2014-08-20 07:10:35 +08:00 via iPad
    反正又拍,和七牛都是被吐槽的,,,,
    我用七牛感觉很好。
    zjgood
        3
    zjgood  
       2014-08-20 08:00:33 +08:00 via Android
    那就别用国内的云存储了呗,反正大家都知道国内的云服务不靠谱,那还用不是活该吗?转移到Azure或者aws吧,这两家也有云存储和CDN,貌似有香港CDN节点,且带宽很足
    alexzhan
        4
    alexzhan  
       2014-08-20 08:27:05 +08:00
    大概十分钟之前正常了,希望以后又拍云的运维能再及时点,我基本上是在宕机的第一时间就发现了,然后等了差不多六个小时修复的第一时间也发现正常了。
    andybest
        5
    andybest  
       2014-08-20 08:29:23 +08:00
    @alexzhan @Kirkcong 你是用又拍缓冲了页面?还是做了监控?

    我是仅用七牛做图片服务器,并且没有监控,也不知道宕没宕机过
    alexzhan
        6
    alexzhan  
       2014-08-20 08:36:05 +08:00
    @andybest 其实我也是只做图片服务器,没有监控,只是我有脚本基本上每5分钟就要上传很多图片到又拍云,所以一出问题基本上能马上发现了,因为上传不能了。另外因为有问题纯粹是在人工刷新他页面或者重跑脚本看有没有恢复正常。
    fork3rt
        7
    fork3rt  
       2014-08-20 08:57:07 +08:00 via iPhone
    一直用七牛 感觉挺稳定的
    muziyue
        8
    muziyue  
       2014-08-20 09:03:16 +08:00
    七牛就是有时候慢了点,而且被大数字报病毒,倒没见宕机过
    wangdaimishu
        9
    wangdaimishu  
       2014-08-20 09:06:43 +08:00
    @andybest 那你惨了,七牛不会全挂,是偶尔挂几个链接,我当初也是无聊用开发工具去点着看才发现的。
    notnumb
        10
    notnumb  
       2014-08-20 09:09:04 +08:00
    国内怎么总不考虑自动化 总是运维盯着不是个靠谱事情。
    semicircle21
        11
    semicircle21  
       2014-08-20 09:31:45 +08:00
    @fork3rt
    七牛是偶尔挂个节点, 或者挂个功能, 比如缩略图, 水印...
    mornlight
        12
    mornlight  
       2014-08-20 10:49:31 +08:00
    新浪云存储最近上线了,有人去试用了吗?
    mingxing
        13
    mingxing  
       2014-08-20 11:01:37 +08:00
    非常抱歉给大家的使用带来了不好的体验。

    又拍云目前是有监控系统的,服务一旦发生故障,会有短信自动通知到相应负责处理的同学。但是由于昨天负责接收短信的同学睡得实在太深了,导致这次的事故长时间的没有被发现。

    接下来我们会有相应的改进措施出来,包括半夜的故障我们将会采用人肉报警的措施,会安排同事实时的关注我们的监控系统。
    mx1700
        14
    mx1700  
       2014-08-20 11:55:47 +08:00
    @mingxing 发生事故是不是应该主动发一个公告?我看你们官网,微博都没有对这次事故做任何声明和解释啊。
    难道只有人投诉了才会给个解释?
    qdvictory
        15
    qdvictory  
       2014-08-20 12:04:35 +08:00
    我们最近多次碰到又拍的事故,已经无语了。经常冷不丁的就挂了。
    总之最近给我的感受是又拍真的不太专业。
    mingxing
        16
    mingxing  
       2014-08-20 13:03:52 +08:00
    @mx1700 @qdvictory 早上我们在整理整个事件的故障报告,稍后将会把书面的故障说明发送给用户。

    爱之深,责之切,非常能理解大家对于我们的寄望。后续我们会加大加快资源的投入,以确保服务的专业性和稳定性。
    underone
        17
    underone  
       2014-08-20 13:12:55 +08:00
    @mingxing 但是由于昨天负责接收短信的同学睡得实在太深了,导致这次的事故长时间的没有被发现。
    这也叫理由啊。。。
    zzutmebwd
        18
    zzutmebwd  
       2014-08-20 13:16:05 +08:00 via Android
    本来打算买点流量的 算了...
    Kirkcong
        19
    Kirkcong  
    OP
       2014-08-20 13:16:44 +08:00
    @mingxing 出线运维问题,居然要靠一个同学是否睡得很深来判断,这难道靠谱??无语
    mingxing
        20
    mingxing  
       2014-08-20 13:26:22 +08:00
    @underone @Kirkcong 这不是我们出问题的理由,出问题的理由只能是我们自己做的还不到位,但是这是一个最真实的原因,它也能让我们看到目前还有做的不够好的地方。

    所以无论是资源上,还是监控体系的完善上,我们后面都会拿出更优的解决方案,毕竟我们自己也很清楚,稳定性是一个云服务提供商生存的关键。
    star001007
        21
    star001007  
       2014-08-20 18:25:48 +08:00
    但是由于昨天负责接收短信的同学睡得实在太深了,导致这次的事故长时间的没有被发现。 我了个去!需要这样找理由吗?
    ven
        22
    ven  
       2014-08-21 09:01:19 +08:00
    睡得太实在。。。难道只有一个人收短信么?
    我现在的公司,只要服务一出问题,N多人都会收到短信。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3106 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 14:06 · PVG 22:06 · LAX 06:06 · JFK 09:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.