工单节点使用指南
• 请用平和的语言准确描述你所遇到的问题
• 厂商的技术支持和你一样也是有喜怒哀乐的普通人类,尊重是相互的
• 如果是关于 V2EX 本身的问题反馈,请使用 反馈 节点
Aliencn

阿里云炸了

  •  
  •   Aliencn · Jun 27, 2018 · 30702 views
    This topic created in 2896 days ago, the information mentioned may be changed or developed.

    控制台连不上

    API 各种报错

    一些阿里产品的官方群的用户已经各种抱怨了

    Supplement 1  ·  Jun 27, 2018
    https://help.aliyun.com/noticelist/articleid/24179443.html?spm=a2c4g.789004748.n2.6.NO57eQ


    [阿里云] [网络] [异常通告]
    异常时间:北京时间 2018 年 6 月 27 日 16:21 左右。
    异常概述:于北京时间 2018 年 6 月 27 日 16:21 左右开始,阿里云部分产品及账号登陆出现访问异常,阿里云工程师正在紧急处理中,请您稍后重试。
    有任何问题,可随时通过服务电话 95187 联系反馈。

    [异常更新]
    北京时间 2018 年 6 月 27 日 16:50
    目前受影响的业务正在逐步恢复中,若遇到异常,请您稍等后重试。
    Supplement 2  ·  Jun 27, 2018
    [异常更新]
    北京时间 2018 年 6 月 27 日 17:30
    目前受影响的业务大部分已经恢复正常,请您确认。若还有异常,请您跟我们反馈,谢谢。


    目前阿里公告说已经恢复了。大家可以看一下自己的业务有没有问题。
    Supplement 3  ·  Jun 27, 2018
    坐等阿里云官方公开故障原因,以及赔偿方案。
    173 replies    2018-06-28 13:15:11 +08:00
    1  2  
    Mitt
        101
    Mitt  
       Jun 27, 2018
    @jayin 明显就是背锅的, 哪家实习生能有那么大权限碰业务的, 拿脚想都不可能让一个啥都不懂的碰这么重要的东西的
    zsdroid
        102
    zsdroid  
       Jun 27, 2018
    @jayin #97 所以这是实习生的锅还是测试的锅?
    tiancaiyong
        103
    tiancaiyong  
       Jun 27, 2018
    上午当着 CTO 面提出想要把自建的 MQ 切到阿里云,然后阿里云下午就搞事情,我还能咋说
    xiaoyang7545
        104
    xiaoyang7545  
       Jun 27, 2018
    @jayin 感觉不能吧。关键服务直接给实习生做了还敢上线,不 review code 的?
    PureWhite
        105
    PureWhite  
       Jun 27, 2018
    看来阿里云花大钱在世界杯打的广告打水漂了
    gccplus
        106
    gccplus  
       Jun 27, 2018   ❤️ 1
    实习生,临时工,黑客攻击,反正不敢甩锅给运营商的
    ooTwToo
        107
    ooTwToo  
       Jun 27, 2018
    Failed to collect dependencies at com.qiniu:qiniu-java-sdk:jar:[7.2.0,7.2.99]: No versions available for com.qiniu:qiniu-java-sdk:jar:[7.2.0,7.2.99] within specified range -> [Help 1]
    mageemeng
        108
    mageemeng  
       Jun 27, 2018
    炸了炸了
    majunbo
        109
    majunbo  
       Jun 27, 2018
    @tiancaiyong 来吧,买华为我可以支持你。:)
    torment5524
        110
    torment5524  
       Jun 27, 2018
    oss 还没好。。。数据库和服务器还算是正常。。。
    lamCJ
        111
    lamCJ  
       Jun 27, 2018
    实习生:随便你们吧 什么都是劳资背锅 现在又是当运维删服务
    tingyunsay
        112
    tingyunsay  
       Jun 27, 2018
    域名代金券怎么不能使用了啊.....马上到期了都,麻烦问下 @Aliencn
    Aliencn
        113
    Aliencn  
    OP
       Jun 27, 2018   ❤️ 1
    @tingyunsay 我不是阿里的人,建议你开工单问一下吧
    Dwwwwww
        114
    Dwwwwww  
       Jun 27, 2018
    阿里云会不会补偿啊(我猜不会
    Aliencn
        115
    Aliencn  
    OP
       Jun 27, 2018
    @Dwwwwww 我之前都找阿里赔偿过很多次了,但是我希望这次阿里能主动赔偿
    tingyunsay
        116
    tingyunsay  
       Jun 27, 2018
    @Aliencn 好的,不好意思问错了哈....(lll ¬ω¬)
    1yndonn3u
        117
    1yndonn3u  
       Jun 27, 2018


    哪个同学知道原因
    1yndonn3u
        118
    1yndonn3u  
       Jun 27, 2018
    @tingyunsay #95 这个是怎么回事啊,是什么服务 404 了好几天啊?好想了解下。
    loserwn
        119
    loserwn  
       Jun 27, 2018   ❤️ 1
    kY8mbXW833Lu28xn
        120
    kY8mbXW833Lu28xn  
       Jun 27, 2018 via Android
    so 不出来解释一下?这都多长时间了
    wingspread
        121
    wingspread  
       Jun 27, 2018
    正发布程序呢,阿里云挂了。:(
    luxin88
        122
    luxin88  
       Jun 27, 2018
    阿里云刚给我打完骚扰电话,然后就挂了
    1yndonn3u
        123
    1yndonn3u  
       Jun 27, 2018


    这么多人都遇到了,只能说明现在阿里云的确做大了,太多人在使用阿里云了。
    orzcc
        124
    orzcc  
       Jun 27, 2018
    @1yndonn3u 市场占有率肯定的啊,国内遥遥领先第一,明摆着。这次问题也算是特大级故障了。
    fhefh
        125
    fhefh  
       Jun 27, 2018
    收到客户经理发的消息了~~~ 我上去瞄了下 还好没业务 嘿嘿~
    galvinwang007
        126
    galvinwang007  
       Jun 27, 2018
    实习生能有这么大权限????
    jiangnanyanyu
        127
    jiangnanyanyu  
       Jun 27, 2018 via Android
    腾讯云或成为最大赢家
    anotherlf
        128
    anotherlf  
       Jun 27, 2018 via Android
    上午阿里云还给我打电话说有促销活动。这下午就挂了啊
    jizhu
        129
    jizhu  
       Jun 27, 2018
    总结:阿里云炸了,要赔偿,过程不重要
    pepesii
        130
    pepesii  
       Jun 27, 2018
    对于服务炸了的厂商的总结:就是不要把鸡蛋放一个篮子
    jmk92
        131
    jmk92  
       Jun 27, 2018 via iPhone
    CDN+OSS,cdn 有鉴权,查看控制台的 httpcode 监控,瘫痪了半个小时。。。
    tingyunsay
        132
    tingyunsay  
       Jun 27, 2018
    @1yndonn3u #118 就是挂在百度云的一些公司基本上都 404 了几天,具体的就不说了,我们就是用的百度云,花了一整个晚上恢复线上环境,重新部署代码,后续慢慢恢复后端任务....
    jimages
        133
    jimages  
       Jun 27, 2018 via iPhone
    这下好了...本来两地三中心灾备...对各种故障信心满满…没想到阿里云崩了
    janxin
        134
    janxin  
       Jun 27, 2018 via iPhone
    @jimages 你放在一个云里就是不行
    1yndonn3u
        135
    1yndonn3u  
       Jun 27, 2018
    @tingyunsay #132 私信说说,好想了解下。
    1yndonn3u
        136
    1yndonn3u  
       Jun 27, 2018
    @tingyunsay #132 好想不能私信,说下具体几月几号?想了解下,说下啊,老哥。
    rootit
        137
    rootit  
       Jun 27, 2018
    业务代码已经高度依赖一个云中的服务了,比如 OSS 已经集成。。。
    Voichesapete
        138
    Voichesapete  
       Jun 27, 2018 via Android
    这就是为什么要混合云、多云
    F281M6Dh8DXpD1g2
        139
    F281M6Dh8DXpD1g2  
       Jun 27, 2018 via iPhone
    五个 9 泡汤了
    yanest
        140
    yanest  
       Jun 27, 2018
    从昨天开始就 DNS 故障,智能解析部分地区无法解析,自己的公共 dns 自己都解析不了
    tiantianjiaban
        141
    tiantianjiaban  
       Jun 27, 2018
    连续性业务还是要上多云呀
    feverzsj
        142
    feverzsj  
       Jun 27, 2018
    哈哈,这个比放机房还要惨得多,阿里号称国内第一,修复速度这么慢
    guoyuchuan
        143
    guoyuchuan  
       Jun 27, 2018
    我同事刚吹逼说他用阿里云,秒进后台,结果打脸了,哈哈哈哈;原来如此
    MOmc
        144
    MOmc  
       Jun 27, 2018 via iPhone
    实习生误删登录服务???
    tgyday
        145
    tgyday  
       Jun 27, 2018
    这个锅看下最终得主是谁
    fish267
        146
    fish267  
       Jun 27, 2018 via Android
    vip
    byuc
        147
    byuc  
       Jun 27, 2018
    赔偿?大家当什么事都没发生过
    tingyunsay
        148
    tingyunsay  
       Jun 27, 2018
    @1yndonn3u #136 这也没啥好说的,7 号下午两三点吧.....
    gleymonkey
        149
    gleymonkey  
       Jun 27, 2018
    还 tm 罗汉堂,还 tm 探寻人类未来,连自身基础都做不好。
    xiaqi
        150
    xiaqi  
       Jun 27, 2018 via Android
    妈耶,上公司刚把我裁了,私有云不搞了,迁到阿里云。这下就出事了。哎,🙃🙃🙃🙃
    wdlth
        151
    wdlth  
       Jun 27, 2018
    怪不得今天用阿里云的 maven 一堆错
    opengps
        152
    opengps  
       Jun 27, 2018 via Android   ❤️ 1
    换个角度理解,云的高可用不是不出错,而是小错误隐藏了到后端了,大错误出一次就是狠的
    jsq2627
        153
    jsq2627  
       Jun 27, 2018
    OSS 挂了,公司内网也炸了一堆应用😂
    applehater
        154
    applehater  
       Jun 27, 2018
    @orzcc 国内的微软 Azure 日常帮用户重启系统也见多少人抱怨,看来没几个人用
    @1yndonn3u
    0xff0x77
        155
    0xff0x77  
       Jun 27, 2018
    今天 OSS 挂了,还以为 CDN 出问题了。
    DZBM
        156
    DZBM  
       Jun 27, 2018 via Android
    去年 AWS S3 大面积故障很好的说明了,越是以为很安全放松警惕的地方越容易出大乱子。阿里这次的问题肯定也有深层次系统系性原因,坐等官方故障报告。
    webjin1
        157
    webjin1  
       Jun 27, 2018
    digitalhaha
        158
    digitalhaha  
       Jun 27, 2018
    肯定是实习生
    york1996
        159
    york1996  
       Jun 27, 2018
    感觉是被黑了
    yangqi
        160
    yangqi  
       Jun 28, 2018
    @webjin1 和这个没关系,都三周前了,还是小道消息
    wenghuan
        161
    wenghuan  
       Jun 28, 2018
    实习生背埚
    mogutouer
        162
    mogutouer  
       Jun 28, 2018   ❤️ 5
    qcloud
        163
    qcloud  
       Jun 28, 2018 via iPhone
    @mogutouer 哈哈哈,图收藏了
    qcloud
        164
    qcloud  
       Jun 28, 2018 via iPhone
    欢迎使用腾讯云,www.qcloud.com
    yexm0
        165
    yexm0  
       Jun 28, 2018   ❤️ 1
    mytsing520
        166
    mytsing520  
    PRO
       Jun 28, 2018
    研发、代码审计、运维联合背锅呵呵哒
    hpayton
        167
    hpayton  
       Jun 28, 2018
    官方出公告了,可以发起赔偿了
    460881773
        168
    460881773  
       Jun 28, 2018
    @hpayton 怎么发起赔偿
    hhh
        169
    hhh  
       Jun 28, 2018
    回应还算得体
    1yndonn3u
        170
    1yndonn3u  
       Jun 28, 2018
    不知道系统有没有小流量过程。
    hpayton
        171
    hpayton  
       Jun 28, 2018
    @460881773 SLA 每个月会统计,系统里会给出赔偿方案
    mytsing520
        172
    mytsing520  
    PRO
       Jun 28, 2018   ❤️ 1
    从阿里内部人处弄来的信息(来源是马哥运维公众号):
    我刚看了下 GOC,这次故障影响了阿里整个集团,包括阿里云、蚂蚁、天猫、飞猪、优酷等 BU、阿里云那边的故障等级是 S1,蚂蚁这边受影响的是 P3。具体原因是一个 core 应用拉 vip 列表的时候,返回了空列表,导致把几千个 vip disable 了,直接影响了整个集团,阿里云只是其中一个受影响的

    线上业务故障 /事故的级别定义如下:
    S0 核心业务重要功能不可用且大面积影响客户;造成巨量损失 响应和恢复时间:立即
    S1 核心业务周边功能不可用,影响部分用户,造成一定损失 响应和恢复时间:小于 15 分钟
    S2 核心业务周边功能不可用,持续鼓掌将大面积影响用户体验 响应和恢复时间:小于 30 分钟
    S3 周边业务功能不可用,轻微影响用户体验 响应和恢复时间:处理和恢复 4 小时
    S4 周边业务功能不可用,但基本不影响不用正常使用 响应和恢复时间:小于 6 小时
    qiudays
        173
    qiudays  
       Jun 28, 2018
    强。。
    1  2  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1221 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 5414617a · 136ms · UTC 17:29 · PVG 01:29 · LAX 10:29 · JFK 13:29
    ♥ Do have faith in what you're doing.