SPOF FTL -

今天早上很快就打破了一个小时的互联网

每个冗余系统仍然有单点故障——通常是人为故障。

联合王国政府的官方网站是受到今天早晨中断影响的人之一。显示的隐秘“Guru调解”消息是从播放缓存服务器供电的旧版缓存服务器返回的未映射Unskinned错误。
扩大 /联合王国政府的官方网站是受到今天早晨中断影响的人之一。显示的隐秘“Guru调解”消息是从播放缓存服务器供电的旧版缓存服务器返回的未映射Unskinned错误。

今天早上6点到早上7点到7点,给予或花几分钟 - 互联网越来越多的互联网,越来越多的互联网被拒绝或有趣地破碎。包括CNN,Guardian,纽约时报,PayPal和Spotify的网站,包括濒临介绍,在停机期间通过Google文档诉诸于通过Google文档报告。

潜在的问题是急剧该公司是世界上最大的内容交付网络提供商之一,整个服务之所以瘫痪,是因为它在全球所有的存在点(POPs)上部署了错误的配置。因此,使用fast进行内容传递的站点会出现各种各样的错误,这取决于本地站点配置。一些站点提供了相对缺乏信息的普通HTTP 503(服务不可用)页面,而其他站点则返回诸如“快速错误:未知域”之类的错误。

“未知领域”错误给了我们一些关于问题本质的诱人暗示,这比fast自己的状态更新到目前为止所拥有的更多。这告诉我们fastfast的网络是正常的,它的Varnish缓存服务器正在响应请求,但是它的缓存配置——Varnish Control Language文件将缓存服务器指向提供原始内容的后端服务器——几乎可以肯定要么是缺失的,要么是乱码的。

速度自己的状态页面承认这个问题是在美国东部时间早上5:58发生的,然后在6:44被发现并在6:57被修复(“增加源负载”,在很多情况下可能意味着站点仍然不可用一段时间)。状态页面将该问题归类为“全球CDN中断”,但没有提供技术细节。fast工程团队的一条推特提供了更多细节:

虽然中断是仁慈的简要介绍互联网分析Doug Madory告诉美国有线电视新闻网他的公司Kentik早上5点49分,车流迅速消失,6点39分再次出现——对金融的影响是巨大的。媒体测量公司Kantar预估在小时长的停机期间,在全球范围内损失2900万美元。

急剧的短暂混乱看起来似乎没有困扰投资者。在纽约证券交易所的市场前交易中有动力下降0.81美元 - 由于中暑,但达到了上午10点至上午10点,达到3.24美元。截至收盘时,昨天的50.70美元的收盘价增长10.8%。

163年读者评论

  1. 引用:
    媒体测量公司Kantar估计,在长达一小时的停电期间,全球广告收入损失了2900万美元。


    好。
    |注册了347个帖子
  2. “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......
    6911帖子|注册
  3. 我想,相信世界上最大的CDN会在发布补丁时遵循最佳实践是天真的。
    |注册了55个帖子
  4. 在澳大利亚,这对我昨晚迟到了。作为命运会有它,我正在做一些深夜部署工作,最终得到了这一点。Gitlab的网站和Terraform Registry是这一中断的突出受害者之一。
    596个帖子|注册
  5. Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......


    广告商损失了钱?

    图像
    36175帖子|注册
  6. 这个时候我们部署到了自己的服务器上,我听说有人说我们网站上嵌入的Vimeo视频没有缩略图。一开始我认为这是一个典型的“除了这个奇怪的事情之外,所有的部署都很好”类型的错误,但后来我看到Vimeo自己的站点丢失了所有的资产。
    2个帖子|注册
  7. Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......

    几乎就是我要发布的内容。不过我会用一个真正的省略号…

    你会选择什么方式进入?Alt-codes吗?复制粘贴吗?一个(非常)扩展的键盘与完整的Unicode集?
    |注册了3221个帖子
  8. 那么快。今天的利比昨天的价值高10% ?(或许是因为他们在美国市场开盘前就已经从错误中恢复过来了?)
    |注册了3221个帖子
  9. 我想我只是个笨蛋,但像这样重要的服务不应该有多个故障点吗?Fastly要为他们的错误付出代价吗?

    最后一次编辑train_wreck上午208年6月5日5:28

    |注册了199个帖子
  10. Defenestrar写道:
    Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......

    几乎就是我要发布的内容。不过我会用一个真正的省略号…

    你会选择什么方式进入?Alt-codes吗?复制粘贴吗?一个(非常)扩展的键盘与完整的Unicode集?

    在Mac上,它通常是一个简单的两键组合。(例如,Alt +;在美国键盘上输入Alt+。关于德国布局)
    |注册了1438个帖子
  11. Defenestrar写道:
    那么快。今天的利比昨天的价值高10% ?(或许是因为他们在美国市场开盘前就已经从错误中恢复过来了?)


    也许这次停电只是让投资者注意到它们实际上有多重要!
    92篇帖子|注册
  12. train_wreck写道:
    我想我只是个笨蛋,但像这样重要的服务不应该有多个故障点吗?

    特别讽刺的是,CDN本质上是一个系统,它为客户创建多个独立的、相同的托管服务,以创造更好的最终用户体验(例如,本地缓存,从而减少延迟等)。
    |注册了3221个帖子
  13. Luke90写道:
    Defenestrar写道:
    那么快。今天的利比昨天的价值高10% ?(或许是因为他们在美国市场开盘前就已经从错误中恢复过来了?)


    也许这次停电只是让投资者注意到它们实际上有多重要!

    所有的宣传都是好的宣传?我想我能看出来。
    |注册了3221个帖子
  14. 也许我只是生气,因为我没有先想到,但是该死的…我们究竟是怎么做到一个小时的部分互联网中断就能带来2900万美元的广告收入(估计)的?
    325帖子|挂号的
  15. 引用:
    由于在全球范围内所有的部署点(pop)配置错误,导致整个服务宕机


    嗯。作为一个在CDN上工作的devops工程师,我真的很想知道他们的鸣叫和回滚过程是什么,因为这似乎是一个不寻常的推动。
    |注册了368个帖子
  16. Luke90写道:
    Defenestrar写道:
    那么快。今天的利比昨天的价值高10% ?(或许是因为他们在美国市场开盘前就已经从错误中恢复过来了?)


    也许这次停电只是让投资者注意到它们实际上有多重要!


    我同意,我认为这才是真正的原因
    |注册了57个帖子
  17. Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......


    你知不知道货架上还有多少没用的阴茎扩大药没卖出去?
    1192帖子|挂号的
  18. Defenestrar写道:
    Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......

    几乎就是我要发布的内容。不过我会用一个真正的省略号…

    你会选择什么方式进入?Alt-codes吗?复制粘贴吗?一个(非常)扩展的键盘与完整的Unicode集?



    选项-;在Mac。
    2910个帖子|注册
  19. 引用:
    媒体测量公司Kantar估计,在长达一小时的停电期间,全球广告收入损失了2900万美元。


    好。

    这是一个非常大的数字。它让我想到,每小时,CondéNast从Ars做出多少。如果数字的大小我认为是1,为什么劳资谈判的事情还没有解决?为了让员工开心,这对收入的打击似乎微不足道。

    1根据质量指标,这是比NYT更有价值的方式!(我确实意识到既不是CN,也没有广告商基础估值质量尽管)。
    |注册了3221个帖子
  20. 有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    据推测,在任何机制中,使用用于在多个CDN之间分配流量的机制中创建新的失败点。
    92篇帖子|注册
  21. 有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。
    |注册了330个帖子
  22. Defenestrar写道:
    引用:
    媒体测量公司Kantar估计,在长达一小时的停电期间,全球广告收入损失了2900万美元。


    好。

    这是一个非常大的数字。它让我想到,每小时,CondéNast从Ars做出多少。如果数字的大小我认为是1,为什么劳资谈判的事情还没有解决?为了让员工开心,这对收入的打击似乎微不足道。

    1根据质量指标,这是比NYT更有价值的方式!(我确实意识到既不是CN,也没有广告商基础估值质量尽管)。


    我得说,Ars可能是关于最糟糕的投放定向广告的地方,我们比这聪明。另外,所有广告商想要的人?那些愿意为优质产品支付高价的人?

    他们根本不会看到广告,因为他们已经订阅了。

    但是,我很好奇。这些数字会超级有趣。
    563个帖子|注册
  23. 和往常一样,这些评论中充满了声称自己有15年经验,并确信自己永远不会遇到这种情况的人。

    由于我们之前没有听说过重大问题,因此可以安全地说他们已经有很好的过程。但是在这种规模,没有什么是简单的。
    2210帖子|挂号的
  24. nmonk写道:
    有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。

    在这种情况下,有一个备用系统来快速切换流量通常是好的,但我绝对不会信任一个自动切换系统,因为正如你所说的,试图让所有东西都很好地运行在一起很可能会导致系统崩溃。在这种情况下,我不确定它会给任何人带来多少好处。只有在宕机持续时间超过工程师查明问题、确定问题出现得不够快并进行切换的情况下,才能将DNS切换到备份。这只关闭了一个小时,所以可能没有什么人可以做的,除非他们有钱投入战斗测试他们的系统,就像Netflix经常做的。
    1557帖子|挂号的
  25. daneren2005写道:
    nmonk写道:
    有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。

    在这种情况下,有一个备用系统来快速切换流量通常是好的,但我绝对不会信任一个自动切换系统,因为正如你所说的,试图让所有东西都很好地运行在一起很可能会导致系统崩溃。在这种情况下,我不确定它会给任何人带来多少好处。只有在宕机持续时间超过工程师查明问题、确定问题出现得不够快并进行切换的情况下,才能将DNS切换到备份。这只关闭了一个小时,所以可能没有什么人可以做的,除非他们有钱投入战斗测试他们的系统,就像Netflix经常做的。

    对 - 这种冗余测试完全是他们2800万美元的每个股份的浪费。
    |注册了3221个帖子
  26. nmonk写道:
    有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。


    CDN不是字面上的冗余结构。在更大的情况下,它们是广泛分布的缓存服务,为了不让核心服务在负载下崩溃,你需要这些服务。

    它们可以是较小的尺度上的冗余结构,但它们也是对剂量类别的相对有效的缓解,因为它们通常也会处理带宽密集的反应。
    |注册了368个帖子
  27. Defenestrar写道:
    Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......

    几乎就是我要发布的内容。不过我会用一个真正的省略号…

    你会选择什么方式进入?Alt-codes吗?复制粘贴吗?一个(非常)扩展的键盘与完整的Unicode集?


    语音识别?
    301帖子|挂号的
  28. 塔里瓦斯写道:
    我想,相信世界上最大的CDN会在发布补丁时遵循最佳实践是天真的。

    somethingsomething我在prodd测试…
    1063帖子|挂号的
  29. 今天,开发人员得到了他们的翅膀。
    6255帖子|挂号的
  30. 在今天的3-4晚3-4分,速度的表现仍然在一些地方的厕所。

    至少,我试着从Ubuntu / Snapcraft拉“快照”,这是在fast上,我只看到300Kbit/sec从我所指向的节点(和我工作的VM是在一个数据中心2x10Gb的DIA feeds)。
    18457帖子|挂号的
  31. Defenestrar写道:
    Zak写道:
    “在长达一小时的停电期间,全世界损失了2900万美元的广告收入。”

    没有任何价值丢失......

    几乎就是我要发布的内容。不过我会用一个真正的省略号…

    你会选择什么方式进入?Alt-codes吗?复制粘贴吗?一个(非常)扩展的键盘与完整的Unicode集?


    我使用LaTeX命令使用这个开源应用程序: https://github.com/dacin21/latex-input

    不仅可以键入…,还可以区分φ's和ϕ's。

    另一个选项(在Windows上)是相对新的表情符号和符号条目键盘,可通过快捷方式可用Win +;
    |注册了15个帖子
  32. ZPrime写道:
    在今天的3-4晚3-4分,速度的表现仍然在一些地方的厕所。

    至少,我试着从Ubuntu / Snapcraft拉“快照”,这是在fast上,我只看到300Kbit/sec从我所指向的节点(和我工作的VM是在一个数据中心2x10Gb的DIA feeds)。



    啊,你检查url了吗?

    我猜你还连接着他们的备份节点,慢点
    4351帖子|注册
  33. Defenestrar写道:
    daneren2005写道:
    nmonk写道:
    有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。

    在这种情况下,有一个备用系统来快速切换流量通常是好的,但我绝对不会信任一个自动切换系统,因为正如你所说的,试图让所有东西都很好地运行在一起很可能会导致系统崩溃。在这种情况下,我不确定它会给任何人带来多少好处。只有在宕机持续时间超过工程师查明问题、确定问题出现得不够快并进行切换的情况下,才能将DNS切换到备份。这只关闭了一个小时,所以可能没有什么人可以做的,除非他们有钱投入战斗测试他们的系统,就像Netflix经常做的。

    对 - 这种冗余测试完全是他们2800万美元的每个股份的浪费。


    我知道cdn是如何工作的,也许我比非技术人员了解得更多,所以如果这是愚蠢的,请原谅我……但是你能在cdn之间进行“负载平衡”以防止这种情况发生吗?不是真正意义上的切换故障转移,而是真正的负载平衡?所以有些流量通过第一个,有些通过第二个(比如Fastly和Cloudflare)?
    |注册了336个帖子
  34. 引用:
    媒体测量公司Kantar估计,在长达一小时的停电期间,全球广告收入损失了2900万美元。


    好。


    我们真的可以说失去了吗?

    我一直有一个关于“收入损失”的问题——你可能会因为一场风暴而损失庄稼,但除非广告商支付了钱,而内容网络从未收到钱,否则它不是真正的损失,只是没有实现。
    4552帖子|挂号的
  35. Audunru.写道:
    这个时候我们部署到了自己的服务器上,我听说有人说我们网站上嵌入的Vimeo视频没有缩略图。一开始我认为这是一个典型的“除了这个奇怪的事情之外,所有的部署都很好”类型的错误,但后来我看到Vimeo自己的站点丢失了所有的资产。


    Twitter缺少Emojis。其他一切工作,但表情符号没有显示。:)
    13242帖子|挂号的
  36. 与此同时,西海岸的每个人都喜欢....zzzzzzzzzz……(醒来)嗯。网络断了一个小时?哦。
    5个帖子|注册
  37. ukeandhike.写道:
    Defenestrar写道:
    daneren2005写道:
    nmonk写道:
    有些大型团队只使用一个CDN而不使用另一个作为备份,这有点令人惊讶。想象一下,这种情况现在将会改变。


    CDN实际上是一种冗余结构。

    在播放中放置另一个冗余结构可能只是使它经常掉两次,因为如果这样的行为不当,它会受到干扰。

    在这种情况下,有一个备用系统来快速切换流量通常是好的,但我绝对不会信任一个自动切换系统,因为正如你所说的,试图让所有东西都很好地运行在一起很可能会导致系统崩溃。在这种情况下,我不确定它会给任何人带来多少好处。只有在宕机持续时间超过工程师查明问题、确定问题出现得不够快并进行切换的情况下,才能将DNS切换到备份。这只关闭了一个小时,所以可能没有什么人可以做的,除非他们有钱投入战斗测试他们的系统,就像Netflix经常做的。

    对 - 这种冗余测试完全是他们2800万美元的每个股份的浪费。


    我知道cdn是如何工作的,也许我比非技术人员了解得更多,所以如果这是愚蠢的,请原谅我……但是你能在cdn之间进行“负载平衡”以防止这种情况发生吗?不是真正意义上的切换故障转移,而是真正的负载平衡?所以有些流量通过第一个,有些通过第二个(比如Fastly和Cloudflare)?


    是的。有些顾客就是这么做的。

    但是,绝大多数CDN客户希望CDN本身充当负载均衡器;摆脱在适当的负载平衡中所涉及的自我管理的复杂性是CDN的卖点,就像低延迟本身一样。所以你不会经常看到这种情况,即使是在相当大的CDN用户中。
    13242帖子|挂号的

你必须评论。

渠道Ars Technica