SPOF FTL -

今天早上快爆了一个小时的网

每个冗余系统仍然有单点故障——通常是人为故障。

英国政府的官方网站是受今早宕机影响的网站之一。显示的神秘的“Guru Mediation”消息是从支持fast CDN的Varnish缓存服务器返回的未捕获的、未剥皮的错误。
放大 /英国政府的官方网站是受今早宕机影响的网站之一。显示的神秘的“Guru Mediation”消息是从支持fast CDN的Varnish缓存服务器返回的未捕获的、未剥皮的错误。

今天早上大约有一个小时——美国东部时间早上6点到7点,误差不超过几分钟——大量互联网瘫痪或有趣的是瘫痪。被关闭的网站包括CNN、《卫报》、《纽约时报》、贝宝和Spotify,还有很多网站,包括The Verge,该公司在宕机期间通过谷歌Docs进行报道。

潜在的问题是急剧该公司是世界上最大的内容交付网络提供商之一,整个服务之所以瘫痪,是因为它在全球所有的存在点(POPs)上部署了错误的配置。因此,使用fast进行内容传递的站点会出现各种各样的错误,这取决于本地站点配置。一些站点提供了相对缺乏信息的普通HTTP 503(服务不可用)页面,而其他站点则返回诸如“快速错误:未知域”之类的错误。

“未知领域”错误给了我们一些关于问题本质的诱人暗示,这比fast自己的状态更新到目前为止所拥有的更多。这告诉我们fastfast的网络是正常的,它的Varnish缓存服务器正在响应请求,但是它的缓存配置——Varnish Control Language文件将缓存服务器指向提供原始内容的后端服务器——几乎可以肯定要么是缺失的,要么是乱码的。

Fastly自己的状态页面承认这个问题是在美国东部时间早上5:58发生的,然后在6:44被发现并在6:57被修复(“增加源负载”,在很多情况下可能意味着站点仍然不可用一段时间)。状态页面将该问题归类为“全球CDN中断”,但没有提供技术细节。fast工程团队的一条推特提供了更多细节:

互联网分析主管道格·马德瑞告诉记者,虽然这次停电很短暂,但还算幸运美国有线电视新闻网他的公司Kentik早上5点49分,车流迅速消失,6点39分再次出现——对金融的影响是巨大的。媒体测量公司Kantar预估在长达一小时的停电中,全世界损失了2900万美元的广告收入。

急剧的短暂混乱投资者似乎并没有太在意。FSLY在纽约证交所盘前交易中下跌0.81美元,可能是由于故障本身,但在上午10点反弹至3.24美元。在收盘时,它达到了56.20美元,比昨天的50.70美元的收盘价上涨了10.8%。

你必须置评。

通道Ars Technica