分页: 1 / 2
#1 AWS问题找到了
发表于 : 2025年 10月 25日 13:21
由 YouHi
At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.
https://www.cnn.com/2025/10/25/tech/aws-outage-cause
LOL
#2 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:29
由 cng
YouHi 写了: 昨天 13:21
At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.
https://www.cnn.com/2025/10/25/tech/aws-outage-cause
LOL
Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…
#3 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:31
由 YouHi
cng 写了: 昨天 13:29
Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…
这个的确比较震撼。。。
someone should be fired for this
#4 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:33
由 赖美豪中
这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹
cng 写了: 昨天 13:29
Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…
#5 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:35
由 YouHi
赖美豪中 写了: 昨天 13:33
这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹
老领导不懂就别瞎掰了。
24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。
#6 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:36
由 苍井吱
YouHi 写了: 昨天 13:35
老领导不懂就别瞎掰了。
24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。
没有备份?
#7 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:36
由 weidong
不能凡事都甩锅三锅啊。
但这事闻起来很象两个部门争取KPI造成的。
cng 写了: 昨天 13:29
Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…
#8 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:37
由 YouHi
没仔细研究。估计是不是dns server太多都需要update and verify?
我不是搞network这方面的。
#9 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:38
由 YouHi
#10 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:39
由 赖美豪中
你会用aws么?这个场景是cloud吹牛b修复起来最快最牛b的,很显然他们花了很长时间没找到root problem,才花了24小时
YouHi 写了: 昨天 13:35
老领导不懂就别瞎掰了。
24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。
#11 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:40
由 苍井吱
24小时,按照它自己标榜的99.99% availability
一下子把3年的quota梭哈光了
#12 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:45
由 YouHi
赖美豪中 写了: 昨天 13:39
你会用aws么?这个场景是cloud吹牛b修复起来最快最牛b的,很显然他们花了很长时间没找到root problem,才花了24小时
我居然无言以对。无法证明或证伪老领导的瞎猜。
#13 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:47
由 苍井吱
YouHi 写了: 昨天 13:45
我居然无言以对。无法证明或证伪老领导的瞎猜。
你敢说老领导是邪教?
#14 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:49
由 牛河梁
YouHi 写了: 昨天 13:37
没仔细研究。估计是不是dns server太多都需要update and verify?
我不是搞network这方面的。
你的机器不是每次都去DNS拿IP。拿回来缓存一段时间过期以后再去拿。所以即使DNS记录更新了。你的机器用的IP还是错的。除非手动刷新。但问题是十万百万计的(中间)服务器谁去手动刷新啊。
#15 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:51
由 牛河梁
可能不止一个问题。老牛听KQED最初的报道是数据库patch有bug。导致整个地区下线。然后流量把其它地区也冲垮了。
YouHi 写了: 昨天 13:21
At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.
https://www.cnn.com/2025/10/25/tech/aws-outage-cause
LOL
#16 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:52
由 YouHi
苍井吱 写了: 昨天 13:47
你敢说老领导是邪教?
根据我对老领导多年的了解,他是搅匙帮的。
#17 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:56
由 cng
YouHi 写了: 昨天 13:52
根据我对老领导多年的了解,他是搅匙帮的。
幾袋?
#18 Re: AWS问题找到了
发表于 : 2025年 10月 25日 13:58
由 YouHi
#19 Re: AWS问题找到了
发表于 : 2025年 10月 25日 16:22
由 tiantian2000
赖美豪中 写了: 昨天 13:33
这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹
你们小作坊用料就是猛,修的也快,老领导亲自改代码,亲自QA,亲自release,亲自指挥,亲自部署,一条龙
#20 Re: AWS问题找到了
发表于 : 2025年 10月 25日 16:24
由 drifter
赖美豪中 写了: 昨天 13:33
这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹
雪崩之后踩踏 限流后慢慢恢复