分页: 1 / 2

#1 AWS问题找到了

发表于 : 2025年 10月 25日 13:21
YouHi

At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.

https://www.cnn.com/2025/10/25/tech/aws-outage-cause

LOL


#2 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:29
cng
YouHi 写了: 昨天 13:21

At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.

https://www.cnn.com/2025/10/25/tech/aws-outage-cause

LOL

Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…


#3 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:31
YouHi
cng 写了: 昨天 13:29

Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…

这个的确比较震撼。。。
someone should be fired for this


#4 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:33
赖美豪中

这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹

cng 写了: 昨天 13:29

Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…


#5 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:35
YouHi
赖美豪中 写了: 昨天 13:33

这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹

老领导不懂就别瞎掰了。

24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。


#6 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:36
苍井吱
YouHi 写了: 昨天 13:35

老领导不懂就别瞎掰了。

24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。

没有备份?


#7 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:36
weidong

不能凡事都甩锅三锅啊。

但这事闻起来很象两个部门争取KPI造成的。

cng 写了: 昨天 13:29

Well-known situation in college level classes, had to be the backfire of Amazon’s hiring of a3 H1B programming campers…


#8 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:37
YouHi
苍井吱 写了: 昨天 13:36

没有备份?

没仔细研究。估计是不是dns server太多都需要update and verify?
我不是搞network这方面的。


#9 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:38
YouHi

总之可笑的要命。。。


#10 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:39
赖美豪中

你会用aws么?这个场景是cloud吹牛b修复起来最快最牛b的,很显然他们花了很长时间没找到root problem,才花了24小时

YouHi 写了: 昨天 13:35

老领导不懂就别瞎掰了。

24小时主要是修复各种dns record吧。Bug本身修起来估计5分钟。


#11 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:40
苍井吱

24小时,按照它自己标榜的99.99% availability

一下子把3年的quota梭哈光了


#12 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:45
YouHi
赖美豪中 写了: 昨天 13:39

你会用aws么?这个场景是cloud吹牛b修复起来最快最牛b的,很显然他们花了很长时间没找到root problem,才花了24小时

我居然无言以对。无法证明或证伪老领导的瞎猜。


#13 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:47
苍井吱
YouHi 写了: 昨天 13:45

我居然无言以对。无法证明或证伪老领导的瞎猜。

你敢说老领导是邪教?


#14 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:49
牛河梁
YouHi 写了: 昨天 13:37

没仔细研究。估计是不是dns server太多都需要update and verify?
我不是搞network这方面的。

你的机器不是每次都去DNS拿IP。拿回来缓存一段时间过期以后再去拿。所以即使DNS记录更新了。你的机器用的IP还是错的。除非手动刷新。但问题是十万百万计的(中间)服务器谁去手动刷新啊。


#15 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:51
牛河梁

可能不止一个问题。老牛听KQED最初的报道是数据库patch有bug。导致整个地区下线。然后流量把其它地区也冲垮了。

YouHi 写了: 昨天 13:21

At a high level, the issue stemmed from two programs competing to write the same DNS entry – essentially a record in the internet’s phonebook – at the same time, which resulted in an empty entry. That threw multiple AWS services into disarray.

https://www.cnn.com/2025/10/25/tech/aws-outage-cause

LOL


#16 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:52
YouHi
苍井吱 写了: 昨天 13:47

你敢说老领导是邪教?

根据我对老领导多年的了解,他是搅匙帮的。


#17 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:56
cng
YouHi 写了: 昨天 13:52

根据我对老领导多年的了解,他是搅匙帮的。

幾袋?


#18 Re: AWS问题找到了

发表于 : 2025年 10月 25日 13:58
YouHi
cng 写了: 昨天 13:56

幾袋?


#19 Re: AWS问题找到了

发表于 : 2025年 10月 25日 16:22
tiantian2000
赖美豪中 写了: 昨天 13:33

这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹

你们小作坊用料就是猛,修的也快,老领导亲自改代码,亲自QA,亲自release,亲自指挥,亲自部署,一条龙


#20 Re: AWS问题找到了

发表于 : 2025年 10月 25日 16:24
drifter
赖美豪中 写了: 昨天 13:33

这就是ai写code的水平,但是三锅fix这种问题居然要花24小时才是奇迹

雪崩之后踩踏 限流后慢慢恢复