4 月 29 日的 Braze 停电:发生了什么、为什么发生以及我们如何应对
已发表: 2024-05-042024 年 4 月 29 日星期一,Braze 平台的美国集群几乎完全中断,全部或部分中断持续了近 11 个小时,影响了客户对我们仪表板的访问以及数据处理和消息发送。 在 Braze 13 年的历史中,这是我们第一次也是唯一一次发生如此严重的事件。 我们与客户的关系建立在信任的基础上,我们始终对构建弹性系统感到非常自豪,这些系统使我们的平台即使在苛刻的工作负载下也能保持可用性和性能。 在这次中断期间,我们未能兑现这一承诺,对于这对我们每一位客户造成的影响,我们深表歉意。
为了帮助您更好地了解发生的情况和原因,我将提供有关我们的架构的一些重要背景信息,详细描述中断的原因,引导您完成我们已经做出的更改,并概述我们将要开展的工作并在近期和未来实施。