亚马逊云科技如何构建可靠的云服务
越来越多的企业将关键性的工作负载放到云上,如何确保云上业务的连续性即云的韧性对企业来说就越来越重要。
为构建和运行世界上最可靠的云,亚马逊云科技持续投入,在服务设计和部署机制中构建保障措施,并将韧性植根于运营文化之中。亚马逊云科技服务的设计中就考虑了如何防止中断和事故的发生,因此当中断确实发生时,对客户和服务的连续性的影响将是最小的。为了避免单点故障,亚马逊云科技最小化全球基础设施之间的互联性。亚马逊云科技全球基础设施地理位置分散,遍及33个地理区域的105个可用区。亚马逊云科技的区域由一个地理区域内的多个相互独立,且在物理上分隔的可用区组成。每个可用区都有独立的电力、制冷和物理安全设施,可用区之间通过冗余的超低延迟网络连接。同一区域内的可用区之间具有足够的距离,最远可达约100公里,既能防止相关故障,但又能实现单位毫秒级延迟的同步复制。亚马逊云科技是唯一在每个区域内提供三个或更多可用区的云提供商,通过更多冗余和更好的隔离来控制故障的影响面。常见故障点,如发电机和冷却设备等,不会在可用区之间共享,并且设计为由独立的电力变电站供电。为了获得高可用性的同时可以实现更大的容错能力,客户可以将他们的应用程序设计为在多个可用区中运行。
韧性根植于亚马逊云科技服务设计之中。在亚马逊云科技构建的服务必须满足极高的可用性目标。亚马逊云科技会仔细考虑系统所依赖的因素。即使这些依赖项受到影响,亚马逊云科技的设计也使我们的系统保持韧性;我们使用被称为静态稳定性来实现这种程度的韧性。这意味着系统以静态状态运行,并在发生故障或依赖项不可用时继续正常运行,无需进行任何更改。
数百万客户信赖亚马逊云科技是构建和运行关键业务和关键任务应用程序的最佳场所。亚马逊云科技提供了一套全面的专门构建的服务、策略和架构最佳实践,客户可以使用这些服务、策略和最佳实践来提升企业自身的韧性。这些服务、策略和最佳实践在亚马逊云科技韧性生命周期框架中被概述成了五个阶段:设定目标、设计和实施、评估和测试、运营以及响应和学习。弹性生命周期框架模仿标准软件开发生命周期,因此客户可以轻松地将韧性纳入现有流程。
来源:中国日报网