Une panne majeure d’AWS a paralysé des services populaires : Canva, Amazon, Prime Video, Fortnite, etc.
Un début de semaine compliqué pour les services d’AWS (Amazon Web Services) : une panne majeure a engendré des perturbations à l’échelle mondiale. De nombreux sites et applications, parmi les plus utilisés au monde, ont été inaccessibles ou fortement ralentis, touchant aussi bien les États-Unis que l’Europe.
En début de matinée, aux alentours de 08h50 (heure française), alors que j’étais en train de créer une vignette d’article sur Canva, l’application a commencé à ne plus afficher certains éléments. J’ai tenté de relancer l’application, même problème et dans le même temps, impossible de me connecter à la version Web : comme si mes identifiants étaient inconnus.
Canva a rapidement mis à jour sa page de statut pour indiquer qu’il y avait une panne. Cela s’est traduit aussi par de premiers signalements sur le site DownDetector. Et, puis, quand j’ai vu un pic de signalements similaires sur de nombreux autres services : il n’y avait plus de doute, cette panne va bien au-delà de Canva.
Une panne majeure dans la région US-EAST-1 d’AWS
L’origine de cette panne s’est révélée dans la matinée : la région US-EAST-1 du Cloud AWS a été impactée par un incident, ce qui a eu un effet direct sur les services hébergés chez ce fournisseur de services Cloud. Amazon a confirmé cet incident via sa page AWS Health, aux alentours de 09h10 (heure française).
“Nous pouvons confirmer des taux d’erreur accrus et des latences pour plusieurs services AWS dans la région US-EAST-1. Ce problème peut également affecter la création de tickets via le centre de support AWS ou l’API Support. Nous travaillons activement à atténuer le problème et à en comprendre la cause profonde.“, peut-on lire. En effet, le ticket évoque que 82 services du Cloud AWS sont impactés par cette panne.
Cette région, basée en Virginie, est l’une des plus importantes d’AWS et sert de pilier à de nombreux services mondiaux. La preuve, de nombreux services et sites web ont été impactés : Amazon.com, Prime Video, Canva, Zoom, Slack, PlayStation Network, Perplexity AI, Fortnite et de nombreuses autres plateformes.

Plusieurs entreprises clientes d’AWS ont rapidement confirmé l’incident. Par exemple, Epic Games a indiqué sur X que “le gameplay de Fortnite n’est pas directement affecté, mais les connexions sont indisponibles car le système d’authentification repose sur AWS”. De son côté, Perplexity AI a annoncé que sa plateforme de recherche conversationnelle était entièrement hors ligne.
Personnellement, j’ai pu récupérer l’accès à l’application Canva aux alentours de 12h00, soit environ 3 heures d’indisponibilité. Cette indisponibilité a pu être plus ou moins longue en fonction du service et de l’emplacement géographique de l’utilisateur.
Une panne liée à un problème de DNS
AWS a indiqué que la cause de cet incident pourrait être un problème de résolution DNS de l‘API DynamoDB dans la région US-EAST-1. Donc, concrètement, les serveurs AWS n’arrivaient plus à résoudre correctement les noms de domaine internes permettant à leurs propres services de communiquer entre eux.
“Nous avons identifié une cause potentielle des taux d’erreur pour les API DynamoDB dans la région US-EAST-1. Selon notre enquête, le problème semble lié à la résolution DNS du point de terminaison de l’API DynamoDB dans US-EAST-1. Nous travaillons sur plusieurs pistes parallèles pour accélérer la reprise. “, peut-on lire.
Ce bug DNS a eu un effet domino sur les services dépendant de DynamoDB et d’autres composants du cloud AWS (tels que EC2, RDS, ECS ou encore Lambda). Il y a donc eu des erreurs de lancement d’instances, des latences importantes et des retards de traitement dans plusieurs régions.
Finalement, ce type de panne ne fait que rappeler à quel point la dépendance à l’infrastructure cloud d’un géant comme AWS est critique pour l’écosystème numérique mondial. En quelques minutes, des millions d’utilisateurs et d’entreprises se retrouvent affectés…
Désormais, la situation semble s’améliorer progressivement. AWS continue de mettre à jour le ticket sur son site web, et à à l’heure où j’écris cet article, la dernière mise à jour date de 13h48 (heure française).
Qu’en pensez-vous ?