Le cloud public n’est pas infaillible, vous en doutiez ?

Le cloud public n’est pas infaillible, vous en doutiez ?

Cette douce nuit du 28 février au 1er mars 2017 a tenu éveillés beaucoup d’européens, le service S3 de Amazon Web Services a connu une indisponibilité de plusieurs heures dans la région historique us-east-1 situé en Virginie (USA). Mais pourquoi de grands noms du web se trouvent autant impactés ? Ces grands du web, Trello, Slack, etc. valorisés à plusieurs millions voire milliards auraient-ils un bad-design d’infrastructure ?

Car Non !

Tout Internet n’est pas tombé, Netflix a survécu, et nos clients n’ont pas été impactés, car non dépendants de cette région mais pourquoi ? Amazon Web Services est une plateforme entièrement programmatique, donc avec une couche logicielle qui pilote l’infrastructure et les services virtualisés et managés : avec ses forces comme ses faiblesses. Un design d’architecture doit tenir compte de cela : des indisponibilités et des solutions de repli. L’automatisation de la plateforme vous permet cette agilité, malheureusement encore mal exploitée !

the-it-crowd-jen-presents-the-internet-box-1379553174y

Les services dits socles fournis par AWS, ont un SLA, c’est à dire un engagement en terme de niveau de service, comme tout fournisseur de solution d’hébergement, nous vous invitons à parcourir notre post du 2 janvier dernier sur ce sujet.

Amazon Web Services, est une boîte à outils extrêmement riche en fonctionnalités, en services plus ou moins haut niveau, pouvant être orchestrés, et assemblés pour créer une infrastructure IT répondant à tous types de uses cases. Il est tout de même important de rappeler quelques fondamentaux : à ce jour 16 régions disponibles avec a minima 2 zones de disponibilité. Les service en cause ce 28 février, Amazon Simple Storage Service aka Amazon S3, est l’un des services centraux de AWS, en effet beaucoup de design patterns s’appuient sur le stockage intermédiaire sur S3 pour découpler les infrastructures.

Saviez-vous que pour augmenter la résilience de S3, il vous est possible d’activer la réplication multi-régions ?

s3-cross-region-replication    s3-activate-cross-region-replication

Il est certain qu’une stratégie de conception multi-régions d’une infrastructure, n’est pas à la portée des start-up en early stage ou TPE/PME. Mais l’usage du cloud public, ne doit pas vous priver d’une véritable stratégie de Disaster Recovery, RTO/RPO, Fail-over / Fallback. Effectuez également le bon choix de région suivant vos audiences, nous avons vu beaucoup de structures avec une audience française ou européenne, impactées par cette panne en Virginie ?!

D’ailleurs il ne semble pas qu’il y ait eu des pertes de données sur cet incident, mais une perturbation importante des autres services dépendants. Ce qui confirme la haute durabilité des données dans S3, mais qui devient de fait un point essentiel dans AWS. Nul doute que les équipes de AWS travaillent déjà sur l’amélioration de sa résilience.

Pour les workloads vitaux de votre business, faites-vous accompagner ! Les partenaires comme COREXPERT, ont des équipes certifiées, qui ont déployé plusieurs dizaines voir centaines d’applications dans le Cloud AWS et pourront choisir avec vous la solution en adéquation avec votre business.

Contactez-nous !

Comments

comments

Les commentaires sont clos.