{"id":197,"date":"2010-07-29T18:01:15","date_gmt":"2010-07-29T16:01:15","guid":{"rendered":"http:\/\/blog.alwaysdata.com\/?p=197"},"modified":"2018-02-01T16:35:04","modified_gmt":"2018-02-01T15:35:04","slug":"evolution-du-systeme-de-redondance","status":"publish","type":"post","link":"https:\/\/blog.alwaysdata.com\/fr\/2010\/07\/29\/evolution-du-systeme-de-redondance\/","title":{"rendered":"\u00c9volution du syst\u00e8me de redondance"},"content":{"rendered":"<p><!--:fr-->Comme vous le savez peut-\u00eatre, nous avons d\u00e9cid\u00e9 d\u00e8s le lancement d\u2019alwaysdata de redonder nos serveurs principaux&nbsp;dans un second datacenter, en temps r\u00e9el (via&nbsp;<a href=\"http:\/\/www.drbd.org\">DRBD<\/a>). Le but \u00e9tait de pouvoir rapidement&nbsp;pallier les pannes graves si besoin, en basculant le cas \u00e9ch\u00e9ant l\u2019activit\u00e9 sur le second serveur.<\/p>\n<div>\n<p>Ce syst\u00e8me \u00ab&nbsp;de secours&nbsp;\u00bb a&nbsp;tr\u00e8s rarement servi pour une raison simple&nbsp;: nous n\u2019avons quasiment jamais eu des pannes mat\u00e9rielles importantes. Nous avons d\u00e9j\u00e0 subi des pannes assez longues, mais elles furent caus\u00e9es soit par des soucis logiciels (notamment la migration difficile vers la nouvelle architecture, en f\u00e9vrier dernier), soit par des perturbations r\u00e9seau.<\/p>\n<p>Ce syst\u00e8me de redondance pr\u00e9sente plusieurs d\u00e9fauts qui se sont r\u00e9v\u00e9l\u00e9s au fil du temps. Le premier, c\u2019est que le surco\u00fbt engendr\u00e9 est important, puisque nous devons quasiment doubler le nombre de serveurs utilis\u00e9s. Le deuxi\u00e8me, c\u2019est que notre fournisseur de secours ne propose pas toujours des configurations \u00e9quivalentes aux serveurs primaires, ce qui engendrerait des probl\u00e8mes de performances en cas de bascule. Le troisi\u00e8me, c\u2019est que la proc\u00e9dure de bascule est complexe, manuelle, et pas assez test\u00e9e.<\/p>\n<p>Une migration totale de tous nos serveurs en cas de panne du datacenter ou de son r\u00e9seau serait donc longue et p\u00e9rilleuse. Or ces derniers jours, notre fournisseur principal a&nbsp;connu des pannes r\u00e9p\u00e9t\u00e9es, dont la plus grosse s\u2019est produite samedi soir avec environ 50 minutes de quasi-indisponibilit\u00e9. Deux autres pannes de 30 et 25 minutes avaient eu lieu en d\u00e9but de mois, heureusement en pleine nuit.<\/p>\n<p>Cela n\u2019impacte pas notre confiance envers notre fournisseur, malgr\u00e9 cette p\u00e9riode difficile. Nous avons connu la n\u00f4tre en f\u00e9vrier dernier. Ces \u00e9pisodes sont acceptables \u00e0&nbsp;nos yeux d\u00e8s lors qu\u2019ils restent rares, que la communication est transparente, et que des mesures sont prises pour que cela ne se reproduise plus.<\/p>\n<p>De notre c\u00f4t\u00e9, nous avons commenc\u00e9 d\u00e8s le mois de juin dernier (avant les indisponibilit\u00e9s r\u00e9centes, donc) \u00e0&nbsp;repenser notre syst\u00e8me de redondance pour \u00e9liminer les d\u00e9fauts sus-cit\u00e9s. Nous sommes encore en plein d\u00e9veloppement, mais il nous semblait important, surtout en ce moment, de vous en faire&nbsp;part.<\/p>\n<p>Ce nouveau syst\u00e8me repose sur le service <a href=\"http:\/\/aws.amazon.com\/ec2\/\">EC2<\/a> d\u2019Amazon plut\u00f4t que des serveurs physiques. Cela nous permet une \u00e9conomie financi\u00e8re substantielle, n\u2019ayant plus besoin de faire tourner des serveurs secondaires 24h\/24. Par ailleurs, nous allons travailler sur le processus de bascule afin qu\u2019il soit plus simple, plus automatique.<\/p>\n<p>EC2 va nous permettre \u00e9galement de dupliquer nos serveurs en production en toute simplicit\u00e9. Cela pourrait servir pour tester des nouveaux d\u00e9ploiements sans risque, simuler des pannes, et d\u2019autres choses sympathiques. Nous aurons l\u2019occasion d\u2019en reparler d\u2019ici&nbsp;l\u00e0.<\/p>\n<p>Nous esp\u00e9rons mettre ce nouveau syst\u00e8me de redondance en production pour la rentr\u00e9e, mais comme toujours, les dates sont \u00e0&nbsp;prendre avec pr\u00e9caution\u2026<\/p>\n<\/div>\n<p><!--:--><!--:en-->Comme vous le savez peut-\u00eatre, nous avons d\u00e9cid\u00e9 d\u00e8s le lancement d\u2019alwaysdata de redonder nos serveurs principaux&nbsp;dans un second datacenter, en temps r\u00e9el (via&nbsp;<a href=\"http:\/\/www.drbd.org\">DRBD<\/a>). Le but \u00e9tait de pouvoir rapidement&nbsp;pallier les pannes graves si besoin, en basculant le cas \u00e9ch\u00e9ant l\u2019activit\u00e9 sur le second serveur.<\/p>\n<div>\n<p>Ce syst\u00e8me \u00ab&nbsp;de secours&nbsp;\u00bb a&nbsp;tr\u00e8s rarement servi pour une raison simple&nbsp;: nous n\u2019avons quasiment jamais eu des pannes mat\u00e9rielles importantes. Nous avons d\u00e9j\u00e0 subi des pannes assez longues, mais elles furent caus\u00e9es soit par des soucis logiciels (notamment la migration difficile vers la nouvelle architecture, en f\u00e9vrier dernier), soit par des perturbations r\u00e9seau.<\/p>\n<p>Ce syst\u00e8me de redondance pr\u00e9sente plusieurs d\u00e9fauts qui se sont r\u00e9v\u00e9l\u00e9s au fil du temps. Le premier, c\u2019est que le surco\u00fbt engendr\u00e9 est important, puisque nous devons quasiment doubler le nombre de serveurs utilis\u00e9s. Le deuxi\u00e8me, c\u2019est que notre fournisseur de secours ne propose pas toujours des configurations \u00e9quivalentes aux serveurs primaires, ce qui engendrerait des probl\u00e8mes de performances en cas de bascule. Le troisi\u00e8me, c\u2019est que la proc\u00e9dure de bascule est complexe, manuelle, et pas assez test\u00e9e.<\/p>\n<p>Une migration totale de tous nos serveurs en cas de panne du datacenter ou de son r\u00e9seau serait donc longue et p\u00e9rilleuse. Or ces derniers jours, notre fournisseur principal a&nbsp;connu des pannes r\u00e9p\u00e9t\u00e9es, dont la plus grosse s\u2019est produite samedi soir avec environ 50 minutes de quasi-indisponibilit\u00e9. Deux autres pannes de 30 et 25 minutes avaient eu lieu en d\u00e9but de mois, heureusement en pleine nuit.<\/p>\n<p>Cela n\u2019impacte pas notre confiance envers notre fournisseur, malgr\u00e9 cette p\u00e9riode difficile. Nous avons connu la n\u00f4tre en f\u00e9vrier dernier. Ces \u00e9pisodes sont acceptables \u00e0&nbsp;nos yeux d\u00e8s lors qu\u2019ils restent rares, que la communication est transparente, et que des mesures sont prises pour que cela ne se reproduise plus.<\/p>\n<p>De notre c\u00f4t\u00e9, nous avons commenc\u00e9 d\u00e8s le mois de juin dernier (avant les indisponibilit\u00e9s r\u00e9centes, donc) \u00e0&nbsp;repenser notre syst\u00e8me de redondance pour \u00e9liminer les d\u00e9fauts sus-cit\u00e9s. Nous sommes encore en plein d\u00e9veloppement, mais il nous semblait important, surtout en ce moment, de vous en faire&nbsp;part.<\/p>\n<p>Ce nouveau syst\u00e8me repose sur le service <a href=\"http:\/\/aws.amazon.com\/ec2\/\">EC2<\/a> d\u2019Amazon plut\u00f4t que des serveurs physiques. Cela nous permet une \u00e9conomie financi\u00e8re substantielle, n\u2019ayant plus besoin de faire tourner des serveurs secondaires 24h\/24. Par ailleurs, nous allons travailler sur le processus de bascule afin qu\u2019il soit plus simple, plus automatique.<\/p>\n<p>EC2 va nous permettre \u00e9galement de dupliquer nos serveurs en production en toute simplicit\u00e9. Cela pourrait servir pour tester des nouveaux d\u00e9ploiements sans risque, simuler des pannes, et d\u2019autres choses sympathiques. Nous aurons l\u2019occasion d\u2019en reparler d\u2019ici&nbsp;l\u00e0.<\/p>\n<p>Nous esp\u00e9rons mettre ce nouveau syst\u00e8me de redondance en production pour la rentr\u00e9e, mais comme toujours, les dates sont \u00e0&nbsp;prendre avec pr\u00e9caution\u2026<\/p>\n<\/div>\n<p><!--:--><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Comme vous le savez peut-\u00eatre, nous avons d\u00e9cid\u00e9 d\u00e8s le lancement d\u2019alwaysdata de redonder nos serveurs principaux&nbsp;dans un second datacenter, en temps r\u00e9el (via&nbsp;DRBD). Le \u2026 <a class=\"read-more\" href=\"https:\/\/blog.alwaysdata.com\/fr\/2010\/07\/29\/evolution-du-systeme-de-redondance\/\">Keep reading<\/a><\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"wp_typography_post_enhancements_disabled":false,"footnotes":""},"categories":[1],"tags":[178],"class_list":["post-197","post","type-post","status-publish","format-standard","hentry","category-uncategorized","tag-infrastructure-fr"],"acf":[],"_links":{"self":[{"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/posts\/197","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/comments?post=197"}],"version-history":[{"count":0,"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/posts\/197\/revisions"}],"wp:attachment":[{"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/media?parent=197"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/categories?post=197"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.alwaysdata.com\/fr\/wp-json\/wp\/v2\/tags?post=197"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}