La place de marché ManoMano plonge ses équipes dans un chaos technique contrôlé pour les former

La place de marché ManoMano spécialisée dans le bricolage et la maison, plonge ses équipes dans des défaillances techniques contrôlées afin de les entraîner à être plus efficaces en cas de vrais problèmes.  La continuité d’activité et la bonne marche du site sont des enjeux clés pour cette plateforme européenne qui est visitée par 50 millions de personnes chaque mois.

Simulation de plusieurs incidents techniques sur la plateforme

Le 2 décembre dernier, les équipes de ManoMano ont ainsi du réagir lors de la simulation de plusieurs incidents. Il y a eu un verrouillage aléatoire de certaines tables de bases de données en pré-production, des pages produits ont été dégradées sur le site e-commerce et il y a eu des problèmes générés sur le système de paiement et dans la gestion des stocks. La journée a été concluante car elle a permis de montrer la qualité des outils de suivi, la réactivité des équipements et a aidé à améliorer la façon d’atténuer l’impact de telles pannes.

Les échanges ont accru le partage des bonnes pratiques et amélioré les interactions avec les nouveaux arrivants

Les échanges en amont et pendant l’événement ont accru le partage de bonnes pratiques et l’amélioration des interactions entre certaines personnes, en particulier les nouveaux arrivants. Ce type d’événement est organisé 2 fois par an. Il rassemble toutes les personnes de l’entreprise réparties en équipes. Une équipe de « super méchants » casse volontairement certaines briques des systèmes techniques. Les autres équipes observent la situation et doivent réparer les problèmes tout en s’entraînant à améliorer l’architecture web pour prévenir d’autres défaillances.

Ces événements permettent de se former à la façon dont les systèmes techniques réagissent au stress. Ils servent également à améliorer la compréhension des problèmes et favorisent une culture de communication et de solidarité lors des incidents. Chaque équipe est composée de participants issus de départements différents au sein de ManoMano.

Les gens apprennent à utiliser les outils de monitoring

« Notre but n’est pas de provoquer un chaos dans notre production, ni un sentiment de malaise pour nos collaborateurs » prévient Clément Hussenot, Platform Engineering Manager chez ManoMano. D’ailleurs, ces journées sont baptisées Game Days. « Ces événements permettent la mise en place de situations contrôlées pour que chacun apprenne à naviguer dans nos outils de monitoring, effectuer une remédiation [NDLR : correction des erreurs] rapide et durable des incidents qui pourraient arriver en conditions réelles » poursuit-il.

L’objectif de ManoMano est de libérer ses collaborateurs du stress des incidents de production

Ces événements grandeur nature servent à entraîner les collaborateurs.  L’objectif de ManoMano est de libérer ses collaborateurs du stress des incidents de production en permettant à chacun de s’exercer et d’échanger librement sur les problèmes rencontrés. Cette démarche s’intitule le Chaos Engineering. Cette discipline née il y a 10 ans consiste à générer volontairement des défaillances pour former les équipes et favoriser les échanges autour des incidents pour mieux détecter les pannes et améliorer les architectures web.

« Nous sommes convaincus que l’humain doit être au cœur de notre stratégie, y compris à la tech » commente Stéphane Priolet, Chief Technology Officer de ManoMano. « Nous voulons donner toutes les clés à nos collaborateurs pour qu’ils puissent développer les meilleures solutions et services en tenant compte de la résilience de leur code, de la stabilité de la plateforme et au final de l’expérience des clients » dit-il.

Le trafic a été multiplié par 4 au printemps 2020

Il faut dire que ManoMano est en forte croissance. Il y a eu 100% de croissance en 2020 et le trafic a été multiplié par 4 au printemps 2020. Côté technique, il faut assurer la production et la stabilité de la plateforme. Dans le même temps, il faut conserver de la flexibilité pour développer de nouvelles fonctions techniques et anticiper la croissance à venir. Les journées de Chaos Engineering servent à sensibiliser tous les employés aux problèmes de résilience, de fiabilité et de disponibilité des déploiements techniques.

ManoMano emploie aujourd’hui 900 personnes en France et en Espagne. La moitié des effectifs sont techniques. ManoMano a fait le choix de construire sa propre plateforme technologique pour s’assurer d’une autonomie de déploiement et d’actions.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *