La résolution d’incident Web 10 fois plus rapide chez Bouygues Télécom grâce au Big Data

Les équipes Web de Bouygues Telecom ont développé une plateforme Big Data en interne à partir de composants Open Source. Cette solution accélère les délais de résolution d’incident sur les services aux clients assurés via le site Web de l’opérateur télécoms. 

Les délais de résolution d’incident Web pour les services à destination des clients de Bouygues Telecom ont été divisés par dix grâce à la nouvelle plateforme de monitoring reposant sur une architecture Big Data. C’est une solution Open Source développée en internet qui a été déployée. Guillaume Pinot, responsable étude et architecture Web chez Bouygues Telecom, a détaillé les composants de cette plateforme le 2 avril lors du salon Big Data à Paris.

La perception du client qui se connecte au site Web de l’opérateur télécoms est reconstituée et analysée par le service informatique. Les différentes phases d’une connexion de bout en bout sont mesurées.

15 sites Web critiques

Le site Web de Bouygues Telecom accueille 15 millions de visites par mois, pour 100 millions de pages vues.  La plateforme Web destinée aux clients est en fait constituée de plusieurs dizaines de sites Web, dont ceux par exemple qui assurent l’accès pour les tablettes ou les mobiles. Une quinzaine de ces sites sont critiques.

« Ces sites font appel à deux cents services métiers. Et plusieurs systèmes applicatifs sont derrière chaque service métier, même si cela paraît simple » décrit Guillaume Pinot. Il est alors très difficile de démêler quel système est responsable d’un incident. Cela peut prendre plusieurs heures, voire plusieurs jours.Bouygues Telecom - Architecture Web - BFUne mesure par robot

La qualité de service était auparavant mesurée par des robots, simulant un utilisateur, avec toujours le même parcours, le même jeu de données, non réconcilié avec les enquêtes auprès des utilisateurs, ni le webanalytic. La nouvelle plateforme s’appuie sur la collecte de données depuis le navigateur Web de l’internaute, les sites Web eux-mêmes et les services métiers.

La solution permet d’améliorer le suivi d’une requête de bout en bout. Par exemple, si le processus de renouvellement d’abonnement en ligne ne fonctionne pas, il y a une analyse du parcours, et la détection de la cause de l’incohérence des données. Auparavant, ce type de souci entraînait du Ping Pong entre les services, c’était assez éprouvant.

Un travail de collecte en cours d’achèvement

Le travail de collecte n’est pas totalement achevé sur le bus du système d’information, idem sur les sites Web. Il est achevé sur la navigation des internautes. Un Javascript permet de suivre le trafic sur le poste client.


Afin d’assurer le suivi des requêtes des internautes, il y a la création d’une base pour le temps réel, qui assure une rétention de faible durée, et une faible volumétrie. Et  il y a une base pivot, qui assure une forte volumétrie.

Bouygues Telecom - Le principe de la solution - BF

Les composants employés sont tous Open Source, à l’exception de l’outil de Tableau Software, destiné à la visualisation des données. Bouygues Télécom utilise ainsi le framework Javascript Boomerang, afin de capter les sessions, sur les pages de l’utilisateur.

En central, on trouve une base centrale Hadoop, dans la distribution de Cloudera, l’outil de recherche Elasticsearch et la base de données orientée documents et NoSQL MongoDB. Flume sert à  la collecte des données des logs.

Pour l’exploitation des données, côté équipes techniques, on trouve l’outil de requêtage Hive,  Groovy Grails, qui est une plateforme de développement agile d’applications Web en Java, et Kibana pour interagir avec les données via ElasticSearch.

Bouygues Telecom - Les composants - BF

 

Photo, Guillaume Pinot, responsable étude et architecture Web chez Bouygues Telecom.

5 réactions sur “La résolution d’incident Web 10 fois plus rapide chez Bouygues Télécom grâce au Big Data

  1. UserReplay France

    Concept très intéressant – Il existe aussi des progiciels du marché (des solutions de CEM : Customer Experience Management) qui peuvent enregistrer les parcours Web et Mobile et rejouer ces parcours pour comprendre la raison des incidents. Les données récupérées peuvent être ensuite traitées par des plateformes BigData telles que celle mentionnée.

    Répondre
  2. walckenaer

    Pour ceux qui sont intéressés, Il existe également des solutions clés en main comme Nudge APM qui permettent d’obtenir les mêmes résultats sans avoir à partir de 0, testez le freemium sur notre site…

    Répondre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *