La lutte est lancée entre le marketing prédictif traditionnel et le Machine Learning

Eviter le sur-apprentissage

Dans le détail de la mise en œuvre du Machine Learning, la clé est d’éviter le sur-apprentissage, prévient David Bassis. Il faut voir également « qu’il y a des modélisations trop complexes à réaliser » Le Graal du machine learning est d’empiler les couches d’abstraction. Dans ce cadre, la modélisation linéaire traditionnelle et sa simplicité ne sont pas à négliger. « Cela devient très riche quand on empile ces modèles » affirme-t-il.

Il rappelle la phrase fameuse sur les statisticiens : « ils passent 90% de leur temps à préparer les données, et 10% de leur temps à se plaindre de devoir préparer leurs données. Nous pensons que préparer les données est la partie noble du métier de statisticien » sourit-il.

Pour lui la technologie en ce qui concerne le marketing prédictif n’est pas le plus intéressant. « Nous ne nous exprimons pas sur la technologie employée » indique-t-il. Il ne parlera donc pas de Hadoop, ce qui amènera une personne de l’auditoire à dire que l’application présentée n’est pas du Big Data.


« La technique, c’est résolu ou en passe de l’être. Stocker 100 Po de données cela va devenir sans intérêt et ennuyeux » répond David Bassis. On apprendra juste que Tinyclues emploie Python comme langage de programmation, et que les mêmes algorithmes peuvent être appliqués chez PriceMinister ou chez CDiscount mais que Tinyclues conserve des frontières étanches entre les e-commerçants en ce qui concerne les résultats des analyses menées, et des meilleurs produits à proposer aux clients.

Photo, David Bassis, fondateur de Tinyclues.