Régulièrement élu métier le plus en vogue par les magazines, très prisé des entreprises, le data-scientist est souvent appelé la « rock-star du numérique ». Mais concrètement, quelles sont ses missions ? Eric Daoud Attoyan, ingénieur ECAM Arts et Métiers 2015, fait partie de ces professionnels qui analysent et font parler des données complexes et massives, couramment appelées « Big Data ».
En 2010, j’ai intégré l’ECAM Lyon juste après mon bac S au lycée Lacordaire à Marseille. J’ai effectué un 1er stage chez DAF Trucks France où j’étais en charge d’automatiser des classeurs Excel pour divers départements de l’entreprise. J’ai enchaîné, ensuite, avec un stage aux Etats-Unis dans la cellule R&D de Hunter Engineering: j’effectuais des tests sur un prototype de mesure de l’usure des pneus de voiture. En dernière année du cycle ingénieur, j’ai choisi un stage de recherche à l’University of California Davis, au sein du laboratoire du professeur Stephen K.Robinson, ancien astronaute de la NASA. Je travaillais sur l’évaluation de la force de traînée exercée sur un profil d’aile d’avion.
Toutes ces expériences m’ont donné l’envie de continuer dans l’informatique. Après mon diplôme d’ingénieur généraliste ECAM Arts et Métiers, j’ai poursuivi avec un Mastère Spécialisé en Systèmes Informatiques Ouverts (SIO) à l’Ecole Centrale Paris, pour perfectionner mes connaissances en développement, technologies Big Data, Cloud Computing et Machine Learning. C’est dans le cadre d’un projet d’études que j’ai découvert le métier de Data Scientist. Je suis aujourd’hui embauché en CDI chez ManoMano, une start-up en très forte croissance spécialisée dans le bricolage/jardinage dans laquelle j’avais effectué mon dernier stage.
Je travaille sur des moteurs de recommandation: il s’agit de recommander du contenu d’information aux visiteurs d’un site web en fonction de leurs goûts ou des pages qu’ils sont en train de consulter. C’est une technique utilisée massivement par les entreprises, comme Amazon qui propose des packs de produits, Spotify qui génère une playlist unique pour chaque utilisateur ou encore Youtube qui suggère de nouvelles vidéos selon la navigation de l’internaute. Cela repose sur des modèles de Machine Learning qui sont capables, à partir des données collectées sur un internaute, de prédire les produits qui seront susceptibles de lui plaire. En tant que Data Scientist, je suis donc en charge de penser et concevoir des algorithmes capables de collecter et traiter des milliers de données (Big Data) qui serviront ensuite à l’entreprise. C’est un mélange de maths et de programmation.
A mon arrivée chez ManoMano, j’ai dû concevoir l’algorithme de A à Z. J’ai d’abord passé quelques semaines à me documenter sur le principe de la recommandation, à travers des publications de recherche, des articles et des tutoriels. Ensuite, j’ai implémenté et testé de nombreux modèles de Machine Learning afin de trouver celui qui donnait les meilleurs résultats. Une fois en ligne, il faut vérifier que les recommandations sont pertinentes et faire des ajustements. C’est un projet très dense et à fort impact sur notre entreprise. Un site e-commerce comme Amazon, par exemple, réalise 30% de ses ventes via la recommandation. Je n’en suis pas encore là, mais environ 4 millions d’utilisateurs uniques voient mes recommandations tous les mois sur notre site web, et leur impact est mesuré positif. C’est très prometteur !
Beaucoup de rigueur et d’organisation ! On passe une grande partie de nos journées à écrire du code et lire des papiers de recherche pour trouver de nouveaux modèles à implémenter. Il ne faut pas s’éparpiller, et coder de façon propre.
De bonnes capacités analytiques sont également nécessaires, puisque que l’on est confronté à des nouveaux problèmes tous les jours, qu’il faut résoudre à l’aide de la donnée et d’un modèle de prédiction.
Il est également nécessaire de bien communiquer car nous sommes souvent amenés à échanger avec d’autres services. Il est donc important d’adapter notre discours à nos collaborateurs, et de comprendre le besoin pour proposer la solution adéquate.
Enfin, il faut avoir envie d’apprendre, être continuellement curieux car la recherche avance très vite dans ce domaine et de nouveaux algorithmes sont créés chaque mois. Un Data Scientist qui ne cherche pas à découvrir de nouveaux modèles ou de nouvelles technologies passe à côté de la meilleure partie de son travail !
En somme, il faut être assez polyvalent, avoir de bonnes compétences techniques et relationnelles. L’approche pluridisciplinaire de ma formation ECAM Arts et Métiers m’a apporté ces connaissances et ce savoir-faire.
Créer, explorer sans cesse, accompagner un projet jusqu’au bout, c’est qui me motive et que je trouve dans mon travail au quotidien.