Article

Compte-rendu évènement Wagon Montréal: échange avec Jean-Louis Maréchaux (Google Cloud)

Ce 14 juillet, nous avons suivi une rencontre avec un expert de Google, organisée par Le Wagon Montréal, l’antenne locale de l’école de code présente dans 45 villes et 25 pays. Une heure dédiée à la « data science » avec Jean-Louis Maréchaux, conseiller technique chez Google. Sa spécialité : l’analytique avancée et les technologies d’intelligence artificielle en nuage (Google Cloud analytics et AI/ML). Voici ce que nous en avons retenu.

Quelle est la mission d’un « technical advisor » Google Cloud ?

Jean-Louis Maréchaux aide les entreprises (de l’Est du Canada) à comprendre les technologies Google, définir leur stratégie, et les guide dans leurs initiatives « data ». Aussi bien petites entreprises, startups, qu’entreprises plus établies. Le conseiller technique Google doit donc comprendre ce que son client veut réussir et comprendre sa maturité (technologique). Il réalisera ainsi un mapping entre ce qui est disponible et ce qu’ils peuvent intégrer dans leur organisation. En d’autres mots « trouver un bon mix pour qu’ils délivrent ».

Et ces deux dernières années Jean-Louis Maréchaux a pu observer que de plus en plus de projets et initiatives d’analytique sont pilotés par des équipes venant d’horizons variés. Par exemple les équipes marketing pour créer de la valeur avec leurs données. Avec du clustering (partitionnement d’un ensemble de données en paquets homogènes), pour comprendre une audience, des modèles de régression pour des problèmes business.

Quelles autres ressources Google sont accessibles aux startups de Montréal?

Parmi les nombreuses ressources, Jean-Louis Maréchaux travaille notamment en collaboration avec la maison Notman / Notman house, le hub pour startups. L’idée est de fournir du contenu technique et non technique pour les fondateurs de startups pour les aider à utiliser le cloud Google et être plus efficace.

Quels secteurs d’activités s’emparent de la data science ?

Tous les secteurs d’activité sont actifs désormais dans le domaine de la data. Pour faire de la prévision de demande à partir de données saisonnières, ou encore modifier des produits en anticipant l’évolution de la demande ou adapter un inventaire. Dans le domaine du gaming et du  retail/e-commerce, l’analyse de données permet de comprendre qui est le client et de définir la valeur à long terme du client (le budget qui sera dépensé tout au long du cycle de vie du client).

Quelles sont les premières difficultés auxquelles doivent faire face les entreprises dans leurs projets de data science ?

En premier des difficultés techniques, car les technologies évoluent vite en IA et ML (Machine Learning / apprentissage automatique). Rester à la pointe des connaissances est difficile pour les clients mais aussi pour les scientifiques de données et les équipes Google. La pratique de la data science est encore jeune dans les entreprises, et manque donc de maturité. Il est alors difficile pour eux d’organiser les ressources, les processus, la collaboration entre les équipes. C’est pourquoi il faut d’abord mettre en place des pratiques pour éviter que les projets ne deviennent « chaotiques ».

Enfin, la différence entre « data science » (science des données) et « data engineering » (ingénierie des données) n’est pas encore comprise. Un data engineer n’a pas besoin de tout comprendre au data ML. Sa mission est de préparer les données et faire du code (computer engineering). Il est responsable de mettre en place un pipeline de données pour que le modèle de données soit nourri. Car si un modèle n’est pas nourri avec un pipeline en continu (de données de qualité) il va échouer.

Quel est le lien entre le lien entre le cloud computing et le AI/ML ?

Pour faire de la data science « at scale » (sur des projets à grande échelle) il faut plus que la puissance d’un simple ordinateur de bureau. Il faut des ressources serveur ou dans le cloud. Il est désormais plus facile avec des fournisseurs cloud d’avoir accès à du stockage et de la puissance de calcul pour entrainer vos modèles et les déployer. Ensuite pour faire des prévisions (en batch par lot ou en temps réel) ce modèle peut aussi être déployé dans le cloud.

Le cloud est désormais une option intéressant pour les trois étapes de l’exploitation des données (Store, Train, Deploy / Stocker, Entrainer et Déployer un modèle analytique). Pour des raisons de coûts, de praticité avec des mises à jour en continu, et aussi d’accès à des données venant d’autres sources. Car les entreprises veulent pouvoir utiliser leurs données mais aussi celles venant des réseaux sociaux (Twitter, Facebook, etc.) et de leurs partenaires. Par exemple dans le domaine du retail/commerce une entreprise pourra exploiter les données de ses fournisseurs via le cloud. Car comme le rappelle Jean-Louis Maréchaux : « créer un modèle d’analyse de donnée c’est bien, mais sans les bonnes données pour votre entrainement vous arriverez à un mauvais modèle ».

Dans le domaine de l’IA, quelles compétences les entreprises canadiennes doivent-elle encore muscler ?

Toutes !  Car toutes les entreprises manquent de « Data scientists ». La plupart veulent lancer des projets d’IA mais n’ont pas les ressources pour le faire. Le « Data engineering » (ingénierie de données) a aussi une importance critique, car un vrai projet d’entreprise ne pourra pas passer à l’échelle sans un processus des données complet, stable et mature.

Dans les petites entreprises la même personne peut jouer le double rôle de data engineer et data scientist. Dans d’autres il s’agit de personnes et d’équipes différentes, jusqu’à des équipes de plus de 20 personnes. Pour des entreprises qui n’ont pas du tout d’équipe IA en place, Google peut être amené à accompagner en les mettant en relation avec ses partenaires.

Est-ce que les méthodes agile peuvent aider les entreprises pour lancer leurs projets d’analytique ?

Jean-Louis Maréchaux est aussi un expert des méthodes agiles et confirme que dans le domaine de la science des données l’agile devient de plus en plus important. Mais il lui préfère le terme plus « sexy » de MLOps (une adaptation du DevOps aux problématiques spécifiques du Machine Learning. Avec une collaboration et des processus partagés entre les équipes de développement et de production informatique).

Car le MLOps permet de mettre en place des pratiques pour gérer la données, son cycle de vie, le cycle de vie d’un modèle d’analyse de données, la gestion des version en production. Avec les bonnes pratiques en place il est alors possible d’entrainer et ré-entrainer un modèle de façon quotidienne ou hebdomadaire, pour l’améliorer.

Comment les entreprises peuvent elle progresser dans leurs pratiques de data science et leurs initiatives de transformation numérique ?

En ayant plus de professionnels de la data science, et de plus grandes équipes pour réaliser leurs projets. Il doivent être capables de construire une sorte de « MVP » (produit minimum viable) ce qui dans le domaine de l’IA/ML serait un « modèle minimum viable ». Jean-Louis Maréchaux précise également que les entreprises doivent s’éduquer sur la dimension business des capacités de l’Intelligence Artificielle. Car l’IA ne peut pas résoudre tous les problèmes. Pour mener une transformation « data driven » (pilotée par les données) il est donc important de comprendre quel type de problèmes peuvent être résolus avec l’IA et le ML. L’éducation des directions générales est particulièrement importante car ce sont les décideurs qui vont donner les impulsions dans l’entreprise.

Comment Google prend en compte l’impact environnemental de ses activités cloud ?

Un sujet qui mériterait un articlé dédié. Mais on se félicitera déjà que Google soit neutre en carbone depuis 2007 (par de la compensation carbone) et équilibre 100% de sa consommation électrique par des énergies renouvelables depuis 2017. Google s’est surtout fixé pour objectif de ne plus produire de carbone d’ici à 2030 (détails). Toute l’énergie des data centres Google viendra d’énergie renouvelable. Et depuis avril 2021 les clients de Google Cloud peuvent choisir leur « région cloud » en fonction de son approvisionnement énergétique. Et donc choisir un cloud alimenté en énergie renouvelable (détails).

Comment s’articule chez Google le lien entre recherche fondamentale en Intelligence Artificielle et recherche appliquée ?

La recherche fondamentale en IA chez Google est réalisée par les équipes de Google Brain et DeepMind. Leurs travaux de recherche vont être rendus disponibles sous forme de produits, frameworks et outils pour être utilisables par « le commun des mortels ».  Ainsi leurs travaux sur l’ « explainable AI » (L’IA explicable ou XAI, l’intelligence artificielle dans laquelle les résultats de la solution peuvent être compris par les humains) sont désormais disponibles dans Google Cloud avec une interface facile à utiliser et comprendre par des humains (même sans PhD 😊).

Pour suivre la veille du Laboratoire Inyulface sur les enjeux de collaboration et d’innovation: Inyulface.com/veille

Afficher Plus

Articles Connexes

Leave a Reply

Your email address will not be published. Required fields are marked *