Déterminer le ‘Quoi’
Point de départ de toute réflexion, il s’agit de déterminer ce que nous souhaitons réaliser, et oublier – pour un moment – l’IA afin de ne n’avoir aucun biais technologique.
Imaginons que vous êtes le/la DAF d’une entreprise industrielle qui détient des bureaux à travers le Monde. Vous souhaitez réduire la consommation de vos bureaux et démarrez avec un test sur l’un d’entre eux.
Rassembler l’équipe
Dans tout projet d’IA, nous aurons besoin des profils suivants:
- Les experts métier afin de déterminer les objectifs, et faciliter les accès aux données;
- Les développeurs (devops et back end) afin de connecter et d’alimenter un lac de données;
- Un ingénieur en IA afin de créer le modèle de prévisions mathématiques;
- Un data scientist afin de nettoyer, et homogénéiser le jeu de données
Démarrer le projet
1) Récupérer les données
A ce stade, il s’agit de récupérer le maximum de données inhérentes au système; le nombre de collaborateurs présent dans ce bureau par jour, la consommation électrique mensuelle voire journalière, les différents équipements composant ces bureaux, les factures relatives aux frais de fonctionnement de ces bureaux (eau, café, papier, etc…). Partez du principe qu’à ce stade, il vaut mieux avoir le maximum de données.
Attention néanmoins sur le terme « Récupérer ». Il ne s’agit pas de télécharger toutes les données une par une, mais plutôt d’identifier leur source, et la manière dont celles-ci seront récupérées, tout en documentant l’ensemble.
Une fois ceci-fait, ce sera aux développeurs de créer des solutions pour « aspirer » cette donnée et l’héberger sur un espace prévu à cet effet. Cette étape est de loin la plus contraignante, mais névralgique pour la suite !
2) Nettoyer et homogénéiser
C’est à cette étape que le Data Scientist intervient. Son rôle initial sera d’abord de « ranger » ces données correctement dans un environnement adapté. Ensuite, il s’agira de les nettoyer. Comprenez par là, vérifier s’il n’y a pas de données manquantes ou de données aberrantes.
Nous considérons donc qu’à cette étape, nous avons un jeu de données propre et prêt à être exploité.
Nous commençons donc à ce stade à explorer la donnée. Il s’agit de pouvoir appliquer des opérations simples entre elles; les classer, les filtrer, identifier des corrélations entre différentes données.
3) Modéliser
On touche enfin à l’IA ! On va tâcher à cette étape de modéliser la corrélation des différentes données entre elles. Vous me direz: « Pas besoin d’intelligence artificielle, je sais que le vendredi j’ai moins de gens au bureau donc on consomme moins. » Très bien; lorsque nous sommes sur un problème à 2 dimensions (le nombre de personnes dans les bureaux et la consommation). Donc plus de personnes = Plus de consommation. Mais intégrons maintenant la méteo, les périodes de congés, l’impact des grèves, la consommation électrique de la machine à café spécifiquement, etc… Le problème est beaucoup plus complexe à modéliser.
C’est là tout l’intérêt de l’IA. En permettant à la machine d’opérer un apprentissage sur les données d’entrées et les données de sorties, c’est elle qui créera son propre modèle ! Bien entendu, il existe différentes méthodes d’apprentissages et ce sera tout le loisir de notre ingénieur en IA d’identifier la plus performante en fonction de l’étape suivante.
4) Evaluer
L’évaluation consiste, en fonction de données d’entrée connues, et du modèle crée, d’évaluer la corrélation entre les données issues du modèle, et des données de sortie connues.
Par exemple, on se sera bien gardés de fournir les données des 3 derniers mois à notre modèle. La consommation résultante étant connue, on pourra mesurer la performance de notre modèle en comparant l’écart proposé avec la réalité !
Voilà, vous savez maintenant comment lancer un projet d’IA. Et maintenant, quel usage en tirer? Déjà, il sera beaucoup plus simple de dupliquer celà à n’importe quel autre bureau, mais surtout, l’intérêt majeur sera de prédire de manière très précide la consommation de l’ensemble des bureaux sur plusieurs jours, mois, voire années. En modifiant certains paramètres à la baisse ou à la hausse, il sera donc possible d’identifier les éléments ayant le plus d’impact sur la consommation de chaque bureau !