Étude de Faisabilité sur l'Implémentation d'Algorithmes de Multi-Agent Reinforcement-Learning (MARL)
Étude de Faisabilité sur l'Implémentation d'Algorithmes de Multi-Agent Reinforcement-Learning (MARL)
Client : Geomatys expert en géo-datascience et visualisation Durée : 14 jours sur 2 mois
Contexte
Cette mission a pour objectif d’étudier la faisabilité de l’intégration d’algorithmes d’apprentissage par renforcement multi-agents (MARL) dans un système d’information du client. L’objectif est d’optimiser l’outil d’aide à la décision du client dans un contexte de classification.
Phases de la Mission
1. Recherche préliminaire et reformulation du besoin - 4 jours
- Analyse des besoins du client.
- Reformulation du problème sous la forme d’une problématique de détection d’anomalies utilisant l’apprentissage par renforcement (RL).
- Recherche sur les techniques d’apprentissage par renforcement multi-agents (MARL) pertinentes.
2. Recherche sur l’état de l’art et analyse des données -4 jours
- Étude approfondie de l’état de l’art concernant les algorithmes de MARL.
- Recherche sur des domaines similaires, tels que la robotique ou l’aéronautique, pour identifier des méthodes transférables.
- Analyse des données fournies par le client pour concevoir une stratégie de modélisation et d’apprentissage.
3. Étude de faisabilité - 3 jours
- Définition d’une stratégie concrète d’implémentation du MARL dans l’outil d’aide à la décision.
- Identification des compétences techniques, outils nécessaires et défis potentiels.
- Préparation des recommandations basées sur l’analyse des données et les résultats de la recherche.
4. Production des livrables - 2 jours
- Rédaction d’un rapport en trois parties : état de l’art, reformulation du problème du client et recommandations.
- Création d’un schéma workflow détaillant les étapes de l’intégration du MARL.
- Développement d’un notebook Jupyter Python pour l’analyse des données et l’intégration des algorithmes MARL.
5. Création d’un démonstrateur - 1 jour
- Développement d’un simulateur simplifié basé sur les données du client, illustrant l’intégration d’un algorithme MARL.
- Utilisation de OpenAI Gym et Stable-Baselines3
- Simulation des trajectoires et tests d’apprentissage.
- Rapport d’évaluation des performances du simulateur.