Étude de Faisabilité sur l'Implémentation d'Algorithmes de Multi-Agent Reinforcement-Learning (MARL)

Client : Geomatys expert en géo-datascience et visualisation Durée : 14 jours sur 2 mois

Contexte

Cette mission a pour objectif d’étudier la faisabilité de l’intégration d’algorithmes d’apprentissage par renforcement multi-agents (MARL) dans un système d’information du client. L’objectif est d’optimiser l’outil d’aide à la décision du client dans un contexte de classification.

Phases de la Mission

1. Recherche préliminaire et reformulation du besoin - 4 jours

Analyse des besoins du client.
Reformulation du problème sous la forme d’une problématique de détection d’anomalies utilisant l’apprentissage par renforcement (RL).
Recherche sur les techniques d’apprentissage par renforcement multi-agents (MARL) pertinentes.

2. Recherche sur l’état de l’art et analyse des données -4 jours

Étude approfondie de l’état de l’art concernant les algorithmes de MARL.
Recherche sur des domaines similaires, tels que la robotique ou l’aéronautique, pour identifier des méthodes transférables.
Analyse des données fournies par le client pour concevoir une stratégie de modélisation et d’apprentissage.

3. Étude de faisabilité - 3 jours

Définition d’une stratégie concrète d’implémentation du MARL dans l’outil d’aide à la décision.
Identification des compétences techniques, outils nécessaires et défis potentiels.
Préparation des recommandations basées sur l’analyse des données et les résultats de la recherche.

4. Production des livrables - 2 jours

Rédaction d’un rapport en trois parties : état de l’art, reformulation du problème du client et recommandations.
Création d’un schéma workflow détaillant les étapes de l’intégration du MARL.
Développement d’un notebook Jupyter Python pour l’analyse des données et l’intégration des algorithmes MARL.

5. Création d’un démonstrateur - 1 jour

Développement d’un simulateur simplifié basé sur les données du client, illustrant l’intégration d’un algorithme MARL.
Utilisation de OpenAI Gym et Stable-Baselines3
Simulation des trajectoires et tests d’apprentissage.
Rapport d’évaluation des performances du simulateur.

Dernière mise à jour le 1 février 2024

← Conception d'un Système IoT 1 août 2024

Conception d’un Robot Autonome pour l’Agriculture 1 février 2023 →