Cette page a été traduite automatiquement.
Merci de bien vouloir compléter un sondage de 1 minute concernant la qualité de cette traduction.
L'Institut Max Planck développe un système de Reinforcement Learning pour détecteur d'ondes gravitationnelles
« L’un des avantages de MATLAB et de Simulink était que je pouvais rapidement itérer sur différents algorithmes de Reinforcement Learning, ce qui réduisait considérablement le temps nécessaire pour parvenir au choix final. »
Principaux résultats
- Un agent de Reinforcement Learning développé avec MATLAB et Simulink a surpassé les humains en améliorant la sensibilité astrophysique aux étoiles à neutrons binaires
- Première mise en œuvre d'un contrôle MIMO basé sur le Reinforcement Learning pour les systèmes optomécaniques, démontrée sur un détecteur d'ondes gravitationnelles
- Agent de Reinforcement Learning formé et validé en simulation avant le déploiement à l'aide de Simulink
Un agent de Reinforcement Learning déployé surpasse les humains en améliorant la sensibilité astrophysique aux étoiles à neutrons binaires. (Crédit image : arXiv)
Les chercheurs de l'Institut Max Planck de physique gravitationnelle de Hanovre, en Allemagne, étudient divers domaines de la physique, notamment la relativité générale, l'optique quantique et l'astrophysique. Un projet important en cours à l'institut consiste à détecter les ondes gravitationnelles provoquées par des événements astrophysiques à grande échelle, comme la collision de trous noirs, à l'aide d'observatoires d'interférométrie laser, tels que GEO600 en Allemagne ou LIGO aux États-Unis.
Un observatoire d'ondes gravitationnelles à interféromètre laser fonctionne en projetant des faisceaux laser sur des miroirs situés à des kilomètres de distance pour mesurer les fluctuations infimes de l'espace-temps causées par le passage des ondes gravitationnelles. Ces miroirs doivent être contrôlés car les ondes gravitationnelles ne peuvent être détectées que si tous les autres changements non gravitationnels sur la longueur du trajet (tels que les perturbations sismiques locales dues à l'activité des vagues océaniques, les agriculteurs faisant fonctionner des machines, etc.) sont activement ou passivement supprimés. Le contrôle et l’alignement des centaines de miroirs installés dans l’observatoire se faisaient traditionnellement manuellement, les ingénieurs et les scientifiques étudiant le système et utilisant leurs connaissances et leur intuition pour créer et ajuster les filtres de contrôle.
Des scientifiques de l'Institut Max Planck de physique gravitationnelle ont développé un système de Reinforcement Learning dans MATLAB® et Simulink® qui peut ajuster et aligner automatiquement certains des miroirs clés de l'observatoire. Ils ont utilisé Deep Learning Toolbox™ pour créer un réseau de neurones combinant convolution et LSTM, qui mesure les désalignements en analysant la vidéo des caméras placées dans la configuration optomécanique. La sortie du réseau de neurones est l’état de l’environnement de Reinforcement Learning. Grâce à Simulink Design Optimization™ et Reinforcement Learning Toolbox™, ils ont pu générer automatiquement un signal de récompense pour le système de Reinforcement Learning basé sur les principes de la théorie du contrôle classique.
Les scientifiques ont mis en place un environnement de simulation dans Simulink basé sur les mesures qu'ils avaient obtenues à partir du système physique à l'aide de System Identification Toolbox™. Ils ont utilisé cet environnement avec Reinforcement Learning Toolbox pour tester différents algorithmes et former leur agent de Reinforcement Learning sans avoir besoin d’apporter des modifications physiques à l’équipement. Leur succès dans l’utilisation du Reinforcement Learning au GEO600 est la toute première mise en œuvre d’une détection et d’un contrôle d’alignement basés sur un réseau neuronal sur un détecteur d’ondes gravitationnelles.