en fr

CROCUS

Calcul de Risque, Optimisation et Calage par Utilisation de Simulateurs

Enjeux scientifiques

Il existe aujourd’hui, dans l’industrie, en ingénierie de l’environnement, et plus généralement en sciences pour l’ingénieur, un réel besoin de méthodes pour l’exploitation de simulateurs. Ce besoin vient notamment des incertitudes sur les données, d’utilisations répétitives, et de couplages entre le simulateur et d’autres sources d’information. Par exploitation, nous entendons des tâches telles que l’analyse de sensibilité, le calage de modèles, l’optimisation, l’estimation de risque, etc. Cette thématique est émergente et continuera à se développer car elle est liée à des défis scientifiques fondamentaux (apprentissage en haute dimension, optimisation de fonctions bruitées).

Actions scientifiques

Les trois directions de développement de l’équipe sont :
- la propagation d’incertitudes et l’optimisation par calcul distribué,
- les mélanges de modèles,
- la méta-modélisation sur bases physiques.

Ces trois points sont repris ci-après. Sur le plan applicatif, nous prévoyons une intensification de nos travaux relatifs aux problématiques environnementales et en particulier à la gestion de l’eau.

Axe 1 : Optimisation et propagation d’incertitudes en calcul distribué

Les ressources en calcul continuent de croître à un rythme très rapide. Depuis 20 ans, les ressources en calcul haute performance doublent chaque année. Récemment, cette croissance repose principalement sur l’essor du calcul distribué (la mise en commun de ressources informatiques). La perspective de plus grandes ressources de calcul permet d’anticiper une utilisation accrue de la simulation dans la prise de décision en sciences pour l’ingénieur.

Cependant, on peut aussi anticiper que, sans le développement de nouvelles méthodes numériques, adaptées au calcul distribué, même l’apparition de grilles de calcul ou d’ordinateurs haute performance atteignant les petaflops changera relativement peu l’utilité de la simulation :
- La précision physique des simulateurs évolue avec les ressources en calcul et tend à les saturer. Ainsi, les thématiques de l’équipe qui concernent le coût des simulateurs resteront d’actualité malgré les progrès de l’informatique.
- Les méthodes actuelles de propagation d’incertitudes et d’optimisation passent mal à l’échelle (i.e., perdent en efficacité) quand le nombre de processeurs croît car elles ont été imaginées pour des processeurs uniques.
- Enfin, pour des raisons de fractionnement des compétences, de confidentialité ou de propriété du savoir, la collaboration d’experts disciplinaires ou d’entreprises autour d’un même projet va de plus en plus impliquer des simulations distribuées chez chaque acteur et connectées par Internet. L’existence de méthodes d’analyse d’incertitudes et d’optimisation aptes à travailler dans un tel cadre devient nécessaire.

Ainsi, l’équipe CROCUS a pour perspective de contribuer au développement de méthodes de propagation d’incertitudes et d’optimisation pour des infrastructures informatiques distribuées. Ces nouvelles méthodes devront être :
- aussi asynchrones que possible,
- robustes aux pannes de processeurs et de transmissions,
- bénéficier de gains en efficacité superlinéaires avec le nombre de processeurs.

Compétences actuelles dans le domaine : des travaux préliminaires ont été réalisés par l’équipe pour paralléliser un important algorithme d’optimisation globale, la méthode EGO [Amigo, Ginsbourger et al., 2007 (E4.46)]. La parallélisation tire partie des lois jointes d’ensembles de points décrites par les processus aléatoires.

Dans le domaine de la propagation d’incertitudes, l’inférence bayésienne et les méthodes de Monte Carlo améliorées (e.g., l’échantillonnage d’importance, les méthodes MCMC) seront les bases de nos développements.

La mise en œuvre de tels algorithmes dans des grilles de calcul suppose une maîtrise des techniques de l’informatique distribuée. Sur ce point, une montée progressive en puissance est prévue à partir de 2009. Le projet ANR/OMD2 (pour Optimisation MultiDisciplinaire Distribuée) qui commence fin 2009 sera l’occasion de prendre en main le middleware ProActive (développé par Activeon, INRIA Sophia). Plus généralement, le projet 1 sera l’occasion de collaborations avec l’équipe ISCOD du LSTI. Par ce projet, notre équipe s’attaque à un des défis du LSTI, celui de la distribution et de la coopération et s’ouvre au premier axe transverse du laboratoire portant sur la conception des biens et de services. Un projet ANR/COSINUS, nommé ID4CS (Integrated Design for Complex Systems) a été proposé en partenariat avec G. Picard de l’équipe ISCOD en 2009. ID4CS a été accepté.

Axe 2 : Mélange de modèles

Simulateurs redondants

En général, il n’existe pas un mais plusieurs simulateurs décrivant l’objet d’étude. Ces simulateurs peuvent différer :

- par la physique qu’ils capturent. Par exemple, un simulateur d’écoulement pétrolier peut intégrer la loi de Darcy, mais celle-ci peut aussi être couplée avec la thermique et des transformations chimiques.
- par la finesse avec laquelle ils représentent une même physique : taille des mailles dans les méthodes de résolution d’EDP par discrétisation (éléments finis, différences finies, volumes finis, éléments frontières), hypothèse de symétrie permettant de réduire les dimensions du problème (e.g., hypothèse de symétrie radiale autour de puits en écoulements poreux).
- par les principes de leur construction. On opposera les modèles basés sur la résolution d’équations physiques aux modèles reproduisant des observations sans physique interne, tout en notant que des modèles intermédiaires existent.
- par les ressources numériques (temps de calcul, place mémoire) qu’ils utilisent pour être évalués.

Si plusieurs modèles perdurent, c’est qu’ils réalisent différents compromis entre représentativité physique, qualité de prédiction et consommation de ressources numériques. Des enjeux stratégiques, comme la non-dépendance aux entreprises développant les simulateurs, vont aussi dans le sens d’une diversité de modèles.

Pour propager les incertitudes et optimiser avec ces simulateurs, il est important de tenir compte des différents modèles disponibles. Par exemple, les modèles de faible précision mais rapides peuvent orienter une procédure d’optimisation à son début. Ils doivent être périodiquement complétés par des simulations fines de manière à converger vers des résultats compatibles avec les meilleures simulations. De même, lorsque la simulation sert à dimensionner des normes (de pollution, de sécurité) et qu’il existe plusieurs méthodes de simulation (typiquement, des modèles basés sur la physique et des modèles capitalisant des mesures antérieures), il est important de prendre en compte simultanément les prédictions données par différents simulateurs.

Pour mélanger les prédictions de simulateurs concurrents, nous nous intéresserons aux approches de fusion de données (Bayes, fonctions de croyance, analyse multicritère). Pour les applications à l’optimisation, la prise en compte de plusieurs modèles simultanément est le sujet de l’optimisation multi-niveau, sujet qui complétera cette direction de recherche.

Compétences actuelles dans le domaine : nous avons commencé à travailler sur ces sujets à travers la méta-modélisation, en particulier avec le krigeage [e.g., E4.2, E4.3, E4.7, E4.29, E4.31]. Il y a dans ce cas deux niveaux de simulateurs, le simulateur physique fin, et le méta-modèle de krigeage.
 

Simulateurs complémentaires : multidisciplinarité et couplage de modèles

Il arrive aussi souvent que plusieurs simulateurs soient complémentaires. C’est le cas de l’analyse multidisciplinaire et de l’emboitement de simulateurs où certains modèles produisent des paramètres utilisés par d’autres modèles. Par exemple, les avions sont conçus sous l’angle de l’aérodynamique, du contrôle, du calcul de structures et de la motorisation. Un autre exemple est celui de la réaffectation de territoires post-industriels (e.g., le projet PiLoT) dans lequel intervient la biologie (phyto-rémédiation), l’hydrogéologie, l’urbanisme et la chimie. Les scénarios d’emboitement de modèles vont se généraliser avec le développement de la simulation et sa distribution à travers Internet.

Sur un plan numérique, la multidisciplinarité pose le problème de la gestion des couplages entre disciplines : les simulations de chaque discipline sont couplées par la physique, mais la prise de décision a besoin d’un certain niveau de découplage pour que les acteurs puissent travailler de manière autonome. Les temps de simulations peuvent aussi grandement différer entre disciplines (e.g., calculs aérodynamiques et calculs de structures) et il ne faut pas que les disciplines les plus lentes paralysent l’ensemble du processus de décision.

Les stratégies de gestion de simulations complémentaires forment les domaines de l’analyse multi-physique et de l’optimisation multidisciplinaire. Elles constituent un de nos axes de recherche, qui sur le plan technique a une parenté forte avec le projet 1 (calcul distribué) et le sous-projet précédent (simulateurs redondants). L’équipe possède une connaissance de l’optimisation multidisciplinaire du fait du pilotage des deux projet OMD (ANR et Fondation CETIM, cf. Bilan). Elle a également déjà travaillé sur l’interopérabilité entre modèles à échelles différentes (« multinesting » pour l’atmosphère), et sur les interfaces entre modélisations dans le cas des écoulements hydrauliques.

Axe 3 : Méta-modélisation prenant en compte la physique et les connaissances d’experts

Le domaine de l’apprentissage (ou, dans des espaces continus, méta-modélisation) a connu un développement important ces dix dernières années avec des méthodes telles que les réseaux de neurones, les réseaux à bases radiales, le krigeage, les machines à supports vectoriels, GAM, ... . Ces méthodes peuvent être considérées comme de la modélisation de boîtes noires dans la mesure où les modèles sont construits uniquement à partir de données d’entrée et de sortie. A l’opposé se trouvent les méthodes de modélisation physique basées en général sur la résolution d’équations aux dérivées partielles (éléments finis, différences finies, volumes finis, éléments frontières).

Nous proposons de travailler au développement de méthodes de méta-modélisation intermédiaires entre les méthodes boîtes noires et les méthodes physiques. Ceci sous-entend une relative spécialisation de nos méta-modèles : nous nous intéresserons à la modélisation d’écoulements en milieux poreux et à ses applications en gestion de l’eau.

Les méthodes pressenties pour bâtir de telles « boites grises » sont :

- les méthodes d’extraction de champs pertinents par POD (proper orthogonal decomposition) ou analyse en composantes principales,
- la construction de méta-modèles généralistes sous contraintes de respect de relations physiques,
- la mise à jour de prédictions au moyen de mesures (techniques d’assimilation de données d’échantillonnage).

Compétences actuelles dans le domaine : Eric Touboul (a travaillé chez Schlumberger à la modélisation dans le domaine du pétrole), et Mireille Batton-Hubert. Une thèse sur le sujet de la méta-modélisation en hydrogéologie a commencée fin 2009.

Partenaires

Collaborations académiques

Les activités menées ont permis de nourrir et de structurer un réseau de coopérations tant au niveau local, régional, national qu’international

Local :
-  Avec l’UR LCG, co-encadrement des thèses de Gustavo Silva (soutenue en 2009) et Christian Gogu (en cours) sur l’identification de lois de comportement à partir de mesures de champs (Encadrants : R. Le Riche, J. Molimard, A. Vautrin).
-  Avec l’UR LPMG, co-encadrement de thèse : F. Diedro, « Simulation géostatistiques de stockage du CO_2 au sein de réserves géologiques », en cours (Encadrants : C. Helbert / B. Guy, C. De Fouquet).
-  Avec l’UR LPMG, co-encadrement de thèse : M. Lakhssassi, « Modélisation mathématique et numérique de la cristallisation fractionnée avec couplage des échanges chimiques et du transport différentiel magma-solide dans les réservoirs magmatiques », soutenue en 2009 (Encadrants : E. Touboul / B. Guy en partenariat avec l’Univ. J. Monnet St Etienne, J.-Y. Cottin).
-  Avec l’UR LPMG, co-encadrement de thèse en partenariat avec Bio-Mérieux (Lyon) : Fabien Bernard, « IDADIGE : Procédé de traitement des images de gels d’electrophorèse bidimensionnelle dans le contexte de la recherche de marqueurs proteiques », soutenue en 2008 (Encadrants : X. Bay / J.-C. Pinoli).
-  Avec l’UR LPMG, co-encadrement de thèse en cours en partenariat avec CHU Saint-Etienne et le CETAF : Marianne SARAZIN, « Elaboration d’un indicateur de vieillissement », (Encadrants : X. Bay / J.-C. Pinoli).
-  Avec l’UR SEPIT, co-encadrement de thèse en cours : M. Tombozafy, « Contribution conjointe de la géochimie et de la modélisation du transport solide à la connaissance des mécanismes d’incision et/ou d’enfoncement d’une rivière », (Encadrants : D. Graillot, M. Batton-Hubert, D. Garcia).

Régional :
-  Cluster « Environnement »

National :
-  UJM : plan pluri-formation (PPF) Alliana (avec participation de ROGI)
-  Participation active au GDR Mascott (analyse numérique) auquel un de nos étudiants (D. Ginsbourger) a obtenu le prix de la meilleure contribution.

International :
-  Université de Floride : thèse de V. Picheny en co-tutelle, accueil de Ben Smarthlock (doctorant de l’Univ de Floride) pendant 3 mois en 2007.
-  Enseignements des probabilités à la National Economics University (NEU), Hanoï, et l’Université d’Economie de Hô Chi Minh ville, Vietnam (X. Bay , O. Roustant, D. Ginsbourger), 4 semaines réparties sur 2007 et 2008.

Collaborations industrielles

- TOTAL, IRSN, EDF, RENAULT, ONERA (montage et pilotage du consortium DICE « Deep Inside Computer Experiments »).

- Renault, Dassault Av., Astrium ST, Sirehna, ONERA, Ecole centrale de Paris, INRIA, Univ. P. Sabatier (Toulouse), Univ. de Technologie de Compiègne, INSA de Rouen, ENS Cachan (montage et pilotage du Consortium ANR/OMD « Optimisation MultiDisciplinaire »).

- INSA de Rouen, LTDS, CETIM (montage et pilotage du projet « Optimisation MultiDisciplinaire d’engrenages », financé par la fondation CETIM).