Plan d’expérience dynamique pour la maximisation

Plan d’expérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale • Choix de l’algorithme ? • Choix de la fonction ? • Présence ou absence de bruit ? • Choix du paramètre ?

Aspect théorique • f est très coûteuse à évaluer • f est supposée régulière, lisse Optimisation stochastique : Donc :

La borne du regret cumulé dépend de la rapidité d’obtention du gain d’information. • Mathématiquement T Etablit une nouvelle connexion entre GP-UCB et ED

GP-UCB • Partie théorique: • Description du modèle • Gain d’information et Experimental Design • Algorithme GP-UCB • Partie expérimentale: • Comparaison avec GP- UCB et ED • Influence de plusieurs maxima • Hypothése de régularité • Influence du bruit • Exemple en dimension 2

Aspect théorique Calcul de la moyenne, de la covariance et de la variance Où et et

Aspect théorique • Objectif : Trouver le maximum de fen l’évaluant le minimum de fois • Ce que l’on sait faire : Pour chaque x, calculer simplement et • Stratégie : Choisir soigneusement (grâce à une borne de confiance) le prochain x à évaluer

Aspect théorique x2 x1 x3 Le prochain x que l’on évaluera sera donc

Aspect théorique Algorithme • Initialisation : On dispose du GP Prior, selon lequel f est supposée être échantillonnée, et des valeurs aux bords f(0) et f(1). • Itérations : Tant que l’on est trop loin du maximum théorique, on calcule (soit par ED soit par GB-UCB) puis puis et

Aspect théorique Mais comment choisir ? cf. Théorème 1 de GaussianProcessOptimization in the Bandit Setting: No Regret and Experimental Design Soit et alors le regret cumulé est en

Expérimentations Lequel des 2 algorithmes choisir ? GP-UCB T = 8 T = 44 GP - Upper Confidence Bound (GP-UCB) Experimental Design (ED)

Expérimentations Quelle « régularité » pour f ? (avec GP-UCB) T = 8 T = 3 T = 6 T = 12 Fonction trop irrégulière : Ne converge pas !

Expérimentations Influence d’un bruit additif gaussien ? T = 18 T = 28 Plus d’évaluations Moins de précision

Expérimentations Choix de et influence de cette constante sur le nombre d’itérations T : / n ? Nombre d’évaluations de f en fonction de n

CONCLUSION • Intérêt : obtention du maximum • Rapidement • Précisément • Limites : • L’hypothèse fonction « régulière » est indispensable. • On n’a pas une idée « globale » de la fonction.

Plan d’expérience dynamique pour la maximisation

Plan d’expérience dynamique pour la maximisation

Presentation Transcript

MISE EN PLACE D’UNE DEMARCHE QUALITE

Du RGPT vers le code pour le « bien-être au travail » ?

Décisions d’investissement et de financement: deux leviers de création de valeur

Pol itique doc umentaire : Les conditions de mise en place

Anesthésie pour transplantation hépatique (chez l’adulte)

La dynamique de groupe et la gestion des conflits

Étude expérimentale multi-échelles de la dynamique de l’eau dans les membranes ionomères utilisées en piles à combustibl

Méthode expérimentale pour un enseignement PLUS juste

Introduction à la statistique inférentielle

Analyse en Composante Principale (ACP)

Bertrand Souweine

APPROCHE PAR PROCESSUS: une occasion pour clarifier, une occasion pour simplifier !

Le vocabulaire du cinéma

David TADDEI

Dynamique des galaxies Confrontation aux Observations

Le langage Javascript pour le web

Informatique

Supports d’exécution pour grappes de machines SMP

Plans de gestion Approche méthodologique

Autonomisation de modèles pour les simulations participatives

Introduction à Java