1 / 101

Modélisation statistique de la topologie d’un nuage de points

Modélisation statistique de la topologie d’un nuage de points. Michaël Aupetit – Ingénieur Chercheur Pierre Gaillard – Doctorant. CEA-DAM – Bruyères-le-Châtel Département Analyse Surveillance Environnement Laboratoire Détection et Sismologie Opérationnelle

lidia
Télécharger la présentation

Modélisation statistique de la topologie d’un nuage de points

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modélisation statistique de la topologied’un nuage de points Michaël Aupetit – Ingénieur Chercheur Pierre Gaillard – Doctorant CEA-DAM – Bruyères-le-Châtel Département Analyse Surveillance Environnement Laboratoire Détection et Sismologie Opérationnelle Présentation aux Journées de Géométrie Algorithmique 12-16 mars 2007

  2. Un point de vue statistique Etant donné un nuage de points de RD, échantillon d’une population (sous-variétés de RD) inconnue, si l’on connaît la densité de probabilité de la population (estimée à partir de l’échantillon), on peut apporter une solution à de nombreux problèmes usuels: classification, discrimination, régression… Il reste pourtant une information peu exploitée car difficile à extraire… CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  3. Une question en attente de réponse… Les modèles statistiques de densité existant ne permettent pas de répondre à la question suivante : Quelle est la forme de ce nuage de points ? CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  4. 1 point et 1 courbe Une réponse subjective… La réponse attendue serait : Topologie : 1 variété de type point, 1 variété de type segment Non connectées l’une à l’autre Géométrie : Leur position absolue, leur position relative, la courbure du segment, sa longueur, l’importance du bruit… CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  5. Pourquoi modéliser la topologie in situ? • Reconnaissance de formes • Ajout de caractéristiques topologiques au caractéristiques statistiques et géométriques • Classification via composantes connexes; dimension intrinsèque… • Apprentissage semi-supervisé CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  6. Pourquoi modéliser la topologie in situ? • Reconnaissance de formes • Ajout de caractéristiques topologiques au caractéristiques statistiques et géométriques • Classification via composantes connexes; dimension intrinsèque… • Apprentissage semi-supervisé • Analyse exploratoire • Mesure des caractéristiques topologiques d’un nuage de point en dimensions >3 • Plus court chemin le long des variétés (projection non linéaire) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  7. [Zeller, Schulten - IEEE ISIC1996] Pourquoi modéliser la topologie in situ? • Reconnaissance de formes • Ajout de caractéristiques topologiques au caractéristiques statistiques et géométriques • Classification via composantes connexes; dimension intrinsèque… • Apprentissage semi-supervisé • Analyse exploratoire • Mesure des caractéristiques topologiques d’un nuage de point en dimensions >3 • Plus court chemin le long des variétés (projection non linéaire) • Robotique, commande de processus • Trajectoire optimale • Cinématique inverse CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  8. Approches génératives (critère ML) Gauss. Mixt. Etat de l’art (Machine Learning): topologie fixée a priori Approches descriptives (critère MSE) QV [Gray] Codage,prédiction, compression Prédiction , correction d’erreurs OD CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  9. Approches génératives (critère ML) Gauss. Mixt. 1D-2D… Modèle de topologie SOM [Kohonen] GTM [Bishop] Projection, clustering, compression Projection Etat de l’art (Machine Learning): topologie fixée a priori Approches descriptives (critère MSE) QV [Gray] Codage,prédiction, compression Prédiction , correction d’erreurs OD CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  10. Approches génératives (critère ML) Gauss. Mixt. 1D-2D… Modèle de topologie SOM [Kohonen] GTM [Bishop] Projection, clustering, compression Projection Modèle de variétés 1D-2D… Prin. Curv. [Kegl] Prédiction , correction d’erreurs LPCA [Bishop] Projection PSOM [Walter] Prédiction, correction d’erreurs Prédiction , correction d’erreurs Prin. Curv. [Hastie,Stuetzle] Etat de l’art (Machine Learning): topologie fixée a priori Approches descriptives (critère MSE) QV [Gray] Codage,prédiction, compression Prédiction , correction d’erreurs OD CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  11. Approches génératives (critère ML) Gauss. Mixt. 1D-2D… Modèle de topologie SOM [Kohonen] GTM [Bishop] Projection, clustering, compression Projection Modèle de variétés 1D-2D… Prin. Curv. [Kegl] Prédiction , correction d’erreurs LPCA [Bishop] Projection PSOM [Walter] Prédiction, correction d’erreurs Prédiction , correction d’erreurs Prin. Curv. [Hastie,Stuetzle] Etat de l’art (Machine Learning): topologie fixée a priori Approches descriptives (critère MSE) QV [Gray] Codage,prédiction, compression Prédiction , correction d’erreurs OD • Problèmes : topologie imposée ou incomplète CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  12. Etat de l’art : topologie apprise des données • Information parcellaire sur la topologie • Calcul de la dimension intrinsèque locale CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  13. Etat de l’art : topologie apprise des données • Information parcellaire sur la topologie • Calcul de la dimension intrinsèque locale • Modélisation sous forme de graphesà partir des données seules • Gabriel Graph, Sphere of Influence Graph, Relative Neighborhood Graph, KNN Graph, beta-squelette… CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  14. Etat de l’art : topologie apprise des données • Information parcellaire sur la topologie • Calcul de la dimension intrinsèque locale • Modélisation sous forme de graphesà partir des données seules • Gabriel Graph, Sphere of Influence Graph, Relative Neighborhood Graph, KNN Graph, beta-squelette… • Modélisation sous forme de complexes simpliciauxà partir des données seules • Crust [Amenta98] (k<4) • a-shapes [Edelsbrunner94] • Intérêt : certaines garanties topologiques / échantillonnage • Problème : sensibilité au bruit moyen à fort, conditions d’échantillonnage invérifiables dans notre cas, absence de critère de sélection des paramètres (une piste : persistence topologique) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  15. Etat de l’art : topologie apprise des données • Approches géométriques basées sur des prototypes représentant les données (Quantification Vectorielle) • Topology Representing Networks [Martinetz94] • Witness Complexes [De Silva03] CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  16. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  17. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  18. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les arcs de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs extrémités M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  19. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les arcs de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs extrémités M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  20. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les arcs de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs extrémités M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  21. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les arcs de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs extrémités M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  22. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les arcs de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs extrémités M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  23. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les triangles de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs sommets M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  24. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Les triangles de Delaunay sont retenus si la variété coupe la frontière de Voronoï commune à leurs sommets M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  25. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] Valable pour tous les k-simplexes (k<=d) M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  26. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] • Propriétés: • - type d’homotopie • homéomorphisme • sous certaines conditions vérifiables • uniquement si on connaît les Mk M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  27. Complexe restreint de Delaunay • Etant donnée une collection de variétés, et un ensemble de points (prototypes), on définit le complexe de Delaunay des points restreint aux variétés. [Edelsbrunner, Shah 1997] • Propriétés: • - type d’homotopie • homéomorphisme • sous certaines conditions vérifiables • uniquement si on connaît les Mk Problème : il faut connaître les variétés Mk M1 M2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  28. Applications : cas où les variétés sont connues Topologie de molécules avec les alpha-shapes [Edelsbrunner1994] Variété M = union des sphères centrées sur les points (alpha règle le rayon des sphères) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  29. Applications : cas où les variétés sont connues Analyse exploratoire par élagage du graphe de Delaunay de données étiquetées [Aupetit2005] Topologie de molécules avec les alpha-shapes [Edelsbrunner1994] Variété M = union des sphères centrées sur les points (alpha règle le rayon des sphères) Variété M = union des cellules de Voronoï des points d’une même classe CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  30. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  31. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  32. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  33. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  34. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) ROI = cellule de Voronoï d’ordre 2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  35. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) ROI = cellule de Voronoï d’ordre 2 1 arc du graphe de Delaunay = 1 cellule de Voronoï d’ordre 2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  36. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) ROI = cellule de Voronoï d’ordre 2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  37. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) ROI = cellule de Voronoï d’ordre 2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  38. Approximation : cas où les variétés sont inconnues • Topology Representing Network [Martinetz, Schulten 1994] • La variété M est remplacée par un échantillon fini • Le test d’intersection entre M et les frontières de Voronoï est remplacé par l’appartenance de l’échantillon à desrégions d’influence qui contiennent ces frontières 2nd 1er Connecter 1er and 2nd PPV de chaque donnée : Competitive Hebbian Learning (CHL) ROI = cellule de Voronoï d’ordre 2 CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  39. Exemple du Topology Representing Network Sans bruit Cellules de Voronoï d’ordre 2 = région d’influence d’un arc du graphe de Delaunay Avec bruit CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  40. Zones mortes (3 ppv non sommets de Delaunay) Witness Complexes [deSilva,Carlsson 2003] A chaque (D+1-K)-facette d’une cellule de Voronoï correspond une cellule de Voronoï d’ordre K (réciproque fausse pour K>2) Voronoï d’ordre 2 Voronoï d’ordre 3 Sommets candidats pour les triangles CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  41. TRN et Witness Complexes : les qualités • Intérêt • On construit un sous-complexe de Delaunay avec peu de calculs O(DNG) • Si les sommets sont « bien » placés et en nombre « suffisant mais pas trop », Alors le complexe simplicial obtenu est « satisfaisant » CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  42. TRN et Witness Complexes : les qualités • Intérêt • On construit un sous-complexe de Delaunay avec peu de calculs O(DNG) • Si les sommets sont « bien » placés et en nombre « suffisant mais pas trop », Alors le graphe obtenu est « satisfaisant » Passons aux « défauts » de mon point de vue (ML) : Le choix de ces ROI est-il « pertinent » pour résoudre le problème posé? CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  43. TRN et Witness Complexes : les défauts • 1) Existence de zones mortes (K>2) donc sous-utilisation des G échantillons (G>>N) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  44. TRN et Witness Complexes : les défauts • 2) Pas de préservation des 0-simplexes générateurs car tout point à toujoursdeux prototypes 1er et 2nd plus proches voisins qui seront donc connectés Sans bruit Avec bruit CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  45. TRN et Witness Complexes : les défauts • 3) Sensibilité au bruit car modèle basé sur des ROI « binaires »: il suffit d’un seul point dans la région pour créer le lien. CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  46. TRN et Witness Complexes : les défauts • 4) Modèle de variétés abstrait : les k-simplexes (k>0) sont plongeables, mais ne sont pas plongés géométriquement dans l’espace du nuage de point. Ce n’est pas un modèle des variétés génératrices au sens où on l’entend en ML modèle « proche » des données au sens des moindres carrés (e.g. K-means), mais « seulement » un modèle de leur connexité. CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  47. TRN et Witness Complexes : les défauts • 4) Modèle de variétés abstrait : les k-simplexes (k>0) sont plongeables, mais ne sont pas plongés géométriquement dans l’espace du nuage de point. Ce n’est pas un modèle des variétés génératrices au sens où on l’entend en ML modèle « proche » des données au sens des moindres carrés (e.g. K-means), mais « seulement » un modèle de leur connexité. CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  48. TRN et Witness Complexes : les défauts • 4) Modèle de variétés abstrait : les k-simplexes (k>0) sont plongeables, mais ne sont pas plongés géométriquement dans l’espace du nuage de point. Ce n’est pas un modèle des variétés génératrices au sens où on l’entend en ML modèle « proche » des données au sens des moindres carrés (e.g. K-means), mais « seulement » un modèle de leur connexité. Toutes les mesures de proximité sont effectuées par rapport aux seuls sommets Le complexe simplicial est abstrait CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  49. TRN et Witness Complexes : les défauts • 4.1) Conséquence 1 : ROI de formes pas toujours adaptées Les « witness » sont loin de l’arc qu’ils génèrent (contre-intuitif en ML: moyenne, centre de gravité) CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

  50. TRN et Witness Complexes : les défauts • 4.2) Conséquence 2 : Pas de self-consistance (définie par Hastie et Stuetzle avec les Variétés Principales), on peut avoir une intersection vide entre un segment et sa ROI (les points échantillons d’un segment peuvent ne pas générer ce segment) Pas d’intersection entre la ROI et le segment qu’elle génère CEA-DAM Laboratoire Détection et Sismologie Opérationnelle Présentation JGA 2007 - Marseille

More Related