1 / 11

Problèmes d’apprentissage posés par la régulation de l’expression des gènes

Problèmes d’apprentissage posés par la régulation de l’expression des gènes. Florence d’Alché-Buc. Extraction des réseaux de régulation géniques : un objectif à long terme. Données d’expression des gènes issues des biopuces. Apprentissage. Informations extraites de bases d’articles. -.

kevin-blake
Télécharger la présentation

Problèmes d’apprentissage posés par la régulation de l’expression des gènes

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Problèmes d’apprentissage posés par la régulation de l’expression des gènes Florence d’Alché-Buc

  2. Extraction des réseaux de régulation géniques :un objectif à long terme Données d’expression des gènes issues des biopuces Apprentissage Informations extraites de bases d’articles - + Informations sur les protéines : fonctions : gène Activation (ou inhibition) par le biais D’une protéine

  3. Décomposition en sous-problèmes • Pb 1 : Classification non supervisée de données d’expression • Pb 2 : Extraction de la structure du réseau de régulation • Pb 3 : A structure fixée, modélisation de la dynamique du réseau et • identification de ses paramètres

  4. Présentation du sous-problème 1 : Classification non supervisée de données d’expression Objectif : Regrouper les gènes de profils expérimentaux similaires

  5. Quelles données ? Exemples : (de Jong 2001) : Initiation de la sporulation chez Bacillus Subtilis

  6. Origine des données : les biopuces ou puces à ADN - permettent d’acquérir les différences d'expression entre les gènes et ceci à l'échelle d'un génome complet (ex : génome de la levure : > 6000 gènes) - technologie difficile à mettre en place : Plusieurs techniques : fluorescence, radioactivité …. Données résultantes : bruitées, difficiles à normaliser …

  7. Biopuces Source site ENS : Auteur Philippe Marc

  8. Biopuce : image des intensités lumineuses correspondant aux Taux d’ARN : Source site ENS : Auteur Philippe Marc

  9. Données observées Type 1 : une matrice n x m : n lignes décrivant n gènes, n colonnes Correspondant aux expériences réalisées Type 2 : une matrice n x m : les colonnes correspondent à une seule Expérience mais pour laquelle on a pris différents instants Expérimentaux Type 3 : n x (m1 + m2 + … mp) P expériences sur une même puce : avec mi instants expérimentaux Ensemble de profils cinétiques Profils cinétiques

  10. Exemple de clustering obtenu avec une classification hiérarchique (logiciel d’Eisen, réf : Eisen et al. 1998)

  11. Clustering Type 1 : de nombreuses méthodes peuvent être appliquées : Déjà : classification hiérarchique, K-moyennes, cartes de Kohonen Type 2 : inclure dans les dissimilarités la notion de séquence, mise En correspondance par time warping (utilisé en reconnaisance de Caractères) Ordre de grandeur actuel : milliers de gènes, dimension 100

More Related