1 / 57

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique. Partie 3: applications. Philippe Kastner. ESBS – septembre 2009. Utilisation des biopuces pour l’étude du transcriptome. Conception d’une expérience de microarray Méthodes d’analyse

brandon
Télécharger la présentation

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique Partie 3: applications Philippe Kastner ESBS – septembre 2009

  2. Utilisation des biopuces pour l’étude du transcriptome • Conception d’une expérience de microarray • Méthodes d’analyse • Exemples d’application

  3. Comment concevoir une expérience de microarrays ? But: déterminer les variations biologiques entre différents échantillons. Mais il faut distinguer celles-ci des variations liées à la technologie, ou à celles liées à la variabililé intrinsèque des échantillons

  4. Thomas Hudson, Montreal Genome Center

  5. Intensité croissante

  6. Différences d’expression réelles ou artéfactuelle ? 6 échantillons: A1, A2, A3, B1, B2, B3 Microarray comprenant 20 000 gènes échelle d’expression: 1- 10000 Mesures pour un gène X Test t: p = 0,01 Pour combien de gènes une telle valeur peut-elle être obtenue par hasard ? (« false discovery rate », ou FDR)

  7. Estimation du nombre de gènes différentiels « réels » La moitié des gènes différentiels est artéfactuelle ! Solutions: multiplier les réplicats augmenter la stringence des critères de sélection.

  8. Combien de réplicats sont-ils nécessaires pour une expérience réussie ? variabilité

  9. Deux grands types de méthodes de « clustering » • Méthodes hiérarchique: génération d’un dendogramme (arbre) qui relie tous les gènes ou échantillons entre eux. • Méthodes par partitionnement, qui divise les gènes en K classes ayant des profils similaires (K défini par l’utilisateur) - K-means - Self-organizing maps (SOM) - analyse par composantes principales (PCA)

  10. Regroupement en fonction de profils d’expression similaires 700 gènes 1. Gènes Évolution temporelle de l’expression des gènes dans des fibroblastes humains stimulés par du sérum (Pat Brown, 1997) (Première expérience publiée de microarrays) Visualisation d’une chorégraphie de l’expression génique dans le temps.

  11. Fold Changes -6 -4 -2 1 +2 +4 +6 Genes belonging to one cluster Different cell lines to be compared Regroupement en fonction de profils d’expression similaires 2. échantillons

  12. Méthodes par partitionnement (K-means, Fuzzy C-means, Self organizing maps) • N expériences • chaque gène est considéré comme un vecteur dans un espace de dimension N (coordonnées = valeurs d’expression dans chaque expérience) • Partitionnement des gènes en K classes optimisées selon des critères de proximité des gènes dans l’espace vectoriel

  13. Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes) Visualisation et sélection des classses de gènes intéressantes

  14. Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes) Ikaros bcat TelJak2 Tal-Lmo1

  15. B-catenin ICN1 Ikaros TelJak2 Tal-Lmo1 Visualisation des clusters FCM (4208 genes)

  16. Applications des microarrays 1. Expression différentielle Question: pourquoi B est-il différent de A ? (KO vs WT; effet d’un traitement; sain vs malade, etc …) Comparaison de A et B 200 gènes différentiels !! Et ensuite ??? …. Extraction d’un sens biologique • Analyse biographique • Annotation fonctionnelle des gènes (gene ontology: codification des annotations) Identification de gènes candidats ou voies moléculaires

  17. Exemple 1: Lymphomes thymiques chez des souris mutantes pour le gène Ikaros Recherche de la voie moléculaire impliquée dans le développement de ces tumeurs par une analyse du transcriptome.

  18. 6 IkL/L tumors Genes specifically deregulated in IkL/L tumors ? 4 Tel-Jak2 tumors 5 non tumoral thymocytes Conception expérimentale

  19. IkL/L tumors TelJak2 tumors IkL/L tumor pT Hes1 Deltex 1 Notch1 Notch upregulation is associated with tumors lacking Ikaros Notch pathway signature Expérience fondatrice d’un projet concernant le rôle d’Ikaros dans la régulation de la voie Notch.

  20. Applications des microarrays 2. Transcriptome comme mesure phénotypique d’un système biologique Concept: Profil apparenté de l’expression des gènes implique une similitude d’état biologique Application principale: classification des tumeurs

  21. 2285 échantillons de tumeurs de 20 types de cancer différents 2198 probe sets Meta-analysis of 2285 tumors, from 20 different cancer types Projet « carte d’identité des tumeurs » de la Ligue contre le Cancer

  22. Example 2 : Cancer Expression Analysis • Large Diffuse B-Cell Lymphomas (LDBCL) • No reliable indicators to subtype them • Analysis of >100 LDBCL samples, as well as normal subsets of B lymphocytes • Hybridise to 18K human “lymphoma” slide • Alizadeh et al. , Nature 2000 • Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling.

  23. Identification de deux groupes de tumeurs distincts

  24. Mortality and LDBCL Pronostic différent pour les deux groupes de tumeurs

  25. Signature transcriptomique Ensemble de gènes caractéristiques d’un état biologique donné • type cellulaire (ex: signature des pDCs) • stimulation d’une voie moléculaire (ex: Notch)

  26. Exemple 3: analyse de la signature de cellules dendritiques plasmacytoïdes Liu et al, Nature Immunol, 2004

  27. Comment les pDCs se développent-elles ? Controverses dans la littérature: Les pDCs sont-elles apparentées aux cellules myéloïdes (macrophages, monocytes) ou lymphoïdes (lymphocytes) ? Les pDCs sont-elles apparentées aux autres types de cellules dendritiques « conventionnelles », impliquées dans la présentation des antigènes ?

  28. Une vue génomique des cellules dendritiques • Assemblage de profils d’expression génique pour la plupart des types cellulaires immunitaires (macrophages, neutrophiles, lymphocytes B, T, NK, pDCs, cDCs) = « compendium » • Pour l’homme et la souris • Clustering pour visualiser les distances entre lignage • Identification de programmes d’expression géniques conservés Robbins et al, 2008 (Genome Biology)

  29. Similitude des profils transcriptomiques des DC 1. SOURIS Principal component analysis (PCA) (Projection on first 2 dimensions) Hierarchical clustering

  30. Similitude des profils transcriptomiques des DC Publicly available datasets on Affymetrix U133 v2 2. HOMME

  31. Signature des DC de souris Pan-DC genes Conventional DC genes pDC specific genes (500 genes) (Fuzzy C-means clustering)

  32. Signatures des DC humaines Conventional DC genes Pan DC genes pDC genes

  33. Gènes les plus fortement associés à des types de cellules spécifiques Rouge: connu pour être spécifique de ces lignages

  34. Conclusion des études transcriptomiques • Proximité des programmes géniques des pDC et cDC: les DC constituent-elles une branche développementale séparée du système hématopoîétique ? • Signatures conservées entre l’homme et la souris • Les gènes spécifiques des DCs sont largement inconnus

  35. Exemple 4: Absence de cellules dendritiques plasmacytoïdes (pDC) chez les mutants IkL/L

  36. Les pDC sont-elles bloquées dans leur différenciation dans la moelle osseuse ? Présence d’une population exprimant un marqueur des pDC, 120G8, mais pas B220

  37. La population 120G8+ mutante appartient-elle au lignage des pDC ? Analyse du transcriptome (Affymetrix: 45000 gènes) Comparaison à divers types cellulaires hématopoïétiques

  38. (scatter plot) Surexpression de la plupart des gènes dérégulés

  39. Visualisation des gènes spécifiques des populations WT et mutantes Clustering hiérarchique) Les pDC IkL/L possèdent la signature pDC Dérégulation (surexpression) d’un grand nombre de gènes Sous-signature commune avec les DC conventionnelles

  40. Applications des microarrays 3. Data mining Recherche d’informations « cachées » dans les données de transcriptome Confrontation des données: - à d’autres sets de données transcriptomiques - aux données de séquence et d’organisation des génomes - aux données de fonctions des gènes

  41. Exemple 5: Profils d’expression et recherche de motifs régulateurs Nature Genetics 22, 281 (1999) Question: En confrontant les séquences des promoteurs de gènes co-régulés, peut-on découvrir de nouvelles séquences régulatrices ? • Données: de transcriptome du cycle cellulaire de levure (2 cycles) • partition en 30 classes de gènes (K-means) • pour chaque classe: • Enrichissement par rapport à une fonction ? • Présence de motifs spécifiques dans les promoteurs (1kb en amont du site d’initiation)? • méthode: déplacement d’une fenêtre de 10pb à travers la séquence, recherche de séquences homologues dans les autres gènes du cluster •  calcul d’un score (MAP score). Si MAP score >10 , = significatif

  42. 18 motifs dans 12 clusters Motifs spécifiques d’un cluster donné Éléments régulateurs connus et inconnus Identification de nouveaux sites régulateurs

  43. Gènes co-exprimés Motif régulateur commun ? Présence d’un ou plusieurs motifs donné Gènes corégulés ?

  44. Generalscheme (1) • clustering-based approaches for finding motifs from gene expression and sequence data classify

  45. Generalscheme (2) • sequence(/knowledge)-based approaches for finding motifs from gene expression and sequence data

  46. Données: levures cultivées dans différentes conditions Etude des promoteurs des groupes 1 et 4: enrichissement de deux motifs régulateurs, PAC et RRPE, souvent présents de façon conjointe.

  47. Question: la présence de l’un ou des deux motifs PAC et/ou RRPE permet-elle de prédire la régulation du gène correspondant? Très bonne corrélation des profils d’expression qui contiennent la suite RRPE, PAC

  48. Exemple 6: découverte de fonction de gènes Idée: gènes aux fonctions similaires sont régulés de façon similaire Compendium : base de données de profils d’expression (levures cultivées dans différentes conditions, souches mutantes, etc …) Gène à la fonction inconnue: - profil d’expression similaire à ??? - Souche mutante pour ce gène: profil similaire à ???

  49. Exemple: découverte de la fonction du gène YER044C Souches mutantes Gènes Forte association avec des gènes impliqués dans la synthèse de l’ergostérol Validation fonctionelle

More Related