1 / 26

Aide à l’interprétation des données

Aide à l’interprétation des données. Virginie Defamie. - Quantification des intensités de fluorescence. Normalisation des données. Tests statistiques. Liste de gènes significativement modulés. 200 gènes modulés. dizaine connus. . 25 000 gènes. reste.

jam
Télécharger la présentation

Aide à l’interprétation des données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aide à l’interprétation des données Virginie Defamie Formation RNG - 24-28 octobre 2005

  2. - Quantification des intensités de fluorescence • Normalisation des données • Tests statistiques Liste de gènes significativement modulés 200 gènes modulés dizaine connus  25 000 gènes reste Comment utiliser sa liste de gènes modulés? Formation RNG - 24-28 octobre 2005

  3. Informations sur les gènes OMIM (Online Mendelian Inheritance in Man) http://www.ncbi.nlm.nih.gov.gate1.inist.fr/entrez/query.fcgi?CMD=search&DB=omim DAVID (Database for Annotation, Visualisation and Integarted Discovery) Permet d’obtenir des infos sur les gènes, les classer par fonction et les inclure dans des voies de signalisation via un lien vers KEGG. http://apps1.niaid.nih.gov/david/ KEGG: Kyoto Encyclopedia of Genes and Genomes Schémas des voies de signalisation impliquées dans divers processus cellulaires et maladies humaines. http://www.genome.jp/kegg/ Formation RNG - 24-28 octobre 2005

  4. Informations sur les gènes Entrez Gene sur NCBI Permet d’obtenir des infos sur les gènes, leur différents symboles, position chromosomique, accès à la littérature, lien vers KEGG http://www.ncbi.nih.gov/entrez/query.fcgi?db=gene Formation RNG - 24-28 octobre 2005

  5. Le clustering Définition Organiser les gènes, dont les profils d’expression sont identiques, en groupes (clusters) But Révéler la fonction putative de certains gènes encore non caractérisée gènes co-exprimés peuvent être reliés fonctionnellement Identifier les gènes co-régulés Identifier rapidement un groupe de gènes régulés selon une pathologie ou un traitement Formation RNG - 24-28 octobre 2005

  6. Le clustering Clustering hiérarchique : analyse non supervisée 1 détermination des distances entre les gènes (méthode euclidienne) 2 liaison des gènes les plus proches (arbre hiérarchique) Techniques de clusterisation: d’après la Manchester Metropolitan University http://149.170.199.144/multivar/ca_alg.htm Formation RNG - 24-28 octobre 2005

  7. Le clustering Clustering hiérarchique : analyse non supervisée Formation RNG - 24-28 octobre 2005

  8. Le clustering Le k meansclustering : analyse supervisée Permet le classement des gènes dans un nombre fixe de classe (k) défini par l’utilisateur. Les gènes sont classés en clusters et dans chaque cluster la distance moyenne entre les gènes est la plus petite possible. Les gènes sont déplacés de clusters en clusters jusqu’à que tout changement n’améliore plus le système. Le logiciel minimise la variabilité au sein des clusters et maximise la variabilité entre clusters. SOM (self organizing map) : analyse supervisée Principe similaire au k means mais calculs par rapport au centroids. Le centroid de chaque cluster est redéfini jusqu’à ce que les clusters restent dans des localisations stables. Formation RNG - 24-28 octobre 2005

  9. min max Nas.ep. Liver Leuco. Ker. Cluster 1 Cluster 2 Cluster 3 Cluster 4 Le clustering Identification de gènes tissu ou cellule spécifiques. Set de 50 microarray homme. Chaque ligne correspond au niveau d’expression d’un gène dans les différents types cellulaires. Niveau d’expression : Formation RNG - 24-28 octobre 2005

  10. Le clustering Logiciels disponibles sur le web MeV: MultiExperiment Viewer http://www.tm4.org/mev.html http://www.tigr.org/software/microarray.shtml Genesis http://genome.tugraz.at/ J-express http://www.ii.uib.no/~bjarted/jexpress/ Formation RNG - 24-28 octobre 2005

  11. EASE (Expression Analysis Systematic Explorer) EASE disponible sur le web: http://david.niaid.nih.gov/david/ease.htm Permet de définir des familles fonctionnelles à partir d’une liste de gènes d’intérêt. EASE utilise les bases de données DAVID, KEGG, Entrez Gene… Formation RNG - 24-28 octobre 2005

  12. EASE (Expression Analysis Systematic Explorer) Liste gène modulés sous format .txt Formation RNG - 24-28 octobre 2005

  13. EASE (Expression Analysis Systematic Explorer) Liste gène présents sur la puce sous format .txt Formation RNG - 24-28 octobre 2005

  14. EASE (Expression Analysis Systematic Explorer) Formation RNG - 24-28 octobre 2005

  15. EASE (Expression Analysis Systematic Explorer) Étude des gènes modulés lors de la régénération hépatique chez la souris. Cinétique de régénération 0, 2, 16 et 40 heures post hépatectomie. Formation RNG - 24-28 octobre 2005

  16. EASE (Expression Analysis Systematic Explorer) Identification des thèmes biologiques les plus important grâce à EASE en donnant un score statistique EASE ou FISHER. Conclusion: réorganisation du cytosquelette surexpression des protéines impliquées dans la synthèse d’ADN au profit des protéines de fonctionnement hépatique Formation RNG - 24-28 octobre 2005

  17. 1 Installation de R (cours Pascal Barbry) http://www.cran.r-project.org/ 2 PAM http://www-stat.stanford.edu/˜tibs/PAM PAM (Prediction Analysis of Microarrays) Exemple biologique Objectifs: identifier un set de gènes modulés en fonction des condition asthme vs témoin diagnostic prédictif de nouveaux patients rhinite ou asthme? 3 Exécution du programme sur Excel Formation RNG - 24-28 octobre 2005

  18. PAM (Prediction Analysis of Microarrays) Formation RNG - 24-28 octobre 2005

  19. PAM (Prediction Analysis of Microarrays) Formation RNG - 24-28 octobre 2005

  20. PAM (Prediction Analysis of Microarrays) % erreur dans la prédiction Trouver le juste milieu entre un nombre de gènes prédictifs satisfaisant et % d’erreur le plus petit possible Formation RNG - 24-28 octobre 2005

  21. PAM (Prediction Analysis of Microarrays) Entrée des données dont le diagnostique des patients est inconnu (Rhinite ou asthme?) Formation RNG - 24-28 octobre 2005

  22. PAM (Prediction Analysis of Microarrays) Formation RNG - 24-28 octobre 2005

  23. Genomatix Logiciel payant disponible sur http://www.genomatix.de/ Formation RNG - 24-28 octobre 2005

  24. Genomatix • Créer des liens entre les gènes de la liste de gènes modulés • Voies de signalisation et voies métaboliques • Étude des facteurs de transcription et de leurs cibles Formation RNG - 24-28 octobre 2005

  25. Genomatix • Analyse des promoteurs • Identifier les gènes co-réguler Formation RNG - 24-28 octobre 2005

  26. Conclusion Il existe plusieurs façons d’aborder ses données selon la question biologique posée. Analyse gène par gène Analyse globale (gènes corégulés…) Dégager un set de gènes prédictifs d’une pathologie Formation RNG - 24-28 octobre 2005

More Related