1 / 53

Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions

intégration. Relations inter-espèces, Équilibres écologiques. Populations. Développement, reproduction, vieillissement. Organismes. Régulations physiologiques. Tissus, organes. Migrations, Communications. Cellules. Réseau d’interactions entre molécules. Fonction cellulaire : voie,

Télécharger la présentation

Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. intégration Relations inter-espèces, Équilibres écologiques Populations Développement, reproduction, vieillissement Organismes Régulationsphysiologiques Tissus,organes Migrations, Communications Cellules Réseau d’interactions entremolécules Fonction cellulaire : voie, cascade, processus Fonction biochimique ou moléculaire Molécule Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions Deuxième partie Octobre 2008 Bernard Jacq

  2. Les méthodes de prédiction fonctionnelle existantes • Sont souvent basées sur des inférences utilisant des données structurales (alignments de séquence, fusions de domaines, proximités géniques, profils phylogénétiques) • Similarité de séquence/structure n’est pas toujours synonyme de similarité de fonction • Ne peuvent souvent être appliquées qu’à un sous-ensemble de protéines • Sont souvent dépendantes de la qualité de l’annotation • Problème du transfert automatique d’annotations (catastrophes transitives) • Nécessitent la connaissance de la séquence génomique • Ne donnent pas accès à des prédictions au niveau cellulaire • NB : Une prédiction doit toujours être vérifiée expérimentalement

  3. Les approches de la fonction à grande échelle (suite) : protéome et interactome

  4. Etude à grande échelle des complexes protéiques

  5. ANALYSE SYSTEMATIQUE DES COMPLEXES PROTEIQUES CHEZ LA LEVURE • Stratégie • PCR of the TAP cassette • Transformation of yeast cells • Selection for positive clones • Large scale cultivation • Cell lysis, Tandem affinity purification • 1D SDS-PAGE • MALDI-TOF protein identification • Bioinformatic interpretation data Gavin et al. (2002) Nature, 415:141-147

  6. Quelques résultats • 589 protéines utilisées comme entrées  78 % ont des partenaires  232 complexes identifiés • 304 protéines sans annotation fonctionnelle dans YPD  proposition de rôle pour 231 d’entre elles  76 % • 113 protéines de fonction connue se voient attribuer une nouvelle fonction

  7. Un RESEAU DE COMPLEXES PROTEIQUES Rouge : Cell cycle Vert foncé : Signalling Bleu foncé : Transcription, DNA maintenance, chromatin structure Rose : Protein and RNA transport Orange : RNA metabolism Vert clair : Protein synthesis and turnover Marron : Cell polarity and structure Violet: Intermediate and energy metabolism Bleu clair : Membrane biogenesis and traffic

  8. ANALYSE STATISTIQUE DES PROTEINES ET DES COMPLEXES

  9. L’interactome Liste de toutes les interactions entre toutes les macromolécules d’une cellule, d’un type cellulaire, d’un organisme Employé par défaut pour décrire l ’ensemble des interactions protéine-protéine

  10. L’interactome (motivation) Les protéines n’agissent pas seules et les processus cellulaires reposent dans leur grande majorité sur des interactions spécifiques entre protéines Après avoir établi la liste des composants protéiques individuels (d’après les résultats du séquençage), une tâche essentielle est maintenant de déchiffrer la sructure, la dynamique, l’évolution des réseaux d’interaction Identifier quels sont les partenaires connus d’une protéine inconnue pourra nous aider à en comprendre la fonction

  11. Genome Transcriptome Proteome Interactome

  12. Les Interactions :quelques définitions Interactions moléculaires • Il y a interaction moléculaire entre le gène Aet le gène B si le gène A(ou son ARNm ou son produit) interagit directement au niveau moléculaire avec le gène B(ou son ARNm ou son produit) --> Il existe un contact physique entre macromolécules. • La majorité des interactions décrites sont de 3 types: • Protéine-ADN • Protéine-ARN • Protéine-Protéine • Les interactions peuvent être orientées (Protéine-ADN, Protéine-ARN)ou non orientées(Protéine-Protéine).

  13. Les Interactions :quelques définitions, suite Interactions et réseaux • Un ensemble d’interactions forme un réseau d’interactions • Un réseau peut illustrer les relation fonctionnelles existant entre gènes/protéines • Un réseau peut être représenté par un graphe orienté ou non B E •A-->B:interaction directe • A-->C-->D-->F-->G: Interactions indirectes • En bleu : le réseau D A F C G

  14. Les Interactions :quelques définitions, fin • Interactions génétiques • Interactions indirectes entre gènes/protéines (mais aussi directes) • Analyse et mise en évidence au niveau du phénotype de l’animal • Quelques Propriétés des interactions • Spécifiques • Dynamiques • Dépendantes des caractéristiques intrinsèques de la protéine (modularité structurale, temps de 1/2 vie, localisation…) • Nombre ? • Eléments de base des réseaux de régulation

  15. Tucker, Gera, and Uetz TCB, 2001 CARTE D’INTERACTIONS Protéine-Protéine LEVURE, 1200 protéines

  16. CARTE D’INTERACTIONS PP LEVURE 1548 protéines, 2358 interactions Gris : Chromatine structure Bleu : Membrane fusion Vert : Cell structure Jaune : Lipid metabolism Rouge : Cytokinesis Schikowski et al. (2000), Nat.Biotech., 18, 1257-1261

  17. Les réseaux protéines-ADN Facteurs de Transcription Gène 1 Gène 2 Gène 3 ..... Un trait liant 2 points Sur la circonférence Représente une interaction Protéine-ADN Comment évolue la dynamique des réseaux P-ADN en fonction des conditions physiologiques ? Crédit: N. Luscombe

  18. Cycle cellulaire Sporulation Diauxic shift Réparation du DNA Stress Utilisation du réseau dans differentes Conditions physiologiques Crédit: N. Luscombe

  19. On dispose maintenant, grâce aux approches à grande échelle (double hybride, Chromatin IP) de milliers d’interactions binaires entre protéines ou entre protéines et ADNQue faire avec cette masse de données ?? • décrire les caractéristiques de l'organisation du protéome/interactome= statistique, approche descriptive • prédire certaines « règles » à partir de l'observation du réseau = inférence, approche prédictive

  20. Analyse fonctionnelle du réseau Comptage des interactions entre groupes fonctionnels Schwikowski et al. (2000), Nat.Biotech., 18, 1257-1261

  21. Analyse structurale et fonctionnelle de réseaux d’interaction Un réseau PPI de levure Quelles caractéristiques structurales peut-on mettre en évidence ?

  22. Analyse structurale et fonctionnelle de réseaux d’interaction Un réseau PPI de levure Deletion phenotype: Red = lethal Green = non-lethal Orange = slow growth Yellow = unknown Ce réseau représente un type d’organisation dit « scale-free » • La plupart des nœuds (protéines) ont peu d’interactions • Un petit nombre de nœuds (hubs) sont connectés à un grand nombre de noeuds

  23. Analyse structurale et fonctionnelle de réseaux d’interaction Des mesures topologiques pour caractériser un réseau Degré de connectivité Coefficient de clusterisation Longueur de chemin Crédit: N. luscombe

  24. Méthodes d’analyse de graphes d’interactions protéine-protéine Comment identifier à l’intérieur du graphe des groupes de protéines reliées fonctionnellement ? • • Approches : • distance dans le graphe • connectivité des protéines • densité Peu dense Dense (clique) Crédit: C. Herrmann

  25. Caractéristiques statistiques • connectivité k d'une protéine = nombre de voisins k = 4 kin = 1 kout = 3 • si le réseau est dirigé (réseaux protéine-ADN) , on distingue kin et kout Crédit: C. Herrmann

  26. Caractéristiques statistiques • distribution de connectivité: quelques protéines fortement connectées = « hub » beaucoup de protéines faiblement connectées Crédit: C. Herrmann

  27. Interprétation biologique (1/3) • particularité des protéines ayant un grand nombre d'interacteurs • protéines structurantesex.: PBS2 chez S. cerevisae, k=15protéine structurante (« échafaudage ») pour le complexe MAP-kinase • protéines létalesex.: Jeong et al. ont montré une corrélation entre la connectivité d'une protéine et son caractère létal chez la levure« plus une protéine a de partenaires, plus elle est essentielle » Crédit: C. Herrmann

  28. Interprétation biologique (2/3) • Si des protéines ont une grande densité de connections ... ... c'est qu'elles forment un module fonctionnel • 2 type de modules fonctionnels • les complexes protéiques (interactions simultanées) • les voies de signalisation/voies métaboliques(interactions consécutives) Crédit: C. Herrmann

  29. Interprétation biologique (3/3) voie de transduction du signal déclenchée par la phéromone levure module impliqué dans la régulation du cycle cellulaire [Spirin & Mirny, PNAS 2003] Crédit: C. Herrmann

  30. Peut-on utiliser les réseaux d'interaction pour faire de la prédiction ? Prédire quoi ? • on dispose d'informations encore très partielles sur le rôle des protéines [date: 9/11/2004] les réseaux d'interactions sont un moyen privilégié pour inférer des fonctions Crédit: C. Herrmann

  31. Observation: les protéines de même fonction ont tendance à être en interaction directe les unes avec les autres source d'erreurs Règle inférée: on peut déduire la fonction d'une protéine à partir des fonctions de ses voisines Exemple de prédiction à partir d’un réseau d'interaction PP levure[Schwikowski et al., Nature Biotech 2000] Crédit: C. Herrmann

  32. Comment peut-on systématiser les prédictions fonctionnelles faites à partir de réseaux d’interactions ? Utilisation de la clusterisation fonctionnelle Exemple de la méthode Prodistin (PROtein DIStance based on INteractions Brun et al., Genome Biology (2003) R, R6

  33. What can be inferred about the functional relationships between A and B on the one hand and C and D on the other ? A B C D Tucker, Gera and Uetz Trends in Cell Biology, March 2001 C and D interact directly and share several common interactors, whereas A and B do not It is likely that the network (cellular) functions of C and D are related whereas that of proteins A and B are not

  34. Principles of our functional classification method (ProDistIn) … Do not compare proteins themselves but… …compare the lists of their interactors… •Etablish a functional distance between proteins using lists of common and specific interactors • Calculate the distance for all possible pairs of proteins • Perform a clusterisation (NJ) • Visualisation of result as a tree (dendrogram)

  35. Z 1- Czekanovski-Dice distance for protein pairs i j k l m X spec + Y spec 1 + 4 D(X, Y) = = = 0.45 Y 8 + 3 (X UY) + (X  Y) X c a b f g h In order to make a functional comparison between N proteins: - calculate D for all pairwise comparisons of proteins - fill in a distance matrix e X Y Z T d X - 0.45 0.5 0.77 2- distance table for all possible pairs Y - 0.6 0.66 Z - 0.84 n o p Apply a clusterisation method (e.g. NJ) and build a functional similarity tree T - X T Y Z T 3- clusterisation and tree drawing ProDistIn : the 3 first steps

  36. Data from : • Double-hybrid screens (Fromont-Racine et al., Uetz et al., Ito et al.) • literature (via MIPS and YPD) • Information Extraction on Medline yeast abstracts Test on the yeast proteome • A total of 2946 direct protein-protein interactions involving 2143 proteins • Only proteins with at least 3 interactors are considered further • =>Classification of 602 yeast proteins (10% of the proteome)

  37. RESULT : FUNCTIONAL PROXIMITY TREE FOR 602 YEAST PROTEINS

  38. • Les interactions sont devenues en quelques années des données essentielles pour analyser et comprendre les fonctions des gènes et protéines • Pour chaque organisme et dans chaque type cellulaire, il existe probablement des dizaines, centaines de milliers voire millions d’interactions moléculaires différentes • Il est nécessaire de stocker informatiquement les données relatives aux interactions Il existe maintenant des bases de données dédiées aux interactions Exemple des bases DIP et BIND …

  39. Vision classique Nouvelle vision A A S (Substrat) P (Produit) La fonction de la protéine A est définie par son action de transformation du substrat (S) en produit (P) La fonction de la protéine A est définie par Le contexte des ses interactions avec d ’autres produits dans la cellule La biologie à grande échelle conduit à un changement de vision de la fonction des protéines

  40. C ’EST FINI !

  41. Le double-hybride dans la levure • Uetz et al. (2000) Nature, 403:623-627 • Ito et al. (2000) PNAS, 97:1143-1147

  42. Le double-hybride dans la levure : bas-débit et haut-débit Schächter (2002)

More Related