1 / 60

# Rappel Classification de spectres

Rappel Classification de spectres. hierarchical clustering. Step 1: the Euclidian distance between each pair of spectra is calculated. Figure: 5 spectra represented in a 2-D space (say we recorded only the absorbance at two wavenumbers). Classification de spectres. hierarchical clustering.

Télécharger la présentation

## Rappel Classification de spectres

E N D

### Presentation Transcript

1. Rappel Classification de spectres hierarchical clustering • Step 1: the Euclidian distance between each pair of spectra is calculated. • Figure: 5 spectra represented in a 2-D space (say we recorded only the absorbance at two wavenumbers)

2. Classification de spectres hierarchical clustering • Step 2: grouping starts by linking the closest spectra. • Figure: grouping of spectra (#1 to 5) and clusters (beyond #5)

3. Classification de spectres hierarchical clustering • Step 3: dendrogram representation. • Statistical significance of the distances

4. Observations des données: recherche des régions spectrales corrélées

5. 3- Information sur la conformation: corrélations p wavenumbers n spectra

6. 3- Information sur la conformation: corrélations The variance An estimate of the spread of the results is given by the variance The variance can be found on the diagonal of the covariance matrix defined just below. The covariance The correlation coefficient This is a measure of the linear association between 2 wavenumbers i and k. Normalized by the standard deviation that exists on both variables, it does not depends on the units and is always included between –1 and +1.

7. 50 spectres de protéines Variance

8. 3- Information sur la conformation: corrélations Corrélation entre fréquences Covariance entre fréq i et k Série de n spectres (j=1:n) Matrice de covariance

9. 3- Information sur la conformation: corrélations

10. 3- Information sur la conformation: corrélations - 1545/1530 (/) - 1655/1630 (/) + 1530/1630 (/) +1690/1630 (/) - 1545/1630 (/) ? ? ? ?   - 1530/1655 (/) - 1630/1655 (/) - 1690/1655 (/) +1545/1655 (/) Combien d’informations indépendantes? Où se trouve l’information? - 1545/1530 (/)

11. 3- Information sur la conformation: corrélations ? 50 log lines Enhancement=100 near 0 Chaînes latérales ??

12. ? 3- Rôle des chaînes latérales Glu  hélices  (la plus haute préférence pour les hélices) Asp  tournants 

13. 3- Information sur la conformation: corrélations Extraire toute l’information corrélée en un petit nombre de paramètres: Analyse en composants principaux (PCA) On peut démontrer que les vecteurs propres de la matrice de covariance forment une base qui permet de décrire complètement les spectres Ces vecteurs propres on une corrélation nulle entre eux

14. 3- Information sur la conformation: corrélations CP6: 1% CP5: 3% CP4: 5% CP3: 8% CP2: 18% CP1: 64% moyenne

15. 3- Information sur la conformation: corrélations

16. 3- Information sur la conformation: corrélations  CP1 est une différence entre hélice et feuillet

17. 3- Information sur la conformation: corrélations  CP1 discrimine entre hélice et feuillet

18. 3- Information sur la conformation: corrélations  CP1 est une différence entre hélice et feuillet

19. Conclusions Les amide I et II contiennent de l’information sur la struct sec Certaines régions entre 1700 et 1500 cm-1 ne semblent pas corrélées à la struct sec (particulièrement 1600-1560 cm-1).

20. Imagerie FTIR

21. Imagerie FTIR Identification de phénotypes • Superposition de l’image optique classique à une image basée sur les spectres IR • Chaque pixel de l’image IR associé à un spectre IR • Représente soit l’absorbance à un nombre d’onde particulier soit une combinaison d’absorbances caractéristiques

22. FTIR imaging resolution? 16 µm 170 µm, 64 pixels Abso at 1655 cm-1

23. Abso 1655 cm-1 170 µm, 16 µm

24. Imagerie de coupes histologiques

25. IMPReS August 2011

26. The IR spectrum of a protein

27. cm-1

28. Protein helices 520 µm 2.7µm/pixel 36864 spectra >108 data points

29. Protein sheets

30. 1468 cm-1 Lipid chains

31. Protein helices/lipid chains

32. Unsupervised classification Normalized Cluster analysis

33. Fibrosis vs Tumor Samples Tissue sections are cut from fixed, paraffin-embedded tissue blocks using a microtome Corresponding deparafined section of the sample H&E stained breast carcinoma sample Tumor Fibrosis

34. Results:GG1 vs GG3 Samples TMA’s : Tissue Micro Array 19 clinical cases of invasive breast carcinomas, 4 tissue cores per patient We know all the clinical parameters of these clinical cases Most of the time, HG1 and HG3 are well defined by the pathologist. So, HG1 -> GG1 and HG3 -> GG3

35. Microarrays analysis Gene expression profiling of breast tumors May lead to individualized management of patients => Gene expression grade index based on the expression of 97 genes is more correlated with relapse-free survival than histologic grade Clinical problem for breast cancer grading

36. Supervised classification • Number of spectra in the different classes • 1849 epithelium • 628 erythrocytes • 14 lymphocytes • 1605collagen/fibroblasts

37. Supervised classification • Number of spectra in the different classes • 1849 epithelium • 628 erythrocytes • 14 lymphocytes • 1605collagen/fibroblasts

38. Supervised classification

39. Unsupervised classification PCA analysis IMPReS August 2011

40. Unsupervised classification PCA analysis

41. Unsupervised classification PCA analysis

42. Unsupervised classification PCA analysis

43. Unsupervised classification PCA analysis

44. Unsupervised classification: collagen

45. Unsupervised classification: epithelial cells

46. Unsupervised classification: epithelial cells

More Related