1 / 34

Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM

Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM. Petr Koutecký & Jiří Košnar, 2011. Next Generation Sequencing - úvod. N ext G eneration S equencing (NGS) High-throughput Sequencing v jednom runu nezávisle sekvenuje tisíce až miliony molekul

Télécharger la présentation

Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Metody molekulární biologie v ekologii a systematice rostlin 13. NGS, SNP, FCM Petr Koutecký & Jiří Košnar, 2011

  2. Next Generation Sequencing - úvod Next Generation Sequencing (NGS) High-throughput Sequencing • v jednom runu nezávisle sekvenuje tisíce až miliony molekul • poskytuje velké množství dat za nižší cenu než klasické (např. Sangerovo) sekvenování • obvykle odlišné biochemické principy • vyplatí se u vzorků s velkou komplexitou (složitostí) – genomy, vzorky společenstev, nebo pro nízce abundantní molekuly • celková cena analýzy je ale stále relativně vysoká (min. desítky – stovky tisíc Kč) • 454 pyrosequencing, Illumina, SOLiD, Ion Torrent a několik dalších nových metod

  3. 454 pyrosequencing princip 454 pyrosekvenování (*1996): • po inkorporaci dNTP se odštěpí pyrofosfát (PPi) → ATP sulfuryláza jej přemění na ATP → luciferáza za přítomnosti ATP přemění luciferin na oxyluciferin → záblesk (→ apyráza – degraduje neinkorp. dNTP a ATP) • v každém cyklu na templát pouštěn jen jeden typ dNTP • např. když se přidá T a vznikne záblesk, tak na dané pozici je opravdu T

  4. 454 pyrosequencing výška píku záblesku odráží počet inkorporovaných nukleotidů daného typu delší homopolymerní sekvence → hlavní zdroj chyb 454 sekvenace (454 je více chybující než klasická sekvenace) na rozdíl od Sangerova sekvenování je čitelný i úsek za sekv. primerem

  5. 454 pyrosequencing • kde vzít molekuly DNA templátu na sekvenaci? • fragmenty DNA – genomická DNA, PCR produkt • na každý jednotlivý fragment DNA napojeny adaptory • adaptory vážou fragment na capture beads (1 fragment → 1 bead) • emulzní PCR (emPCR) – na každé bead proběhne klonální amplifikace fragmentu → namnožení daného typu molekuly DNA

  6. 454 pyrosequencing jednotlivé beads zapadnou do jamek pikotitrační destičky ... ... zařízení snímá signál zvlášť pro každou dílčí jamku: v 1 jamce jen 1 bead → sekvenační signál z původně 1 fragmentu DNA (klonálně namnoženého do mnoha kopií pomocí emPCR) ... a jsou podrobeny cyklickému procesu pyrosekvenace

  7. 454 pyrosequencing výstup: získají se sekvence o délce < 1000 bp, nejčastěji 700 bp (podle typu použité sequencing chemistry) počet získaných sekvencí - podle kapacity daného typu přístroje: ◄ Roche GS FLX (17 mil. Kč): ~ 1 000 000 sekvencí / run (~ 100 tis. Kč) ◄ Roche GS Junior (3.5 mil. Kč): ~ 100 000 sekvencí / run (~ desítky tis. Kč) vzorky se posílají komerčním servisním firmám

  8. 454 pyrosequencing • jak analyzovat víc vzorků najednou? • předpokladem je odlišit jednotlivé sekvence = určit, kterému ze vzorků patří • fyzická separace jednotlivých vzorků (jen u GS FLX): pomocí gasket (těsnění) rozdělujícího pikotitrační destičku do několika regionů (2, 4, 8 a 16) • identifikace výstupních sekvencípomocí připojení MID (= Multiplex Identifier) sekvence: může být součástí adaptorů napojovaných na DNA fragmenty, nebo součástí PCR primerů použitých na amplifikaci daného konkrétního vz. • vede ke snížení počtu sekvencí na 1 vzorek, ale zároveň šetří peníze

  9. Illumina (Solexa) Illumina Genome Analyzer II Workflow

  10. Illumina (Solexa) výstup: získají se biliony sekvencí o délce 50-100 bp • možnost analýzy více vzorků najednou - 8 lanes: • 7 na vzorky (každá až s 12 multiplex. vzorky) • 1 na kontrolní Illumina vzorek nosič pro bridge amplification

  11. SOLid (Life Technologies - Applied Biosystems) Sequencing by Oligonucleotide Ligation and Detection • navázání adaptorů, emulzní PCR, beads navázány na glass slide • po navázání primeru probíhá sekvenace ligací: • fluor. značené dinukleotidové sondy → pokud sonda sedí, je přiligována • po detekci ze sondy odštěpena fluor. část, opakování předchozího kroku • produkt odstraněn denaturací • další cyklus s primerem o (n-1) kratším → nová sekvenace vlákna biliony readů 50 bp, díky opakované sekvenaci vysoká spolehlivost čtení!

  12. Ion Torrent (Life Technologies) princip Ion Torrent:navázání dNTP při prodlužování řetězce DNA vede k odštěpení H+ → detekována změna pH emulzní PCR podobně jako při 454 postupně pouštěny jednotlivé typy dNTP velmi rychlé 100 tis. až miliony < 200 bp readů nejlevnější run (< 10 tis. Kč) i přístroj homopolymerní sekvence (TT): jako u 454 – např. 2x vyšší pík

  13. Aplikace NGS Sekvenování genomů • metodu je třeba zvolit zejména podle velikosti zkoumaného genomu: na malé (prokaryotní, cp nebo mt) genomy dostačuje i 454 pyrosekvenování • hledání nových sekvenčních markerů – screening genomu, EST library Doorduin et al. 2011.The Complete Chloroplast Genome of 17 Individuals of Pest Species Jacobaea vulgaris: SNPs, Microsatellites and Barcoding Markers for Population and Phylogenetic Studies. DNA Res. 18: 93–105. • Illumina, chloroplastový genom 12 původních (Evr.) a 5 invaznich jedinců (S Amer.) • 5 nových cp úseků vhodných pro fylogenetiku Asteraceae • 34 SSR a 32 SNP lokusů

  14. Aplikace NGS Sekvenování genomů Ancient DNA http://mammoth.psu.edu/howToSeqMammoth.html ▲ Rowe et al. 2011. Museum genomics: low-cost and high-accuracy genetic data from historical specimens. Molecular Ecology Resources 11, 1082–1092. genom 50 let starých historických preparátů Rattus norvegicus, Illumina, porovnání – namapování na známé genomy

  15. Aplikace NGS Hledání mikrosatelitních lokusů asi jediným řešením je 454 pyrosekvenování, protože ostatní metody dávají příliš krátké ready nedostatečné pro design primerů screening celého genomu, nebo možné kombinovat s vytvořením SSR-enriched library, která se následně sekvenuje Lepais O, Bacles CFE 2011. Comparison of random and SSR-enriched shotgun pyrosequencing for microsatellite discovery and single multiplex PCR optimization in Acacia harpophylla F. Muell. Ex Benth. Mol. Ecol. Res. 11, 711–724. 454 pyrosekv., porovnávají frekvenci SSR získaných: sekvenaci genomu vs. obohacené knihovny = 0.5% vs. 2.2% celkového počtu sekvencí Lepais O, Bacles CFE 2011. De Novo Discovery and Multiplexed Amplification of Microsatellite Markers for Black Alder (Alnus glutinosa) and Related Species Using SSR-Enriched Shotgun Pyrosequencing. Journal of Heredity102: 627-632. Takayama et al. 2011. A simple and cost-effective approach for microsatellite isolation in non-model plant species using small-scale 454 pyrosequencing. Taxon 60: 1442-1449. z 10-20 tis. sekvencí → 63-284 SSR lokusů Gardner et al. 2011. Rise of the machines – recommendations for ecologists when using next generation sequencing for microsatellite development. Mol. Ecol. Res. 11, 1093–1101. na 40 funkčních SSR lokusů je u rostlin potřeba asi 25 tis. sekvencí; pro bezobratlé asi 2x tolik sekvencí

  16. Aplikace NGS Analýza společenstev Izolace celkové DNA vzorku ↓ PCR amplifikace úseku, který slouží jako marker (= umožňuje rozlišit taxony společenstva, primery specificky amplifikují pouze zkoumanou tax. skupinu; prokaryota – 16S, eukaryota – LSU, SSU nrDNA) ↓ Analýza směsi molekul PCR produktu ↓ 454 pyrosekvenování • metoda s nejdelšími ready, analýza amplikonů <600(-800?) bp • obrovské množství sekvencí na 1 vzorek (tisíce až desítky tisíc sekv.) → překonává všechny ostatní metody × nutné zvolit vhodně variabilní úsek (délková limitace!), počet analyzovaných vzorků je poněkud limitovaný (nutno řešit separaci vzorků – gasket, MIDs) • projekt BarFrost: NGS vzorků z permafrostu (rostliny, houby, bezobratlí, až 10 tis. let BP)

  17. SNP = Slovenské národné povstanie … a nebo taky Single Nucleotide Polymorphism

  18. SNP (single nucleotide polymorphism) • Nejde o označení metody • Obecně znamená přítomnost bodové mutace (substituce) v daném místě genomu • Kodominantní, až 4 alely (ACGT) • Nutno znát primery pro dané místo genomu • Počet SNP lokusů velmi vysoký (~ desítky tisíc) a skutečně v celém genomu • Téměr ideální marker, až půjde rychle a levně sledovat velké množství SNP lokusů najednou

  19. SNP (single nucleotide polymorphism) • Zatím hlavně u modelových / užitkových organismů a jejich nejbližších příbuzných • vyhledávání v databázích EST, celých genomů,… • Aplikace na divoké organismy zatím hlavně v zoologii, v botanice zatím prakticky ne • … ale za pár let ??? • zoologický příklad:Tokarska et al. 2009, Heredity 103: 326-332 • genetická variabilita současné populace zubra a srovnání s (mnohem větší) populací amerického bizona, cca 54 tis. SNP lokusech pro krávy (BovineSNP50 BeadChip, Illumina) • úspěšná amplifikace cca 52 tis. SNP lokusů • z nich u zubra ~900 polymorfních (→ kodominantní data!)

  20. Průtoková cytometrie • Flow cytometry, FCM • spíše cytologická než molekulární metoda • ale děláme ji u nás v laboratoři… • umožňuje určit ploidii / počet chromosomů, což je obvykle nezbytné pro interpretaci výsledků molekulárních metod! • vypovídá o genomu v nejhrubším měřítku • velikost • počet kopií chromosomů • lze odhadovat i zastoupení bazí (AT vs. GC) na úrovni celého genomu

  21. Průtoková cytometrie • cytometrie= metoda umožňující sledovat vlastnosti optické částic (buňky, buněčná jádra) • intenzita fluorescence • rozptyl světla • průtoková= sledované částice v suspenzi, při průtoku měřící kyvetou • velmi často používaná v medicíně (běžná diagnostická metoda) • použití v botanice / zoologii jen výsekem možných aplikací

  22. Vzorky • suspenze sledovaných částic • krev, hemolymfa,… • voda (plantkton,…) • a u kytek co? jak to dostat z buněčné stany ? • chemické narušení → protoplasty • izolace jader • izolace buněčných jader u rostlin (cca 5 min.) • nasekání tkáně žiletkou v izolačním pufru • stabilizace jader (vhodné pH, osmolarita, antioxidanty,…) • detergent (snižuje slepování jader) • přefiltrování (tkanina 42 μm) • přidání fluorescenční barvy (pokud není součástí izolačního pufru)

  23. Vzorky • Obvykle analyzované tkáně • čerstvé listy, stonky, květy,… apod. • semena • vysušené tkáně (silikagel) • nepredikovatelné posuny fluorescence, lze použít jen orientačně – určení ploidie • fixovaná jádra (glycerol apod.) ?

  24. Průtokový cytometr

  25. Průtokový cytometr vzorek kyveta zdroj světla • laser • UV lampa / UV dioda fluidika • pumpa • sheath fluid optika + počítač odpad

  26. Fluorescence • barviva vázající se na DNA • propidium jodid (PI) – interkalační, nespecifické • DAPI – vazba na AT páry • příp. jiná barviva specifická pro GC páry (např. mitramycin) • výsledek vždy porovnáván s vnitřním standardem • rostlina o známém obsahu DNA, zpracovávaná společně se vzorkem • zobrazujeme jako histogram • poměr průměrů / mediánů píků • koeficient variance („šířka“ píků) • počet buněk

  27. Centaurea 157.92 Glycine 189.46 poměr 0.833 Glycine 2.50 pg Centaurea = 2.50 * 0.833 = 2.08 pg Velikost genomu • poměr mezi fluorescencí vzorku a standardu • absolutní • barvivo PI • vyjadřuje se v pg nebo Mbp, 1 pg = 978 Mbp • obvykle průměr ze 3 měření jedince • relativní • barvivo DAPI • standard = 1 • vhodná např. pro určení ploidie • přesnější a méně jedovaté než PI • porovnáním obou lze spočítat obsah bazí AT / GC Centaurea weldeniana+* Glycine max ‘Polanka’

  28. Velikost genomu • (holoploidní) velikost genomu • C-hodnota • 1C = velikost genomu gamet / gametofytu • 2C = velikost genomu v somatických buňkách (sporofytu) • měřením zjišťujeme obvykle 2C hodnotu (u cévn. rostlin) • monoploidní velikost genomu • Cx-hodnota • velikost genomu jedné průměrné chromosomové sádky diploid: Cx = 2C / 2 triploid: Cx = 2C / 3 tetraploid Cx = 2C / 4 … atd.

  29. Rozptyl světla • Forward scatter, FSC • původní vlnová délka, v přímém směru • vypovídá o velikosti částic • v botanických aplikacích se nepoužívá • Side scatter, SSC • původní vlnová délka, v kolmém směru • vypovídá o velikosti a vnitřnístruktuře částic • používáme k odlišení degradovaných jader a „vyčištění“ histogramu fluorescence

  30. Výhody / nevýhody Výhody • nedestruktivnost • obvykle nejsou potřeba speciální tkáně (× karyologie) • rychlost, statisticky robustní data na populační úrovni • cca 100 vz. za den, někdy lze analyzovat více jedinců / vz. • přesnost, detekce drobných rozdílů a vzácných cytotypů • cena Nevýhody • většinou potřeba čerstvého materiálu • problémy se sekundárními metabolity, slizy,… + analýza pylu • omezená citlivost při vyšších chromosomových počtech (detekce aneuplodie, B-chromosomy apod.) • stanovení chromosového počtu jen nepřímé

  31. Aplikace v botanice Analýza ploidního stupně • ploidii odhadujeme nepřímo z velikosti genomu,nutná kalibrace klasickým počítáním! • taxonomický znak • Centaurea phrygia – diploid, C. erdneri – tetraploid; morfologicky ale velmi podobné • biologie polyploidů • rozšíření cytotypů, geografické, ekologické,… rozdíly • detekce meziploidní hybridů a vzácných cytotypů (např. nových polyploidů) • detailní studie smíšených populací (prostorové rozmístění, vazba na mikrostanoviště, hybridizace, kompetice, změny zastoupení cytotypů v čase,…)

  32. Aplikace v botanice Velikost genomu • taxonomický znak (2C) • odlišení taxonů se stejným počtem chromosomů, detekova-telné i drobné rozdíly, od 3 – 4 %) – např. Melampyrum • „vystopování“ původu polyploidů (různé „součty“ možných předků) • skupiny příbuzných druhů (např. několik „základních“ Cx-hodnot, které jsou stabilní mezi ploidiemi – Batrachium) • obecnější biologické závislosti • redukce Cx hodnoty se stupněm ploidie • vztahy velikosti genomu k délce životního cyklu, prostředí (nadm. výška, ostrovy, zeměpisná šířka), vlastnostem druhu (invazivnost,…) ale pozor na design těchto studií, obvykle problematický

  33. Aplikace v botanice Reprodukční systém, hybridizace • u krytosemenných dvojité oplození • embryo 2C (1C ♀ + 1C ♂) • endosperm 3C (2 * 1C ♀ + 1C ♂) • jiné poměry v případě odchylek(apomixie, neredukované gamety) • viz grafy – Sorbus (data M. Lepšího) • hybridizace diploida a tetraploida,vzniklo 3x semeno na diploidovi:(a) hybrid nebo (b) autopolyploid ? a) 2 * 1C(♀) + 2C(♂) = 4C b) 2 * 2C(♀) + 1C(♂) = 5C embryo 2C (2x) endosperm 3C (3x) normální sexualita Bellis perennis embryo 2C (4x) Bellis perennis endosperm 6C (12x) pseudogamie, neredu-kované embryo i pyl

  34. Další aplikace • studium planktonu • detekce hlavních skupin (bakterie, sinice, zelené řasy) • kombinace několika parametrů – velikost genomu, autofluorescence chlorofylů, specifické barvy pro bakterie,… • lze i kvantitativně – stanovení počtu buněk / koncentrace • analýzy chromosomů, genomika • medicínské aplikace • analýza buněčného cyklu (nádorová bujení apod.) • přítomnost antigenů pro danou protilátku,… • třídění buněk (sorting)

More Related