270 likes | 435 Vues
Indeling. Inleiding kansrekening. Kansrekening bij detectie van kosmische stralen. normaalverdeling. Je hebt gemerkt dat gemeten waarden nogal eens fluctueren Geiger-Müller tellers tikken onregelmatig als je ze bij een bron houdt De aantallen die je meet bij een enkele HISPARC-detector.
E N D
Indeling • Inleiding kansrekening • Kansrekening bij detectie • van kosmische stralen normaalverdeling
Je hebt gemerkt dat gemeten waarden nogal eens fluctueren • Geiger-Müller tellers tikken onregelmatig als je ze bij een bron houdt • De aantallen die je meet bij een enkele HISPARC-detector
Kosmische straling vormt een constante achtergrond die de aarde gelijkmatig treft vanuit alle richtingen Gemeten waarden zijn NIET echt CONSTANT Lange termijn gemiddelden geven de werkelijkheid redelijk goed weer
Uit metingen BLIJKT dat de gemeten waarde afhangt van: • Tijdstip van de dag • Hemelrichting • Weersomstandigheden Waarom? Al deze invloeden kun je meten. Je kunt er zelfs correcties voor bepalen. Maar: je meting zal meestal niet het echte gemiddelde opleveren! Gelukkig kom je met goede metingen dichtbij het echte gemiddelde.
Inleiding Je zet een experiment op om een bepaald verschijnsel te onderzoeken …en je laat het experiment een bepaalde tijd lopen.… Maar je meet niets: Je telt NUL tikken. Wat betekent dat? Stel dat je in een meting van een uur één treffer (=gebeurtenis) waarneemt Kun je dan concluderen dat dit verschijnsel een tempo heeft van een 1/uur?
Eerst even afspreken: • Random gebeurtenissen: • zijn onafhankelijk van elkaar • worden niet beïnvloed door voorgaande gebeurtenissen • zijn niet te voorspellen 0 sectijd Als het aantal treffers op 1 uitkomt kan dit het resultaat zijn van het toevallig vastleggen van een zeldzaam optredend verschijnsel dat beter weer-gegeven kan worden door een veel lager tempo (~0?). Of de looptijd van de meting kan de gebeurtenis net gemist hebben(net te laat gestart of te vroeg beëindigd).
Een meting van 1 zou in werkelijkheid een gemiddelde kunnen zijn van 0 of misschien zelfs 2? 1 ± 1 Een meting van 2 2 ± 1? ± 2? Een meting van 37 37 ± minstens een paar? Een meting van 1000 1000 ± ?
2-voudige coïncidenties Gemeten per minuut Gedurende 2 uur Dit histogram laat, minuut na minuut, 2-voudige coincidencies zien tussen 2 gestapelde CROP detectoren
2-voudige coïncidenties Gemeten per minuut Gedurende 2 uur 657 562 500 Merk op dat de 0 “onderdrukt” is! (de vertikale as begint bij 500, niet bij 0) In werkelijkheid zijn dit lichte fluctuaties rondom een gemiddelde van ruim 600. Laagste waarde562 Hoogste waarde657 De meeste metingen liggen dichtbij het gemiddelde van 609.5 tikken/minuut
2-voudige coïncidenties Gemeten per minuut Gedurende 2 uur Geen plotselinge pieken van 800; geen terugval tot 400. Zijn dit goede data? Hoe kunnen we vaststellen of dit goede metingen zijn of dat de verschillen te groot zijn?
Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel de standaarddeviatie ) De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere meting verwijderd is van het gemiddelde . Als alle metingen identiek waren, dan was het gemiddelde duidelijk en zou de standaarddeviatie simpelweg 0 zijn. ?
Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel de standaarddeviatie ) De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere meting verwijderd is van het gemiddelde . Als alle metingen identiek waren, dan was het gemiddelde duidelijk en zou de standaarddeviatie simpelweg 0 zijn. 0
Mijn hartslag bij het ontbijt gedurende 100 dagen 61 64 67 70 70 71 75 72 72 69 68 70 65 67 62 59 62 66 66 68 68 73 71 72 73 71 71 68 69 68 69 65 63 70 70 76 71 72 74 60 56 74 75 79 72 72 69 68 68 68 62 66 66 66 61 77 75 74 63 72 63 62 65 65 66 65 67 67 65 67 68 62 67 60 68 65 70 70 69 70 68 73 64 71 71 68 70 69 73 72 70 69 67 64 67 58 66 69 76 73 Frequentietabel van de verdeling van de hartslag 56 1 57 0 58 1 59 1 60 2 61 2 62 5 63 3 64 3 65 7 66 7 67 8 68 12 69 8 70 10 71 7 72 8 73 5 74 3 75 3 76 2 77 1 78 0 79 1 Hartslag gedurende 100 dagen
Hartslag gedurende 100 dagen Spreiding = xmax-xmin = 23 gemiddelde= =67.20 Modus = 68 (=meest voorkomend) Mediaan = 68.52 (=middelste waarneming)
Het gemiddelde alleen laat ons niet zien hoe dicht op elkaar gepakt de data zijn. De spreiding kan misleidend zijn als de metingen buitensporige gegevens bevatten:
σ beschrijft de spreiding in de metingen op een andere manier: door een berekening van hoe groot de gemiddelde afstand van een meetpunt is tot het gemiddelde N • (xi – m)2 N s = i=1 gemiddelde, m
Hartslag gedurende 100 dagen Spreiding = xmax-xmin = 23 gemiddelde = =67.20 standaardafwijking s = 4.357= • (xi – m)2 N
2-voudige coïncidenties Gemeten per minuut Gedurende 2 uur De nieuwe lijnen geven de afstand aan van een en twee keer de standaarddeviatie onder en boven het gemiddelde Voor deze gegevens gaf Excel een SD van 20. Dus staan de lijnen op: 609.5 ± 20.0 = 589.5 and 609.5 ± 40.0 = 569.5629.5 649.5
2-voudige coïncidenties Gemeten per minuut Gedurende 2 uur De meeste meetwaarden blijken binnen ±1 SDvan het gemiddelde te liggen. Een paar meetwaarden vallen binnen 1 à 2 SD. Een gering aantal (hier 5) ligt op meer dan 2 SD van het gemiddelde. Hier zijn er geen meetpunten op meer dan 3 SD. de SD beschrijft hoe dicht op elkaar gepakt de meetwaarden rond het gemiddelde zijn, en geeft een grens aan over hoe ver ze mogen spreiden.
Tempo (aantallen per minuut) Frequentieverdeling van 2-voudige coïncidenties frequentie, opgenomen in intervallen van een minuut gedurende een periode van 1 week (zelfde opstelling) • Metingen gegroepeerd rondom het gemiddelde(615). • Nul onderdrukt; weinig data onder 550 (of boven 680). *Verticale lijnen op ±1, 2, 3 SD van het gemiddelde. *Je ziet dat de meeste metingen binnen ±1 SD van het gemiddelde liggen. *Heel af en toe worden er metingen gevonden met >3 SD van het gemiddelde.
Karakteristiek voor deze vorm: het stuk tussen µ- en µ+ bevat 68% Van het totale oppervlak onder de curve. Met andere woorden: 68% van de metingen valt binnen ±1 SD van het gemiddelde. 95%van de metingen binnen ±2 SD 99.7% van de metingen binnen±3 SD
Je ziet dus dat een goede meting wel erg dicht bij de echte waarde kan zitten maar nooit helemaal perfect zal zijn. (Zelfs als dat zo is weten we dat niet met zekerheid.) Daarom geven we in de kansrekening een verschil aan tussen de echte waarden en de gemeten waarden. We hebben nu een aardig idee over hoe metingen verspreid kunnen liggen rondom een gemiddelde. Omgekeerd kunnen we ook zeggen: Als we een meting doen dan zal deze in 68% van de gevallen op minder dan een SD van het gemiddelde af liggen. Maar we weten nog steeds niet nauwkeurig hoe groot dit gemiddelde werkelijk is!
Voorbeeld: het aantal jongeren in Nijmegen van 12 tot 18 jaar is 14.987. *Gemiddelde lengte = 1.680 m (=µ) *Gem. afwijking: 5,3 cm (= ) Steekproef: alle leerlingen van onze school: (1412) Gemiddelde 1.685 m (=x) Gem. afw: 6,1 cm (=SD) Je snapt dat hoe groter de steekproef is hoe beter je bij het echte gemiddelde uitkomt.
Deze voorgaande beschrijving gaat op voor alle onafhankelijke gebeurtenissen. Dit zijn zowel allerlei soorten metingen als spellen met een dobbelsteen. Bij een grafische voorstelling van de uitkomsten ontstaat dan de bekende Gausskromme. Soms is het gemiddelde (m) niet eens bekend, zoals bij onze opstelling voor het meten van kosmische straling. Toch kun je dan met een beperkt aantal metingen een redelijke schatting maken van wat het gemiddelde moet zijn en hoe groot de spreiding daarin is. Het zal je nu wel duidelijk zijn dat één meting geen bruikbaar gemiddelde oplevert. Terug naarIndeling