1 / 89

Cursus Probabilistisch Ontwerpen en Statistiek - Betonvereniging 27 September 2005

Cursus Probabilistisch Ontwerpen en Statistiek - Betonvereniging 27 September 2005. Pieter van Gelder TU Delft (Fac. Civiele Techniek). ROC ASA Techniek Scutos Columbuslaan 540 Utrecht. Opbouw cursus. Les 1 Kansrekening Les 2 Statistiek

dusty
Télécharger la présentation

Cursus Probabilistisch Ontwerpen en Statistiek - Betonvereniging 27 September 2005

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cursus Probabilistisch Ontwerpen en Statistiek - Betonvereniging27 September 2005 Pieter van Gelder TU Delft (Fac. Civiele Techniek) ROC ASA Techniek ScutosColumbuslaan 540 Utrecht

  2. Opbouw cursus • Les 1 Kansrekening • Les 2 Statistiek • Les 3 Kansrekening, inleiding betrouwbaarheidsanalyse • Les 4 Betrouwbaarheidsanalyse • Les 5 Voorschriftentheorie • Les 6 Beslistheorie, design-by-testing, tijdafhankelijkheid • Les 7 Systemen, case studie

  3. Opzet lesblok 2 • Wat is statistiek ? • Stochastische variabelen • Schattingsmethoden voor de verdelingsparameters • Waarschijnlijkheidspapier • Bestfit berekeningen

  4. Terugblik op lesblok 1 • Wat is probabilistisch ontwerpen? • Kans en gebeurtenis • Systeem faalkansen

  5. Verschil tussen kansrekening en statistiek • Het woord statistiek is afkomstig van de moderne Latijnse zin statisticum collegium (les over staatszaken), waar het Italiaanse woord statista van af is geleid, wat "staatsman" of "politicus" (vergelijk ons woord status) en het Duitse Statistik, wat oorspronkelijk de analyse van staatsgegevens betekende.

  6. Statistiek is een tak van wetenschap, onderdeel van de wiskunde. Statistici verzamelen gegevens over een bepaald onderwerp en interpreteren de vergaarde gegevens. Waarschijnlijkheidsrekening of kansrekening is een tak van de wiskunde die gericht is op kansen van gebeurtenissen en verwachtingswaarden.

  7. Statistiek voor de betonconstructeur

  8. Statistiek voor de betontechnoloog • Beschrijving verhardingsproces middels niet-lineaire regressie (druksterkte als functie van de verhardingstijd (in jaren)) • Variabiliteit in kubusdruksterkte van proefstukken (afhankelijk van water-cement factor, van luchtgehalte, volumieke massa, chloride gehalte, etc) • Probabilistische formulering van goed- en afkeuringseisen van beton (mu-k.sigma > vereiste karakteristieke druksterkte)

  9. 0.5 0.4 (x) 0.3 R f 0.2 s 0.1 0 -4 -2 0 2 4 6 x m Normale verdeling kansdichtheid 2 - m 1 x æ ö 1 - ç ÷ ( ) s = 2 è ø f x e R s p 2 m gemiddelde, indicatie voor ligging s standaarddeviatie, indicatie voor spreiding

  10. Standaard normale verdeling • Normaal verdeelde variabele X: • Standaard normaal verdeelde variabele u: • Kansdichtheid: Kansverdeling: ofwel tabel

  11. Normale verdeling • Waarom zo populair? • Centrale limietstelling: • Som van veel variabelen (met willekeurige verdelingen) is (bijna) normaal verdeeld. • Y = X1 + X2 + X3 + X4 + ….

  12. Centrale limietstelling

  13. Normale verdeling Normale verdelingen 1 0.8 (x) 0.6 sR R f 0.4 sR 0.2 0 -4 -2 0 2 4 6 x mR

  14. Voor onafhankelijke stochasten X en Y geldt dat: • VAR(X+Y) = VAR(X) + VAR(Y) • voor de standaardafwijking van de som van 2 stochasten geldt dus de stelling van Pythagoras.

  15. Andere verdelingstypen • Verdelingstype = ‘vorm van de verdeling’ • Uniforme verdeling • Lognormale verdeling • GumbelverdelingWeibullverdeling • Gammaverdeling • ….

  16. Uniforme verdeling fR(x) oppervlak = totale kans = 1 1/(b-a) a b x Gemiddelde m = (a+b)/2 Standaarddeviatie s = (b-a)/12

  17. Snelle kenmerken • Gemiddelde • (zwaartepunt) • Variantie • Standaarddeviatie • Variatiecoefficient

  18. Lognormale verdeling 0.7 0.6 0.5 fX(x) 0.4 0.3 0.2 sX 0.1 0 0 1 2 3 4 5 mX x

  19. fx x Lognormale verdeling X : lognormale verdeling fY Y = ln(X) : normale verdeling y

  20. Lognormale verdeling y fX(x) : lognormaal fY(y) : normaal y = ln x ofwel x = exp(y) x Als X lognormaal is verdeeld, dan is Y = ln(X) normaal verdeeld

  21. Lognormale verdeling • X lognormaal verdeeld  Y = ln(X) normaal verdeeld • Kansdichtheidsfunctie voor X: • waarin mY en sYparameters van de lognormale verdeling: • mY gemiddelde waarde van Y (dus niet van X !!) • sYstandaarddeviatie van Y (dus niet van X !!)

  22. Lognormale verdeling • X lognormaal verdeeld  Y = ln(X) normaal verdeeld

  23. Lognormale verdeling • Afgeleide van centrale limietstelling: • Product van veel variabelen met willekeurige verdelingen is (bijna) lognormaal verdeeld • dus log y (bijna) normaal verdeeld. • Definitie: log y normaal y lognormaal

  24. Asymptotische verdelingen • Normal • Lognormal • Weibull • Gumbel

  25. Voorbeeld: gumbelverdeling jaarmaxima Schiphol 1950-2002 -3 x 10 8 7 6 /N) 2 Gumbelverdeling 5 4 kansdichtheid (m 3 2 1 0 0 50 100 150 200 250 300 350 400 450 500 550 600 2 2 winddruk (0.5 * rho * U ) in N/m p o t

  26. Oefening • Een variabele R is normaal verdeeld met: • Gemiddelde m = 50 • Standaarddeviatie s = 10 • Bepaal: • a. P(X < 40) • b. P(X > 60) • c. P(40 < x < 60)

  27. Tabel van de cumulatieve standaard normale verdeling

  28. Presenteren van grote datasets • In een histogram • Op waarschijnlijkheidspapier

  29. Bij een histogram worden de waarnemingen geklassificeerd • Ordenen van n gegevens • Aantal klassen: • Klassen zijn bij voorkeur even breed

  30. Histogram • Horizontale as verdelen in intervallen • Kolom plaatsen boven elk interval • Oppervlak van kolom geeft frequentie aan! • Kolomhoogte: frequentie / kolombreedte

  31. Histogram • Boekenprijzen (Euro’s): • 25 45 35 25 30 70 20 45 65 30 40 4035 45 55 35 32 3728 45 49 39 40 6029 34 47 35 45 4935 45 34 28 34 5448 38 32 39 45 58

  32. Histogram • Aantal klassen: sqrt 42 = 7 • hoogste - laagste = 70 - 20 = 50 • klasse breedte ca. 50 / 7 ca. 7

  33. Histogram 4 • klasse frequentie freq/kb (eenh=5)17,5 - 27,5 3 3/227,5 - 32,5 7 7/132,5 - 37,5 9 9/137,5 - 42,5 6 6/142,5 - 47,5 8 8/147,5 - 57,5 5 5/257,5 - 77,5 4 4/2

  34. Kansdichtheidsfunctie • Frequentie uit histogram wordt genormeerd naar kans • De verdeling van een discrete stochastische variabele kun je vastleggen in een zogenoemde kansfunctie van die variabele. • Als stochastische variabele X is, met de mogelijke uitkomsten x, dan wordt de kansdichtheidsfunctie aangeduid met f(X=x), vaak ook: P(X=x). (P van probability)

  35. Normaal waarschijnlijkheidspapier • De verticale as is verdeeld van 0% tot 100% op een zodanige wijze, dat de kansdichtheidsfunctie van een normale verdeling een rechte lijn is. • Zet de data gesorteerd (van klein naar groot) uit tegen i/N+1 waarbij i het volgnummer van de waarneming en N het totaal aantal waarnemingen

  36. Momenten van Random Variables

  37. Methode der Momenten voor het schatten van verdelingsparameters • D.m.v. gelijkstelling van de verdelings-momenten aan de steekproefmomenten • Voorbeeld uniforme verdeling (uitwerking op bord)

  38. Verdelingsfuncties hebben vrije parameters die zodanig gekozen moeten worden, dat ze zo goed mogelijk de data beschrijven (een lijn die z.g.m. het histogram van de data benadert) • De methode der momenten levert schatters op voor de onbekende parameters in een verdelingsfunctie

  39. = 8621 S = 8194 n = 31 Bepalen van de kansdichtheidsfunctie op waarnemingen Drukstekte van 31 beton elementen druksterkte

  40. Kansdichtheidsfunctie 1

  41. Kansdichtheidsfunctie 2

  42. Bestfit • Het programma bestfit bepaalt bij een gegeven dataset (die bijv. ingevoerd kan worden met copy and paste vanuit Excel) van een 20-tal verdelingsfuncties de optimale parameters (d.m.v. een zogenaamde maximum likelihood methode)

  43. Demo Bestfit • Goodness of fit criteria • Chi Square (in PDF domain) • Kolmogorov (in CDF domain)

  44. Bijvoorbeeld P(c2³ 1.3, n = 3) ≈ 73% (af te lezen uit bijgesloten grafiek). De kans dat c2³ 1.3 met 3 vrijheidsgraden door toeval is 0.73. Dus de data wordt goed beschreven door het model.

  45. Kolmogorov-Smirnov Test • Het berekent de grootste afstand tussen de doel CDF FX(x) en de geobserveerde CDF, F*(X). • De test grootheid D2 is: waarbij X(i) is de i-de grootst geobserveerde waarde is in de steekproef ter lengte n.

  46. Resume • Bestfit is een pakket waarmee de beste verdelingsfunctie bepaald kan worden bij een gegeven dataset (van bijv. druksterkten) • De optie ‘stats’ in Bestfit laat de ordening zien op basis van een Chi-kwadraat en een KS-criterium • Onderschrijdings-, overschrijdings-, en intervalkansen van een stochast kunnen berekend worden met de uitvoer van Bestfit • Voorbeelden zijn behandeld van de exponentiele, Normale en Pareto verdeling. Bij de normale verdeling dient een tabel gebruikt te worden, omdat de cumulatieve verdeling niet analytisch beschikbaar is. • Bij het sommeren van stochasten neemt de standaardafwijking niet-linear toe volgens een wortel functie. Het gevolg hiervan is dat de variatiecoefficient van het gemiddelde fors lager is dan de variatiecoefficient van een enkele stochast. De simulatie met het sinaasappelvoorbeeld liet dit duidelijk zien.

  47. Voer een statistische analyse uit van de volgende datasets (breuktaaiheid) • 3 • 5 • 8 • 11 • 14 • 18 • 22 • 26 • 30 • 35 • 40 • 46 • 52 • 60 • 69 • 80 • 95 • 115 • 150

  48. Statistiek van discrete stochasten

  49. Bernoulli-verdeling • Slechts twee uitkomsten mogelijk! De stochastische variabele X kan dus twee waarden aannemen (1=success of 0=failure). • Dus ook slechts twee kansen. • P(X=1) en P(X=0) • Soms zijn ze gelijk, i.h.a. niet.

More Related