1 / 37

OLASILIK VE İSTATİSTİK I

İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü. OLASILIK VE İSTATİSTİK I. 1. Hafta:. Öğr. Gör. Berk Ayvaz. İstatistik Nedir ?. İstatistik kelimesi günlük hayatımızın her aşamasında sıkça duyduğumuz bir kavram haline gelmiştir.

taima
Télécharger la présentation

OLASILIK VE İSTATİSTİK I

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü OLASILIK VE İSTATİSTİK I 1. Hafta: Öğr. Gör. Berk Ayvaz

  2. İstatistik Nedir ? • İstatistik kelimesi günlük hayatımızın her aşamasında sıkça duyduğumuz bir kavram haline gelmiştir. • Bu kavrama farklı manalar yüklenmesi de kaçınılmaz olmuştur. • Örnek olarak borsa istatistikleri, hava durumuna ilişkin istatistikler, medya kanallarına ilişkin takip edilme istatistikleri, finansal göstergelere ilişkin istatistikler vs. • Bu durumda, istatistik kavramına sayı anlamı verilmektedir. • Fakat burada sayı anlamına gelen istatistikler sıradan sayılar değil bilimsel yöntemlerle tespit edilen sayıları ifade etmektedir. • İstatistik; ‘Araştırmanın amacına yönelik olarak var olan bir problemin belirlenmesi, istatistik birimlerinin tanımlanması ve bunlara ilişkin değişkenlerin belirlenmesi, değişkenlere ilişkin verilerin toplanması, bu verilerin seriler ve tablolar yardımıyla gösterilmesi, serilerin çözümlenmesi ve yorumlanması sürecini içeren bir yöntemler bilimidir.’ • İstatistik, veri toplama, özetleme ve yorumlama, sonuçları ortaya koyup çizelgelere yansıtma vs. süreçleri için bir prensip ve metodoloji sağlayan bir kavramdır (Johnson and Bhattacharyya, 2010).

  3. İstatistik Bilimi İstatistik Bilimi • İnsanoğlu hayatının her anında bir karar verme süreci ile karşı karşıyadır. • Bu kararları verirken sahip olduğumuz bilgileri kullanır ve bu bilgileri düşünme ya da fikir sürecinden geçirerek bir sonuç elde etmeye çalışırız. • SORU: “Karar aşamasında sahip olduğumuz bilgiler acaba yeterli mi?…..Bu bilgileri nasıl elde ediniriz?” v.b. • sorulara vereceğimiz cevaplar bizi istatistiğe yönlendirecektir. • İhtimallerin ve belirsizliklerin bu kadar çok olduğu bir hayatta elbettekialınacak kararların, içinde bulunulan şartların en iyi biçimde analiz edilip değerlendirilmesi ile alınması gerekmektedir. • Bu değerlendirme sürecinde en güçlü yardımcı araçlardan birisi istatistiktir.

  4. İstatistik Bilimi • İstatistik bilimi; verilerin toplanması, düzenlenmesi, özetlenmesi, takdimi, analizi ve bu analizler vasıtasıyla elde edilen sonuçların yorumlanması ve bir karara bağlanması ile ilgilenir. • Frekans dağılımları • Yer ölçüleri: aritmetik ort., geometrik ort., harmonik ort., kareli ort., mod, medyen vs. • Dağılma ölçüleri: ortalama sapma, standart sapma, varyans, değişim aralığı • Çarpıklık ve Basıklık • Örnekleme teorisi • Hipotez testleri • Regresyon analizi • Korelasyon analizi

  5. Kavramlar : Anakütle ve Örneklem Araştırma sorusu: Su kaç derecede kaynar? • Anakütleve Örneklem: Bir istatistiki araştırmada araştırmaya konu olan bütün birimlere anakütle denir. • Örneğin;2013-2014 öğretim yılında İTİCÜ öğrencilerinin kitap okuma alışkanlığı üzerine yapılacak bir araştırmada, İTİCÜ öğrencilerinin her biri istatistik birimi iken bu öğrencilerin tümünün oluştur­duğu topluluğa anakütle denir. • Nüfus sayımı için anakütleTürkiye’dir. • Anakütlebazen tek tek sayılamayacak kadar çok büyük olabilir. • Bundan dolayı büyük anakütleler için araştırmalar; zaman, maliyet, personel, ulaşım, vb. nedenlerden dolayı tüm birimler yerine daha az sayıdaki örneklemler seçilerek yürütülür. • Bu örneklemlerden elde edilen sonuçlar tüm anakütleye teşmil edilir. • Örneklem anakütlenin alt kümesidir. • Bir üniversitede yapılacak olan bir araştırmada tüm öğrenciler anakütle iken anakütle içinden seçilecek olan 100 kişilik bir grup ise örneklem olarak adlandırılır.

  6. Parametre ve İstatistik parametre ANAKÜTLE istatistik • Anakütledeki bütün birimler üzerinden hesaplanan ölçülere parametre denir. • Anakütleyi temsil eden bir örneklemdeki verilerden hesaplanan ölçülere ise istatistik denir. • İstatistik hesaplamaları tasviri (tanımlayıcı) istatistiğin konusudur. • Eldeki istatistik değerlerini kullanarak anakütle parametreleri hakkında bir kısım yargılara varmak tahlili (Açıklayıcı) istatistik veya istatistik analizin konusunu teşkil eder. • Ana kütle ya da örneklemde yer alan her birime gözlem ya da denek denir. Gözlem (ya da denek) sayısı aşağıdaki biçimde simgeleştirilmektedir. Ana Kütledeki Gözlem Sayısı : N Örneklemdeki Gözlem Sayısı: n Örnek: Parametre ( AnakütleOrtalaması, AnakütleVaryansı) İstatistik (Örneklem Ortalaması, Örneklem Varyansı) The major objectives of statistics are: 1. To make inferences about a population from an analysis of informationcontained in sample data. This includes assessments of the extentof uncertainty involved in these inferences. 2. To design the process and the extent of sampling so that the observationsform a basis for drawing valid inferences.

  7. Veri Türleri • İstatistik birimlerin sahip oldukları ve farklı değerler alabilen, diğer istatistik birim­lerinden ayırt edilmesini sağlayan özelliklere değişken denir. Değişkenin aldığı de­ğerlere de gözlem veya ölçüm değerleri denir. • Sayısal (kantitatif) veya sayısal olmayan (kalitatif) bir özellikte belirgin bir şekilde görülen farklılıklar değişken ile gösterilebilir. • Örneğin; İhracat-İthalat Değerleri , Cari Fiyat, kalite kontrol oranları vs… • Sayısal değişkenler de kesikli ve sürekli olmak üzere iki kısma ayrılırlar. • Sürekli değişkenler belirli bir aralıkta sonsuz sayıda değer alabilen değişkendir. • Kesikli değişkenler sadece belirli tamsayı değerleri alabilen değişkenlerdir. • Ölçülen ve tartılan değişkenler sürekli, sayılabilen değişkenler ise kesikli değişkendir. • Örnek: Bir sınıftaki öğrencilerin ağırlıkları (sürekli değişken), bir sınıftaki kız ve erkek öğrenci sayısı (kesikli değişken) Değişken Türleri Sayısal Kantitatif Nicel Sayısal Olmayan Kalitatif Nitel

  8. Ölçek Türleri • İstatistiki araştırmaya konu olan veriler aşağıdaki 4 ölçekten biri ile ölçülmektedir: • Sınıflama (Nominal) Ölçeği • Sıralama Ölçeği • AralıkÖlçeği • Oran Ölçeği • SınıflamaÖlçeği: Bir cisim veya olayı belirli bir isme göre diğer bir cisim veya olaydan ayırmaya yarar. • Sınıflama ölçeğinde değişkenlerin aldığı değerler sayısal bir büyüklük ifade etmezler. • Bu sayı ve simgeler arasında bir büyüklük veya küçüklük söz konusu olmadığından matematiksel işlemler yapılamaz. • Bu değerler değişkenlere ait bazı özellikleri tanımlarlar. • Örneğin Cinsiyet değişkeni için “1” değeri “Kadın”ları, “2” değeri “Erkek”leri temsil edebilir. • Bu çerçevede Medeni Durum, Meslek, Doğum Yeri gibi değişkenlere ait ölçümler için sınıflama ölçeğinin kullanımı uygun olacaktır.

  9. 2- Sıralama Ölçeği • Sınıflama ölçeğinde değişkenlerin aldığı değerler önem derecesi ya da üstünlükleri baz alınarak sıralanır. Kullanım yerleri şu şekildedir. • Bir yarışa katılan koşucular, yarışı bitirme zamanlarına göre, birinciden sonuncuya kadar sıralanırken; • Belirli bir mamül hakkında tüketicilerin beğenileri « hiç beğenmedim, biraz beğendim, çok beğendim» gibi sıralanabilir. • Katılım Düzeyi (Kesinlikle Katılıyorum, Katılıyorum, Karasızım, Katılmıyorum, Kesinlikle Katılmıyorum), • Sıklık Düzeyi (Hiç, Nadiren, Genellikle, Her Zaman) • Öğrenim Durumu (İlköğretim, Lise, Lisans, Yüksek Lisans), • Yönetim Kademesi (Alt, Orta, Üst) vb. değişkenler için Sıralama (Ordinal) Ölçeğinin kullanımı uygun olacaktır. • Servis kalitemizden memnun musunuz? • Hiç memnun değilim • Biraz memnunum • Oldukça memnunum • Çok memnunum • Fazlasıyla memnunum

  10. 3- Aralık Ölçeği • Bu ölçme düzeyinde değişkenin aldığı sayısal değerler birimle ifade edilir ve sayı­lar arasındaki farklar anlamlıdır. • Üzerinde durulan değişken belirli iki değer arasında sonsuz değer alabilir. • Ancak bu ölçme düzeyi için kesin bir sıfır başlan­gıç noktası yoktur. Bu ölçekteki 0 değeri, ölçülen karakteristiğin olmadığını göstermez. • Örneğin, sıcaklık değişkeni için birim, santigrat derece (°C) olduğundaki sıfır başlangıç noktası (0°C) ile fahrenheit (°F) olduğundaki sıfır başlangıç noktası (0°F) farklı sıcaklık ölçümlerini verirler. Çünkü 0°C’ye karşı gelen değer 32°F dır. • Aynı şekilde ölçüm karakteristiklerinden birinin değeri diğer değişken değerinin katlarıyla ifade edilemez. • Buna verilecek en açık örnek ısı ölçümleridir. 4°C, 2°C’den 2 kat büyük değildir. • Sıcaklık, başarı, performans gibi sayısal değişkenleri ölçmek için kullanılır.

  11. 4- Oran Ölçeği • Yukarıdaki ölçeklerin en hassas olanıdır. • Ölçülen karakteristiğin 0 olması o karakteristiğin olmadığını gösterir. • Ölçülen değişken değeri diğer değişken değerinin katları ile ifade edilebir. • Bir cismin ağırlığının 0 kg olması onun olmadığını gösterirken, 10 kg gelen bir cisim 2 kg gelen cismin 5 katı ağırlıktadır. • Aylık gelir, ağırlık, uzunluk, hız gibi değişkenleri ölçmek için kullanılır. • Bu ölçekte başlangıç “0” noktasıdır. • Aralık ölçeğinin oran ölçeğinden temel farkı bir başlangıç noktasının bulunmamasıdır. • Diğer bir ifade ile “0” değeri aralık ölçeğinde yokluk ifade etmez. • Örneğin termometrede görülen “0 °C” belirli bir anlam taşır. • Oysa oran ölçeğinde yer alan “0 Kg” bir yokluk ifadesidir.

  12. ÖDEV • 6 çalışma grubu oluşturuldun. • Bu gruplar ders kapsamındaki ödevleri beraber yapacaklar. ÖDEV 1 • Herbir grup birbirinden bağımsız olarak 4 ölçek için 4 örnek oluşturup haftaya ders öncesinde sunum yapacak.

  13. Frekans Dağılımları • Bir araştırmaya konu olan anakütledeki tüm verileri veya örneklemdeki verileri alt alta ya da yan yana dizdiğimizde basit bir seri elde etmiş oluruz. • Bu seriyi özetlemek ve daha anlaşılır hale getirmek istediğimizde sınıflandırma ya da gruplandırma yoluna gideriz. Sınıflandırmada serideki herbir değerin karşısına o değerin frekansını yani tekrarlanma sayısını yazarız. • İlgilenilen değişkenin almış olduğu farklı değerlerin küçükten büyüğe sıralanması ve bu değerlerin karşısına kaç kez tekrar ettiğinin (frekansı) yazılmasıyla oluşturu­lan istatistik serisine “frekans serisi” denir, • Mesela Ali ismi, bir seride 10 kez geçiyorsa bu değerin frekansı 10’dur. • Farklı birimlerin çok olması halinde yani gözlem sayısı çok olduğu durumlarda sınıflandırma işlemi verilerin özetlenmesine kafi gelmez. Bu gibi durumlarda gruplandırma yoluna gidilir. Gruplandırılmış seri Sınıflandırılmış seri Gruplar frekans X frekans 5 6 10 20 5.00-7.75 7.75-10.50 10.50-13.25 13.25-16.00 6 20 10 5 1 4 2 8 Gruplamada hesap kolaylığı açısından aralıklar genellikle eşit alınır. Gruplandırılmış seride matematiksel işlemler yapabilmemiz için, herbir sınıfı bir sayı ile temsil etmemiz gerekir.

  14. Gruplandırılmış seri • İlgilenilen değişken değerlerinin, belirlenen gruplara (aralıklara) ayrılması ve bu sı­nıflara giren gözlem sayısının ayrı bir sütuna yerleştirilmesiyle oluşan seriye “grup­landırılmış seri” denir, • Frekans serisini, gruplandırılmış seri haline dönüştürürken sınıf aralığı büyüklüğü Sturges Kuralı ya da araştırmacının görüşüne bağlı olarak belirlenir. • Sınıf aralığının key­fî olarak belirlenmesinde göz önüne alınması gereken kriter birbirine yakın gözlem de­ğerlerinin bir araya getirilmesidir. Genellikle, en az 5 en fazla 20 sınıf sayısı önerilir. • Sturgeskuralı yardımıyla sınıf sayısı ve buna bağlı olarak da sınıf aralığı büyük­lüğü belirlenir. • Gruplandırılmış seride her sınıfın en küçük değerine alt sınır değe­ri, en büyük değerine de üst sınır değeri denir. • Her bir sınıftaki üst sınır ile alt sı­nır arasındaki farka da sınıf aralığı yada büyüklüğü (genişliği) denir.

  15. Sturges kuralı • Sturges Kuralı Xb = En büyük gözlem değeri Xk = En küçük gözlem değeri N= Gözlem sayısı k = Sınıf Sayısı h = Sınıf Aralığı Büyüklüğü k = 1 + (3,322) * log(N) Sınıf büyüklüğü = h= ( Xb - Xk) / k • Genel olarak 5k20 seçilmesi benimsenir. • Eşit aralıklı k sınıflı gruplandırılmış bir seri oluşturmak için serideki en büyük değerden en küçük değer çıkarılarak k sayısına bölünür. Elde edilen değer sınıf büyüklüğüdür. • Bu değer k adet sınıf oluşturuluncaya kadar serideki en küçük değere kümülatif olarak eklenir.

  16. Örnek 1 Tabloda gösterilen sıralanmış seriyi sınıf sayısı k= 4 olacak şekilde gruplandırılmış seri haline getiriniz.

  17. Çözüm Sınıf sayısı k: 4 olsun. Sınıf büyüklüğü = h= = 96,98 26,4 +96,98

  18. Örnek 2 120 Öğrencinin Aylık Harcamaları (Frekans Serisi) Tablo’daverilen sınıflandırılmış seri gruplandırılmış seriye dönüştürülmek istendiğinde; k = 1 + (3.322) * log(N) Xb =1050 Xk= =200 N=120 k = 1 + (3.322) * log(120) k = 1 + (3.322) * (2.079) k = 1 + 6.906 = 7.906 k~ 8 Bu örnek için sınıf aralığı büyüklüğü (h); h= ( Xb - Xk) / k h= (1050-200)/8 h =106.25~ 107

  19. Çözüm 2 120 Öğrencinin Aylık Harcamaları için oluşturulan gruplandırılmış seri

  20. Gruplandırılmış Seri • Sürekli gruplandırılmış bir seride her sınıfın alt ve üst değerlerine sınıf sınırları denir. • Bu rakamlardan küçük olan alt sınır, büyük olan ise üst sınır olarak adlandırılır. • Kesikli gruplandırılmış bir seride bir üst sınıfın alt sınırından bir alt sınıfın üst sınırı çıkarılıp ikiye bölünerek, bu değer üst sınıf değerinden çıkarılır ve alt sınıf değerine eklenerek sınıf uçları sınıf sınırlarına dönüştürülür. Sınıf için üst sınıf hesabı: 178,25+ 0,375 = 178,625 2. Sınıf için alt sınıf hesabı: 179-0,375 = 178,625 = = 0,375 sınıf sınırları

  21. Frekans Dağılımları • Gruplandırılmış bir seride her sınıfın ilk rakamı alt sınıf ucu, son rakamı ise üst sınıf ucudur. • Sürekli gruplandırılmış serilerde sınıf uçları sınıf sınırlarına eşittir. • Daha önce belirtildiği gibi bir sınıfın üst ve alt sınırları arasındaki farka sınıf büyüklüğü denir. • Sınıf büyüklüğü :178,25-26,40=151,85 • Sınıf değeri, alt ve üst sınıf uçlarının veya alt ve üst sınıf sınırlarının toplanıp ikiye bölünmesiyle elde edilir. • Sınıf değeri: (26,4+178,25)/2=102,32

  22. Frekans Dağılımları • Serideki herbir frekansın toplam frekansa bölünmesiyle nisbi frekanslar elde edilir. • Bu frekanslar nisbi frekans dağılımını teşkil eder. Gruplandırılmış seri Gruplar Frekans 5.00-7.75 7.75-10.50 10.50-13.25 13.25-16.00 6 20 10 5 Kümülatif frekans Nisbi frekans 6/41 20/41 10/41 5/41 6 26 36 41 41 41/41

  23. Örnek 3 Bir üniversite kampüsünün başka bir lokasyona taşıması ile ilgili öğretim üyeleri ile anket yapılmıştır. 152 öğretim üyesi kampüsün taşınması fikrini desteklerken, 77 öğretim üyesi tarafsız kalmakta ve geriye kalan 51 öğretim üyesi bu fikre karşı çıkmaktadır. Buna göre ankete verilen cevapların frekansını ve nisbi frekanslarını hesaplayınız.

  24. Örnek 4 Aşağıdaki tabloda bir fabrikanın kalite kontrol departmanı tarafından tespit edilen hatalı ürün sayıları gösterilmektedir. Bu tablodaki verileri sıralı seri olarak gösteriniz. Frekans ve nisbi frekansları hesaplayınız.

  25. Çözüm

  26. Örnek 5 Yukarıdaki tablo için 12-14, 15-17, 18-20, 21-23 ve 24-26 aralıkları için frekans ve nisbi frekans değerlerini bulunuz.

  27. Çözüm

  28. Histogram • Bir dikdörtgenler dizisidir. • Bu dikdörtgenlerin tabanları gruplandırılmış serideki herbir sınıfın büyüklüğünü, yükseklikleri ise sınıf frekansını gösterir. • Bu dikdörtgenlerin üst kenarlarının orta noktaları birleştirilmek suretiyle elde edilen grafiğe frekans poligonu adı verilir. • Nisbi ya da kümülatif frekans dağılımlarına ait histogramları elde etmek için bu histogramdaki dikey eksene nisbi veya kümülatif frekanslar eklenmelidir.

  29. Örnek 6 Gruplandırılmış seri Gruplar Frekans 5.00-7.75 7.75-10.50 10.50-13.25 13.25-16.00 6 20 10 5

  30. Kategorik Verilerin Grafikle Gösterilmesi • Kesikli sayısal veriler ve sayısal olmayıp kategorilere ayrılabilen veriler de grafiklerde gösterilebilir. • TV izlenme oranları, partilerin oy oranları vs. grafiklerle gösterilmesi mümkündür. • Bu tip verileri çok farklı grafik türleri ile göstermek mümkündür…

  31. Sütun Grafiği • Yatay eksek kategoriler, dikey eksen bunların frekanslarından oluşur. • Sütunlar birbirine bitişik yada ayrık olabilir.

  32. Sütun Grafiği

  33. Daire Grafiği • Bu grafikte genellikle kategorilerin nisbi frekansları 360 ile çarpılarak daire içinde alacakları dilimin büyüklüğü belirlenir.

  34. Çalışma Soruları

  35. Çalışma Sorusu 1 • Yandaki grafikte 21 öğrencinin istatistik dersinden aldıkları notlar görülmektedir. Buna göre: • Notları değişim aralığını bulunuz. • Notları basit bir seri haline getiriniz. • Bu verileri sınıf büyüklüğü 10 olacak şekilde gruplandırıp, herbir grubun frekansını bulunuz. • Her sınıfa ait sınıf değeri ve sınıf sınırlarını bulunuz. • C şıkkındaki değerleri dikkate alarak histogram çiziniz. • Bu verileri 5 grup olacak şekilde gruplandırdığımızda sınıf büyüklüğü değeri kaç olur?

  36. Çalışma Sorusu 2 • Hesapları denetlenen 692 Avustralya şirketinden alınan denetim dışı ücretlerin toplam denetici ödemeleri içindeki payları ilişikteki çizelgede gösterilmiştir. • Göreli sıklıkları ve birikimli nisbi sıklıkları bulup histogram çiziniz.

  37. Çalışma Sorusu 3 • Buna göre: • Bütün sınıfların alt ve üst sınırlarını, • Bütün sınıfların sınıf değerlerini, • Altıncı sınıfın nisbi frekansını • Dayanma süresi 6000 saate çıkmayan ampüllerin yüzdesini, • Dayanma süresi 9000 saat veya daha fazla olan ampüllerin yüzdesini bulunuz. • Bir ampül fabrikasında üretilen mamüller arasından tesadüfi olarak 400 tanesi seçilmiş ve bunların dayanma sürelerine ait frekans dağılımı aşağıda gösterilmiştir.

More Related