1 / 35

İleri İstatistik Teknikleri

İleri İstatistik Teknikleri. Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim

Sophia
Télécharger la présentation

İleri İstatistik Teknikleri

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. İleri İstatistik Teknikleri Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim “Hayat fena halde futbola benzer: dört doğru pas yüzde 90 gol demektir” Bir filmden

  2. İleri İstatistik Teknikleri • ? Neden “ileri” teknikler? • Amaç: Eldeki “veriyi” “bilgiye” dönüştürebilmek - Veri vs. Bilgi

  3. İstatistiksel Yöntemler • Betimleyici (Descriptive) Yöntemler • Verili herhangi bir dağılımı bir ya da birden çok katsayıda anlatabilmek - Örn: şirkettekilerin yaş ortalaması • Açıklayıcı (Explanatory) Yöntemler • Bir veri setinde olası ilişkileri sergilemek - Örn: Şirkettekilerin ayakkabı numaralarıyla aldıkları maaş arasındaki ilişki

  4. Betimleyici Yöntemler • Amaç: Eldeki dağılımı en iyi şekilde temsil etmek • Araçlar: • Ortalama: • Medyan: • Mod:

  5. Betimleyici Yöntemler • Veeee.... • Varyans/Standart Sapma: • Neden:

  6. Dağılım: 6,6,6 Ortalama: 6 Medyan: 6 Mod: 6 Std. Sapma: 0 Dağılım: 0,6,12 Ortalama: 6 Medyan: 6 Mod: 6 Std: Sapma: 6 İki Dağılımın Hikayesi Amaç: Görünenin Ötesine Bakabilmek

  7. Açıklayıcı Analizler • Amaç: Verili bir sette olası ilişkileri keşfetmek ya da öngörülen hipotezleri test etmek

  8. Görünen....

  9. Görünenin Arkası.... Genel Ortalama: 51, Std. Sapma: 22 Kadınlar Ortalama: 46, Std. Sapma: 23 Erkekler Ortalama: 46, Std. Sapma: 21

  10. Örnek: Internet Kullanımı

  11. Ve Görünenin Arkası... Erkekler Kadınlar

  12. Açıklayıcı Analizler • Amaç: İlk bakışta görül(e)meyen ilişkileri sergileyip ilişkisel açıklamalar getirmek • Y= f(x) ie: İnternet kullanımı= f(cinsiyet) ie: Yaşam biçimi= f(gelir) ie: Tüketim kalıpları= f(yaşam biçimi)

  13. Örnek: Gelişmişlik ve Yaşam Kalitesi • BM verilerinden elde edilen bir tablo... • Araştırma sorusu: Gelişmişlik ve Yaşam Kalitesi arasındaki ilişki • İşlemleştirme: • Gelişmişlik: Kişi Başına Düşen GSMH • Yaşam Kalitesi: Çocuk ölümleri

  14. Gruplanmış Veri

  15. Scatterplot

  16. Sorular • Grafiği ne kadar temsil ediyor? • Ne gibi çıkarımlar yapabiliyoruz? • “Forecasting” yapılabiliyor mu? • İlişkinin “boyutu” ve “yönü” ölçülebiliyor mu? Ne Kadar Yeterli?

  17. Amaç: Daha iyi analiz, daha iyi veri • Covariance (kovaryans) • Correlation Coefficient (korelasyon)

  18. Sonuçlar • Covariance: 2115,318 • Correlation: -0,60165 Çıkarılacak Sonuç Ne?

  19. Amaç: Nedensel İlişkileri Göstermek • Y= f(x) • X, Y’nin belirleyicisi mi? • X, Y’yi ne kadar belirliyor? • X, Y’yi ne yönde belirliyor?

  20. Regresyon Analizi • Y= f(x) • Y= a+bx • Regresyon Denklemi:

  21. Scatterplot

  22. Regresyon Katsayılarının Hesaplanması

  23. Regresyon Analizi Sonuçları

  24. Regresyon Analizinin Açılımları • Çoklu Regresyon • Kukla Değişkenli Regresyon (Dummy Variable) • Binomial/Multinomial Regression

  25. Regresyon Analizinin “cız-kaka”ları • Arkasında çok ciddi üç varsayım vardır. • Regresyon analizi sadece “interval” ya da “ratio” ölçümleme düzeyinde yapılır • “Do not use any mathematical model without understanding it”

  26. Kümeleme ve Birleştirme Analizleri • Bütün olgular birbiriyle ilişkilidir. Aradaki ilişkinin 0 olduğu yerde bile... • Birleştirme analizlerinin amacı olguların birbirleriyle olan ilişkilerinden yola çıkarak işimizi kolaylaştırmaktır • 1. Değişken sayısını azaltabilirler • 2. Vaka sayısını azaltabilirler • 3. Boyut sayısını azaltabilirler

  27. Faktör Analizi: Değişken Sayısını Azaltmak • Analize tabi bütün değişkenler birbiriyle ilişkili. • Bu değişkenlerin bazıları birbirleriyle daha kuvvetli ilişki sahibi. • Kuvvetli ilişki sahibi değişkenleri birleştirerek aza indirmek mümkün. • Değişkenlerarası korelasyon matrisi kullanılarak “faktör”ler inşa ediliyor

  28. Faktör Analizi

  29. “Case” Sayısı Azaltmak: Clustering • Verili değişkenler bazında analize alınan “case”ler birbirlerine benzerler • Bu benzerlik bir ya da daha fazla boyutta olabilir • Benzerliklerden yola çıkarak “clusters” oluşturmak mümkün • Benzerlikler metric mesafelerle ölçülüyor

  30. Cluster Analysis I

  31. Cluster Analysis II

  32. Cluster Analysis III

  33. Boyut Sayısını Azaltmak: MDS • Analizde gözönünde tuttuğumuz her değişken bir “boyut” sayılabilir. • İki-üç boyuttan fazlasını “visualize” etmek kolay değil. • Değişkenler arasındaki uzaklıktan yola çıkılarak bu boyut sayısı azaltılabilir. • Değişkenler arasındaki uzaklıklar metric olarak ölçülebilir

  34. MDS

  35. Ve mutlu son.... • “İstatistiksel araçlarınız ne kadar güçlü, ne kadar gelişmiş olursa olsun, unutmamanız gereken tek şey var: • Bu verileri okuma yazması olmayan demiryolu bekçileri topladı” Sir John Maynard Keynes

More Related