1.02k likes | 1.22k Vues
?znitelik uzayi (Feature space). ?znitelikler ?ok daha karmasik olabilirler.. ?znitelik uzayi (Feature space). ?znitelikler ?ok daha karmasik olabilirler.B?y?k bir ayrik k?meden alinmis olabilirler.. ?znitelik uzayi (Feature space). ?znitelikler ?ok daha karmasik olabilirler.B?y?k bir ayrik k?m
E N D
1. Makine grenmesi - 3(Machine Learning) Blm 18
2. znitelik uzayi (Feature space) znitelikler ok daha karmasik olabilirler.
3. znitelik uzayi (Feature space) znitelikler ok daha karmasik olabilirler.
Byk bir ayrik kmeden alinmis olabilirler.
4. znitelik uzayi (Feature space) znitelikler ok daha karmasik olabilirler.
Byk bir ayrik kmeden alinmis olabilirler.
iktilar eger sirali degilse, her bir ikti ikili sistemde tek bir biti kapsayacak sekilde gsterilebilir. (0001, 0010, 0100, 1000 gibi)
Eger iktilar sirali ise, reel sayilar kullanilabilir. (0.1, 0.3, 0.5, 0.7, 0.9 gibi)
5. znitelik uzayi (Feature space) znitelikler ok daha karmasik olabilirler.
Byk bir ayrik kmeden alinmis olabilirler.
iktilar eger sirali degilse, her bir ikti ikili sistemde tek bir biti kapsayacak sekilde gsterilebilir. (0001, 0010, 0100, 1000 gibi)
Eger iktilar sirali ise, reel sayilar kullanilabilir. (0.1, 0.3, 0.5, 0.7, 0.9 gibi)
Reel degerler iin zniteliklerin birbirine yakin oldugu degerler iin iktidaki reel farklilik da az olmalidir.
6. Iflas etme (bankruptcy) tahmini
7. En yakin komsu kurali Btn verileri aklinda tut.
Yeni bir veri geldiginde
Eski verilerden bu veriye en yakin olanini tespit et.
Bu en yakin veri hangi sinifa ait ise yeni veri de ayni sinifa aittir.
8. En yakin nasil hesaplanir ? Girdilerin birbirine uzakligi iin bir fonksiyon kullanmak lazim.
Genellikle Euclid mesafesi kullanilir.
9. En yakin nasil hesaplanir ? Girdilerin birbirine uzakligi iin bir fonksiyon kullanmak lazim.
Genellikle Euclid mesafesi kullanilir.
10. lekleme Bir arabanin benzin tketimini tahmin etmeye alisiyoruz.
f1 = arabanin agirligi (kg)
f2 = silindir sayisi
11. lekleme Bir arabanin benzin tketimini tahmin etmeye alisiyoruz.
f1 = arabanin agirligi (kg)
f2 = silindir sayisi
f2nin sonuca etkisi hemen hemen hi grlmeyecek.
12. lekleme Bir arabanin benzin tketimini tahmin etmeye alisiyoruz.
f1 = arabanin agirligi (kg)
f2 = silindir sayisi
f2nin sonuca etkisi hemen hemen hi grlmeyecek.
Bu durumda girdileri 0 ortalama ve 1 varyans olacak sekilde leklemek gerekir.
13. lekleme Bir arabanin benzin tketimini tahmin etmeye alisiyoruz.
f1 = arabanin agirligi (kg)
f2 = silindir sayisi
f2nin sonuca etkisi hemen hemen hi grlmeyecek.
Bu durumda girdileri 0 ortalama ve 1 varyans olacak sekilde leklemek gerekir.
Baska bir lege gre de leklemek mmkn (lineer, log)
14. lekleme Bir arabanin benzin tketimini tahmin etmeye alisiyoruz.
f1 = arabanin agirligi (kg)
f2 = silindir sayisi
f2nin sonuca etkisi hemen hemen hi grlmeyecek.
Bu durumda girdileri 0 ortalama ve 1 varyans olacak sekilde leklemek gerekir.
Baska bir lege gre de leklemek mmkn (lineer, log)
Veya cross-validation kullanarak lekler seilebilir.
15. Iflas etme (bankruptcy) tahmini
16. Iflas etme (bankruptcy) tahmini
17. Iflas etme (bankruptcy) tahmini
18. Iflas etme (bankruptcy) tahmini
19. Iflas etme (bankruptcy) tahmini
20. Iflas etme (bankruptcy) tahmini
21. Iflas etme (bankruptcy) tahmini
22. Voronoi ayirimi
23. Voronoi ayirimi
24. Zaman ve bellek gereksinimi grenme ok hizli
25. Zaman ve bellek gereksinimi grenme ok hizli
n znitelik, m adet veri varsa m*n bellek gerekmektedir.
26. Zaman ve bellek gereksinimi grenme ok hizli
n znitelik, m adet veri varsa m*n hesap gerekmektedir.
Veriler uygun bir aga yapisinda tutuldugunda (log m)*n hesap yapmak yeterli olabilir.
27. Zaman ve bellek gereksinimi grenme ok hizli
n znitelik, m adet veri varsa m*n hesap gerekmektedir.
Veriler uygun bir aga yapisinda tutuldugunda (log m)*n hesap yapmak yeterli olabilir.
Btn veriler hafizada yer almali, veya
Sinirdan uzaktaki verileri silebiliriz.
28. Grlt
29. Grlt
30. Grlt
31. En yakin k komsu
32. En yakin k komsu
33. En yakin k komsu
34. En yakin k komsu
35. okboyutlulugun laneti En yakin komsu dsk boyutlarda (6ya kadar) ok iyi alismaktadir.
n artmaya basladigi zaman isler degisir.
36. okboyutlulugun laneti En yakin komsu dsk boyutlarda (6ya kadar) ok iyi alismaktadir.
n artmaya basladigi zaman isler degisir.
Yksek boyutlarda hemen hemen her nokta birbirinden uzaktir.
Hemen hepsi sinirlara yakin durmaktadir.
37. okboyutlulugun laneti En yakin komsu dsk boyutlarda (6ya kadar) ok iyi alismaktadir.
n artmaya basladigi zaman isler degisir.
Yksek boyutlarda hemen hemen her nokta birbirinden uzaktir.
Hemen hepsi sinirlara yakin durmaktadir.
n=1 iin 0 ve 1 arasinda birbirinden 0.1 esit uzaklikta 10 adet veri yerlestirilebilir.
38. okboyutlulugun laneti En yakin komsu dsk boyutlarda (6ya kadar) ok iyi alismaktadir.
n artmaya basladigi zaman isler degisir.
Yksek boyutlarda hemen hemen her nokta birbirinden uzaktir.
Hemen hepsi sinirlara yakin durmaktadir.
n=1 iin 0 ve 1 arasinda birbirinden 0.1 esit uzaklikta 10 adet veri yerlestirilebilir.
n=2 iin 102
39. okboyutlulugun laneti En yakin komsu dsk boyutlarda (6ya kadar) ok iyi alismaktadir.
n artmaya basladigi zaman isler degisir.
Yksek boyutlarda hemen hemen her nokta birbirinden uzaktir.
Hemen hepsi sinirlara yakin durmaktadir.
n=1 iin 0 ve 1 arasinda birbirinden 0.1 esit uzaklikta 10 adet veri yerlestirilebilir.
n=2 iin 102 ... n=k iin 10k veri lazim.
40. okboyutlulugun laneti zm: znitelik seimi veya baska modeller (lineer siniflandirici, YSA, vb.)
41. rnekler Kalp hastaligi teshisi: Test sonularina bakarak hastada aort daralma sorunu olup olmadiginin tespiti
26 znitelik
297 adet veri
42. rnekler Kalp hastaligi teshisi: Test sonularina bakarak hastada aort daralma sorunu olup olmadiginin tespiti
26 znitelik
297 adet veri
Araba benzin tketimi: Arabanin zelliklerine gre 100 kmde 10.64 lt. benzinden daha az veya fazla tketeceginin tespiti
12 znitelik
385 adet veri
43. Kalp hastaligi teshisi k seiminin fazla bir etkisi yok.
44. Kalp hastaligi teshisi k seiminin fazla bir etkisi yok.
Normalizasyonun (lekleme) etkisi var.
45. Araba benzin tketimi k seiminin fazla bir etkisi yok.
Normalizasyonun (lekleme) etkisi ok az.
46. Araba benzin tketimi Bu durumda normalizasyonun etkisi var.
izgelerdeki leklere dikkat edin !!
47. Karar agalarini hatirlayin Btn verileri kullanarak olusturulan agata sorular dallari, sonular yapraklari olusturuyordu.
48. Sayisal degerler iin ne yapmali? Bu durumda dgmlerdeki sorular xi > sabit? olarak yazilabilir.
49. Sayisal degerler iin ne yapmali? Bu durumda dgmlerdeki sorular xi > sabit? olarak yazilabilir.
Uzayi eksenleri kesen dikdrtgenlere bleriz.
50. Sayisal degerler iin ne yapmali? Bu durumda dgmlerdeki sorular xi > sabit? olarak yazilabilir.
Uzayi eksenleri kesen dikdrtgenlere bleriz.
51. Sayisal degerler iin ne yapmali? Bu durumda dgmlerdeki sorular xi > sabit? olarak yazilabilir.
Uzayi eksenleri kesen dikdrtgenlere bleriz.
52. Veri uzayinda ayrim nasil olacak? Her nokta iin btn boyutlarda ayrim olabilir.
53. Veri uzayinda ayrim nasil olacak? Her nokta iin btn boyutlarda ayrim olabilir.
54. Veri uzayinda ayrim nasil olacak? Her nokta iin btn boyutlarda ayrim olabilir.
55. Veri uzayinda ayrim nasil olacak? Her nokta iin btn boyutlarda ayrim olabilir.
56. Veri uzayinda ayrim nasil olacak? Olusan agataki ocuk dgmlerin ortalama entropisini minimum yapacak bir ayrim yapilabilir.
57. Iflas etme (bankruptcy) tahmini
58. Iflas etme (bankruptcy) tahmini
59. Iflas etme (bankruptcy) tahmini
60. Iflas etme (bankruptcy) tahmini
61. Iflas etme (bankruptcy) tahmini
62. Iflas etme (bankruptcy) tahmini
63. Iflas etme (bankruptcy) tahmini
64. Iflas etme (bankruptcy) tahmini
65. Kalp hastaligi teshisi Karar agalarindaki en iyi performans (0.77) en yakin komsu kuralindan az daha kt (0.81)
66. Kalp hastaligi teshisi
67. Kalp hastaligi teshisi
68. Kalp hastaligi teshisi
69. Kalp hastaligi teshisi
70. Kalp hastaligi teshisi
71. Kalp hastaligi teshisi
72. Kalp hastaligi teshisi
73. Kalp hastaligi teshisi
74. Araba benzin tketimi Karar agalarindaki performansi en yakin komsu kuraliyla ayni (0.91)
75. 100 kmde 10.64lt.den ok mu?
76. Regresyon Bu durumda ikti sayisal bir degerdir.
Yerel-agirlikli ortalama (MA, vb.)
Regresyon agalari
77. Yerel ortalama Btn veriyi bellekte tutmak gerekir.
78. Yerel ortalama Btn veriyi bellekte tutmak gerekir.
Herhangi bir yeni nokta geldiginde
Eski verilerden en yakin K komsu bulunur.
79. Yerel ortalama Btn veriyi bellekte tutmak gerekir.
Herhangi bir yeni nokta geldiginde
Eski verilerden en yakin K komsu bulunur.
Bunlarin sonularinin ortalamasi alinir
80. Yerel ortalama Btn veriyi bellekte tutmak gerekir.
Herhangi bir yeni nokta geldiginde
Eski verilerden en yakin K komsu bulunur.
Bunlarin sonularinin ortalamasi alinir ve yeni sonu bu olur.
81. K=1 Veriyi ok yakindan takip eder.
Overfitting olma sansi fazla
82. Knin daha byk degerleri Verideki oynamalar ortadan kalkar.
ok fazla genel bir yapi olusabilir.
83. Yerel agirlikli ortalama Sonucunun bulunmasi istenen yeni noktadan en fazla ? uzaklikta noktalari bul.
Bu noktalarin verdigi sonulari istenen noktaya yakinligina gre agirliklarla arp ve ortalamalarini al.
84. Yerel agirlikli ortalama Sonucunun bulunmasi istenen yeni noktadan en fazla ? uzaklikta noktalari bul.
Bu noktalarin verdigi sonulari istenen noktaya yakinligina gre agirliklarla arp ve ortalamalarini al.
Ayni model en yakin k komsu iin de gelistirilebilir.
85. rnek: Epanechnikov Kernel
86. Veri yumusatmasi ? nasil seilecek?
Eger kkse, ok fazla nokta ortalamada yer almaz.
Grltnn ortalanmasi iin yetersiz kalabilir.
Verilerdeki keskin geisleri daha rahat modelleyebilir.
Eger bykse, ok sayida nokta ortalamada yer alir.
Grltnn ortalanmasi iin uygun olur.
Verilerdeki keskin geisler ortadan kalkar.
? seiminde cross-validation kullanilabilir.
Yerel alanlardaki nokta sayisina gre dinamik sekilde olusturulabilir.
87. Regresyon agalari Karar agalarina benziyor, fakat yapraklarda sinif yerine reel degerler var.
88. Regresyon agalari Karar agalarina benziyor, fakat yapraklarda sinif yerine reel degerler var.
89. Yaprak degerleri Her yaprakta o yapraga dsen noktalarin iktilarinin (y) ortalamasi yer aliyor.
90. Yaprak degerleri Her yaprakta o yapraga dsen noktalarin iktilarinin (y) ortalamasi yer aliyor.
Bu sebeple ayni yaprakta yer alan noktalarin benzer y degerlerine sahip olmasi modelin dogrulugu iin gereklidir. Neden?
91. Varyans (variance) Varyans bir sayi kmesinin ne derecede birbirinden farklilik ierdigini gsterir.
92. Varyans (variance) Varyans bir sayi kmesinin ne derecede birbirinden farklilik ierdigini gsterir.
z1den zme kadar olan sayilarin ortalamasi (mean)
93. Varyans (variance) Varyans bir sayi kmesinin ne derecede birbirinden farklilik ierdigini gsterir.
z1den zme kadar olan sayilarin ortalamasi (mean)Varyans: Kmede yer alan her sayi ile kme ortalamasi arasindaki farkin karelerinin ortalamasi
94. Agata dal ayrimi Bir ayrim esnasinda ayrim iin seilecek znitelik sonucu olusacak ocuklarin ortalama varyansi dikkate alinarak aga olusturulabilir.
95. Agata dal ayrimi
96. Agata dal ayrimi
97. Agata dal ayrimi
98. Agata dal ayrimi
99. Durma kriteri Olusturulan yapraktaki varyans ortalamasi belli bir esik degerinin altina inerse dur.
100. Durma kriteri Olusturulan yapraktaki varyans ortalamasi belli bir esik degerinin altina inerse dur.
Ya da yapraktaki veri sayisi belli bir degerin (min-leaf) altina inerse dur.
101. Durma kriteri Olusturulan yapraktaki varyans ortalamasi belli bir esik degerinin altina inerse dur.
Ya da yapraktaki veri sayisi belli bir degerin (min-leaf) altina inerse dur.
Durduktan sonra o yapraktaki y degerlerinin ortalamasini yapraga yaz.
102. Durma kriteri Olusturulan yapraktaki varyans ortalamasi belli bir esik degerinin altina inerse dur.
Ya da yapraktaki veri sayisi belli bir degerin (min-leaf) altina inerse dur.
Durduktan sonra o yapraktaki y degerlerinin ortalamasini yapraga yaz.