1 / 17

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie.

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie. . Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika. Neuro-fuzzy Feature Space Mapping - motywacje Funkcje transferu. Co było. Stosowanie reguł: niepewność pomiaru. Dokładność - prostota reguł.

paloma
Télécharger la présentation

Inteligencja Obliczeniowa Reguły logiczne i ich stosowanie.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Inteligencja ObliczeniowaReguły logiczne i ich stosowanie. Wykład 22 Włodzisław Duch Uniwersytet Mikołaja Kopernika

  2. Neuro-fuzzy Feature Space Mapping - motywacje Funkcje transferu Co było

  3. Stosowanie reguł: niepewność pomiaru. Dokładność - prostota reguł. Odrzucanie i stopień zaufania do reguł. Od danych do systemu ekspertowego. Co będzie

  4. Stosowanie reguł Dane: obarczone nieznanym błędem; zakładamy Gaussowski rozkład: x - liczba rozmyta, z Gaussowską funkcją przynależności. Zestaw reguł logicznych R zastosowany do liczb rozmytych: jeśli wykonać symulacje Monte Carlo da p(Ci|X). Analityczna ocena p(C|X) oparta jest na f. kumulującej: dokładność przybliżenia f. błędu logistyczną < 0.02

  5. Rozmywanie reguł Reguła Ra(x) = {x>a} spełniona jest przez Gx z prawd. F. błędu jest przybliżoną f. logistyczną; odpowiada to założeniu rozkładu błędu typu s(x)(1- s(x)), dla s2=1.7 przybliża f. Gaussa z dokładnością <3.5% Różnica dwóch sigmoid, f. przynależności typu miękkiego trapezoidu. Wniosek: logika rozmyta z f. przynależności s(x) -s(x-b) jest równoważna klasycznej przy założeniu Gaussowskich niepewności rozkładu.

  6. Optymalizacja reguł Fuzzy: duże pola recepcyjne, ocena „z grubsza”. Gx - niepewność pomiaru, małe pola recepcyjne. Minimalizacja liczby błędów dla klasyfikatora regułowego: trudna, metody niegradientowe, wolno zbieżne. Minimalizacja z uwzględnieniem niepewności: Optymalizacja gradientowa, działa nawet dla >1000 parametrów (opisujących kształt i położenie przedziałów dla przesłanek). Najprościej: wspólny parametr sx dla grupy cech. Możliwe inne funkcje błędu.

  7. Zalety 1) Zbiór ciągłych prawd. zamiast 0,1 ocen; 2) Niesklasyfikowane wektory mają niezerowe prawd. 3) Dyspersje sx mogą być parametrami adaptacyjnymi. Obliczanie prawdopodobieństw dla wielu przesłanek. Dla koniunkcji przesłanek R=r1(x1) r2 (x2)  .. rk (xk) jeśli ri są niezależne (ortogonalne) wystarczy iloczyn p(ri).Jeśli reguły się nakrywają nie można dodawać p bo policzymy wielokrotnie to samo. Odtworzenie symulacji Monte Carlo wymaga: (RC - reguły dla klasy C)

  8. Odrzucanie Prostota reguł vs. dokładność. Zaufanie do reguł vs. wektory odrzucone. Zdefiniujmy macierz rozrzutu F(Ci,Cj|M) = Nij/N częstość przypisania klasy Cj do klasy Ci przez reguły M. Dla 2 klas: Wrażliwość reguł: Se=F++/(F+++F+-)[0,1] Specyficzność: Sp=F--/(F--+F-+) [0,1] Se=1 klasa - nigdy nie jest przypisywana do + Sp=1 klasa + nigdy nie jest przypisywana do - Minimalizacja l. pomyłek: możliwe wektory odrzucone, węższe przedziały. Max. liczby poprawnych wektorów.

  9. Zastosowania Szczegółowy przykład dla danych Iris. Przykłady rzeczywistych zastosowań: Grzyby: dane czysto symboliczne. 3 Mnichów: sztuczne dane symboliczne. Dane Medyczne: Rak piersi - nawroty (Ljubliana)Rak piersi - złośliwość (Wisconsin)Badania przesiewowe tarczycy. Badania psychometryczne Dane techniczne: NASA Shuttle

  10. Grzyby Dane z książki, w której wyraźnie napisano: „nie ma łatwego sposobu odróżnienia jadalnych od niejadalnych i trujących. 8124 przypadki, 22 cechy symboliczne, razem 118 wartości logicznych, czyli 2118=3.1035 możliwych wektorów binarnych. 2480 brakujących wartości cechy „stalk-root” 51.8% jadalnych, 48.2% niejadalnych. Grzyb jest jadalny jeśli: odor = (almond Ú anise Ú none) Ù spore-print-color = Ø green 48 błędów, 99.41% dokładności Węch - najważniejszy zmysł; Jakie receptory pozwalają odróżnić zapach anyżu i migdałów? Reguła z MLP2LN. Prosta sieć, automatyczna analiza funkcji logicznych i sprawdzania ich poprawności (program w Prologu).

  11. Grzyby - reguły Reguły dla grzybów trujących R1) odor = Ø (almond Ú anise Ú none); 120 błędów, 98.52% R2) spore-print-color = green 48 błędów, 99.41% R3) odor = none Ù stalk-surface-below-ring = scaly Ù      stalk-color-above-ring = Ø brown 8 błędów, 99.90% R4) habitat = leaves Ùcap-color = white 0 błędów! R1 + R2 stabilne, wychodzą nawet na 10% danych; R3 i R4 można zamienić na: R'3): gill-size = narrow Ù stalk-surface-above-ring = (silky Ú scaly) R'4): gill-size = narrow Ù population = clustered Wystarczy 5 cech! 100% dokładności w testach CV. Dane całkowicie zrozumiałe.

  12. Rak piersi - nawroty (Ljubliana) Po wycięciu guza zdarzają się nawroty: czy można je przewidzieć? 286 przypadków, 201 bez nawrotów (70.3%), 85 z nawrotami (29.7%) 9 cech symbolicznych, 2 do 13 wartości: wiek (9 przedziałów), wielkość guza (12 przedziałów), liczba guzów (13 przedziałów), złośliwość (1,2,3), kwadrant lub centrum; napromieniowanie itd. Reguła: Jeśli (l. guzów > [0,2] Ù złośliwość = 3 To nawrót ELSE brak nawrotu ma dokładność 77% na całym zbiorze; najlepsze systemy nie dają więcej niż 78% przy bardziej złożonym opisie. Cała wiedza zawarta w tej bazie to: Złośliwe raki z przerzutami dają nawroty. Problem: jak znaleźć jedną, stabilną regułę w kroswalidacji?

  13. Budowa systemów regułowych Analiza psychometrycznych kwestionariuszy: jak zbudować system wspomagający diagnozy w oparciu o interpretację danych tekstowych? System analizy danych i indukcji reguł pozwalający na wspomaganie decyzji - IDSS (Intelligent Decision Support System)

  14. Psychometria Test: kwestionariusz, odpowiedzi na pytania. MMPI (Minnesota Multiphasic Personality Inventory) - typowy test. Skanowanie formularzy. • Odpowiedzi na 550 pytań - czyste dane. • Rezultaty kombinuje się liniowo z współczynnikami ustalonymi przez psychometrów, tworząc 14 „skal”. • Każda skala mierzy tendencje do oszukiwania, unikania odpowiedzi, hipochondrii, depresji, paranoi, schizofrenii itp. • Interpretacji podlega „psychogram”, czyli histogram skal. Interpretacja zależy od intuicji i doświadczenia psychometry. • Czy można zrobić sztucznego psychometrę? • Dokładność interpretacji: < 70% zgodności pomiędzy dwoma ekspertami?

  15. Dane do analizy. Około 1600 przypadków dla kobiet i tyle samo dla mężczyzn. 27 klas: norma, psychopatia, zespół urojeniowy, schizofrenia, paranoja, nerwica, stan maniakalny, symulacja, dyssymulacja, alkoholizm, narkomania, skłonności przestępcze, zmiany organiczne w mózgu ... Etap tworzenia reguł: przesłanki to wartości ciągłe, 14 skal. FSM, MLP2LN, drzewo decyzji - około 2-3 reguł/klasę. 10-CV daje 82-85% z FSM i 79-84% z C4.5. Rozmycie poprawia wyniki dla FSM do 90-92%

  16. Wyniki Prawdopodobieństwa przynależności do klas. Analiza dopasowania reguł i szczegółowa analiza przyczyn. Werbalne interpretacje przypadków. Prezentacja danego przypadku w relacji do pozostałych.

  17. Koniec wykładu 22 Dobranoc !

More Related