1 / 11

Ekstrakcja wiedzy z Polskiego Rejestru Wrodzonych Wad Rozwojowych

Ekstrakcja wiedzy z Polskiego Rejestru Wrodzonych Wad Rozwojowych. Izabela Brzezińska. Polski Rejestr Wrodzonych Wad Rozwojowych (PRWWR). PRWWR działa od 1997r. jako projekt Ministerstwa Zdrowia i Opieki Społecznej Obejmuje 74% powierzchni Polski, 72% populacji

stone-combs
Télécharger la présentation

Ekstrakcja wiedzy z Polskiego Rejestru Wrodzonych Wad Rozwojowych

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ekstrakcja wiedzy z Polskiego Rejestru Wrodzonych Wad Rozwojowych Izabela Brzezińska

  2. Polski Rejestr Wrodzonych Wad Rozwojowych (PRWWR) • PRWWR działa od 1997r. jako projekt Ministerstwa Zdrowia i Opieki Społecznej • Obejmuje 74% powierzchni Polski, 72% populacji • Ponad 32 000 wpisów dzieci z wrodzonymi wadami rozwojowymi • Od 2001 r. członek EUROCAT’u- zrzeszania rejestrów europejskich

  3. Zbiór danych do analizy • Zbiór 867 dzieci z zespołem Downa, spośród których 290 ma wrodzoną wadę serca • 10 atrybutów warunkowych (np. masa urodzen., wiek płodowy, kariotyp, itd.) • 1 atrybut decyzyjny (wada_serca={tak, nie}) • Problemy: brakujące wartości, niespójności • Jakie czynniki wpływają na występowanie wrodzonych wad serca wśród dzieci z zespołem Downa?

  4. Etapy procesu odkrywania wiedzy • Identyfikacja dziedziny problemu, • wybór/tworzenie docelowych danych, • wstępne przetwarzanie danych, • wybór zadania i algorytmów odkrywania wiedzy, • pozyskiwanie wiedzy z danych, • interpretacja i ocena wyników poszukiwań.

  5. Wstępne przetwarzanie danych • Usunięcie duplikatów • Identyfikacja obserwacji nietypowych • Dyskretyzacja atrybutów ciągłych • Uwzględnianie nieznanych wartości

  6. Wybrana metoda analizy danych • Teoria zbiorów przybliżonych jako narzędzie do uwzględniania niespójności mogącej być wynikiem granularności dostępnej informacji, • Narzędzie: ROSE 2.0, algorytm Explore, indukcji satysfakcjonującego zbioru reguł,

  7. Wyniki

  8. Inne metody • Instance based learning (IBL1-3), • Indukcja drzew decyzyjnych (C4.5), • Regresja logistyczna (Statistica 6.0)

  9. Porównanie wyników różnych metod

  10. Dodatkowe eksperymenty • Selekcja - w celu zrównoważenia liczności obu klas decyzyjnych • Projekcja • 9 atrybutów warunkowych • 8 atrybutów warunkowych

  11. Kierunki dalszych badań • Rozszerzenie analizy na zbiór z atrybutem decyzyjnym wskazującym rodzaj/skalę wady serca, • Ekstrakcja wiedzy z innych obszarów Rejestru, • Zastosowanie innych podejść ekstrakcji wiedzy, np.sieci neuronowe, podejścia biorące pod uwagę uporządkowanie dziedzin atrybutów według preferencji, • Analiza skalowalności wybranych metod ekstrakcji wiedzy.

More Related