WordNet: Semantic Network Management for Global Web Content
E N D
Presentation Transcript
Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία WordNet
Σημασιολογικά Δίκτυα • δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών • οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις • μια μορφή αναπαράστασης γνώσης (knowledge representation)
WordNet • δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985 • εποπτεία του Καθ. Ψυχολογίας George A. Miller • τρέχουσα έκδοση 3.0 • διανέμεται υπό παραλλαγή της BSD άδειας χρήσης
Εισαγωγή • πρόκειται για: • μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών • περιέχει: • ουσιαστικά, ρήματα, επίθετα, επιρήματα • διπλή φύση: • λεξικού και θησαυρού • ομαδοποίηση λέξεων σε: • σύνολα συνωνύμων όρων (synsets) • διασύνδεση synsets: • εννοιολογική-σημασιολογική ή λεξικολογική σχέση
Ορολογία • synset (έννοια): • ένα σύνολο από συνώνυμες λέξεις ή collocations (συνδυασμοί λέξεων με ξεχωριστό νόημα) • gloss (ορισμός): • σύντομος ορισμός μιας έννοιας
Σημασιολογικές Σχέσεις • ουσιαστικά: • υπερωνυμίας: το Y είναι υπερώνυμο του X όταν κάθε X είναι μέρος του Y • υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y είναι μέρος του Y • ολωνυμίας: το Y είναι ολώνυμο του X όταν το X είναι μέρος του Y • μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y είναι μέρος του X • αντίστοιχες σχέσεις υπάρχουν και για τα ρήματα, επίθετα και επιρήματα
Ιεραρχίες • Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας
Σχετικά Projects • σημασιολογικάδίκτυα: • σεάλλεςγλώσσες (εκτόςτωναγγλικών) • web interfaces: • πρόσβασημέσωάλλωνδικτύων • APIs: • σεόλεςσχεδόντιςγνωστέςγλώσσες (πχ: C#, Java, MySQL, Perl, PHP, PostgreSQL, Python, Ruby) • extentions: • επέκτασητωνχαρακτηριστικώντου ή ενσωμάτωσησεμεγαλύτερασυστήματα • mappings: • μεταξύδιαφορετικώνεκδόσεων
Μετρικές Σημασιολογικής Ομοιότητας • δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες • γνωστές μετρικές ομοιότητας: • Leacock-Chodorow Similarity • Wu-Palmer Similarity • Resnik Similarity • Jiang-Conrath Similarity • Lin Similarity
Wu-Palmer Similarity • Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους
Δικτυακοί Τόποι • WordNet official page: • http://wordnet.princeton.edu/ • WordNet Wikipedia page: • http://en.wikipedia.org/wiki/WordNet • WordNet visualization: • http://www.visuwords.com/ • WordNet vocabulary helper: • http://poets.notredame.ac.jp/cgi-bin/wn