Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg

Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg Datum: 01.07.2002

CXT verwendet „Support Vector Machines“... Machine Learning VerfahrenX Neuronale Netzwerke Genetische Algorithmen SUPPORT VECTOR MACHINES

Erstmals Thema 1992 auf der COLT-92 Praxisrelevante Forschung seit 1995 Findet Verwendung in folgenden Gebieten... • Biometrie (z.B. Gesichtserkennung) • Computerlinguistik (z.B. Textkategorisierung) • Allgemein gesprochen ... „Mustererkennung“ Ermöglicht das Lernen von Klassifizierungen Kombination von mehreren bekannten Konzepten

Eine Einführung in „Support Vector Machines“ SVMs & Chunking Praxis-Demonstration: „Proof of Concept“

w b x-b x Fand erste Anwendung im „Perceptron“ (1956)

Es existieren relativ einfache Algorithmen Algorithmen sind schnell und massendatentauglich Nur linear separable Klassen können gelernt werden Lösung ist nicht immer ideal

y x R R Hyperebene (Punkt) Gesucht ist also

SVM hängen ausschließlich von den Skalarproduktender Trainingsdaten ab Kernel-Funktion

Ein Beispiel für einen Kernel: Der Polynomial-Kernel

Polynomialer Kernel Radial Basis Function Kernel (RBF) Sigmoider Kernel

Nur linear separable Klassen können gelernt werden Lösung ist nicht immer ideal

+1 -1 w < 0 > 0

Berechnung der „wirklichen Breite“ 

Formalisierung der Trainingsdaten Nun ist folgendes zu erreichen: Minimiere: Unter der Bedingung, dass:

…diese Funktion Maximiere unter diesen Bedingungen

Für die Lösung gilt…

Die Trainingsdaten sind folgendermaßen aufgebaut vi Wort: wi-2 wi-1 wi wi+1 wi+2 POS: ti-2 ti-2 ti-2 ti-2 ti-2 yi z.B.: +1, wenn „wi ist Anfang einer NP“ Und -1, wenn „wi ist nicht Anf. einer NP“ Für die Trainingsdaten wurde der Negr@-Korpus (V2)verwendet. (ca. 10000 Sätze  ca. 170000 Wörter)

Was verursacht die Probleme beim Chunken? Es muss der „passende“ Kernel gefunden werden Es gilt, alle Parameter ideal zu wählen Der Algorithmus ist vergleichsweise langsamKomplexität: O(n2) bis O(n3)

IRChunker Output CSVM IRTagger CPoCDemo Die CSVM-Klasse ist aufgabenunabhängig.Möglichst allgemeine und effiziente Implementierung

Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg

Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg

Presentation Transcript

Get Motivated Seminars

Dental Seminar 2010

Financial Planning Seminar

USA Hockey Officiating Seminar

SEACEN Seminar on “INTERNAL AUDIT OF CENTRAL BANKS” Taipei, Taiwan, R.O.C. 14-17 September 2004

Seminar with Dr. Chaim Rosenthal 5/9/10

Special Regulations Seminar January 2009

USA Hockey Officiating Seminar

Seminar On Nanotechnology

Welcome to the CLU-IN Internet Seminar

Algorithmik

TEkNIK PRESENTASI UNTUK AKADEMIK (SEMINAR PROPOSAL, SEMINAR HASIL DAN UJIAN TESIS)

präsentiert:

VIM SEMINAR

CE240: Young Children With Special Needs Unit 7 Seminar

TQU präsentiert

The Lewis C. Richardson Seminar Room

Welcome to the CLU-IN Internet Seminar

SEMINAR

Algorithmik

Sections Officers Leadership Seminar

Beyond Budgeting: Leading with Flexible Targets. 2-day seminar