Implementierung

Vergleicht man die Einleitung dieser Arbeit mit dem Wissen der vorangegangenen drei Kapitel, so sind ganz klar Parallelen zwischen Real-World-Beispiel und dem technischen Ansatz erkennbar. Die Definition des vorgestellten Vermittler wird durch folgende Definition [Gamma94] gänzlich abstrahiert:

Mediator - definiert ein Objekt, welches die Interaktion einer Menge von Objekten kapselt. Mediatoren ermöglichen eine loose Kopplung, indem Objekte vom expliziten verlinken aufeinander abgehalten werden und es ermöglicht die unabhängige Veränderung ihrer Interaktion.

Xcerpt liefert im aktuellen Zustand eine konjungierte Liste mit Veranstaltungen, welche von mehreren Quellen bezogen wurden. Diese treten jedoch inhaltlich ungleichmäßig auf und enthalten duplizierte Ergebnise mit ähnlichen Schreibweisen. Im folgenden Kapitel werden in den Kapiteln 3 und 4 vorgestellte Ansätze auf die Einbindung in Xcerpts Abarbeitung untersucht.

Unterkapitel

Vorbetrachtung
Das durch Xcerpt vorgestellte patternbasierte Prinzip erlaubt es, Inhalte einfach aus Web-Dokumenten mit einer Toleranz in Breite und Tiefe zu entnehmen.
Umsetzung
Auf Grundlage der identifizierten Anforderungen kann folgende Verteilung der anstehenden Teilaufgaben erstellt werden
Inhaltsintegration
Die Inhaltsintegration stellt eine Auswertung und Verlinkung des syntaktisch und ontologisch aufgewerteten Datenbestandes dar. Die vorgestellten mathematisch-statistisch aufwendigen Rechnungen laufen in sich geschlossen ab, die Bestandteile der Analyse unterliegt keinen Änderungen.
Clustering
Dem Grouping wird eine Sammlung an Datensätzen übergeben, welche sortiert und entsprechend in Gruppen klassifiziert zurückgeliefert werden muss. Auf diese Sammlung kann zum ersten Mal der gesamte Inhaltsintegrations-Ablauf angewendet werden, von Suchraumbestimmung
top