Ontologische Anpassung
Nachdem im vorangegangenen Kapitel Daten aufgespürt und strukturiert wurden, müssen die herausgefilterten Informationen in eine für Vermittler verständliche und vergleichbare Form gebracht werden.
Dazu sind unterschiedliche Formulierungen, die Gleiches ausdrücken, zu erkennen und auf ein Oberformat zu bringen. Beispielsweise sollten sprachlich und orthographisch voneinander abweichende Begriffe, die Gleiches ausdrücken, vereinheitlicht werden. „House“ als Oberkonzept von Musikstilen besitzt u.a. die Synonyme und Unterkonzepte „Chicago“, „Dub“, „Europop“, „Funk“ oder „Eurodance“ [Ishkur06].
Andererseits muss ein Begriff, welcher in unterschiedliche Bedeutung verwendet wird, im jeweiligen Kontext der Quelle auf seinen Sinn untersucht werden. So kann der Begriff „Blume“ als eine Krautpflanze mit auffälligem Blütenstand gemeint sein, jedoch auch der Schaum auf dem Bierglas. Duft und Aroma von Weinen sowie das bei Pferden auftretende weiße Zeichen auf deren Stirn bezeichnet man ebenso als „Blume“. [Brockhaus99] nennt zusätzlich die weiße Schwanzspitze von Hasen, Wildkaninchen, Fuchs und Wolf als „Blume“, sowie „Friedrich B. Blume“ (1893 – 1975), welcher als Musikforscher arbeitete.
In dieser Phase der Datenintegration wird versucht, zunächst Terme auf ihre Grund- bzw. Stammform zu reduzieren. Dies beinhaltet die Ersetzung von Umlauten, Akzentuierungen und Sonderzeichen. Wortverbünde werden in einzelne Token aufgespaltet, Abkürzungen aufgelöst. Die Bedeutung einzelner Terme wird durch Ontologien erkannt und gegebenenfalls zu Subkonzepten zusammengefasst, von Synonymen und Homonymen bereinigt und somit in den Zusammenhang der gegebenen Wissensbase eingefügt.