Deutsch

Network your information – Wahres Wissen gehört vernetzt! (1/3)

Was sind eigentlich Ontologien oder semantische Netze und wem nützen sie?

PROVIDE
Network your information – Wahres Wissen gehört vernetzt! (1/3)

In dieser dreiteiligen Blog-Serie möchte ich veranschaulichen, welche Rolle Wissensnetze bei Informationskonzepten spielen können. In diesem ersten Teil will ich kurz die Begriffe und Hintergründe sortieren, bevor ich in den nächsten Teilen einen Blick auf die Einsatzmöglichkeiten und Perspektiven werfe, die sich ergeben.

Ontologie? Das ist doch ein Feld der Philosophie! Nun denn: „Warum ist überhaupt Seiendes und nicht vielmehr Nichts?“ – zweifellos eine spannende Frage, die Martin Heidegger aufwarf. Aber auch wenn technologienahe Themen gerne mal philosophisch diskutiert werden, geht es beim Informationsmanagement eher um Ontologie, wie die Informatiker sie verstehen. Im Grundsatz geht es für uns also um die Frage, wie Wissen formell dargestellt, visualisiert und abgefragt werden kann. Semantische Netze oder auch Wissensnetze sind eine Möglichkeit. Aber worin besteht überhaupt das Problem?

Menschliches Wissen ist komplex. Zunächst kennen wir feste Begriffe und können ihnen eine Bedeutung zuordnen: Beispielsweise assoziiert die Mehrheit mit dem Begriff „Hund“ einen Haushund und hat nun irgendwas zwischen Chihuahua und Deutscher Dogge vor dem geistigen Auge. Schon alleine diese Assoziation ist eine Frage des Kontextes, in diesem Fall der Summe unserer persönlichen Erfahrungen. Ein Computer mit Zugriff auf das gesamte Weltwissen wäre alleine mit dem Begriff „Hund“ und unserer gewünschten Assoziation nahezu überfordert. Biologisch gesehen sind Hunde eine Familie innerhalb der Hundeartigen mit über zehn Gattungen und insgesamt über 30 Arten. Dass wir unter „Hund“ die domestizierte Unterart der Art des Canis lupus (Wolf) verstehen und jeder Einzelne von uns ggf. auch noch nur eine bestimmte Zuchtform vor Augen hat … Wie soll ein Computer so etwas erahnen? Durch Nutzungsstatistiken und Machine Learning haben Algorithmen wie die von Google inzwischen gelernt, dass wir mit „Hund“ in der Regel den Haushund meinen. Kann auf diesem Wege aber wirkliches Wissen digital abgebildet werden?

Das kann es nicht. Wir kennen nicht nur Begriffe und ihre Bedeutung, sondern setzen die Begriffe auch in Beziehungen und Kontexte. So bilden wir im Kopf Wissensnetze zu verschiedensten Themengebieten. Je spezifischer diese Wissensnetze werden und je weniger Menschen sich damit befassen, desto schwerer wird es für Algorithmen, die Beziehungen zu finden, die wir später bei der Recherche erwarten. Es gäbe für diese Fälle sehr wahrscheinlich zu wenige Nutzungsdaten, als dass ein Algorithmus richtige Rückschlüsse ziehen könnte.

Wird ein Kunst-Enthusiast auf den „Garten in Sainte-Adresse“ angesprochen, ist Vieles, was er über dieses Gemälde weiß, über die Beziehungen zu anderen Begriffen definiert:

Das Gemälde „Garten in Sainte-Adresse“

  • … wurde gemalt von Claude Monet
  • … stammt aus dem Jahr 1867
  • … ist eine Ölmalerei
  • … wird dem Impressionismus zugerechnet
  • … ist derzeit ausgestellt im Metropolitan Museum of Art in New York

Hier lassen sich noch viele weitere Beziehungen, neue Begriffe und hierzu wieder neue Beziehungen finden; letztlich entstünde ein beeindruckendes Wissensnetz der Malerei oder gar der gesamten Kunstwelt. Die Beziehungen der einzelnen Begriffe ohne menschliche Hilfe zu identifizieren, wäre für einen Algorithmus extrem schwierig.

In dieser Weise Wissen über Begriffe und Beziehungen strukturiert zu digitalisieren, war im Prinzip schon das Ziel hinter der Idee des Semantischen Web. Mit dem Resource Description Framework (RDF) und auch eleganter über aktuelle Softwareprodukte lassen sich heute umfangreiche Wissensnetze weben. Wie aufwändig es wird, solche Wissensnetze zu erstellen, hängt von vielen Faktoren wie beispielsweise den angestrebten Use Cases und den Ausgangsdaten ab.

Die Idee und die Technologien sind zwar nicht besonders neu, aber mit den exponentiell wachsenden Informations- und Datenmengen brauchen wir mehr denn je intelligente Suchmöglichkeiten. Wer nach Beispielen sucht, wo semantische Netze bereits eingesetzt werden, findet sie an vielen Stellen. Die Wikimedia Stiftung lässt zum Beispiel die Quelldaten für Wikipedia-Beiträge in Wikidata verwalten – auch als Wissensnetze. Dort findet sich auch das obige Beispiel vom Garten in Sainte-Adresse als Dateneintrag samt Beziehungen zu anderen Begriffen. Solche Daten werden natürlich erst richtig spannend, wenn man die Möglichkeiten sieht, die sich daraus ergeben: Wie wäre es beispielsweise mit der grafischen Darstellung aller Nachkommen von Dschingis Khan, dem Begründers des Mongolischen Reichs? Weitere grafische und nicht grafische Beispiele finden Sie hier.

Im zweiten Teil dieser Blog-Serie möchten wir analysieren, welches Potential Wissensnetze für andere Arten von Informationen spielen können und wie beispielsweise Use Cases für Service- und Nutzerinformationen aussehen können.

 

Sie möchten die weiteren Teile der Beitragsreihe "Wissensnetze" nicht verpassen? Dann melden Sie sich zu unserem Newsletter an.

Christopher Rechtien
Autor:
Blog post Christopher Rechtien