SPOC-Web Icon, semantic Knowledge Management

The Semantic Web for Everyone

Das semantische Web für Jedermann

Hier möchten wir uns etwas tiefer in das Kaninchenloch begeben.

Semantik ist die Theorie der (Wort-)Bedeutung und somit genau das fehlende Element bei der Suche mit Google oder bing. Die Ideen für das Semantische Web werden seit 1999 entwickelt und sind zu internationalen Standards des World-Wide-Web Consortiums gereift.

Tim Berners-Lee, der Erfinder des World Wide Web war nicht zufrieden mit dessen 'Oberflächlichkeit'. Er treibt seit Ende der 90er die "Semantic Web" Initiative, um die Web-Inhalte nicht nur Menschen, sondern auch Computern zugänglich zu machen. Dies wird es Computern ermöglichen, Menschen besser zu unterstützen. 

Semantik würde bei der Internet-Suche grundlegende Verbesserungen bringen, weil nicht nur Stichworte, sondern Zusammenhänge beschrieben werden könnten. 

Auch doppeldeutige Begriffe oder Homonyme (der Golf/das Golf-Spiel etc.) verschlechtern die Ergebnisse bisheriger Suchmachinen und könnten vermieden werden.

Das semantische Web ist ein aktives Forschungsgebiet und viele Wissenschaftler nähern sich ihm aus verschiedenen Richtungen.

Das Problem:

Das Problem besteht darin, dass Computer Web Pages oder Email nicht verstehen. 

Mit "Verstehen" ist nicht das reflektierte menschliche Verständnis für einen Zusammenhang gemeint, das es uns erlaubt, über etwas nachzudenken.

Semantik für Computer bedeutet, dass Sie Programme oder Steuerdaten korrekt verarbeiten.

Am nächsten kommen Computerprogramme, diesem Ziel, aber die werden von Programmieren in seltsamen Sprachen geschrieben wie 'Java' oder 'C'.

Das semantische Web definiert eine gemeinsame Sprache für Menschen und Computer: RDF (Resource Description Format).

Diese Sprache nutzt die Technologien des WWW und ist so minimalistisch, dass der Computer ggf. auch mit unvollständigen oder unscharfen Daten arbeiten kann.

Aktuell wird RDF vor allem in der Selbst-Beschreibung von Web-Seiten für Suchmaschinen eingesetzt.

Ein weiterer Trend ist die Open Data Initiative, im Rahmen derer Behörden, Forschungseinrichtungen und auch die Wikipedia ihre Daten in RDF veröffentlichen und untereinander vernetzen.

Wie James Hendler bemerkt:

Ein bisschen Semantik reicht schon sehr weit

 

Wie ist der aktuelle Stand?

Das semantische Web wurde anfänglich überschwänglich begrüßt, aber das hat inzwischen nachgelassen.

Nichtsdestotrotz werden seine Kern-Technologien erfolgreich eingesetzt bei Wikipedia, Google und durch Web-Entwickler, meist zur Verbesserung der Suchergebnisse.

Spoc-Web verwendet ebenfalls diese internationalen W3C Standards und kann unter Anderem so auf den mächtigen Wissenspool von Wikipedia zugreifen. Nicht nur das, Spoc-Web kann jede Web-Seite und ganze Sites zerlegen und dessen Teile zur Weiterbearbeitung speichern.

 

Die Zutaten: Dinge, Werte, Eigenschaften und Beziehungen

Dinge = URIs

Jedes Ding hat eine eigene Identität und die erhält es durch einen eindeutigen Namen. Im semantischen Web wird dies durch eine sogenannte URI ausgedrückt. Die wohlbekannten Browser-Adressen (URLs) sind auch URIs. Der einzige Unterschied besteht in der Konvention, dass man mit URLs etwas aus den Internet herunterladen kann, wenn man sie in einen Browser eingibt; bei URIs ist das nicht notwendig.

URIs sind weltweit eindeutig, deshalb können Sie URIs benutzen, um beliebige reale oder abstrakte Dinge zu benennen.

Da diese URIs ziemlich lang werden können, verwendet Spoc-Web zur Darstellung den von Ihnen eingegebenen Namen.

Dieser Name kann für jede Sprache anders lauten, es wird jeweils die vom Benutzer gewünschte Sprache verwendet.

Werte = Text, Zahlen oder Zeitpunkte

Im Unterschied zu Objekten haben Werte keine Identität. Wenn dieselben Werte mehrmals aufkommen, werden sie einfach wiederholt. Das gleichzeitige Auftreten wird als eher zufällig angesehen.

In Spoc-Web gibt es drei Sorten von Werten:

  • Zahlen: diese können alles ausdrücken: das Gewicht, Länge, Höhe oder geographischer Ort des Dings.
  • Datum und Uhrzeit: z.B. das Datum an dem das Ding erschaffen oder zerstört wurde.
  • Text: neben dem Ding-Namen sind beliebig viele weitere Eigenschaften durch Text beschreibbar. Text-Eigenschaften sind sprachabhängig, damit die Dinge zwischen Spoc-Web Datenbanken weltweit ausgetauscht und wiederverwendet werden können.

Allerdings gibt es Namen, d.h. Text-Werte, die einen Verweis auf Dinge darstellen. Diese Verweise werden oft in Objekte umgewandelt, sobald weitere Eigenschaften angelegt werden müssen. Diesen Vorgang nennt man "Reifizierung".

Prädikate = Arten von Eigenschaften

Dinge wollen mit Eigenschaften versehen werden, mit denen man sie beschreiben kann.

Dazu werden Prädikate verwendet. Prädikate sind Mengen von Eigenschaften mit gleicher Bedeutung wie "Höhe", "Gewicht", "Farbe" oder "Vorname". Spoc-Web definiert bereits ca. 500 Prädikate, die Sie verwenden sollten, um Ihre Daten ggf. mit anderen Nutzern auszutauschen.

Aber darüber hinaus können Sie nach Belieben neue Prädikate anlegen und sie anwenden wo Sie wollen.

Relationen = Arten von Beziehungen