Wednesday, March 10, 2010

SemanticBlog

all about web innovation

Archive for Februar, 2009

Triplify im Praxistest mit Wordpress 2.7.1

Posted by admin On Februar - 28 - 2009

Triplify ist ein kleine aber feine Software, die als Enabler zur Semantifizierung von CMS-, Shopsystem- beziehungsweise Bloginhalten verwendet werden kann. Besonders einfach ist die Handhabung der Applikation. Triplify findet sich bei Sourceforge in der Version 0.4.

Nach Download und Entpackung wird ein Ordner names ./triplify im root-Verzeichnis des Webservers erstellt. Daraufhin werden alle PHP-Skripte in dieses Verzeichnis kopiert. Es findet sich dort ein Ordner names ‘Cache’, dem Lese-und Schreibrechte gegeben werden.
Um Triplify zu konfigurieren ist es erforderlich die entsprechende Wordpress-Konfigurationsdatei aus einem Webformular zu kopieren, in Textpad zu pasten, abzuspeichern und die originäre config.inc.php auf dem Server zu ersetzen.

Dabei ist die Verwendung des richtigen Zeichensatzes beachtenswert, da ansonsten später eine bekannte Fehlermeldung namens (“headers already sent by”) auftreten kann. Falls jemand diese Fehlermeldung erhält, lohnt es sich die Erläuterungen bei Tippscout durchzulesen. Das wars im Prinzip auch schon. Fertig…. Nur noch die URL http://www.meinservername.xy/triplify/ aufrufen. Es wird nun über Datenbankabfragen eine Datei names triplify (im xml+n3 Format) erzeugt und die entsprechenden Daten an die Registry unter http://triplify.org/Registry gesendet. Die Ergebnisse können unter http://triplify.org/Registry eingesehen werden. Die Daten werden mit Exhibit aufbereitet. Sich die Ergebisse anzusehen ist hilfreich, um zu verstehen was triplify effektiv macht. Der Inhalt eines Blog kann nachdem seine Daten semantifiziert wurden nach folgenden Kriterien (um nur die Wichtigsten zu nennen) selektiert und durchsucht werden:

  • abstract
  • accountName
  • comment_type
  • content
  • created
  • description
  • description
  • family_name
  • firstName
  • format
  • has_attachment
  • homepage
  • modified
  • reply_of

Die Parametrisierung der config.inc.php ist ebenfalls möglich. So lassen sich beispielsweise unerwünschte SQL-Abfragen auskommentieren beziehungsweise die Linktiefe anpassen, falls geplant ist, eine sehr große Datenmenge zu verarbeiten.


/* Linked Data Depth
*
* Specify on which URI level to expose the data - possible values are:
* - Use 0 or ommit to expose all available content on the highest level
* all content will be exposed when /triplify/ is accessed on your server
* this configuration is recommended for small to medium websites.
* - Use 1 to publish only links to the classes on the highest level and all
* content will be exposed when for example /triplify/user/ is accessed.
* - Use 2 to publish only links on highest and classes level and all
* content will be exposed on the instance level, e.g. when /triplify/user/1/
* is accessed.
*/
$triplify['LinkedDataDepth']='0';

Als Ausgabedatenformat ist RDF oder JSON möglich. Die Daten werden, bei erfolgter Registrierung, unter der URL http://pingthesemanticweb.com/ veröffentlicht, was je nach Anzahl der Teilnehmer zu einem immer dichter werdenden Netz verlinkter Daten führen kann (wird?).

Das Semantic Web

Posted by admin On Februar - 27 - 2009

Das Problem der semantischen Interpretierbarkeit des World Wide Webs beschäftigt
zahlreiche Wissenschaftler aus den Gebieten der Datenbanktechnik,
der künstlichen Intelligenz und der Bibliotheks- beziehungsweise Informationswissenschaft.
Tim Berners-Lee, der Erfinder des World Wide Web, hat den
Term „Semantic Web“ geprägt. Gemäß seiner Vorstellung ist die Zukunft des
heutigen „Web der Links“ ein „Web der Bedeutung“. Große Bekanntheit
erreichte der Artikel The Semantic Web von Tim Berners-Lee, James Hendler
und Ora Lassila mit der erstmaligen Definition ihrer Vision:

The Semantic Web is not a separate Web but an extension of the current one, in which
information is given well defined meaning, better enabling computers and people to work in
cooperation.

Die Idee ist, Informationen im Internet nicht nur darzustellen, sondern sie
so zu strukturieren, dass nicht nur Menschen, sondern auch Maschinen sie
’verstehen’ können.
Das Semantic Web ist folglich eine Erweiterung des bestehenden World
Wide Web mit maschinenlesbaren Daten. Sollte diese Idee auf eine breite
Akzeptanz stoßen und ähnliche Wachstumsraten erleben wie das World Wide
Web seinerzeit, könnten Interoperabilität und Integration zwischen Systemen
und Anwendungen beflügelt werden.

Ob dieses Ziel je erreicht werden wird, ist gegenwärtig fraglich. Die Technologie
ist zwar langsam ausgereift, doch es mangelt an Killer-Applikationen.
Falls die Benutzeranzahl von semantischen Anwendungen keine kritische
Masse überschreitet, könnte dem Semantic Web das Schicksal zuteil werden,
dem akademischen Umfeld nicht zu entwachsen.

Es tritt wieder die Frage in den Vordergrund, durch welche Methoden des
Semantic Web die im vorhergehenden Abschnitt dargestellten Probleme der
semantischen Repräsentation von Inhalten im Internet gelöst werden sollen.
Im Ansatz des semantischen Webs werden keine Systeme mit künstlicher
Intelligenz entwickelt, die versuchen die menschliche Intelligenz und Problemlösungsfähigkeit
nachzubilden. Vielmehr soll die bereits existierende Struktur des World Wide Web erweitert werden.

Die Augmentation von HTML durch Wissensrepräsentationssprachen
führt dazu, dass diese Dokumente nicht länger nur Formatierungsinformationen
enthalten, sondern auch Informationen über ihren Inhalt und
dessen Bedeutung. Die daraus resultierenden Informationen können wieder
miteinander verknüpft werden, was schließlich zu einer semantischen
Repräsentation des Inhalts des gesamten World Wide Web führen soll.
Diese Verknüpfungen sind nicht auf Textdokumente beschränkt. Multimediale
Objekte (zum Beispiel Fotografien), auf die in Hypertextdokumenten
verwiesen wird oder die in Hypertextdokumenten eingebettet sind, können
mit denselben Mechanismen integriert und beschrieben werden.
Die nachfolgende Abbildung zeigt das layer-cake-Modell eben erwähnter Wissensrepräsentationssprachen.

Das Layer Cake Modell des Semantic Web

Das Layer Cake Modell des Semantic Web

Sie beschreibt die wichtigsten Schichten des Designs
des Semantic Web. Das Fundament des Semantic Web wird auf der untersten
Ebene des „Layer-Cake“-Modells durch XML gebildet. XML ist eine Sprache
zur Erzeugung von strukturierten Dokumenten, die von Menschen lesbar
sind. Diese Dokumente können durch ein benutzerdefiniertes Vokabular
ausgezeichnet werden. XML hat mittlerweile, vor allem im ökonomischen
Bereich, einen festen Platz bei der Datenkommunikation im Internet erlangt.
RDF bildet das grundlegende syntaktische Datenmodell des semantischen
Netzes. Um einen Vergleich zu ziehen, könnte RDF als das aus dem
Gebiet der Datenbanken stammende entity-relationship-Modell des Semantic
Web bezeichnet werden.

Es ermöglicht die Angabe von einfachen Aussagen über Objekte oder
Ressourcen des World Wide Web. Das Datenmodell von RDF basiert nicht auf
XML, aber RDF hat auch eine XML-basierte Syntax. Aus diesem Grunde ist
es in der Abbildung oberhalb von XML vorzufinden.

RDF Schema bietet einfache Möglichkeiten zur hierarchischen Organisation
von Objekten des World Wide Web an. Äquivalent zu vielen modernen,
objektorientierten Programmiersprachen (zum Beispiel Smalltalk, Java und
C++) enthält es Klassen und Eigenschaften. Weiterhin ermöglicht es Vererbung
in Form von Subklassen, Subeigenschaften sowie Restriktionen bezüglich
Wertebereichen und Domänen. Die Grundlage von RDF Schema wird
durch RDF gebildet. Insgesamt kann RDF Schema als eine simple Sprache
zur Erzeugung von Ontologien betrachtet werden.
Je nach Anwendungsfall besteht das Bedürfnis nach einer mächtigeren
Sprache zur Generierung von Ontologien, welche RDF Schema erweitern
und Repräsentationen mit komplexeren Beziehungen zwischen Objekten
des World Wide Web erlauben. Ein Beispiel hierfür ist die Web Ontology Language.

Die Logikschicht erweitert Ontologiesprachen und erlaubt die Bildung
von deklarativem applikationsspezifischem Wissen.

Die proof -Schicht führt sowohl deduktive Prozesse als auch die Repräsentation
von Beweisen durch Sprachen des semantischen Netzes (aus den
darunter liegenden Schichten) ein und kann zur Validierung von Beweisen
benutzt werden.

An der Spitze der Pyramide findet sich die Vertrauensschicht. Vertrauen
ist ein zentrales Konzept des semantischen Webs: Es wird sein Potential erst
dann voll ausschöpfen können, wenn die Benutzer seinen Operationen Vertrauen entgegenbringen.
Damit wird auf deren Sicherheit und die Qualität der bereitgestellten Informationen Bezug genommen.

An dieser Stelle der Zusammenhang zwischen Metadaten und dem semantischen Web wichtig.
Der Schlüsselaspekt hinter der Realisierung des Semantischen Webs ist
nach Nagarajan die Bereitstellung von Metadaten und deren Assoziation
mit Ressourcen des World Wide Web. Der Prozess Metadaten mit Ressourcen,
zum Beispiel Fotografien und Webseiten oder [un]-strukturierter Text mit
Fotografien, zu verknüpfen, wird Annotation genannt. Semantische Annotation
bezeichnet dabei den Vorgang, Ressourcen mit semantischen Metadaten
auszuzeichnen.

Semantische Annotation kann entweder durch formale oder nicht formale
Methoden erfolgen. Formale semantische Annotation basiert, im Gegensatz
zur nicht formalen Beschreibung, auf konzeptuellen Modellen, die mittels
wohlgeformter Wissensrepräsentationssprachen ausgedrückt werden.

Tim Berners Lee on the Semantic Web

Posted by Christian On Februar - 26 - 2009

Tim Berners Lee über das Semantic Web

YouTube Preview Image

The Future of Information Retrieval Part 2

Posted by Christian On Februar - 26 - 2009

Interviews with prominent experts in the field of information retrieval, internet search and text mining. Interviewer: Peter Kawinek
www.matrixware.com

The Future of Information Retrieval Part 1

Posted by Christian On Februar - 26 - 2009

YouTube Preview Image
Interviews with prominent experts in the field of information retrieval, internet search and text mining. Interviewer: Peter Kawinek
www.matrixware.com

Search, Google, and Life: Sergey Brin – Google

Posted by admin On Februar - 26 - 2009
YouTube Preview Image

Intro to the Semantic Web

Posted by admin On Februar - 26 - 2009

Die SPARQL Protocol And RDF Query Language

Posted by admin On Februar - 26 - 2009

Jedes RDF-Modell kann als gerichtetes, beschriftetes Graphen-Datenformat
zur Informationsrepräsentation im Web aufgefasst werden. SPARQL (SPARQL
Protocol and RDF Query Language) ist eine Empfehlung des W3C und
beinhaltet ein Protokoll und eine Anfragesprache, um auf standardisierte
Weise auf in RDF vorliegende Informationen zuzugreifen. Die Spezifikation
definiert die Syntax und Semantik der SPARQL-Abfragesprache für RDF.
Die Syntax weist größere Ähnlichkeiten zur Structured Query Language der
Datenbankwelt auf als zu XML-basierten Abfragesprachen. Durch die Angabe
von Suchmustern werden im Verlauf der Suche entweder Graphen oder
RDF-Tripel ermittelt und dem Benutzer als Ergebnis präsentiert.

Es wird erwartet, dass die SPARQL-Spezifikationen einen signifikanten
Einfluss auf die Interoperabilität der Anwendungen auf dem Gebiet des
semantischen Webs haben werden. Ein entscheidender Faktor hierbei ist,
dass Inhalte nicht auf RDF beruhender Datenbanksysteme ebenfalls durch
die SPARQL-Schnittstelle abgefragt werden können. Das Semantische Web
könnte demnach schnell mit den ’alten’ Inhalten des bestehenden Webs
gefüllt werden, wobei der Prozess der Anbindung relationaler Datenbanken
(engl. database wrapping) zwar teilweise, aber nicht vollständig automatisiert
werden kann.

SPARQL ist ein Versuch, eine Reihe von bereits existierenden RDF-Abfragesprachen
durch einen umfassenden allgemein akzeptierten Standard
zu ersetzen (zum Beispiel RQL, RDQL beziehungsweise RDF-Query).

Für die Angabe von RDF-Tripel wird oftmals die N3-Notation verwendet, welche wesentlich
kompakter und besser lesbar ist als die RDF/XML-Syntax. In dieser Notation
wird ein Tripel als Sequenz von Termen (gefolgt von einem Punkt) geschrieben.
Die Schreibweise für einen leeren Knoten ist _:a, wobei a der Namensraum des Knotens ist.

Die Präfixe zu Beginn einer Definition sind syntaktische
Abkürzungen und dienen im Wesentlichen demselben Zweck wie die
Definitionen von XML-Namensräumen. Abfragen werden in der SPARQL
durch Angabe eines Abfragemusters definiert.

Abgesehen von Inferenzprozessen erlauben sämtliche Abfragesprachen, die
bislang für das Semantic Web entwickelt wurden zwar präzises data retrieval,
aber kein information retrieval. So existieren keine Verfahren um die Abfrageergebnisse
in eine Rangfolge, gemäß ihrer Signifikanz, einzuordnen. Dieser Punkt bedarf weiterer zukünftiger Untersuchungen.

Wissensabfrage

Posted by admin On Februar - 26 - 2009

Es gibt unterschiedliche Wege, Wissensbasen durch Methoden oder Sprachen des Semantic Web
aufzubauen. In diesem Artikel wird untersucht, welche allgemeinen
Eigenschaften die Wissensrepräsentationsmodelle im Kontext des Semantic
Web aufweisen. Darüber hinaus werden Beispiele der Benutzung von
SPARQL als eine Methode der Wissensabfrage vorgestellt.

Eigenschaften von ’Wissen’ im Kontext des semantischen Netzes
In diesem Abschnitt wird auf die Eigenschaften von ’Wissen’, welches durch
Konstrukte des semantischen Webs repräsentiert wird Bezug genommen.
Walton nennt sechs unterschiedliche Merkmale dieses ’Wissens’:

1. „Wissen ist eher netzwerkartig strukturiert, als relational. Eine Tabelle
einer Datenbank besteht aus Mengen logischer Relationen. Abfragen
innerhalb einer Datenbank umfassen ein oder mehrere Tabellen, unter
Verwendung von Operationen auf diese Mengen. Im Kontrast dazu
steht eine RDF-Wissensbasis. Sie ist durch ein semantisches Netzwerk
von Ressourcen festgelegt.“

2. „Eine Wissensbasis ist im Allgemeinen weniger strukturiert als eine
Datenbank. Fehlende Informationen oder Inkonsistenzen des Wissens
können auftreten. Wenn mehrere Wissensbasen bei einer Abfrage beteiligt
sind, können Teile des Wissens nicht verfügbar werden. So kann
das Wissen, welches von einer Abfrage ermittelt wird, nur eine Teilmenge
des insgesamt vorhandenen Wissens sein. Die Größe der Rückgabemenge
und die Zeit, die für eine Abfrage benötigt wird, ist dann
nicht vorhersagbar.“

3. „Wissen kann entweder bereits in einer Wissensbasis vorhanden sein,
oder geschlussfolgert werden. Falls jedoch der Inferenzprozess zum
Beispiel eine dynamische Kombination unterschiedlicher RDF-Quellen
oder ein RSS-News-Feed mit einschließt, können Abfragen zu unterschiedlichen
Zeitpunkten unterschiedliche Ergebnisse hervorrufen.
Sollte eine dieser Quellen nicht verfügbar sein, würde unter Umständen
kein Ergebnis zurückgegeben werden.“

4. „Wissen kann durch unterschiedliche syntaktische Formen repräsentiert
werden, selbst wenn ’nur’ RDF zum Einsatz kommt. Zum Beispiel
kann RDF sowohl ein RDFS-Vokabular repräsentieren als auch eine
OWL-Ontologie. In diesem Fall müssen die Abfragen an die Struktur
der zugrunde liegenden Wissensrepräsentation angepasst werden.“

5. „Es kann der Fall eintreten, dass Abfragen keine Spezifikationen derjenigen
Wissensbasen enthalten, auf die sie angewendet werden. In
vielen Fällen ist die Wissensbasis, die letztendlich abgefragt wird, unbekannt.
Hier besteht eine Analogie zur ’gewöhnlichen’ Suche im World
Wide Web, wobei oftmals nicht im Voraus bekannt ist, welche Webseiten
von Suchmaschinen als geeignet erachtet werden. Ein Ausweg aus
dieser Situation kann dadurch gefunden werden, sich auf Dienste zu
verlassen, die geeignete Wissensbasen für eine spezifische Suchanfrage
zur Auswahl stellen.“

6. „Datenbanken verwenden das Modell einer abgeschlossenen Welt; das
heißt, alles was nicht explizit definiert ist, wird als falsch angenommen.
Im Gegensatz dazu obliegt dem semantischen Web eine open-world assumption:
Alle Dinge die falsch sind, müssen explizit definiert werden,
oder sie bleiben nicht festgelegt. Die Domäne einer Datenbank wird immer
als abgeschlossen angesehen, während diejenige des semantischen
Webs unendlich sein kann.“

OWL

Posted by admin On Februar - 26 - 2009

Die Möglichkeiten bei RDFS, RDF-Vokabularien zu definieren, sind bezüglich
deren Ausdrucksstärke eingeschränkt. Das war eine bewußte Entscheidung
beim Design von RDFS. Die Sprache sollte einfach und verständlich
sein. Die OWL hingegen ist eine Sprache zur Beschreibung von Ontologien
und somit ausdrucksstärker als RDFS. Durch die OWL können, wie
bei RDFS, RDF-Wissensbasen eingebunden werden. Die Sprache ist eine
Erweiterung von RDFS mit einer größeren Anzahl an Funktionalitäten, um
Klassenhierarchien und Eigenschaftsbeschränkungen zu definieren.

Dazu zählen Relationen zwischen Klassen, Kardinalität (zum Beispiel
„exakt eins”), Gleichheit, ausgeprägtere Möglichkeiten der Typisierung von
Eigenschaften und Eigenschaftscharakteristika (zum Beispiel Symmetrie).
Um Kompromisse zwischen Ausdrucksstärke und effizientem Schließens
zu ermöglichen, wurde OWL in drei Sprachen untergliedert. Diese drei
Sprachen weisen unterschiedliche Charakteristika auf:

1. OWL-Lite ist eine eingeschränkte Form der OWL. Sie ist dafür optimiert,
leicht verständlich und einfach implementierbar zu sein. Bei
OWL-Lite werden disjunkte Ausdrücke ausgeschlossen. Kardinalitätsbeschränkungen
werden zwar unterstützt, jedoch sind nur die Werte
0 und 1 erlaubt. Der Nachteil des ’schlichten’ Designs von OWL-Lite
sind Einschränkungen in der Ausdrucksstärke.

2. Die OWL-DL enthält alle Spracheigenschaften von OWL-Full, die jedoch
teilweise in ihrer Verwendung eingeschränkt sind. OWL-DL ist
für Benutzer ausgerichtet, die maximale Ausdrucksstärke benötigen
und gleichzeitig auf Berechenbarkeit (alle Schlüsse sind garantiert berechenbar)
und Entscheidbarkeit (alle Berechnungen terminieren in
endlicher Zeit) angewiesen sind.

3. OWL-Full unterstützt alle Sprachmerkmale der OWL und erlaubt
eine willkürliche Kombination dieser Merkmale mit RDF und RDFS.
Das heißt jedoch: Die Flexibilität hat ihren Preis, der auf Kosten der
Entscheidbarkeit von Schlüssen geht.

Der Ausdruck „DL“ in OWL-DL steht für Beschreibungslogiken. Diese
bilden die formale Grundlage für OWL. Beschreibungslogiken sind einer
Familie von Sprachen zugehörig, die zur Wissensrepräsentation benutzt
werden können. Ihr Ursprung liegt in auf Frames basierten Systemen zur
Wissensrepräsentation. Der Begriff wurde ursprünglich von Marvin Minsky
eingeführt.

Ein Frame ist eine Struktur zur Repräsentation eines Konzepts oder einer
Situation. Frames können mit unterschiedlichen Arten von Information belegt
werden. Hierzu zählen zum Beispiel Informationen zur Definition, Beschreibung
und Benutzung des Frames. Die Beschreibungslogiken sind wichtige
Abkömmlinge framebasierter Repräsentationsformalismen, die den deklarativen
Anteil von Frames unter Benutzung einer logikbasierten Semantik
übernommen haben. Da sie auf Teilen der Prädikatenlogik erster Ordnung
basieren und entscheidbar sind, können über sie Schlussfolgerungen getroffen
werden (das heißt aus bereits präsentem Wissen kann Neues gewonnen
werden). In Beschreibungslogiken ist es möglich, eine Konzepthierarchie
aus atomaren Konzepten und Attributen zu erstellen. Die Attribute werden
dabei für gewöhnlich Rollen genannt. Die beabsichtige Bedeutung von
atomaren Konzepten kann durch andere Konzepte und Rollenrestriktionen
festgelegt werden.

Ein einfaches Beispiel hierfür:

Frau = Person und weibliches Wesen
Elternteil = Person mit einem Kind
Großmutter = Frau mit einem Kind, die Elternteil ist.

Eine der wichtigsten Aufgaben des Schlussfolgerns in diesem Zusammenhang
ist die Frage, ob alle Instanzen eines Konzepts notwendigerweise auch
Instanzen des anderen Konzepts sind. Eine Antwort auf diese Frage soll
unter Berücksichtigung aller Definitionen gefunden werden. So wird zum
Beispiel die „Großmutter“ als „Elternteil“ klassifiziert, weil jede „Großmutter“
per Definition gleichzeitig auch „Elternteil“ ist. Ähnlich zur Aufgabe
der Klassifizierung ist die Aufgabe der Überprüfung von Instanzen. Hierbei
wird die Antwort auf die Frage ermittelt, ob ein gegebenes Objekt eine Instanz
des vorher spezifizierten Konzepts ist. Beschreibungslogiken haben,
wie ersichtlich wird, auch Ähnlichkeiten zu objektorientierten Konzepten in
Programmiersprachen.

Internet Semantic Web Web 3.0

Verfasst von Christian
Dez-27-2009 I View Comments

Yahoo pipes: My semantic web pipe

Verfasst von Christian
Nov-2-2009 I View Comments

Backlink Visualisierung

Verfasst von Christian
Nov-1-2009 I View Comments

Semantic Web für Unternehmen

Verfasst von Christian
Sep-26-2009 I View Comments

Blogverzeichnis - Blog Verzeichnis bloggerei.de   Blogverzeichnis   Blog and ping   Blog Top Liste - by TopBlogs.de   Bloggeramt.de   Blog Directory   powered by rankingcloud   Internet Multimedia blogs & blog posts  
blog search directory   Blogverzeichnis   Blog Directory   Blog Verzeichnis   Blog Directory   Technology Blogs - Blog Rankings   blogoscoop  

Clicky