Friday, September 10, 2010

SemanticBlog

all about web innovation

Yahoo pipes: My semantic web pipe

Posted by Christian On November - 2 - 2009

Nachdem ich festgestellt hatte, dass dieser Blog desöfteren über yahoo gepiped wird, habe ich mir selbst eine kleine Demoanwendung zusammengebaut, welche die Möglichkeiten von Yahoo Pipes demonstriert:http://pipes.yahoo.com/dataminingsemanticweb.
Die Anwendung integriert zur Zeit ca. 60 RSS-Feeds, deren Einträge auf gängige “Buzzwords” auf dem Gebiet Semantic Web und Data Mining untersucht werden. Wird eines der angegebenen Schlagworte gefunden, führt dies zu einer Anzeige des Eintrags. Aggregation leichtgemacht…

Bings Ansatz zur semantischen Suche

Posted by Christian On September - 24 - 2009

Ein Interview, während dessen Verlaufs Bings semantische Fähigkeiten kurz dargestellt werden:
YouTube Preview Image

Rezension zu Programming the Semantic Web (Taschenbuch)

Posted by Christian On August - 2 - 2009

Mit “Programming the Semantic Web” von Toby Segaran, Colin Evans und Jamie Taylor ist beim O’Reilly-Verlag ein neues Semantic-Web-Buch erschienen. Die Autoren haben sich das Ziel gesetzt, dem Leser dabei zu helfen, heute bestehende Werkzeuge, Bibliotheken und theoretische Grundlagen, auch praktisch anzuwenden. Die Tools sind da, die Spezifikationen größtenteils fertig. Jetzt wartet die Welt nur noch auf die Killerapplikation ;-) .

Das Buch handelt Theorie und Praxis sehr gut ab und es wird sowohl auf RDF, OWL, als auch auf SPARQL eingegangen. Weiterhin werden die momentan wichtigsten Bibliotheken und Frameworks zur Erstellung, Abfrage und Visalisierung von Triplestores vorgestellt:

  • Jena
  • Redland
  • Mulgara
  • OpenLink Virtuoso
  • Franz AllegroGraph
  • Oracle
  • SIMILE/Exhibit

Am interessantesten ist wohl das zehnte Kapitel, dass die Entwicklung einer Job-Listing-Applikation für US-Firmen beschreibt. Für Interessierte ist das Buch eine Anschaffung wert, da neben der grauen Theorie auch endlich praktische Umsetzungen beschrieben werden, was bisher in anderen Büchern zum Thema kaum der Fall war.

Der Quellcode zum Buch ist zu 90% in Python geschrieben und zu ca. 10% in Java.
Um Python zu installieren, besuchen Sie die Python-Webseite oder www.jython.org. Als Entwicklungsumgebung bietet sich die Python IDE an.

Semantic Web and Social Software

Posted by Christian On August - 1 - 2009

In diesem kurzen Interview erklärt Dr John Breslin (Leiter Social Software DERI, Galway), was seiner Ansicht nach, das Semantic Web ist.
Er gibt eine kurze Einführung über die Ziele von DERI und diskutiert über die Projekte, an denen er arbeitet. Inbesondere gibt er eine Definition für Social Software.

YouTube Preview Image

Semantic Web Dokumentation auf 3sat

Posted by Christian On Juni - 27 - 2009

Auf 3sat wurde am 21.06. ein kurzer Bericht über das semantische Web gesendet, wobei auch auf dbpedia eingegangen wurde. Tim Berners-Lee hatte schon einmal eine Idee, die die Welt veränderte. Vor 20 Jahren erfand er das World Wide Web. Nun hat er eine neue Vision – das Linked Data Web. “Das Datenweb könnte eine grundlegende Veränderung bedeuten. Es hilft den Menschen nicht nur effektiver auf weltweite Informationen zuzugreifen, sondern sie auch effektiver zu nutzen und zu verarbeiten”, sagt Berners-Lee.
Hier klicken, um das Video abzuspielen (Achtung Popup!)

Data Mining, Machine Learning, Semantic Web Videos

Posted by Christian On April - 2 - 2009

Es ist überraschend, wie viele Videos zu Data Mining, Machine Learning und Semantic Web bei http://videolectures.net/Top/Computer_Science/ gespeichert sind. Alleine für Semantic Web finden sich momentan 214 Einträge! Zum Thema Machine Learning sind es sogar 713. Die Seite ist einen Besuch wert!

Sprachen des Semantic Web

Posted by Christian On April - 2 - 2009

Ein Video mit Informationen über RDFS und OWL: http://videolectures.net/sws09_roman_swl/

Um mich und diesen Blog vorzustellen habe ich ein kleines Tutorial geschrieben, mit dessen Hilfe erklärt wird, wie der eigenen Homepage ein Friend of a Friend Profil hinzugefügt werden kann.

Was ist denn Friend of a Friend (FOAF)?!?

“Friend-of-a-friend (FOAF) ist ein Internet-Standard, um Menschen und ihre Beziehungen untereinander in einer maschinen-verständlichen Form zu beschreiben.” (http://was-ist-foaf.de/)

„Wenn Sie mit dem semantischen Web spielen wollen, können Sie eine Freund-eines-Freunds-Datei [...] für Ihre Homepage erstellen. In einer FOAF-Datei können Sie Dinge über sich selbst veröffentlichen [...]. Mit einem Verweis können Sie etwa sagen, „das ist ein Foto von mir“ oder wer noch darauf ist. Um eine FOAF-Datei zu erstellen, müssen Sie ein Formular [...] ausfüllen. Aus dieser Information wird eine im semantischen Web lesbare Textdatei erzeugt, die Sie auf Ihre Website stellen können. Es gibt semantische Websites, die diese Daten auslesen und Ihnen etwa eine Liste von Fotos geben, die Sie mit anderen Leuten verbinden. Ich bin drei Fotos von Frank Sinatra entfernt, weil ich mit Bill Clinton fotografiert wurde, der mit einem der Kennedys fotografiert wurde, der mit Frank Sinatra fotografiert wurde.“ Tim Berners-Lee

aus Frauenfelder, M. (2004). Das Unvollendete. In: Technology Review, 11 [http://www.heise.de/tr/Das-Unvollendete--/artikel/52516].

Wer es ganz genau nachlesen möchte, findet die FOAF-Spezifikation hier oder in der englischen beziehungsweise deutschen Wikipedia, aber das ist nicht sooo wichtig.

Um ein eigenes FOAF-Profil zu erstellen, ist die Verwendung eines FOAF-Generator am einfachsten.  Die gibts im Internet reichlich. Ich fand den foaf-a-matic ganz gut. Weitere Tools sind der Facebook Foaf Generator von Matthew Rowe  und bei Sourceforge finden sich auch einige FOAF-Werkzeuge.

Nachdem beispielsweise mit  foaf-a-matic der Quellcode erzeugt wurde, wird dieser in eine Datei namens  “foaf.rdf” kopiert und mit einem FTP-Programm in den Root-Ordner (/) auf dem Webserver kopiert.

Nachdem das erledigt ist, folgt die Einbindung des nachfolgenden Source-Codes im <head></head>-Bereich der index.html (php, jsp…) um Suchmaschinen auf das FOAF-Profil aufmerksam zu machen:

<link rel=”schema.FOAF” href=”http://purl.org/dc/elements/1.1/”/>
<link rel=”meta FOAF.MAKER” type=”application/rdf+xml” title=”FOAF” href=”foaf.rdf”/>

<foaf:mbox_sha1sum> ist das einzige Element, welches nicht selbsterklärend ist. Es ist eine eindeutige Kennzeichnung einer eMail-Adresse.
<foaf:mbox_sha1sum>31951faf660be03adee9784a53f4d2fcddd5d158</foaf:mbox_sha1sum> steht übersetzt für “info@semanticblog.eu”. Der foaf-a-matic Generator erzeugt jedoch den Zeichensalat automatisch und die Checksumme kann per Copy-Paste in das eigene FOAF-Profil übernommen werden.

Um den gesamten Vorgang zu erleichtern könnt Ihr auch mein Profil kopieren und dann mit den eigenen Angaben überschreiben. Ein bischen poblematisch bei XML ist, dass der Quellcode fehlerfrei sein muss. Doch mit einem geeigneten XML-Editor ist das kein Poblem. Bei http://www.tecchannel.de ist die Auswahl derartiger Editoren reichlich.

Der letzte Schritt ist die Registrierung bei pingthesemanticweb.com. PingtheSemanticWeb.com ist ein Dienst zur Registrierung von  RDF-Dokumenten. Nachdem dieser benachrichtigt wurde,  fallen Crawler über dort neu hinzugefügte RDF-Dokumente her und später kann zum Beispiel über sindice wieder gesucht werden.

Das wars. Semantic Web für jeden!

Um sich das Ergebnis anzusehen sind Werkzeuge zur Darstellung hilfreich: foaf-visualizer und http://www.foafer.org/. Das URL Format bei  foaf-visualizer.org sieht beispielsweise so aus:

http://foaf-visualizer.org/?uri=http://www.Ihr-ServerName.xy/foaf.rdf

Wer möchte kann auch meinen Source-Code kopieren und für seine eigenen Zwecke anpassen (hier zum download). Ich habe ihn für diesen Blog benutzt und er ist hoffentlich fehlerfrei. Ihr müsst nur mit dem <foaf:mbox_sha1sum>-Element in Kombination mit eurer eigenen eMail-Adresse vorsichtig sein!

Das Ergebnis kann hier betrachtet werden.

Der nachfolgende Eintrag ist nicht unbedingt nötig, er kann dazu verwendet werden, auf mein Profil zu verweisen. Fügt es vor dem </foaf:Person>-Element ein, falls Ihr möchtet.

<foaf:knows>
<foaf:Person>
<foaf:name>Christian</foaf:name>
<foaf:mbox_sha1sum>387b814c974087a80ef0efb7fb21c7cc408fe74b</foaf:mbox_sha1sum>
<rdfs:seeAlso rdf:resource=”http://www.semanticblog.eu/foaf.rdf”/></foaf:Person></foaf:knows>

Ein kleine Spielerei ist, die eigenen Interessen mit einem Verweis auf eine von Wordle (http://www.wordle.net/) erzeugte Tagcloud darzustellen. Dazu sollte seine Java-Runtime auf dem Rechner installiert sein.

<rdf:Description rdf:about=”http://www.wordle.net/gallery/wrdl/624349/Visualizing_my_Blog”
dc:title=”Social Networks, Knowledge Management and Information Retrieval stuff… (Visualized by http://www.wordle.net/)” />
</foaf:interest>

Die Tagclouds von Wordle sehen sehr gut aus, wie das nachfolgende Bild zeigt. Naja, ich hab vergessen, das Wort “Lesezeichen-Menü” zu löschen :-)

Wordle: Visualizing my Blog

Das Semantic Web

Posted by admin On Februar - 27 - 2009

Das Problem der semantischen Interpretierbarkeit des World Wide Webs beschäftigt
zahlreiche Wissenschaftler aus den Gebieten der Datenbanktechnik,
der künstlichen Intelligenz und der Bibliotheks- beziehungsweise Informationswissenschaft.
Tim Berners-Lee, der Erfinder des World Wide Web, hat den
Term „Semantic Web“ geprägt. Gemäß seiner Vorstellung ist die Zukunft des
heutigen „Web der Links“ ein „Web der Bedeutung“. Große Bekanntheit
erreichte der Artikel The Semantic Web von Tim Berners-Lee, James Hendler
und Ora Lassila mit der erstmaligen Definition ihrer Vision:

The Semantic Web is not a separate Web but an extension of the current one, in which
information is given well defined meaning, better enabling computers and people to work in
cooperation.

Die Idee ist, Informationen im Internet nicht nur darzustellen, sondern sie
so zu strukturieren, dass nicht nur Menschen, sondern auch Maschinen sie
’verstehen’ können.
Das Semantic Web ist folglich eine Erweiterung des bestehenden World
Wide Web mit maschinenlesbaren Daten. Sollte diese Idee auf eine breite
Akzeptanz stoßen und ähnliche Wachstumsraten erleben wie das World Wide
Web seinerzeit, könnten Interoperabilität und Integration zwischen Systemen
und Anwendungen beflügelt werden.

Ob dieses Ziel je erreicht werden wird, ist gegenwärtig fraglich. Die Technologie
ist zwar langsam ausgereift, doch es mangelt an Killer-Applikationen.
Falls die Benutzeranzahl von semantischen Anwendungen keine kritische
Masse überschreitet, könnte dem Semantic Web das Schicksal zuteil werden,
dem akademischen Umfeld nicht zu entwachsen.

Es tritt wieder die Frage in den Vordergrund, durch welche Methoden des
Semantic Web die im vorhergehenden Abschnitt dargestellten Probleme der
semantischen Repräsentation von Inhalten im Internet gelöst werden sollen.
Im Ansatz des semantischen Webs werden keine Systeme mit künstlicher
Intelligenz entwickelt, die versuchen die menschliche Intelligenz und Problemlösungsfähigkeit
nachzubilden. Vielmehr soll die bereits existierende Struktur des World Wide Web erweitert werden.

Die Augmentation von HTML durch Wissensrepräsentationssprachen
führt dazu, dass diese Dokumente nicht länger nur Formatierungsinformationen
enthalten, sondern auch Informationen über ihren Inhalt und
dessen Bedeutung. Die daraus resultierenden Informationen können wieder
miteinander verknüpft werden, was schließlich zu einer semantischen
Repräsentation des Inhalts des gesamten World Wide Web führen soll.
Diese Verknüpfungen sind nicht auf Textdokumente beschränkt. Multimediale
Objekte (zum Beispiel Fotografien), auf die in Hypertextdokumenten
verwiesen wird oder die in Hypertextdokumenten eingebettet sind, können
mit denselben Mechanismen integriert und beschrieben werden.
Die nachfolgende Abbildung zeigt das layer-cake-Modell eben erwähnter Wissensrepräsentationssprachen.

Das Layer Cake Modell des Semantic Web

Das Layer Cake Modell des Semantic Web

Sie beschreibt die wichtigsten Schichten des Designs
des Semantic Web. Das Fundament des Semantic Web wird auf der untersten
Ebene des „Layer-Cake“-Modells durch XML gebildet. XML ist eine Sprache
zur Erzeugung von strukturierten Dokumenten, die von Menschen lesbar
sind. Diese Dokumente können durch ein benutzerdefiniertes Vokabular
ausgezeichnet werden. XML hat mittlerweile, vor allem im ökonomischen
Bereich, einen festen Platz bei der Datenkommunikation im Internet erlangt.
RDF bildet das grundlegende syntaktische Datenmodell des semantischen
Netzes. Um einen Vergleich zu ziehen, könnte RDF als das aus dem
Gebiet der Datenbanken stammende entity-relationship-Modell des Semantic
Web bezeichnet werden.

Es ermöglicht die Angabe von einfachen Aussagen über Objekte oder
Ressourcen des World Wide Web. Das Datenmodell von RDF basiert nicht auf
XML, aber RDF hat auch eine XML-basierte Syntax. Aus diesem Grunde ist
es in der Abbildung oberhalb von XML vorzufinden.

RDF Schema bietet einfache Möglichkeiten zur hierarchischen Organisation
von Objekten des World Wide Web an. Äquivalent zu vielen modernen,
objektorientierten Programmiersprachen (zum Beispiel Smalltalk, Java und
C++) enthält es Klassen und Eigenschaften. Weiterhin ermöglicht es Vererbung
in Form von Subklassen, Subeigenschaften sowie Restriktionen bezüglich
Wertebereichen und Domänen. Die Grundlage von RDF Schema wird
durch RDF gebildet. Insgesamt kann RDF Schema als eine simple Sprache
zur Erzeugung von Ontologien betrachtet werden.
Je nach Anwendungsfall besteht das Bedürfnis nach einer mächtigeren
Sprache zur Generierung von Ontologien, welche RDF Schema erweitern
und Repräsentationen mit komplexeren Beziehungen zwischen Objekten
des World Wide Web erlauben. Ein Beispiel hierfür ist die Web Ontology Language.

Die Logikschicht erweitert Ontologiesprachen und erlaubt die Bildung
von deklarativem applikationsspezifischem Wissen.

Die proof -Schicht führt sowohl deduktive Prozesse als auch die Repräsentation
von Beweisen durch Sprachen des semantischen Netzes (aus den
darunter liegenden Schichten) ein und kann zur Validierung von Beweisen
benutzt werden.

An der Spitze der Pyramide findet sich die Vertrauensschicht. Vertrauen
ist ein zentrales Konzept des semantischen Webs: Es wird sein Potential erst
dann voll ausschöpfen können, wenn die Benutzer seinen Operationen Vertrauen entgegenbringen.
Damit wird auf deren Sicherheit und die Qualität der bereitgestellten Informationen Bezug genommen.

An dieser Stelle der Zusammenhang zwischen Metadaten und dem semantischen Web wichtig.
Der Schlüsselaspekt hinter der Realisierung des Semantischen Webs ist
nach Nagarajan die Bereitstellung von Metadaten und deren Assoziation
mit Ressourcen des World Wide Web. Der Prozess Metadaten mit Ressourcen,
zum Beispiel Fotografien und Webseiten oder [un]-strukturierter Text mit
Fotografien, zu verknüpfen, wird Annotation genannt. Semantische Annotation
bezeichnet dabei den Vorgang, Ressourcen mit semantischen Metadaten
auszuzeichnen.

Semantische Annotation kann entweder durch formale oder nicht formale
Methoden erfolgen. Formale semantische Annotation basiert, im Gegensatz
zur nicht formalen Beschreibung, auf konzeptuellen Modellen, die mittels
wohlgeformter Wissensrepräsentationssprachen ausgedrückt werden.

Intro to the Semantic Web

Posted by admin On Februar - 26 - 2009

Blogverzeichnis - Blog Verzeichnis bloggerei.de   Blogverzeichnis   Blog and ping   Blog Top Liste - by TopBlogs.de   Bloggeramt.de   Blog Directory   powered by rankingcloud   Internet Multimedia blogs & blog posts  
blog search directory   Blogverzeichnis   Blog Directory   Blog Verzeichnis   Blog Directory   Technology Blogs - Blog Rankings   blogoscoop  

Clicky