Metadaten

Metadaten sind übergeordnete Daten, welche die Nutzdaten eines Datenträgers zusammenfassend beschreiben. Z.B. umfassen die Metadaten eines Buches den Namen des Autors, die Auflage, das Erscheinungsjahr, den Verlag und die ISBN. Solche Metadaten erleichtern die Indexierung und Auffindbarkeit großer Datenmengen, z.B. als Katalogsystem in einer Bibliothek. In neuerer Zeit spielen Metadaten eine große Rolle für die automatische Indexierung und Abrufbarkeit von Webseiten durch Suchmaschinen im Internet.

Besonders im digitalen Bereich besteht der große Vorteil von Metadaten darin, dass sie separat von den eigentlichen Nutzdaten in kurzer Zugriffszeit gespeichert werden können. Über ein eigenes Datenmanagement-System können sie zeitsparend abgerufen werden. Im Gegensatz dazu dauert das Abrufen von Nutzdaten vergleichsweise lange.

Anwendungsgebiete

Musikerzeugnisse

Tonträger verfügen wie Bücher über eine Reihe von Metadaten, z.B. Titel, Künstler, Veröffentlichungsdatum usw. Digitale Formate wie MP3 erlauben die direkte Abspeicherung der Metadaten in der Datei.

Digitale Bilder

Moderne Digitalkameras fügen Aufnahmen automatisch eine Reihe von Metadaten hinzu, z.B. Aufnahmedatum, Aufnahmezeit, Brennweite, Blende usw. Mithilfe von Software kann ein digitales Bild noch um weitere Metadaten ergänzt werden, z.B. Bildtitel, Bildbeschreibung, Fotograf usw. Bildbearbeitungsprogramme ergänzen oder verändern die Metadaten eines Bildes oft zusätzlich.

Statistik

Daten, die nicht direkt den Inhalt einer Statistik ausdrücken, werden als Metadaten bezeichnet; ein Beispiel sind Branchen- oder Berufsbezeichnungen. Auch die Inhalte von Datenfeldern in Umfrageformularen gehören zu den statistischen Metadaten. Die eigentlichen statistischen Daten bezeichnet man demgegenüber als Mikro- und Makrodaten.

Softwareentwicklung

In der klassischen Programmierung versteht man unter Metadaten Bestandteile eines Codes, die nicht vom Compiler, sondern von Zusatzwerkzeugen ausgelesen werden. Metadaten dienen in diesem Kontext der Dokumentation oder in Verbindung mit Annotationen der Codegenerierung.

WWW

Im Zusammenhang mit Webseiten im Internet dienen Metadaten u.a. dazu, Informationen für den Server und den Browser bereitzustellen. Aber auch Suchmaschinen greifen auf Metadaten zu: Sog. Robot- oder Crawler-Programme durchsuchen und indexieren automatisch Webseiten, und orientieren sich dabei auch an den zur Verfügung gestellten Metadaten. Und nicht zuletzt können Metadaten auch Befehle zur Ausführung einer Webseite enthalten. Beispielsweise können solche Befehle den Browser auf eine andere Seite weiterleiten oder eine optimierte Darstellung für mobile Endgeräte ermöglichen.

HTML-Metadaten finden sich im Head-Element einer Webseite und können hier editiert werden. Oft verwendete HTML-Metatags sind :

  • Title: Beinhaltet den Seitentitel einer Webseite, analog zum Titel eines Buches
  • Meta-Description: Beinhaltet eine kurze Beschreibung der Webseite, analog zum Klappentext eines Buches
  • Meta-Keywords: Beinhaltet Schlagworte, welche die Webseiteninhalte charakterisieren; analog zur Verschlagwortung eines Buches in einem Bibliothekskatalog

Beispiel für Metadaten im HTML-Code

Die Angabe von Metadaten ist optional, ihre Verwendung empfiehlt sich aber in Hinblick auf das Thema Suchmaschinenoptimierung (s. „2.6 Metadaten und Online-Marketing“).

Hier ein typisches Beispiel für Metadaten im Head-Bereich einer Webseite:

  <head>    <meta charset="UTF-8">    <title>Online Marketing Performance Agentur - KLICKHELDEN</title>    <meta name="description" content="Online Marketing Performance Agentur | KLICKHELDEN: Online Marketing Agentur aus Leidenschaft! Wir bieten Suchmaschinenoptimierung ✓ Affiliate Marketing ✓ Suchmaschinenmarketing ✓ aus einer Hand ➔ Jetzt informieren!">    <meta name="viewport" content="width=device-width, initial-scale=1.0">    </head>  

Metadaten und Online-Marketing

Die Metadaten einer Webseite haben einen Anteil daran, wie gut eine Webseite rankt und welcher wirtschaftliche Erfolg ihr beschieden ist. Die Crawler-Programme großer Suchmaschinenbetreiber wie Google durchforsten das Internet und sammeln dabei Informationen über die vorgefundenen Webseiten. Stellt ein User eine Suchanfrage, dann wird die Anfrage von Google mit den gespeicherten Daten abgeglichen und das relevanteste Ergebnis an erster Stelle auf den Suchergebnisseiten (=SERPs) angezeigt.

Der Title-Metatag einer Webseite fungiert dabei als sogenannter Rankingfaktor: Sein Inhalt beeinflusst die Relevanzeinschätzung der Suchmaschine. Früher zog Google außerdem noch die Schlagworte aus dem Meta-Keywords-Tag hinzu. Dieses Metatag wurde aber vor einigen Jahren als Rankingfaktor komplett aufgegeben , weil durch die sachfremde Anreicherung von Keywords oft Rankingmanipulationen betrieben wurden.

Die Meta-Description ist kein Rankingfaktor, d.h. in ihr enthaltene Keywords wirken sich nicht auf die Hierarchie in den SERPs aus. Allerdings verfügt sie über eine nicht zu unterschätzende Userrelevanz: Besteht eine hohe Deckungsgleichheit zwischen Suchanfrage und Inhalt der Meta-Description, dann steigt auch die Wahrscheinlichkeit, dass der User auf die angezeigte URL klickt. Die Qualität der Meta-Description beeinflusst also die Click-Through-Rate.

Interoperabilität

Interoperabilität bezeichnet die Fähigkeit von Metadaten, über Systemgrenzen hinweg austauschbar zu sein; dazu müssen bestimmte Standards eingehalten werden. Diese Standards umfassen drei unterschiedliche Aspekte: Semantik, Datenmodell und Syntax.

Semantik

Die Semantik betrifft die inhaltliche Bedeutung von Metadaten, z.B. den Titel oder den Autor eines Dokuments. Solche Bedeutungen werden durch Gremien wie die Dublin Core Metadata Initiative normiert.

Datenmodell

Datenmodelle definieren die strukturelle Beschaffenheit von Metadaten. Beispiele für solche Datenmodelle sind HTML-Meta-Elemente oder die Tripel-Struktur in RDF.

Syntax

Die Syntax dient zur Repräsentation der im Datenmodell gemachten Strukturaussagen. Ein Beispiel für ein solches Format ist die Auszeichnungssprache XML.

Diese drei Aspekte bauen aufeinander auf; man kann sie auch als Schichtenmodell darstellen. Die einzelnen Schichten sind aber insofern voneinander unabhängig, als die Verwendung eines bestimmten Standards für eine Schicht keine Auswirkungen auf die Standards der anderen Schichten hat. Das heißt aber auch, dass es eine umfassende Identifikationsmöglichkeit geben muss, die alle drei Schichten umfasst, z.B. in Form eines URI (=Uniform Resource Identifier). Das korrekte Zusammenspiel dieser Elemente gewährleistet die Interoperabilität von Metadaten.