allgemeine Metadaten

Allgemeine Metadaten

Unter den allgemeinen Metadaten fassen wir alle nicht essentiellen Metadaten zusammen.

<title> Titel der Webseite - dieser wird in Google groß und blau angezeigt </title>
<meta name="description" content="Hier kommt die Meta Beschreibung rein, die darf nicht länger als 160 Zeichen sein. ">
<meta name="keywords" lang="de" content="Keywords, die auch mit Komma, getrennt sind, und nicht mehr, als 8, Stück ">
<meta name="robots" content="index, follow">
<meta name="copyright" content="Meistens der Seitentitel ">
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="revisit-after" content="14 days">
<meta name="author" content="Meistens der Seitentitel ">
<meta name="language" content="de">
<meta http-equiv="Content-Style-Type" content="text/css">
<meta http-equiv="Content-Script-Type" content="text/javascript">

Den Meta Titel, Die Meta Keywords und die Meta Beschreibung haben wir in auf den Vorangegangenen Seiten beschrieben. Die folgenden Metadaten müssen nicht dringend im der Seite enthalten sein. Hier ist zum einen der Hinweis auf die robots.txt.

Hier fange ich besser erst einmal über die Sitemap.xml an. Die Sitemap ist eine Auflistung der Seiten die eine Webseite enthält. Auf dieser werden auch kleine Buttons (zum Bsp. der Duckenknopf aufgeführt.) Google kann also Gefahrlos jede Seite und Unterseite auf der Seite erkennen und wird diese auch in den Index aufnehmen. Interessanter wird es bei großen Webseiten, wie zum Beispiel einer Shop Software mit mehr als 500 Produkten im Shopsystem. Dazu kommen noch die kleinen Knöpfchen wie Favoriten und Drucken, was als einzelne Seite zählt und schon hat man mehr als 1000 Seiten. Leider nimmt Google nicht alle Seiten der Webseite mit auf oder nur ungenügend. Also klammert man unbedeutende Seiten ohne eigenen Inhalt aus. Dafür ist die Robots.txt da. Die Sitemap.xml sagt der Suchmaschine welche Webseiten es gibt. Und die Robots.txt sagt der Suchmaschinen-Bot welche Verzeichnisse es durchsuchen darf. Hier sollte man bei der robots.txt die Verzeichnisse, die die Suchmaschine nicht durchsuchen soll ausklammern. Soll die Suchmaschine alle Seiten durchsuchen und darf in jedes Verzeichnis gehen, setzt man den Standard.

User-agent: *
Disallow:

  • Revisit-after sagt dem Suchmaschinen-Bot, wann er automatisch wiederkommen soll. In diesem Falle hier, nach 14 Tagen.
  • author - sollte klar sein, das ist der Autor der Webseite, hier gibt man meistens den Firmennamen an.
  • language - Hier gibt man die Spracherkennung ein. In Falle von Deutschland ein de.
  • Content-Style-Type - gibt an, welchen Style (Aufbauform der Webseite) das html verwendet. Meistens ist es text/css.
  • Content-Script-Type - gibt an, wie der Content / Seiteninhalt aufgebaut ist, oder was verwendet wird. Also die Text-Form oder Javascripte.

Auf den nächsten Seiten will ich mich den Alt Texten oder auch Alternativ Texten widmen. Eine Shop Software besteht meistens aus einem CMS und dieses aus vielen Bildern. Bilder werden nicht von allen Browsern und allen Einstellungen angezeigt. Also kann man einen Alternativ Text oder auch alt Text angeben.