Der Server – Web, Mail, FTP Einen Provider finden Der Weg ins Netz Aufbau von Web-Adressen Hintergrundwissen DNS Dynamik mit PHP Verwaltung einer Datenbank Analyse mit Logfiles Hits, PageImpressions und Visits Caching Ports Datenschutz auf Ihrem Server

Hits, PageImpressions und Visits

Wie bei jeder Statistik können auch Nutzungsstatistiken Ihrer Webseite zu größerer Verwirrung als zur Aufklärung beitragen. Einige Grundlagen sollten Sie sich daher immer vor Augen halten, wen Sie mit Nutzungsdaten konfrontiert werden.

Hit

Der „Hit“ ist eine sehr technische und heute kaum noch genutzte Einheit zur Messung der Reichweite einer Webseite. Als Hit (Trfeffer) wird jede einzelne vom Webserver ausgelieferte Datei bezeichnet. Ein Hit entspricht so auch einem Eintrag im Logfile Ihres Webservers. Wenn Ihre Webseite zwei Bilder beinhaltet, würde ein Nutzer mit einem Seitenabruf drei Hits erzeugen (1x HTML, 2x Bilder). Je mehr Bilder auf einer Seite zum Einsatz kommen, umso höher werden die gemessenen Hits.

PageImpression

Um die tatsächlichen Seitenabrufe zu nennen, werden in den Hits nur Seiten gezählt, die Endungen wie HTML- oder PHP tragen. So ergebt sich eine Zahl für PageImpressions, also Seitenaufrufe. Aber auch hier ist die Logfile-Anayse mit Vorsicht zu sehen. Kommen Framesets zum Einsatz, können pro „realem“ Seitenabruf dennoch mehrere HTML-Seiten ausgeliefert werden. Umgeht können z.B. PHP-Scripte auch Bilder erzeugen und ausliefern. Ein PHP-Abruf ist so nicht zwingend ein Seitenabruf.

AdImpressions

Mit der Auslieferung von Werbung auf Webseiten kommt eine weitere Maßeinheit zum Einsatz. Die AdImpression zählt jedes ausgelieferte Werbemittel. Sind auf einer Webseite drei Werbeflächen mit Anzeigen bestückt, würde ein Nutzer bei einem Seitenaufruf drei AdImpressions erzeugen.

Visit

Als „Visit“ wird ein einzelner Besuch einer Webseite verstanden. Besuchen Sie eine fremde Webseite und rufen dort mehrere einzelne Seiten ab, wird dieser Vorgang als ein Visit gemessen. Kommen Sie am folgenden Tag wieder auf diese Seite und rufen erneut mehrere Webseiten ab, haben Sie einen zweiten Visit erzeugt.

Visitor / Unique Visitor

Im Gegensatz zu den „Visits“ versucht die Messung der „Visitors“ tatsächlich einzelne Menschen zu erfassen, nicht ihre Aktionen. Besuchen Sie einen Internet-Auftritt tatsächlich mehrfach, bleiben Sie der gleiche Mensch – also ein Visitor der Webseite – auch wenn Sie innerhalb eines Monats mehrere „Visits“ erzeugen und dabei mehrere „PageImpressions“ und vor allem zahlreiche „Hits“ erzeugt haben.

Probleme der Analyse

Die klassischen Webseiten-Statistiken basieren auf den Logfiles des Webservers. Hier sind die Hits die härteste Währung. Alle anderen Angaben versuchen die Statistik-Programme aus den Logfiles zu errechnen.

So muss für die PageImpression erkannt werden, welche Dateien tatsächlich Inhalte tragen. Dies erfolgt Anhang der Dateiendung. Nutzen Sie PHP-Scripte unter der ungewöhlichen Endung „.phtml“ müssen Sie sicherstellen, dass diese Endung von der Analyse auch als Inhaltsseiten erhält werden. Liefern Sie Ihre Bilder dagegen ebenfalls durch PHP-Scripte aus, müssen Sie ebenfalls darauf achten, dass Ihr Statistik-Programm hier die Abrufe richtig interpretieren kann.

Zum Ermittlung von Visits werden zumeist die IP-Adressen herangezogen. Eine IP-Adresse gilt dabei zunächst als ein Besuch. Ist diese IP-Adresse für eine festgelegte Zeit, zum Beispiel 30 Minuten, nicht aktiv, wird dann ihr erneutes Auftreten als ein zweiter Visit gezählt. Die Definition dieser Wartezeit kann so schon das Ergebnis der Auswertung beeinflussen. Zudem müssen Sie beachten, dass sich zum Beispiel Büronetze von Firmen oft nur mit einer IP-Adresse nach außen darstellen. So können mehrere hundert verschiedene Menschen theoretisch unter einer einzigen IP-Adresse auftreten.

Diese Schwierigkeiten bei der Erkennung von Besuchen auf Basis einer Logfile-Analyse sorgt dafür, dass Sie auch eindeutige Besucher auf diesem Weg kaum nicht mehr sauber erkennen können. Hierzu sind andere Analyse-Verfahren nötig.

Robots gegen Menschen

Als Robots oder Spider bezeichnet man im Internet automatisierte Seitenabrufe. So rufen zum Beispiel Suchmaschinen regelmäßig die ihnen bekannten Webseiten ab, um die aktuellen Inhalte zu erfassen und Verweise auf neue Seiten zu kennen. Diese Aufrufe sind wichtig, damit die eigene Webseite auch in Suchmaschinen aufgelistet wird. Doch zugleich bringen diese Seitenabrufe auch weitere Verwirrung in Ihre Webseiten-Statistik. Der Seitenabruf wird zunächst wie jeder andere auch In Ihren Logfiles verzeichnet und steht damit Auswertungsprogramme zur Verfügung. Zumeist senden Robots eine eigene Kennung mit, die ebenfalls erfasst wird. Eine Analyse-Software kann dann bekannte Robots von echten Webbrowsern unterscheiden. Doch nimmt nicht jede Software diese Trennung richtig vor. Achten Sie daher beim Betrachten von Nutzungszahlen auch immer darauf, ob Robots aus den Zahlen heraus gerechnet wurden oder nicht. Anderenfalls laufen Sie Gefahr, sehr unterschiedliche Messwerte miteinander zu vergleichen.

Pixel-Systeme

Die genannten Probleme der Logfile-Analyse haben zur Entwicklung anderer Messverfahren geführt. Aktuell liegen zentrale Messverfahren im Trend, die mitunter auf einem anderen Server laufen und über JavaScript- und Bildeinbindungen die Nutzung einer Seite messen. Für solche Messungen haben sich eigene Dienstleister etabliert, aber auch kostenlose Software ist im Internet erhältlich.

Bei diese Zählung wird in jede Webseite, die gemessen werden soll, eine JavaScript-Code eingefügt. Dieser bindet ein winziges Bild in die Seite ein, das vom Zählsystem ausgeliefert wird. Zudem kann das Zählsystem einen Cookie setzen, der den Nutzer genauer identifiziert, als die IP-Adresse das kann. Da Bilder und JavaScript von Robots nicht beachtet werden, erhalten Sie so eine Nutzungsanalyse, die diese Abrufe ausschließt. Zudem können Sie festlegen, welche Seiten tatsächlich in die Analyse einfließen sollen.