Ich habe im vorigen Artikel schon ausführlich darüber gesprochen, wie wichtig die Besucherzahlen einer Internetseite für SEO-Zwecke sind. Jetzt möchte ich ein bißchen näher beleuchten, wie diese Besucherzahlen überhaupt zustande kommen.
PHP-Skripte für Besucherzähler
Besucherzähler gibt es wie Sand am Meer, vom einfachen PHP-Snippet bis zum ausgefeilten Plugin mit allen statistischen Schikanen. Ich gehe hier mal nicht näher auf die technischen Feinheiten ein, sondern erkläre nur mal das Prinzip, wie so ein Besucherzähler überhaupt funktioniert.
Woher weiß die Webseite, daß sie jemand besucht?
Ganz einfach, wenn man eine Internetseite im Browser aufruft, wird am Webserver der Seite eine neue Session für den neuen Besucher erzeugt. Diese Session enthält allerhand interessante Informationen über den Besucher, aber dazu später mehr. Im einfachsten Fall kann man also die Anzahl der Sessions in einem bestimmten Zeitraum zählen und hätte schon mal einen groben Überblick, etwa Sessions pro Tag oder pro Woche. Das ist aber statistisch noch nicht sehr aussagekräftig, weil nicht unterschieden werden kann, ob jetzt X verschiedene Besucher die Seite jeweils einmal aufgerufen haben, oder ob es im Extremfall nur ein Besucher war, der die selbe Seite X mal aufgerufen hat. Deswegen gibt es:
Besucherzähler mit IP-Sperre
Die meisten modernen Besucherzähler arbeiten mit sogenannter IP-Sperre, damit realistischere Besucherzahlen erhoben werden können. Der Knackpunkt dabei ist, daß anhand der IP-Adresse der Besucher genau unterschieden werden kann, ob es denn wirklich viele verschiedene Besuchersessions waren oder immer nur ein und der selbe.
Woher weiß das PHP-Skript meine IP-Adresse?
Die ist in der Session als sogenannte Superglobale Variable abrufbar. Da gibt es übrigens noch mehr interessante Informationen über sie, etwa welchen Browser sie benutzen, von welchem Server aus sie die Seite aufrufen und vieles mehr. Das ist den meisten Internetbenutzern nicht bewußt, viele denken, wenn man nur im Internet herumsurft und sich nirgendwo mit Paßwort und Username anmeldet, sei man anonym. Das ist ein gründlicher Irrtum, aber dazu wird es später noch einen Beitrag geben.
Jedenfalls ist per PHP die IP-Adresse abrufbar, und so kann man unterscheiden, wie viele verschiedene Benutzer die Seite besucht haben. Paßt aber auch noch nicht so ganz:
Und wenn ich am nächsten Tag die Seite wieder besuche?
Dann haben sie immer noch die gleiche IP-Adresse, und das Skript würde sie nicht als neuen Benutzer registrieren, weil sie ja mit der selben IP-Adresse schon mal da waren.
Ein Kompromiss: Cookie mit Timeout
In der Praxis macht man es oft so: beim Start der Session setzt man auf ihrem Rechner ein Cookie, in dem eine Timeout-Zeit vorgegeben wird. Dann wird nicht nur ihre IP-Adresse abgefragt, sondern zusätzlich noch, ob die in dem Cookie festgelegte Zeitspanne schon abgelaufen ist oder nicht.
Die Cookie-Timeout-Zeit wird meistens zwischen ein und drei Stunden festgelegt, weil man allgemein annimmt, daß das eine gute durchschnittliche Verweildauer innerhalb einer Session ist. Das heißt mit anderen Worten: wenn die Timeout-Zeit des Cookies noch nicht abgelaufen ist, wird der Besucherzähler aufgrund ihrer IP-Adresse nicht hochgezählt. Erst wenn die festgelegte Zeit vorbei ist und sie die Seite nochmal ansurfen, zählt es als neuer Besuch, der Besucherzähler schaltet um eins hoch.
Besucherzähler zählen also nur ungefähr
Hab ich das verständlich ausgedrückt? Ich hoffe schon, denn hier passiert etwas ganz Wichtiges. Man muß sich darüber im Klaren sein, daß ein Besucherzähler niemals ganz exakte Werte liefern kann, das hängt immer von vielen Faktoren ab. Die Cookie-Timeout-Zeit ist genau genommen ein willkürlich festgelegter Wert und spiegelt keinesfalls die Realität exakt wieder. Es handelt sich immer nur um ungefähre Werte, je nachdem mit welcher Methode der Besucherzähler programmiert ist und wie die Programmparameter gesetzt sind.
Man darf die Besucherstatistiken auf Internetseiten nicht als wissenschaftlich exakt miss-interpretieren, und ich setze sie zwar auf meinen eigenen Seiten auch ein, aber ich überbewerte ihre Zahlen nicht. Sie sind ein ungefährer Anhaltspunkt, und nicht das Maß aller Dinge!
Ich möchte hier als Schlußwort gerne eins meiner Lieblings-Sprichwörter zitieren: Trau keiner Statistik, die du nicht selbst gefälscht hast!