IITR Datenschutz Blog

Gute eigene Web-Statistiken

29.07.2008

Da ich Google-Analytics ablehne, werde ich regelmässig gefragt, wie man denn meiner Meinung nach gute und bezahlbare Statistiken erhalten soll. Heute verweise ich auf eine andere Lösung: Durch Zufall habe ich entdeckt, dass phpMyVisitors unter neuem Namen weiterentwickelt wird – es nennt sich nun Piwik. Mit Piwik kann man Statistiken zu seiner Seite führen, ähnlich zu GoogleAnalytics. Dabei ist es problemlos möglich, Piwik zentral zu installieren und alle Seiten diese zentrale Installation nutzen zu lassen – so wie man es von GoogleAnalytics kennt. Allerdings mit dem Unterschied, dass die IPs der eigenen Benutzer nicht an Dritte übertragen werden.

Piwik ist hier zu finden. Zwar erfasst Piwiki noch die IP der User, doch wird bereits diskutiert, dies zu ändern (hier zu lesen), wobei erstmal der übliche Unsinn verklärt wird (IP ist unbedingt nötig). Dort wird aber bereits ein Plugin zum Anonymiseren angeboten, ich selbst denke, dass es problemlos möglich ist, die IPs durch Hash-Werte zu ersetzen.

Fazit: Auf jeden Fall eine schöne Idee, wenn man eine oder mehrere Webseiten hat und zentral darüber Statistiken führen will. Zwar bleibt der Haken, dass die IPs der User noch erfasst werden, doch immerhin bleiben sie beim jeweiligen Webmaster und werden nicht an Dritte übermittelt. Für mich momentan ein guter Weg, zumal abzusehen ist, dass daran gearbeitet wird, die Anonymisieren ganz zu ermöglichen.

Beitrag teilen:

5 Kommentare zu diesem Beitrag:

Flitsch

Das Ersetzen der IPs durch Hashwerte hatte ich für meine private Homepage auch schon überlegt. Wenn ich es aber darauf abgesehen habe, die IPs herauszubekommen, kann ich doch alle möglichen IPs (was bei IPv4 ja nicht so sehr viele sind) durchgehen und den jeweils daraus berechneten Hashwert mit dem in den Logs vergleichen. Ohne es getestet zu haben schien mir das in akzeptabler Zeit möglich zu sein, so dass Hashwerte keine wirkliche Anonymisierung liefern. Oder übersehe ich da etwas?

"Oder übersehe ich da etwas?"

Sofern man nur ein md5() ausführt bringt das relativ wenig, da man es über den Weg theoretisch wirklich nachprüfen könnte. Ich z.B: hänge daher noch eigene Signaturen und eine Zufallskennziffer an

Flitsch

"Ich z.B: hänge daher noch eigene Signaturen und eine Zufallskennziffer an"

Dabei kommt es wohl stark darauf an, wie man es implementiert. Ständig neu generierte "Zufallskennziffern" würden das gesamte Hashing ja überflüssig machen. Ich müsste also mal sehen, ob ich meinem Webserver beibringen kann, zufällige Inhalte aus einer Datei zu nehmen, die in bestimmten Intervallen (täglich, stündlich o.ä.) erneuert werden.

maescot

Piwik ist hervorrangend, hat aber leider noch große Schwächen. Beispielsweise scheint das Tracking eher unzuverlässig zu sein, wenn ich die Zahlen mit meinen Logfiles vergleiche.

Zweitens ist der RAM-Verbrauch recht hoch. Ich habe mir nur einen kleinen Webspace gemietet und wenige Besucher, kann aber schon keine Monatsstatistiken abrufen.

Ansonsten eine sehr gute Lösung, ich werde sie im Auge behalten.

Kommentar schreiben:

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

https://www.iitr.de/blog/wp-content/uploads/2020/10/chatbot-load.png https://www.iitr.de/blog/wp-content/uploads/2020/10/loading.gif