Logfileanalyse Prof. Dr. Eduard Heindl. Elemente einer Logfilezeile IP-Adresse des Clients Identit...

Click here to load reader

  • date post

    05-Apr-2015
  • Category

    Documents

  • view

    103
  • download

    1

Embed Size (px)

Transcript of Logfileanalyse Prof. Dr. Eduard Heindl. Elemente einer Logfilezeile IP-Adresse des Clients Identit...

  • Folie 1
  • Logfileanalyse Prof. Dr. Eduard Heindl
  • Folie 2
  • Elemente einer Logfilezeile IP-Adresse des Clients Identit t des Clientrechners (normalerweise nicht verf gbar) Identit t des Benutzers (nur bei Authentifikation verf gbar) Sekundengenauer Zeitpunkt des Abrufs (Serverzeit) Erste Zeile der http Clientanfrage Status der Serverantwort Dateigr e in Bytes
  • Folie 3
  • Combined Log Format Referer, letztes Dokument im Browser des Besucher Domain von der die Seite abgerufen wurde Browser des Besuchers Betriebssystem des Besuchers 217.81.42.213 - - [01/Apr/2002:15:04:16 +0200] GET / HTTP/1.1 200 25432 www.heindl.de http://www.google.de/search?q=heindl+Internet+A G&hl=de&btnG=Google-Suche&meta=lr%3Dlang_de Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)
  • Folie 4
  • Warum Kennziffern Websites mssen sich lohnen Nur gute Websites lohnen sich Kundengerechte Websites sind gute Websites Controlling der Kundenzufriedenheit durch Kennziffern
  • Folie 5
  • Klassische Webstatistik MessgreProblem UmsatzNur bei reinen E-Shops sinnvoll PageViews (PV)Abhngig von der Auffindbarkeit SitzungsdauerAbhngig von Internetanbindung HitsAbhngig vom Webdesign
  • Folie 6
  • Anforderung an Kennziffern Aussagekrftig Unabhngig von Zusatzbefragung Einfach zu ermitteln Keine aufwendige Technik berschaubare Fehlerquellen Statistisch signifikant Auch auf Einzeldokumente anwendbar
  • Folie 7
  • Pageimpression AdImpression "AdImpressions sind der messbare Werbemittelkontakt. Sie bezeichnen die Anzahl der von den Clients der Nutzer abgerufenen (requested) Werbemittel vom Server eines Werbetr gers oder anderen AdServers." (dmmv) Pageimpression PI Eine Internetseite im Browser ~ AdImpression Pageview PV Abruf einer HTML Seite vom Server (nicht Aussagekrftig)
  • Folie 8
  • Frame Frameseiten haben weniger PI als PV
  • Folie 9
  • Usersession Usersession = Visit Visit Zusammenhngender Nutzungsvorgang, Besuch auf der Internetsite View Time Nutzungsdauer, keine exakte Definition verfgbar (dmmv)
  • Folie 10
  • Erkenntnisse aus Abweichungen Flut der Anfragen
  • Folie 11
  • Marketingerfolg Beispiel einer Marketingkampagne mit 60.000 Werbebriefen
  • Folie 12
  • Seitentypen Entry-, Brcken- und Exitpage
  • Folie 13
  • In-Out Analyse
  • Folie 14
  • Exit-Page Normale Ursachen Letzte Seite in einem Bestellprozess Linkliste, Angebot eines wichtigen externen Links Struktureller Abschluss etwa Z im Lexikon Newsseite Seite zum Ausdrucken Glossar Kanalwechsel, z.B. Ansprechpersonen, Kontaktformular
  • Folie 15
  • Exit-Page Problematische Ursachen Keine internen Links vorhanden Frameunterseiten, die isoliert gesehen werden (Externer Einstieg) Lange Ladezeit Seite hat unerwarteten Inhalt Layout problematisch z.B. zu kleine Schrift Unbliches Datenformat, z.B. Postscript
  • Folie 16
  • Berechnung der Kennziffern
  • Folie 17
  • Ntzliche Kennziffern KennzifferBedeutung In/PV Einstiegseite/Seitenabruf Suchmaschinen, Externe Links Out/PV Letzte Seite/Seitenabruf Seitenqualitt, Ladezeitprobleme Only/PV Einzige Seite/Seitenabruf Suchmachinentext, Seiteninhalt
  • Folie 18
  • Neue Kennziffer: Fav/PV Annahmen: Gute Seiten werden von Besuchern in die Favoriten aufgenommen (unter Netscape: Bookmark) Je hufiger von verschiedenen Besuchern ein Favorit gesetzt wird, um so besser das Dokument
  • Folie 19
  • Favicon im Browser Favicon von Google Standardicon
  • Folie 20
  • Das Favicon Das File favicon.ico wird immer vom Webbrowser (IE5 und hher) vom Webserver angefordert, wenn der Besucher ein Lesezeichen setzt. Favicon/Seitenabruf: Kennziffer, die ermittelt, ob ein Besucher Interesse an der Webseite (Website) hat.
  • Folie 21
  • Messverfahren Im Logfile werden alle Serveranfragen protokolliert, auch der Faviconabruf Logfileauswertung mit Statistikprogramm (z.B. websuxess) Bestimmung der Abrufe des Files favicon.ico Zeitabhngig Seitenbezogen
  • Folie 22
  • Technische Probleme Netscape und Gecko Browser rufen das File favicon.ico bei jedem Seitenabruf auf -> Filtern auf IE-Browser Favicon wird immer aus dem lokalen Verzeichnis geholt -> File in allen Verzeichnissen abspeichern Bezugsseite kann nur durch Pfadanalyse ermittelt werden (rechenaufwendig)
  • Folie 23
  • Tageszeitabhngigkeit Bestimmung des Faviconabrufs, relativ zu den Seitenaufrufen Je spter der Abend, um so wahr- scheinlicher wird ein Lesezeichen gesetzt
  • Folie 24
  • Websitequalitt Analyse Relaunch www.tuebingen.com www.tuebingen.com Favicon/Besucher Vorher ~1% Fav/PV Nachher ~2% Fav/PV Relaunch war erfolgreich
  • Folie 25
  • Webseitenqualitt Auswertung Website Solarserver.de Zeitraum: 1. Quartal 2003 Datenbasis: Ca. 1.000.000 Seitenaufrufe Lehre: Branchenverzeichnis ist beliebt Die Top Seiten
  • Folie 26
  • Suchmaschinen Relevante Suchmaschinen Relevante Suchworte
  • Folie 27
  • Nutzung der Suchmaschinen
  • Folie 28
  • Externe Links
  • Folie 29
  • Quelle der Besucherstrme Suchmaschinen Externe Links Favoriten E-Mails Manuelle Eingabe
  • Folie 30
  • Favoriten Lesezeichen = Bookmark = Favorit Bei Explorer: Abruf des Files favicon.ico Achtung: Netscape 7 ruft das File immer ab
  • Folie 31
  • Pfadverfolgung Wenig gleiche Pfade Lange Pfade von Interesse Analyse nach Zielelementen Einzelauswertung mhsam
  • Folie 32
  • Pfadlnge Lngere Besuche sind wnschenswert Grund der lngeren Pfade verstehen Pogosticking vermeiden
  • Folie 33
  • Zieldokumente Jede Website hat Targetdokumente Bestellabschluss Newsletterabo
  • Folie 34
  • Relevante Hyperlinks
  • Folie 35
  • Robotsfile Immer wenn eine Suchmaschine kommt wird das File robots.txt abgerufen
  • Folie 36
  • Ladezeit Zuerst wird das HTML-File geladen Bilder werden in der Reihenfolge im HTML Text nachgeladen Anzahl der abgerufenen Bilder gibt Einblick ber Besucherverhalten
  • Folie 37
  • Fehleranalyse Datenquelle Statistik Signifikanz Grosse Ereigniszahl Lngere Zeitrume Einfache Betrachtung Abhngigkeiten erkennen
  • Folie 38
  • Schiefe Statistik - Ursachen Suchrobots nicht herausgefiltert Sonderfunktion im Browser ntig Viele Nutzer auerhalb der Zielgruppe (z.B. Mitarbeiter, Sprachraum) Sitzungslnge falsch eingeschtzt Serverfehler falsch einbezogen (404-Fehlerseiten) Proxyserver Bildschirmauflsung Automatische Verknpfung von Seiten (Frames) nderung von Dokumentadressen (Seitenumzug) Inhalt URL Relation falsch interpretiert
  • Folie 39
  • Proxyserver Normalerweise mit Meldung 304 zu erkennen Abhngig von HTTP Version Abhngig von Proxyeinstellung Lokaler Cache wird nicht erkannt
  • Folie 40
  • Pseudobesucher Interne Besucher (Startseite) Robots Downloads Linkchecker Strer (DDOS) Hacker Frameeinblendungen
  • Folie 41
  • Sitedownload
  • Folie 42
  • Dynamische Seiten Erzeugung durch Content Management System Erzeugung durch Shopsoftware Besucherindividuell Profilabhngig
  • Folie 43
  • Dynamische Seiten
  • Folie 44
  • Besuchszeiten Tagesverlauf Wochenverlauf Jahresverlauf Monat? Sehr viele Sondereffekte!
  • Folie 45
  • Zyklenvergleich
  • Folie 46
  • Statuscode Status aus dem HTTP Header 200 alles ok 300 kleine Umleitung 400 dumme Frage 500 Server kaputt
  • Folie 47
  • IVW Informationsgemeinschaft zur Feststellung der Verbreitung von Werbetrgern e.V. Registrierte Websites werden analysiert Jeder kann die Resultate abrufen Relativ teuer Ntzlich fr alle Banner-Werbetreibenden
  • Folie 48
  • www.Alexa.com Service aus den USA Arbeitet mit Browserplugin Analyse fremder Websites mglich Teilweise schiefe Statistik Nur hnliche Websites vergleichbar
  • Folie 49
  • Alexa - IVW Problematik der Alexaabfrage
  • Folie 50
  • Seitenzhler ASP- Webstatistik Beispiel Hitbox
  • Folie 51
  • Trends Alle Bevlkerungsgruppen nutzen das Web Die durchschnittliche Nutzungsdauer wchst Die Internetzugnge werden schneller (DSL) Wachsende Bereitschaft zu Online Transaktionen Leistungsfhige Endgerte Moderne Browser Multimediale Rechner Hhere Bildschirmauflsung Erfahrene Internetnutzer Heavy User
  • Folie 52
  • Vielen Dank fr Ihre Aufmerksamkeit Weitere Informationen: http://webuser.hs-furtwangen.de/~heindl/om-2007ws.html