NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

15
NorthernLight „Suchmaschinen – Prinzipien und Allgorithmen“ Fallstudie Matthias Horbank

Transcript of NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Page 1: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

NorthernLight

„Suchmaschinen – Prinzipien und Allgorithmen“

Fallstudie

Matthias Horbank

Page 2: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

- gegründet September 1995 in Cambridge, Massach.- online seit August 1997- damals 20 Mio. Pages und 1.800 Special Collection Sources- heute über 240 Mio. Pages und 20 Mio. Special Collections

- rein privates Unternehmen- Investoren z.B. Reuters Group. PCL und Hewlett-Packard

Quelle: northernlight.com

Geschichte

Page 3: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Besonderheit Custom Search Folders 1

- Folder sind nicht fest vorgegeben

- werden bei jeder Suchanfrage neu generiert

- Informationen zum Algorithmus unbekannt (patentiert)

- vier Typen: Subject, Source, Document Type, Language

- Folder verschachteln sich, bis max. 26 Einträge pro Folder

Quelle: northernlight.com

Page 4: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Besonderheit Custom Search Folders 2

Page 5: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Besonderheit Custom Search Folders 3

Page 6: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Besonderheit Custom Search Folders 4

Page 7: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Besonderheit Custom Search Folders 5

Page 8: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Aufbau - Special Collections

- enthalten Sammlungen von Artikeln verschiedener Veröffentlichungen

- sie sind i.a. nicht im Internet verfügbar

- können gleichzeitig oder unabhängig vom Web durchsucht werden

- kurzes, kostenloses Summary

- ganzer Artikel gegen Gebühr von ein bis vier Dollar

- Special Collections sollen in wissenschaftskreisen sehr beliebt sein

Quelle: northernlight.com

Page 9: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Technologie

- Server läuft auf Apache 1.3.9 unter Solaris

- Name des Spiders ist Gulliver

- läuft auf drei Hosts: scooby.~, taz.~ und gulliver.northernlight.com

- läßt sich durch Tag „gulliver“ ausschließen

- indiziert 2-3 Mio. Pages pro Tag

Quellen: northernlight.com, The Web Robots Database

Page 10: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Statistiken 1

- Nummer der indizierten Seiten (Stand 15.6.2000, 19:50 Uhr): 242,317,169

- zu prüfen durch:

Quelle: northernlight.com

Page 11: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Statistiken 2

Quelle: searchengineshowdown.com

Page 12: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Statistiken 3

Quelle: Search Engine Watch

Page 13: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Statistiken 4

Quelle: Search Engine Watch

Page 14: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Vielen Dank für die Aufmerksamkeit !

Page 15: NorthernLight Suchmaschinen – Prinzipien und Allgorithmen Fallstudie Matthias Horbank.

Gestern registrierte .DE-Domains: 54.137

Quelle: nic.de