Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf ·...

46
Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 1 Lucene's Welt: Ordnen, Finden, Klassifizieren Java Forum Stuttgart, 2011 Christian Meder inovex GmbH Chief Technology Officer

Transcript of Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf ·...

Page 1: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 1

Lucene's Welt: Ordnen, Finden, Klassifizieren

Java Forum Stuttgart, 2011

Christian Mederinovex GmbHChief Technology Officer

Page 2: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 2

Agenda

Motivation Beispiele Projektübersicht Projekte Möglichkeiten Bewertung

Page 3: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 3

Speaker

Christian Meder

Schwerpunkte open source (free software) Linux Web Java

[email protected]

Page 4: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 4

Motivation

Page 5: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 5

Motivation Google then (Mitte 2010)

Page 6: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 6

Motivation Google then (Mitte 2010)

Relevanz

Page 7: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 7

Motivation Google then (Mitte 2010)

Autovervollstaendigung

Snippets

Page 8: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 8

Motivation Google then (Mitte 2010)

Spellchecker

Antwortzeiten

Page 9: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 9

Motivation Google then (Mitte 2010)

Aehnliche Seiten (More like this)

Page 10: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 10

Motivation Google then (Ende 2010)

Page 11: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 11

Motivation Google then (Ende 2010)

Instant Search

Facetten

Page 12: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 12

Motivation Google then (Ende 2010)

Vorschau

Page 13: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 13

Motivation Google now

Page 14: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 14

Motivation Google now

Facetten

Page 15: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 15

Motivation Amazon

Page 16: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 16

Motivation

„Die Aussage eines Probanden bei einem Usability-Test einer Faceted Search Lösung im Rahmen dieser Studie ist damit richtungsweisend:

„Mit dem Filter hier habe ich das Gefühl, dass selbst eine schnöde Suche richtig Spaß machen kann.””

Quelle: Faceted Search: Die neue Suche im Usability-Test (zum kostenlosen Download unter http://usability.de)

usability.de

Page 17: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 17

Motivation osscensus.org

Rank Package Installs1 firefox 3761 82%2 zlib 3118 67%3 wget 3000 65%4 xerces 2494 54%5 prototype 2450 53%6 eclipse 2428 52%7 c.-logging 2423 52%8 docbook-xml 1692 52%9 lucene 2394 52%10 xalan 2363 51%11 commons-lang 2349 51%12 wsdl4j 2242 48%13 tk 1557 48%14 samba 1554 48%15 activation 2175 47%

Page 18: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 18

Beispiele

Page 19: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 19

Beispiele Ebay Kleinanzeigen

Page 20: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 20

Beispiele

Site metrics:• ~ 3.2 M active ads• 16 – 24 M PVs per day• Peak hours = 1.8 M PVs (~ 500 PVs per second)Solr request metrics:• ~ 60 M requests per day• Peak hours = ~ 1500 request per secondAvg. response time• 20 ms (search) and 3 ms for auto-suggest

Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen)

Page 21: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 21

Beispiele

• 2 datacenters• 1 Master + 6 Slaves per datacenterSlaves show very low resource consumption. Could go down to 4slaves per datacenter while still having 50% overcapacity

• Master only used for indexing• Load balancer in front of slaves• Varnish in front of slaves (for dedicated use cases)• Working closely with SITE-OPS Team• DEV-OPS are part of development process

Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen)

Page 22: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 22

Beispiele weitere

polyvore Mozilla Wikipedia Twitter ...

Page 23: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 23

Projektuebersicht

Page 24: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 24

Projektübersicht Lucene

Lucene: Suchbibliothek Solr: Suchserver Nutch: Crawler Tika: Inhaltsanalyse ElasticSearch (Compass): Suchserver Mahout: Machine Learning HibernateSearch: Lucene-Integration für Hibernate

Page 25: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 25

Projekte

Page 26: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 26

Architektur Indizierung

Inhalte

Bereitstellung

Aufbereitung

Analyse

Indizierung

Index

Lucene

Solr

Page 27: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 27

Projekte Lucene

Information Retrieval

Bibliothek

Kern einer Sucharchitektur

effizient

skalierbar

Viele Ports: .Net, C, Python

Vielfach integriert in

Produkte

Page 28: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 28

Historie Lucene

0.01 (2000) Doug Cutting 1.2 (2002) Apache Jakarta Projekt 2.0 (2006) Sortieren, Datums- und Zahlenfelder, Bereichsfelder, ... 2.9 (2009) near realtime search, neue Analyzer, ... 3.0 (2009) cleanup release, deprecations 3.1/3.2/3.3 (2011) performance, grouping, autocomplete Verbesserungen, ...

Page 29: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 29

Projekte Solr

Enterprise Suchserver

XML über HTTP

skalierbar

Adminoberfläche

schema-basiert

viele Analyse-Klassen

Handler, Filter, Facetten

Page 30: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 30

Projekte Solr: Schema

enthält Felder / Feldtypen

Feldtypen mit

unterschiedlichen Analysern

dynamische Felder

CopyField

Konfigurierbare Textanalyse

Listen von Synonymen, Stopp-

Wörtern, etc.

Page 31: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 31

Projekte Solr: Schema, Beispiele Felder

<field name="subject" type="string" indexed="true" stored="true" />

<field name="contactPhotoURL" type="string" indexed="false" stored="true" />

<field name="priceperhour" type="sfloat" indexed="true" stored="true" />

<field name="created" type="date" indexed="true" stored="true" />

<field name="subject" type="string" indexed="true" stored="true" multiValued="true" />

<field name="all_text" type="text" indexed="true" stored="false" />

<dynamicField name="skills_*" type="text" indexed="true" stored="true" multiValued="true" />

<copyField source="subject" dest="all_text" />

Page 32: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 32

Projekte Solr: Features

Markierte Treffer

Spellchecker

MoreLikeThis

Dismax Query

DataImportHandler: DB,

XML, ...

Indexanalyse

Page 33: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 33

Historie Solr

2006 code donation von CNET 1.1: 17.1.2007 aus incubator zu lucene Subprojekt 1.2: 2.6.2007 spellcheck, sounds-like, ... 1.3: 15.9.2008 verteiltes Suchen, ... 1.4: 10.11.2009 db dataimporthandler, ... 3.1/3.2/3.3 (2011) geospatial support, grouping/collapsing, ...

Page 34: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 34

Projekte Solr: Queries

HTTP Interface mit verschiedenen Formaten (XML, JSON...)

Mehrfachsortierung

Auto Suggest

Dismax query

Snippets

Spelling suggestions

More Like This

einfache Datumsberechnungen

Function Query

einfache Statistik (min, max, ...)

Facetten Suche (Filtern nach mehreren Facetten)

Page 35: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 35

Projekte Solr: Einfache Beispiele für q

+goethe +schiller

+goethe -schiller

title:faust

title:faust AND -all_text:goethe

“romeo and juliet”

water*

water~

created:[1995-12-31T23:59:59.999Z TO 2007-03-06T00:00:00Z]

price:[20 TO 50]

price:[100 TO *]

Page 36: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 36

Projekte Solr: Beispiele für Parameter

sort=score asc

sort=created asc

sort=created asc, title asc

start=10

rows=20

fl=*

fl=id, title

fl=*, score

created:[NOW/DAY-1MONTH TO NOW/DAY]

fq=created:[NOW/DAY-2YEARS TO

NOW/DAY]&fq=all_text:poetry

Page 37: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 37

Projekte Nutch

Web Crawler

verteilt, parallel

Erstellt gerichteten

Graphen

Multi-Format (HTML, PDF,

Office, Tika, ...)

MapReduce, Hadoop

Lucene oder Solr

Page 38: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 38

Projekte Tika

Inhaltsanalyse

Extrahiert Metadaten und

strukturierte Inhalte

nutzt existierende Parser

große und wachsende

Anzahl an Formaten

weitere Parser einfach

ergänzbar

Page 39: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 39

Projekte ElasticSearch

nutzt Lucene

Facetten, Typen, ...

elastic: sharding/replicas

automatisch

schemalos

Vorgänger: Compass

Framework

Page 40: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 40

Projekte Mahout

Machine Learning

Empfehlungen

Clustering

Classification

Hadoop

Zahlreiche Algorithmen

Page 41: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 41

Moeglichkeiten

Page 42: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 42

Möglichkeiten Beispiel 2009

Page 43: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 43

Möglichkeiten Solr browse

Page 44: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 44

Möglichkeiten Solr browse

Page 45: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 45

Bewertung The road ahead

Solr: einfach, konfigurierbar,

skalierbar, endnutzerfreundlich

Lucene: lowlevel,

komplexer, volle Flexibilität

ElasticSearch: relativ neu,

aber automatische Skalierung

Mahout: komplex, mächtig,

skalierbar

Page 46: Lucene's Welt: Ordnen, Finden, Klassifizierenalt.java-forum-stuttgart.de/jfs/2011/folien/B2.pdf · 7/7/2011  · 07.07.2011 Wir nutzen Technologien, um unsere Kunden glücklich zu

Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 07.07.2011 46

inovex GmbH

PforzheimKarlsruher Straße 71D-75179 Pforzheim

MünchenKonrad-Zuse-Platz 1D-81829 München

KölnKaiser-Wilhelm-Ring 27-29D-50672 Köln

Vielen Dank für Ihre Aufmerksamkeit!