ID3 vs. Apriori

ID3 vs. AprioriChristian Schulz, Marc Thielbeer, Sebastian Boldt

Inhaltsverzeichnis

1. Klassifikation ( ID3 )2. Assoziationsanalyse ( Apriori )3. Klassifikation anhand von Assoziationsregeln4. Realisierung in KNIME5. Probleme 6. Auswertung der Ergebnisse7. Zusammenfassung & Ausblick

Klassifikation• Zuordnung von Objekten mit gemeinsamen Eigenschaften zu Gruppen/Klassen • Im Gegensatz zum Clustering Klassen bereits bekannt• Erstellen von Klassifikationsregeln (z.B “guter Kunde” wenn Alter > 20 und …)• Verwendung von Stichproben (Trainigsdaten)

NAME RANK SKILL AGEPeter 1 HIGH 18

Gustav 2 LOW 35Harald 3 LOW 49

Trainingsdaten

If object.rank <= 1 && object.age <= 20{

object.skill = “High”}

Klassifikator

ID3-Algorithmus• Algorithmus der zur Entscheidungsfindung dient• Generierung von Entscheidungsbäumen• Iterative Basisstruktur• Für jedes nicht benutztes Attribut werden Entropien bezüglich der Traningsmenge berechnet• Aus Attribut mit höchsten Informationsgehalt wird Baumknoten generiert• Das Verfahren terminiert wenn alle Traningsmengen klassifiziert worden sind

Assoziationsanalyse• Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam auftretenden Dingen • Zweck : Auffinden von Elementen einer Menge die das Auffinden anderer Elemente

implizieren• Beispielregel (Warenkorbanalyse): Kunden die Brot kaufen, werden mit einer

Wahrscheinlichkeit von 60 % auch Milch kaufen • Support & Konfidenz spielen wichtie Rolle

Apriori-Algorithmus• Iteratives Verfahren zur Erzeugung von Assoziationsregeln• Funktionsweise:• Übergabe von: Datensätzen, min. Support, min. Konfidenz • Bestimmung von Frequent Itemsets deren relative Häufigkeit min. Support übersteigt• Bildung von Assoziationsregeln aus Itemsets die min. Konfidenz erfüllen

Klassifikation anhand von Assoziationsregeln• Assoziationsregeln für die Klassifikation nutzen• Aufstellen der Assoziationsregeln (Apriori Algorithmus)• Klassifikation des Datensatzes anhand dieser Regeln

NAME RANK SKILL AGEPeter 1 HIGH 18Gustav 2 LOW 35Harald 3 LOW 49

Trainingsdaten

If object.rank <= 1 && object.age <= 20{

object.skill = “High”}

Assoziationsregeln

Realisierung in Knime• Nutzung bestehender Bausteine (ID3 , Apriori , Decision Tree )• Vergleich von unterscheidlichen Datensätzen• Datenvorverarbeitung mittels bestimmter Module• Aufteilung von Daten in Trainings und Test-Daten• Ausgabe der Ergebnisse

Apriori in Knime• Auslesen der Daten über File Reader• Aufteilung der kontinuierlichen Größen in diskrete Werte mit Numeric Binner• Partionierung der Daten in Test und Trainingsdaten

Apriori in Knime• Manuelles Filtern der Relevanten Regeln• Eintragen in die Rule Engine

Apriori in Knime• Wenn Zielattribut kein boolscher Wert -> One2Many Element notwendig • Aufteilung jedes möglichen Wertes in einzelne Spalten mit boolschem Wert

ID3 & Decision Tree Knime• Einlesen der Daten über File-Reader• Aufteilung in Intervalle mittels Numeric Binner• Partionierung der Datensätze und Training und Testdaten• Vorhersage mittels Predictor

Vergleich der Genauigkeiten• Vergleich von 4 Datensätzen• Bei Klassenanzahl = 1 keine

gravierenden Unterscheide• Bei höherer Klassenanzahl bessere

Klassifizierung mittels Apriori• Bei großen Datensätzen zu hoher

Aufwand

Probleme• KNIME-Module bieten nicht die nötigen Ein & Ausgänge• Abbildung von numerischen Daten auf Intervalle• Abbildung dieser Intervalle auf boolsche Werte• Mit Anzahl der Klassen steigt der Konfigurationsaufwand in KNIME• A-Priori im Gegensatz zum ID3 unter Knime deshalb sehr aufwändig

Zusammenfassung & Ausblick• Zielstellung : Apriori Regeln für die Klassififkation von Daten besser geeignet als ID3 ?• Knime Module erweitern• Für Große Datensätze aufgrund des manuellen Zwischenschrittes in Knime momentan noch ungeeignet• Vergleichbare Ergebnisse der unterscheidlichen Ansätze• Bei höherer Anzahl von Klassen bessere Klassifizierung

ID3 vs. Apriori

Documents

Transcript of ID3 vs. Apriori

Classification and Regression Trees - ke.tu-darmstadt.de · node.add(branch, result) branch.add(child) end for End function. ID3-Algorithmus

CobraNet vs. Dante - dealer-center.ru vs... · CobraNet vs. Dante • Digital Audio ...

Usability vs. User Experience vs. CRO - warum eigentlich nicht miteinander?

Trockenstand: kurz vs lang? Laktation: lang vs kurz? Beckers... · Trockenstand: kurz vs lang? Laktation: lang vs kurz? Yves Beckers Université de Liège Gembloux Agro-Bio Tech Unité

LR Zerlegung - Max Planck Societypeople.mpi-inf.mpg.de/~msagralo/LR_Zerlegung.pdfAx+b = x ()(Id3 A)x = b LR Zerlegung Michael Sagraloff 15.06.2016 2 Beispiel eines linearen Gleichungssystems

ID3 und Apriori im Vergleich - Hochschule Wismarcleve/vorl/projects/dm/ss13/Assoziation/Doku-id3... · ID3 und Apriori im Vergleich Lassen sich bei der Klassifikation mittels Apriori

KAWASAKI Z900RS VS SUZUKI KATANA 1000 VS TRIUMPH …

ZDv - reservistenverband.de · ZDv Nummer – T i t e l – DSK 3/15 3/16 3/17 3/19 VS-NfD 3/20 VS-NfD 3/21 3/50 VS-NfD 3/90 VS-NfD 3/101 VS-NfD 3/120 VS-NfD 3/132 VS-NfD 3/136 VS-NfD

Was wissen Sie jetzt? Verbesserungen von Apriori · Prof. Dr. Katharina Morik | Wissensentdeckung in Datenbanken SoSe 2008 46 Fakultät für Informatik LS 8 technische universität

MASTERTIPPSCHEIN - wem-toto.ch · Brasilien vs Costa Rica Süd Korea vs Mexiko Serbien vs Schweiz Deutschland vs Schweden Serbien vs Brasilien Mexiko vs Schweden ... ...

ID3 vs. Apriori Christian Schulz, Marc Thielbeer, Sebastian Boldt.

APRIORI - IT Recruitment für Startups

Das Erfolgsmodell der Taktischen Periodisierung...1 vs.1 / 2 vs.2 „Fußballsprints:Intensive Intervalle für maximal explosive Aktionen 3 vs.3 / 4 vs.4 extensive Intervalle 5 vs.5

Rafale vs Typhoon vs Gripen

Goldgedeckte Tokens vs. Bitcoin vs. Stablecoins

APRIORI Studie: Karrieremodelle in der IT

Achillessehnenrupturen – Durch die OP schneller …€¢ Offen vs Perkutan Nachbehandlung: • Postop. Immobilisierend vs Orthese/frühfunktionell • Kons.: Immobilisierend vs Orthese

Verein zur Persönlichkeitsentwicklung, Die Heilige Hure ... · Single-Dasein vs. Partnerschaft Monogamie vs. Polygamie Verliebtheit vs. Routine Sexualität vs. Geschwisterlichkeit

Entscheidungsbäume zur Prüfung der Simulationswürdigkeit ... · ID3 Iterative Dichotomiser 3 CART Classification and Regression Tree CHAID Chi-square Automatic Interaction Detectors

Campixx 2015: Shop SEO Battle - modified vs. PrestaShop vs. shopware