eoda R-Akademie 2014

11
R-Akademie 2014

description

Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen.

Transcript of eoda R-Akademie 2014

Page 1: eoda R-Akademie 2014

R-Akademie 2014

Page 2: eoda R-Akademie 2014

R-Akademie

Die eoda R-Akademie - Wissen, was bewegt

Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen. Unsere Trainer arbeiten seit über 10 Jahre in der statistischen Datenanalyse. Unsere R-Trainings für Unternehmen, Universitäten und Graduiertenzentren werden regelmäßig evaluiert und sehr gut bewertet. Eine Auswahl unserer Referenzen:

Page 3: eoda R-Akademie 2014

R-Akademie

Über R R ist eine Open Source Programmiersprache für statistische Datenanalyse und -visualisierung. Mittlerweile hat sich R, neben den kommerziellen Softwarelösungen SPSS®, Stata® und SAS®, als Standardsoftware für Datenanalyse sowohl in der Wissenschaft als auch in der freien Wirtschaft etabliert. In vielen Bereichen ist R den kommerziellen Softwarelösungen bereits überlegen. Die Entwicklung deutet darauf hin, dass sich R auf absehbare Zeit zum führenden System für softwaregestützte Datenanalyse entwickeln wird. R besteht aus einer Basisumgebung und einer Vielzahl freier Zusatzpakete, mit denen sich praktisch alle Problemstellungen, die im weitesten Sinne mit Datenanalyse zu tun haben, lösen lassen.

Traffic auf Email Listen

Jahr

Traf

fic

auf

E-M

ail L

iste

n

Anzahl an R-Paketen

Zeit

An

zah

l an

ver

fügb

aren

R-P

aket

en

Page 4: eoda R-Akademie 2014

R-Akademie

Die Vorteile von R

• Investitionssicherheit: Das Involvement der wissenschaftlichen Community in Verbindung mit dem zunehmenden Engagement großer Unternehmen wie IBM®, SAS® und Revolution Analytics® für R bestätigt die Vehemenz mit der sich R in den letzten Jahren in der Datenanalyse durchgesetzt hat und lässt eine weitere sehr positive Entwicklung für die Marktakzeptanz erwarten.

• Grafik: R verfügt über eine enorm leistungsfähige Grafikengine, mit der Sie publikationsreife Grafiken automatisiert erstellen können. Größe, Format und Auflösungen der Grafiken können direkt in R eingestellt werden, so dass eine Weiterbearbeitung in anderen Programmen entfällt. Selbst Geodaten und Karten lassen sich ohne Weiteres visualisieren.

• Flexibilität: R kann verschiedenste Daten und Datenquellen nutzen. Von klassischen Dateien wie .sav-, .sas-, .xls- oder .txt-Dokumenten bis hin zu Datenbanken und Internetressourcen lassen sich alle Datenquellen direkt in R einlesen und weiterverarbeiten. Mit dem gleichen Code, den gleichen Tools und dem gleichen Know-how können sowohl Big Data als auch kleinere Studien analysiert werden.

• Kosten: Es fallen keinerlei Lizenzkosten an.

• Analyseumfang: Mit R lassen sich alle gängigen und bekannten Analyseverfahren umsetzen. Darüber hinaus kann noch auf unzählige weitere Verfahren zurückgegriffen werden. Selbst neueste Analyseverfahren stehen zeitnah zur Verfügung.

• Migration: R kann an alle gängigen Statistikprogramme, Microsoft Office® und Programmiersprachen angebunden werden. Ein kompletter Umstieg auf R ist nicht zwingend, sondern Ihre bestehende Analyseumgebung kann – um ein vielfaches an Funktionsumfang erweitert – weiterhin verwendet werden.

• Qualität: Das Kernentwicklerteam rund um R setzt sich aus weltweit renommierten Experten für Datenanalyse zusammen.

Eine Auswahl an R-Usern

Page 5: eoda R-Akademie 2014

R-Akademie

Der Aufbau der eoda R-Akademie

Page 6: eoda R-Akademie 2014

R-Akademie

Kursangebot Einführung in R

• Einstieg in R Das Programm R, CRAN-Mirror, verschiedene Umgebungen/Editoren von R, Nutzung der internen Hilfe-Funktionen, Hilfen im Internet • Konzept und Philosophie von R Die Programmiersprache, Objekte und Objektorientierung, Wertezuweisung, Funktionen • Variablentypen Vektoren, Dataframes, Listen,… • Einlesen von Daten .txt-, .csv-, .xls-, .sav-Dateien, Internetquellen etc. • Datenmanagement Bildung neuer Variablen, bedingtes Umkodieren, einfache Berechnungen, fehlende Werte • Auswertungen mit R Statistische Kennzahlen, einfache Tabellen und Grafiken

Data Mining mit R

• Einführung in das Data Mining • Modell-Evaluation Modellauswahl und Datenbasis, Fehlermatrix, Risk-Charts, ROC, Sensitivität, Präzision, Lift, Prognose und Beobachtung • Explorative Analyse tabellarische Analyse, visuelle Analyse (metrisch, kategorial), Korrelationsanalyse, Missing-Values Korrelation • Assoziationsanalyse Support, Konfidenz, Lift, Interpretation • Decision- und Regressiontrees Algorithmus, Interpretation, grafische Interpretation • Neuronale Netze Theorie, Lernprozess im KNN, nnet • Random Forest Theorie, Interpretation, erweiterte Optionen, Conditional inference trees

Grafikerstellung mit R

• Grafik Pakete base, grid, ggplot2, lattice, plot • ggplot Data, Mapping • High-Level Grafik Elemente Balkendiagramm, Punktdiagramm, Tortendiagramm, Mosaikdiagramm, Histo-gramme, Dichtediagramme, Scatterplots • Low-Level Grafik Elemente Pfeile, Achsen, Legenden, Gitter, Überschriften • Layer Komponenten Geoms, Stats, Coord, Facet, Opts

Page 7: eoda R-Akademie 2014

R-Akademie

Kursangebot Multivariate Statistik mit R

• Regressionsanalyse Modell und Ausgangspunkt Interpretation und Güte Mögliche Probleme • Faktorenanalyse Theorie der Faktorenanalyse Eignungsprüfung Anzahl der Faktoren Anzahl der zu extrahierenden Dimensionen • Clusteranalyse Ausgangspunkt und Theorie Unterschiedliche Abstandsmaße Interpretation Visualisierung

Statistische Testverfahren

• Überblick über statistische Testverfahren • Normalverteilung Kolmogorov-Smirnov-Anpassungstest • Unabhängigkeit Chi-Quadrat-Test, Cramers V • Homogenität Kolmogorov-Smirnov-Z-Test, Kruskal-Wallis-H-Test • Korrelation Pearsons Korrelationskoeffizient, Kendall Tau-b, Spearmans Rangkorrelationskoeffitient • Varianztest t-test, ANOVA • Post-Hoc-Tests Varianzhomogenität, Multiple Vergleiche • Kontraste

Qualitative Analysen mit R

• Überblick über Text Mining • Einlesen von unstrukturierten Daten • Klassifikation von Dokumenten • Clustering

• Assoziationsanalyse

Page 8: eoda R-Akademie 2014

R-Akademie

Kursangebot Programmieren mit R (I)

• Einstieg Vektoren, Dataframes, Funktionen, Indizieren, Logische Operatoren • Funktionen definieren • Bedingte Anweisungen if, else, ifelse • Schleifen Indizieren, Abbrechen, Wiederholen • Apply-Funktionen lapply, sapply, tapply • S3-Klassensystem Theorie, eigene Klassen erstellen, generische Funktionen erstellen, Vererbung • Metaprogrammierung Calls, Expressions, Zeichenketten • Einbindung in Betriebssysteme • Parallelisierung

Programmieren mit R (II)

• Parallelverarbeitung Multicore, snow, snowfall, doParallel • Compiling Funktionen Cmpfun, just-in-time compiling • Benchmarking Microbenchmarking, autoplot • Profiling Rprof-Funktionen, trace, memory profiling • Code Optimierung Vektorisierung, Pre-allocating memory, Suche nach hilfreichen Paketen • Debugging U.a. Visual debugging

Zeitreihenanalyse mit R

• Einführung in Zeitreihenverfahren • Visualisieren von Zeitreihen • Dekomposition • Testverfahren • Exponentielles Glätten • ARIMA Modelle • Forecasting • Einführung in die Eventhistory-Analyse • Kaplan Meier Modell • Cox-Regression

Page 9: eoda R-Akademie 2014

R-Akademie

Kursangebot Angewandte Statistik im Qualitätsmanagement mit R

• Grundlagen im Umgang mit R • Einführung in die Konzepte des

statistischen Testens Ermittlung der optimalen Stichprobengröße Auswahl des richtigen Testverfahrens Interpretation von Kennziffern Aussage über die Sicherheit der Ergebnisse Definition von zulässigen Abweichungen AQL Normwerttabellierungen nach ISO 2859 und DIN ISO 3951 • Praxisbezogener Einsatz von R im

Qualitätsmanagement

Interaktive Grafiken mit R

Interaktive Grafiken sind ein flexibler und effizienter Weg um Daten zu analysieren und um Analyseergebnisse zu präsentieren. Interaktive grafische Anwendungen bieten Abfragen, Selektionen, Highlighting oder die Modifikation von Grafikparametern. Im Umfeld von R gibt es verschiedene Konzepte, die die Erstellung von interaktiven Grafiken und Anwendungen direkt aus R heraus möglich machen. Erwähnt seien hier IPlots, googleVis oder shiny. Der Kurs gibt einen ersten Überblick über die Erstellung interaktiver Grafiken mit R und liefert das Rüstzeug, um selbst interaktive Visualisierungen in R zu realisieren.

Reproducible Research Reproducible Research

• Einlesen von Daten aus verschiedenen Quellen

Z. B. aus Excel, SPSS • Analyse der eingelesenen Daten Pan doc, knitR • Anfertigen von statischen

Reportvorlagen und variablen Stylesheets

Z. B. Latex, HTML, CSS • Ausgabe dynamischer Reports

Page 10: eoda R-Akademie 2014

R-Akademie

Kursangebot Big Data mit R

Vielfältige Initiativen haben verschiedene Konzepte zum Umgang mit großen Datenmengen in R hervorgebracht. Unter anderem wurden verschiedene Parser und Pakete entwickelt, die den Umgang mit Big Data in R vereinfachen. Der Kurs gibt einen einführenden Überblick über folgende Aspekte: • Verbindungen zu Datenquellen wie

Datenbanken oder File Systemen wie Hadoop,

• Anbindung an Cloud Umgebungen wie WindowsAzure oder Amazon Web Services,

• Chunking – Aufteilen der Daten in Teilbereiche,

• Parallelisierung von Jobs zur Berechnung, • Überblick über die verschiedenen

Konzepte der verschiedenen Parser (Revolution Analytics, Oracle R Enterprise, Renjin, …)

• Visualisierung von Big Data.

Hadoop mit R

Daten in verteilten Systeme wie Hadoop-Clustern erfordern im Vergleich zu nicht verteilt vorliegenden Daten andere Verfahren zur Analyse der Daten als MapReduce. Das Prinzip von MapReduce besteht darin, ein Problem in kleine Aufgaben einzuteilen, die dann auf einem kleinen Teil der Daten gelöst werden. Ein typisches Einsatzszenario für Daten, die in einem Hadoop-System gespeichert sind, ist das Auszählen von Wörtern in Textdateien. Während bei herkömmlichen Techniken die gesamte Textmenge en bloc zeitaufwendig durchgearbeitet wird, zerlegt man mit MapReduce die Texte auf den einzelnen Knoten in kleine Blöcke. Mit dem Reduce-Teil werden dann die Ergebnisse wieder zusammengefasst. Auf diese Art lassen sich auch komplexere Such-, Vergleichs- und Analyseoperationen parallelisieren und dadurch schneller berechnen. Der Kurs vermittelt die Entwicklung von Skripten für MapReduce Jobs an konkreten Beispielen.

Ort Die Kurse finden in unseren Schulungsräumen in der Ludwig-Erhard-Straße 8 in Kassel statt. Es besteht sowohl eine gute Anbindung mit dem Auto als auch mit öffentlichen Verkehrsmitteln. In der unmittelbaren Umgebung zum Veranstaltungsort sind verschiedene Übernachtungsmöglichkeiten gegeben. Wir helfen Ihnen gerne bei der Suche.

Voraussetzungen

Die Kurse richten sich vornehmlich an Personen, die bereits Grundlagenkenntnisse mit Statistiksoftwarepaketen bzw. Excel gemacht haben. Grundlegende R-Kenntnisse sind für alle Kurse außer „Einführung in R“ vorausgesetzt. Für die Kurse wird ein eigener Laptop mit Administrationsrechten benötigt.

Page 11: eoda R-Akademie 2014

R-Akademie

eoda Wir bei eoda lieben Daten und Analysen. Wir sind Data Scientists, Softwareentwickler, Unternehmensberater und Personal Trainer in einem. Auf der Basis reichhaltiger Erfahrung in Data Mining und Predictive Analytics generieren wir strategische Wettbewerbsvorteile aus Daten. Unser Team entwickelt Handlungs-empfehlungen und Lösungen, die Ihnen helfen, sich bestmöglich an kommende Trends oder anstehende Marktveränderungen anzupassen. Wir sind als erstes deutsches Unternehmen Mitglied der R-Community und gehören zu den Vorreitern in der unternehmerischen Verwendung von R im deutschsprachigen Raum. Dieses Wissen und die Begeisterung für die nahezu unbegrenzten Möglichkeiten von R teilen wir auch gerne mit Ihnen – In unserer R-Akademie bieten wir Ihnen die Möglichkeit zu erlernen, wie Sie selbst sinnvoll mit statistischen Methoden und den anfallenden Daten in Ihrem Umfeld umgehen.

Anmeldung Das Anmeldeformular, eine und weitere Informationen zu Terminen und Preisen finden Sie auf unserer Homepage

Ludwig-Erhard-Straße 8 34131 Kassel

Tel. +49 (0)561 202 724 40 Fax. +49 (0)561 202 724 30

[email protected] www.eoda.de

Was wir bieten

• Kurse in Kleingruppen bis maximal 8 Teilnehmer • Hohe Praxisorientierung durch erfahrene Trainer aus der Praxis • Ausreichend Übungsphasen, in denen das Gelernte direkt umgesetzt werden kann • Hochwertige Kursmaterialien und einheitliche Übungsdatensätze • Überprüfung der Lernziele