eoda R-Akademie 2015_Kursprogramm

21
R-Akademie I Aus Daten Wissen machen

description

Die R-Akademie von eoda ist seit 2011 das modulare Trainingsprogramm für die freie Statistiksprache R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten von R behandelt. Die R-Akademie bietet Interessenten ein breit gefächertes und ganzheitliches Trainingsprogramm rund um die Themen R und Datenanalyse. Das Angebot reicht von Einsteigerkurse bis hin zu Programmierkursen für fortgeschrittene R-User.

Transcript of eoda R-Akademie 2015_Kursprogramm

Page 1: eoda R-Akademie 2015_Kursprogramm

R-Akademie I Aus Daten Wissen machen

Page 2: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Über R

R ist eine der besten Alternativen zur Analyse und Visualisierung von Daten, Data Mining und Business Intelligence. Gleichzeitig ist R eine objektorientierte Programmiersprache zur statistischen Datenanalyse.

R ist enorm leistungsfähig und im Vergleich zu den großen kommerziellen Softwarepaketen zur Datenanalyse extrem flexibel. R ist Open Source und wird vor allem von einer weltweiten Entwicklergemeinde im wissenschaftlichen Umfeld weiterentwickelt. Allein dadurch setzt R einen nie erreichten Maßstab an Funktionalität, Qualität und Aktualität. Das Involvement der wissenschaftlichen Community in Verbindung mit dem zunehmenden Engagement großer Unternehmen wie IBM®, SAS® und Revolution Analytics® schafft eine hohe Investitionssicherheit für die Nutzer von R. Die Programmiersprache bietet eine Funktionsvielfalt weit über die Anwendungen der klassischen Statistik hinaus.

R entwickelt sich gerade zur plattformübergreifenden Lingua franca für Datenanalysten. Mittlerweile stehen allein auf CRAN über 7.000 Erweiterungspakete für R zur Verfügung, welche die Analyse von Daten in allen denkbaren Formen unterstützen.

Über die eoda R-Akademie

Die R-Akademie von eoda ist seit 2011 das modulare Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen.

Unsere R-Trainings für Unternehmen, Universitäten und Graduiertenzentren werden regelmäßig evaluiert und als sehr gut bewertet. Über 1.000 zufriedene Teilnehmer sprechen für die Qualität der Statistik-Schulungen von eoda.

Was wir bieten

• Kurse in Kleingruppen bis maximal 8 Teilnehmer

• Hohe Praxisorientierung durch erfahrene Trainer aus der Praxis

• Ausreichend Übungsphasen, in denen das Gelernte direkt umgesetzt werden kann

• Hochwertige Kursmaterialien und einheitliche Übungsdatensätze

• Überprüfung der Lernziele

• Optionaler R-Support im Anschluss an die R-Akademie Schulungen

www.r-akademie.de

Page 3: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Das Kursangebot der eoda R-Akademie

Einführung in R

Grafikerstellung mit R

Interaktive Grafiken

Multivariate Statistik I

Multivariate Statistik II

Data Mining

Text Mining

Programmieren mit R

Big Data und Hadoop

Survivalanalyse

Werbewirkungsanalyse

R-Experte

Zeitreihenanalyse

Paketerstellung

Daten-management

R im produktivenUnternehmensumfeld

Qualitäts-management mit R

ReproducibleResearch

www.r-akademie.de

Wählen Sie Ihren Kurs

Page 4: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Einführung in R

9. bis 10. Februar 2015 I 8. bis 9. September 2015

R ist eine der besten Alternativen zur Analyse und Visualisierung von Daten, Data Mining und Business Intelligence. R setzt einen nie erreichten Maßstab an Funktionalität, Qualität und Aktualität.

Der Kurs versteht sich als Einführung in R und seine Grundfunktionalitäten und soll den Teilnehmern mit praktischen Tipps und Übungen den Einstieg in R erleichtern. Dieser Grundkurs soll R-Einsteigern ohne tiefergehende Vorkenntnisse als Ausgangspunkt für den weitergehenden Einsatz von R in ihren individuellen Anwendungsszenarien dienen.

Kursinhalte• Einstieg in RDas Programm R, CRAN-Mirror, verschiedene Umgebungen/Editoren von R , Nutzung der internen Hilfe-Funktionen, Hilfen im Internet• Konzept und Philosophie von RDie Programmiersprache, Objekte und Objektorientierung, Wertezuweisung, Funktionen• Variablentypen und ihre EigenschaftenVektoren, Dataframes, Listen,…• Einlesen von Daten.txt-, .csv-, .xls-, .sav-Dateien, Internetquellen etc.• DatenmanagementBildung neuer Variablen, bedingtes Umkodieren, einfache Berechnungen, fehlende Werte• Auswertungen mit RStatistische Kennzahlen, einfache Tabellen und Grafiken• Erstellen grundlegender Grafiken

www.r-akademie.de

Page 5: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Zeitreihenanalyse mit R

10. bis 11. November 2014 I 16. bis 17. Februar und 14. bis 15. September 2015

Für die Analyse von Zeitreihendaten stehen eine Reihe spezieller Analyseverfahren zur Verfügung. So lassen sich beispielsweise Zeitreihendaten in die Zukunft fortschreiben und die Konsequenzen unterschiedlicher Zukunfts-Szenarien schätzen.

Weitere Anwendungsfälle sind die Berechnung der Wahrscheinlichkeit, dass ein Ereignis (z.B. der Ausfall eines Bauteils, die Bestellung eines Produkts etc.) in einer gegebenen Zeitspanne eintritt oder die Extraktion saisonaler Effekte in einem Prognosemodell. Neben den unten aufgeführten Aspekten werden im Kurs die Besonderheiten von Zeitreihendaten in klassischen Analysekontexten thematisiert.

Kursinhalte•Einführung in Zeitreihenverfahren Grundlagen, Saisonalität, Erstellen von Zeitreihenobjekten•Visualisieren von Zeitreihen•DekompositionTrend-, Saisonal- und Zufallseffekte; Berechnung saisonbereinigter Werte•TestverfahrenStationarität und Autokorrelation•Exponentielles GlättenModellierung nach Holt-Winters, ETS und STL

•ARIMA ModelleHerstellen von Stationarität über Differenzierung; Festlegung der AR- und MA-Terme; Modellerstellung•ForecastingSaisonale und nicht-saisonale Modelle; Ausreißerbehandlung•Einführung in die Eventhistory-AnalyseGrundlagen, Erstellung von Survival Objekten•Kaplan Meier ModellKumulativie Hazardkurven; Log-Rank Test•Cox-RegressionModellerstellung; Modellprüfung; Interpretation der Koeffizienten

Page 6: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Zeitreihenanalyse mit R II - Survivalanalyse

12. November 2014 I 18. Februar 2015

Mit Survival-Modellen wird geschätzt, wie viel Zeit vergeht, bis ein bestimmtes Ereignis eintritt. Die Prognose von Maschinenausfällen und Krankheitsverläufen sind zwei mögliche Anwendungsgebiete. Die Anwendung der Survival-Analyse Verfahren wird anhand von praxisnahen Beispielen erlernt.

Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke zugeschnitten anzuwenden. Für eine optimale Wissensgrundlage wird der Besuch des R-Akademie Kurses „Zeitreihenanalyse mit R I“ empfohlen.

Kursinhalte•Einführung in die Grundbegriffe der Survival-AnalyseEpisoden & Zensierung, Survivor-Funktion, Hazard-Rate

•Einführung in die Survival-Analyse in RDas Paket survival

•Kaplan-Meier-SchätzerGrundlagen, Visualisierung, Tabellierung, Gruppenvergleiche, Signifikanztests

•Cox-Proportional-Hazards-ModellVoraussetzungen und Annahmen, Modellaufbau, Die Funktion coxph(), Das ties-Argument, Effektinterpretation

•Zeitveränderliche Variablen & Episoden-SplittingDie Funktion survSplit ()

•Cox RegressionUmsetzung in R, Modellvergleiche, Likelihood-Ratio-Test, Informationskriterien (BIC / AIC), Schätzwerte

www.r-akademie.de

Page 7: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Grafikerstellung mit R

24. bis 25. November 2014 I 27. bis 28. April 2015 I 12. und 13. Oktober 2015

R bietet umfangreiche Möglichkeiten zur Erzeugung publikationsreifer Grafiken zur ansprechenden Visualisierung der Ergebnisse von Analysen.Neben den Standardgrafiken von R werden in diesem Kurs auch spezielle Grafikpakete wie ggplot2, grid etc. und deren „Grammatik“ behandelt.Es wird umfangreich auf die vielen Einstellungsmöglichkeiten und Grafikoptionen eingegangen, so dass die Kursteilnehmer in der Lage sein werden individualisierte Grafiken zu erstellen.

Daneben werden die Exportmöglichkeiten (Devices) erläutert und es wird gezeigt, wie Sie Geodaten mit Hilfe von R visualisieren können.Ergänzend zu "Grafikerstellung mit R" empfehlen wir Ihnen unseren Kurs "Interaktive Grafiken mit R".

Kursinhalte•Grafik Paketebase, grid, ggplot2, lattice, plot

•ggplotData, Mapping

•High-Level Grafik ElementeBalkendiagramm, Punktdiagramm, Tortendiagramm, Mosaikdiagramm, Histogramme, Dichtediagramme, Scatterplots

• Low-Level Grafik ElementePfeile, Achsen, Legenden, Gitter, Überschriften

• Layer KomponentenGeoms, Stats, Coord, Facet, Opts

www.r-akademie.de

Page 8: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Interaktive Grafiken mit R

26. November 2014 I 29. bis 30. April 2015 I 14. und 15. Oktober 2015

Interaktive Grafiken sind ein flexibler und effizienter Weg um Daten zu analysieren und um Analyseergebnisse zu präsentieren. Interaktive grafische Anwendungen bieten Abfragen, Selektionen, Highlighting oder die Modifikation von Grafikparametern. Im Umfeld von R gibt es verschiedene Konzepte, die die Erstellung von interaktiven Grafiken und Anwendungen direkt aus R heraus möglich machen. Erwähnt seien hier ggvis, rCharts oder shiny mit denen sich R-Analysen einfach in Web-Applikationen umsetzen lassen. Der Kurs gibt einen ersten Überblick über die Erstellung interaktiver Grafiken mit R und liefert das Rüstzeug, um selbst interaktive Visualisierungen in R zu realisieren.

Kursinhalte• ggvisggvis ist die konsequente Weiterentwicklung des beliebten Grafik Pakets ggplot2 und erweitert dessen Funktionalitäten um interaktive Effekte.

• rChartsrCharts bietet eine Anbindung aus R an beliebte Javascript Grafik Bibliotheken, darunter NVD3 und Highcharts.

• shinyshiny ist ein Framework das Datenanalysten ohne tiefergehende Programmierkenntnisse die Entwicklung von eigenen Webapplikationen ermöglicht.

www.r-akademie.de

Page 9: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Data Mining mit R

17. bis 18. März 2015 I 9. bis 10. Oktober 2015

Data Mining steht für das hypothesenfreie Extrahieren von Erkenntnissen aus Daten. Statistische und mathematische Verfahren werden auf Datenbestände angewendet, um bestehende Muster und Zusammenhänge aufzudecken. Data Mining Verfahren stellen i.d.R. geringe Anforderungen an das Messniveau der Daten (kategorial, ordinal, metrisch) und sind in der Lage komplexe nicht-lineare Zusammenhänge zu erkennen. Konkrete Anwendung findet Data Mining beispielsweise bei der Erstellung von Prognose-Modellen, in der Zielgruppenanalyse, der Warenkorbanalyse, für Empfehlungsdienste und vielem mehr.

Kursinhalte•Einführung in das Data Mining

•Modell-EvaluationModellauswahl und Datenbasis, Fehlermatrix, Risk-Charts, ROC, Sensitivität, Präzision, Lift, Prognose und Beobachtung

•Explorative Analysetabellarische Analyse, visuelle Analyse (metrisch, kategorial), Korrelationsanalyse, Missing-Values Korrelation

•AssoziationsanalyseSupport, Konfidenz, Lift, Interpretation

•Decision- und RegressiontreesAlgorithmus, Interpretation, grafische Interpretation

•Neuronale NetzeTheorie, Lernprozess im KNN, nnet

•Random ForestTheorie, Interpretation, erweiterte Optionen, Conditional inference trees

www.r-akademie.de

Page 10: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Multivariate Statistik mit R

20. bis 21. April 2015 I 7. bis 8. Oktober 2015

Der Kurs zu Multivariaten Analyseverfahren soll die Teilnehmer in die Lage versetzen vorhanden Datensätze auf statistische Gesetzmäßigkeiten zu analysieren und die Ergebnisse zu interpretieren.

Im Mittelpunkt des Kurses stehen dabei die Regressions-, die Faktoren- und die Clusteranalyse.

KursinhalteClusteranalyse:•Ausgangspunkt und TheorieTanimoto- bzw. Jaccard-Koeffizeint, Russel & Rao-Koeffizient, M-Koeffizient

•Unterschiedliche AbstandsmaßeCity-Block Metrik, Quadierte euklidische Distanz, Single-Linkage Verfahren, CompleteLinkage-Verfahren, Ward Methode

•Interpretation

•VisualisierungGrafiken, Dendrogramme

Faktorenanalyse:•Ausgangspunkt und Theorie der FaktorenanalyseHauptkomponentenanalyse vs. Hauptsachenanalyse

•EignungsprüfungKaiser-Meyer-Olkin-Kriterium, Anti-Image Korrelationskriterium, Kommunalitäten

•Anzahl der FaktorenScreeplot, Eigenwertkriterien, Anteil der erklärten Varianz

•Anzahl der zu extrahierenden Dimensionen

Regressionsanalyse:•Modell und AusgangspunktGrundannahmen, nötige Voraussetzungen

•Interpretation und GüteBestimmtheitsmaß R², F Statistik, Signifikanzniveaus

•Mögliche ProblemeHeteroskedastizität, Autokorrelation, Multikollinearität

www.r-akademie.de

Page 11: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Multivariate Statistik mit R II

22. April 2015

Innerhalb Kursprogramms werden essentielle Methoden im Umgang mit multivariaten Daten besprochen. Dabei richtet sich der Fokus zunächst auf Problemstellungen, mit denen sich (nahezu) jedes Analyseprojekt konfrontiert sieht:

- Wie soll mit fehlenden Daten verfahren werden?- Lassen sich Ausreißer identifizieren?- Auf welche Weise lassen sich Fallgewichtungen an die Daten hängen?

Neben diesen pre-analytischen Methoden werden folgende Verfahren der Multivariaten Statistik besprochen:

Kursinhalte

• Konfirmatorische Faktorenanalyse

• Multi Dimensionale Skalierung

• Shapley Value Regression

• Diskriminanzanalyse

• Bootstrapping

www.r-akademie.de

Page 12: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Big Data und Hadoop mit R

11. März 2015 I 9. Oktober 2015

Vielfältige Initiativen haben verschiedene Konzepte zum Umgang mit großen Datenmengen in R hervorgebracht. Der Kurs "Big Data und Hadoop mit R" gibt einen Überblick über diese Konzepte und zentrale R-Pakete zum Thema Big Data. Zudem werden Vorgehensweisen und Strategien vorgestellt, die sich sowohl mit effizientem Daten- und Speichermanagement in R, als auch mit Datenbankanbindung und Parallelisierung beschäftigen.

Der zweite Teil der Schulung umfasst das Thema Hadoop mit R. Daten in verteilten Systeme wie Hadoop-Clustern erfordern im Vergleich zu nicht verteilt vorliegenden Daten andere Verfahren zur Analyse der Daten wie beispielsweise MapReduce. Das Prinzip von MapReduce besteht darin, den Analyseprozess auf die Hadoop-Cluster zu verteilen (Mapping-Phase) und die Ergebnisse der Teilanalysen anschließend zusammenzuführen (Reduce-Phase). Statt wie bei herkömmlichen Techniken die gesamte Datenmenge en bloc zu analysieren, führt der MapReduce Ansatz die Analyse in kleinen Blöcken durch.

Auf diese Art lassen sich auch komplexere Such-, Vergleichs- und Analyseoperationen parallelisieren und dadurch schneller berechnen. Der Kurs vermittelt die Entwicklung von R-skripten für MapReduce Jobs an konkreten Beispielen unter Verwendung der R-Pakete rhdfs und rmr.

Die Verwendung von Programmierelementen wird anhand von praxisnahen Beispielen erlernt. Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke im Umfeld von Big Data anzuwenden.

Kursinhalte

• C++ Integration von R

• Konzepte zur Daten-Auslagerung „out ofmemory“

• Parallelisierung

• Memory Management & Profiling

• MapReduce

www.r-akademie.de

Page 13: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Text Mining mit R

11. bis 12. November 2015

Als Disziplin des Data Mining umfasst Text Mining Algorithmus basierte Analyseverfahren zur Entdeckung von Strukturen und Informationen aus Texten mit statistischen und linguistischen Mitteln. Ein Anwendungsfeld ist beispielsweise das Web Mining, wodurch sich Trends und Kundenbedürfnisse auf Webseiten und Social Media Plattformen ermitteln lassen. Text Mining wird auch eingesetzt, um Preisentwicklungen oder Börsenkurse anhand der Nachrichtenlage zu prognostizieren.

Der Kurs konzentriert sich auf die Anwendung der Pakete tm, RTextTools und OpenNLP und behandelt die folgenden Inhalte.

Kursinhalte

•Überblick über Text Mining mit R

•Einlesen von unstrukturierten Daten, Web Scraping

•Strukturieren der Texte (Pruning, Tokenisierung, Sentence Splitting, Stoppwortliste, Normalisierung, Stemming, Lemmatisierer,N-Gramme)

•Einfache Inhaltsanalysen und Assoziationsanalysen

•Klassifikation von Dokumenten mit unterschiedlichen Verfahren (Support Vector Machines, Generalized Linear Model, Maximum Entropy, Supervised latent Dirichlet allocation, Boosting, Bootstrap aggregating, Random Forrests, NeuralNetworks, Regression Tree)

www.r-akademie.de

Page 14: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Werbewirkungsanalyse mit R

16. September 2015

Die Beurteilung von Werbemitteleinsatz und dessen Effizienz stellt nach wie vor eine der großen Herausforderungen des Marketings dar. Mit Hilfe von Webtracking und Webanalytics kann eine solche Diagnose anhand evidenzbasierter Datenanalyse erfolgen.

Der Kurs „Werbewirkungsanalyse mit R“ richtet seinen Fokus auf die Analyse von Informationen aus dem Webtracking. Vermittelt werden dazu elementare Techniken aus dem Methodenset der Regressionsmodellierung. Zielvariablen bilden bspw. Klickraten und Suchmaschinenanfragen, die durch den Werbedruck (GRP / GrossRating Point) unter Berücksichtigung von zeitbasierten Einflussfaktoren (Tageszeit, Wochentage etc.) erklärt werden. Darüber hinaus liegt ein weiterer Schwerpunkt des Kurses auf der Analyse zeitverzögerter Werbeeffekte mit Hilfe von Distributed Lag Models.

Kursinhalte

•Wie können Werbeffekte quantifiziert werden?

•Wie stark erklärt der Einsatz von Werbemitteln Kennziffern von Webanalytics?

•Interagieren zeitliche Effekte mit der Werbewirkung?

•Wie werden zeitverzögerte Modelle erstellt und interpretiert?

•Welche zeitliche Verzögerung ist beim Werbemitteleinsatz zu erwarten?

www.r-akademie.de

Page 15: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Angewandte Statistik im Qualitätsmanagement mit R

2. bis 4. Dezember 2014 11. bis 13. Mai 2015

Vor dem Hintergrund immer dynamischer werdender Produktionsabläufe und Prozesse gewinnen statistische Verfahren im Qualitätsmanagement stetig an Bedeutung. Methodisches Know-how gepaart mit einer leistungsstarken Software sind die Treiber für deren erfolgreiche Anwendung.

Die Veranstaltung richtet ihren Fokus zunächst auf die Vermittlung von Grundlagen im Umgang mit der statistischen Programmiersprache R.Im Anschluss daran werden die für das Qualitätsmanagement wichtigsten statistischen Methoden eingeführt und direkt in R umgesetzt. Die Auswahl der Verfahren erfolgt anhand praxisrelevanter Kennzahlen im QM und von Managementsystemen wie Six Sigma und TQM. Neben den Kennwerten der deskriptiven Statistik werden ausgewählte Visualisierungstechniken der statistischen Daten vorgestellt.

Statistisches Testen und Prüfplanentwicklung (unter Berücksichtigung der AQL-Normwerttabellierungen nach ISO 2859 und DIN ISO 3951) bilden weitere Kursschwerpunkte. Die Methoden werden innerhalb des Trainings theoretisch eingeführt und anschließend anhand von praxisnahen Beispielen in R umgesetzt

Kursinhalte•Einstieg in R / Konzept und Philosophie von R

•Variablen und ihre Eigenschaften / Datenmanagement

•Deskriptive Statistiken unter Einbezug statistischer Kennzahlen des QM wie Cp, Cpk, PPM

•Tabellierung von Daten

•Visualisierungstechniken

•Antworten auf zentrale Fragen der Inferenzstatistik im QM

Page 16: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Programmieren mit R

Die Verbindung aus den umfassenden Statistik Bibliotheken und etablierten Programmierkonzepten macht R zu einer mächtigen Programmiersprache für alle Aufgaben im Umfeld von Data Mining, Predictive Analytics und vieles mehr. Durch die Verwendung von Statistik- und Grafikfunktionen mit Programmierelementen können regelmäßig wiederkehrende Skripteile elegant und effizient automatisiert werden.

Die Verwendung von Programmierelementen wird anhand von praxisnahen Beispielen erlernt. Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke zugeschnitten anzuwenden.

Kursinhalte

•Schleifen und Steuerungselemente/ Bedingte Anweisungen

•Vektorwertiges Programmieren

•Split-Apply-Combine Approach

•Eigene Funktionen definieren

•Environments und Scoping

•Objektorientierte Programmierung / R-Klassensysteme

•Exceptions / Error Handling

•Profilling und Debugging

11. bis 12. Februar 2015 I 17. bis 18. September 2015

www.r-akademie.de

Page 17: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Datenmanagement mit RUm Daten effizient analysieren zu können, müssen sich die Daten in einem für die jeweilige Analyseform passenden Format befinden. In der Praxis ist es die Regel, dass der Großteil des Aufwandes für den Analyseprozess auf die Aufbereitung der Rohdaten entfällt.

Im Kurs Datamanagement mit R werden effiziente Methoden zur Aufbereitung von unterschiedlich strukturierten Daten anhand praxisnaher Beispiele erlernt. Dabei konzentriert sich der Kurs neben den Grundfunktionalitäten von R im Wesentlichen auf die Verwendung der bewährten R-Pakete plyr/dplyr und tidyr(reshape). Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke zugeschnitten anzuwenden.

Kursinhalte

•Einfache-, bedingte- und komplexe Rekodierung von Variablen

•Datenaggregation

•Bilden und analysieren von Subsets und Datengruppen

•Gruppenweise Datenoperationen (split-apply-combine)

16. März 2015 I 10. September 2015

•Zusammenführen und sortieren von Daten

•Datentransformationen (wide vs. long format)

•Vergleichen von Daten

•Duplikate identifizieren und entfernen

www.r-akademie.de

Page 18: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Paketerstellung in REin wichtiger Bestandteil von R sind Pakete. Der enorme Funktionsumfang von R liegt vor allem in der kontinuierlichen Entwicklung von Paketen aus der Community begründet.

Um die Arbeit mit R auf ein noch höheres Niveau zu heben besteht für Anwender die Möglichkeit Pakete selbst zu erstellen. Das individuelle Zusammenführen von selbst erstellten Funktionen zu Paketen erhöht nachhaltig die Effizienz und die Reproduzierbarkeit der eigenen Analysen. Insbesondere für den Einsatz von R im produktiven Unternehmensumfeld erleichtern selbsterstellte Pakete die Arbeitsprozesse mit R entscheidend. Unkompliziert und einfach haben Sie das Methodenset, dass optimal zu Ihren Anforderungen passt immer verfügbar und können es auch anderen Unternehmensmitgliedern zur Verfügung stellen.

Zudem besteht die Möglichkeit Pakete zu veröffentlichen und Sie damit der R-Community zugänglich zu machen – wertvoller Austausch und konstruktive Kritik inklusive.

Der Kurs Paketerstellung mit R, erklärt wie man einfach und unkompliziert von einer losen Funktionssammlung zu einem veröffentlichungsfähigen Paket gelangt.

Kursinhalte

•Paketaufbau

•Veröffentlichung von Paketen

•Paketdokumentation

•Namespaces und Paketabhängigkeiten

•Testing

13. Februar 2015

www.r-akademie.de

Page 19: eoda R-Akademie 2015_Kursprogramm

R-Akademie

R im produktiven UnternehmensumfeldDer Einsatz von R in Produktivumgebungen stellt besondere Anforderungen hinsichtlich Reproduzierbarkeit, Kompatibilität, Zusammenarbeit in Teams, Last-Verteilung und Rechtemanagement. R-Skripte sollten jederzeit reproduzierbare Ergebnisse erzeugen, auch wenn zwischenzeitlich Updates an Paketen, R selbst oder dem Environment in dem R läuft durchgeführt wurden. Die Überarbeitungen von R-Skripten durch verschiedene Mitarbeiter sollten mit Hilfe von Versionierungssoftware gemanagt werden. Zudem kann mit automatisierten Tests sichergestellt werden, dass Veränderungen in einem Skript keine Nebenfolgen für andere Skripte haben. Schließlich ist die Server/Client Architektur ein zentraler Bestandteil produktiver R-Environments, weil sich so Zugriffsrechte und Rechenleistung besser steuern lassen.

Der zweitägige Kurs vermittelt die zentralen Aspekte einer auf den Produktiveinsatz ausgelegten R-Umgebung mit vielen praxisnahe Beispielen.

12. bis 13. März 2015 I 16. bis 17. November 2015

Kursinhalte•Updates von Paketen und R selbst

•Arbeiten in einem geschlossenen Environment

•Testing

•Versionierung und Kollaboration

•Dokumentation und Paketerstellung

•R in Server/Client-Architektur

www.r-akademie.de

Page 20: eoda R-Akademie 2015_Kursprogramm

R-Akademie

Reproducible Research mit RBei der Analyse statistischer Daten entstehen Berichte mit verschiedensten Elementen wie Text, Daten, Formeln, Tabellen und Grafiken. Durch Schnittstellen zwischen R und Latex/html können die verschiedenen Inhalte aus R heraus zusammengebracht und publikationsreif ausgegeben werden. Zudem ermöglicht es R, die Berichte dynamisch an neue Daten anpassen.

Bei der unter dem Begriff Reproducible Research bekannten Methode werden die Berichtselemente aktualisiert, ohne manuelle Anpassungen vorzunehmen. Nach dem Kurs sollen die Teilnehmer in der Lage sein, individuelle und automatisierte Reports zu erstellen.

Anhand von theoretischen Einführungen, konkreten Fällen und praktischen Übungen werden die beschriebenen Inhalte verständlich vermittelt.

19. Februar 2015 I 11. September 2015

Kursinhalte

•Die Benutzeroberfläche R-Studio

•Die Pakete „Sweave“ und „knitR“

•Kurzeinführungen in Latex, Markdown und HTML

•Formatieren der R-Ausgaben mit Chunk-Optionen

•Anfertigen von statischen Reportvorlagen in verschiedenen Ausgabeformaten wie pdf und html

•Dynamische Berichte und automatisierte Anpassungen

www.r-akademie.de

Page 21: eoda R-Akademie 2015_Kursprogramm

R-Akademie

eodaWir bei eoda haben eine Leidenschaft für Daten und Analysen. Wir sind Data Scientists, Softwareentwickler, Unternehmensberater und Schulungsanbieter. Auf der Basis reichhaltiger Erfahrung in Data Science und unter der Verwendung modernster Technologien generieren wir strategische Wettbewerbsvorteile aus Daten.

Vor neuen Herausforderungen und individuellen Anliegen schrecken wir nicht zurück. Mit unseren agilen Vorgehen, bewährten statistischen und analytischen Verfahren und erprobten Technologien sind wir bereit für neue und spannende Aufgaben –sprechen Sie uns an.

Preis / OrtDie Kursgebühren belaufen sich auf € 490,- pro Person/Tag zzgl. MwSt. Frühbucher und Hochschulmitglieder erhalten attraktive Sonderkonditionen. In den Kosten sind Getränke und Snacks inbegriffen.

Die Kurse finden in unseren Schulungsräumen in Kassel statt. Es besteht sowohl eine gute Anbindung mit dem Auto als auch mit öffentlichen Verkehrsmitteln.

AnmeldungDas Anmeldeformular und weitere Informationen finden Sie unter www.r-akademie.de

eoda GmbHLudwig-Erhard-Straße 8

34131 KasselTel. +49 (0)561 202 724 40Fax. +49 (0)561 202 724 30

[email protected]