RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI...

15
RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu ZAMBEAU 26/10/2016

Transcript of RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI...

Page 1: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

RATTLE-GUI UN PACKAGE R DE DATAMINING

Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu ZAMBEAU

26/10/2016

Page 2: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

• Introduction

• Présentation de Rattle

• Evaluation

• Conclusion

• Démonstration

SOMMAIRE

2M2 SISE RATTLE - 26/10/2016

Page 3: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

INTRODUCTION

• Logiciel libre de datamining

• RATTLE : R Analytic Tool To Learn Easely

• GUI : Graphical User Interface

• Package accessible sous R et RStudio

3M2 SISE RATTLE - 26/10/2016

Page 4: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

HISTORIQUE

• Développé par le Dr. Graham Williams dans les années 2000

• Version finale sortie en janvier 2013

• Régulièrement mis à jour depuis (version actuelle : 5.0.2)

4M2 SISE RATTLE - 26/10/2016

Page 5: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

UN PREMIER APERCU

• Logiciel de clic-bouton

• Différents onglets de navigation

• Bouton Exécuter pour lancer la tâche ou pour modifier un paramètre

5M2 SISE RATTLE - 26/10/2016

Page 6: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

INSTALLATION DE RATTLE

• 3 lignes de commande sous R/Rstudio :

• install.packages(« rattle »)

• library(rattle)

• rattle()

6M2 SISE RATTLE - 26/10/2016

Page 7: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

PRINCIPAUX PACKAGES

• Beaucoup de packages supplémentaires à installer, parmi les principaux :

o GTK+ : permet la construction d’interfaces graphiques pour l’utilisateur

o RGtk2 : installations supplémentaires pour les interfaces graphiques de programmation

o Stringr : facilite la manipulation de chaîne de caractères

o XML : utile dans la lecture et la création de fichiers XML

o CairoDevice : permet d’afficher des graphiques à l’écran et de les enregistrer dans un fichier ou en mémoire

7M2 SISE RATTLE - 26/10/2016

Page 8: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

EXEMPLE DE COMPARAISON R ET RATTLE

Sous R : summary() Sous Rattle

8M2 SISE RATTLE - 26/10/2016

Page 9: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

LISTING DES METHODES DE DATAMINING

Analyses factorielles ACP ACM AFC AFDM

Régression linéaire linéaire généralisée de Poisson

logistique logistique multinomiale

Clustering K-means

CAH

9M2 SISE RATTLE - 26/10/2016

Classification floue K-médoides

CDH

Analyse de la variance Analyse de la covariance

Quid des variables catégorielles ?

Caractérisation des classes difficile

Page 10: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

LISTING DES METHODES DE DATAMINING

Tests statistiques Student Khi-2 Fisher

10M2 SISE RATTLE - 26/10/2016

Modèles de survie

Analyse discriminante

Boosting

Règles d’association Réseaux de neurones Séries temporelles

Data visualisation

Support vector machine (SVM)

V de Cramer

Wilcoxon-Mann-Whitney Rangs signés de Wilcoxon

Arbres de décision Apprentissage supervisé

Random forest

Page 11: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

POINTS FORTS DE RATTLE

• Même capacité à gérer les bases de données volumineuse que R

• Diversité des sources de données (Excel, R, ODBC, etc.)

• Analyse descriptive assez complète (illustrations graphiques, modalités, statistiques descriptives, etc.)

• Interface graphique (facilité d’utilisation pour les dataminers)

• Syntaxe code auto-gérée par Rattle

11M2 SISE RATTLE - 26/10/2016

Page 12: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

POINTS FAIBLES DE RATTLE

• Peu de documentation sur Internet

• Interface (présentation des résultats, graphiques, etc.)

• Absence de certaines méthodes statistiques

• Connaissance préalable du langage R souhaitable

• Dépendance d’autres packages (GTK implique l’installation de beaucoup de packages)

• Outil parfois instable

12M2 SISE RATTLE - 26/10/2016

Page 13: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

EVALUATION CRITIQUE

13M2 SISE RATTLE - 26/10/2016

• Moins complet que d’autres logiciels gratuits (Knime et Orange par exemple)

• Rendu graphique insatisfaisant

• Types des données traitées : uniquement quantitatives, qualitatives et binaires. Pas de traitement des données textuelles (contrairement à Orange, Weka, RapidMiner, Knime par exemple)

Logiciel limité pour les dataminers, car seules les principales méthodesstatistiques sont présentes sous Rattle, donc un complément deprogrammation en R est quasiment obligatoire pour aller plus loindans les analyses

Page 14: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

CONCLUSION

• Utilisation plutôt intuitive et facile

• Réalisation des principales méthodes de datamining

• Limité pour les statisticiens

14M2 SISE RATTLE - 26/10/2016

Page 15: RATTLE-GUIeric.univ-lyon2.fr/.../sise/LogicielsOct2016/5_Rattle.pdf · 2016. 10. 31. · RATTLE-GUI UN PACKAGE R DE DATAMINING Mathilde EVIN Emilien FROMAGE Nirasay SISOMBAT Matthieu

Merci de votre attention !

Avez-vous des questions ?