Mais, on le met peu souvent en avant, R est aussi un excellent outil de préparation des données. Il propose l’équivalent des fonctionnalités qui font la popularité des tableurs dans la phase de pré-traitement (filtres, filtres élaborés, élaboration de variables synthétiques, tris, tableaux croisés dynamiques, etc.).
Dans ce tutoriel, nous présentons succinctement les possibilités de R en matière de manipulation de données. Nous aborderons tour à tour : le filtrage, les statistiques descriptives ciblées sur des sous-populations, les tris et, très brièvement, les outils graphiques.
Mots-clés : logiciel R, package xlsx, fichier
excel, filtrage, tri, graphiques, préparation des données
Fichier : r_manip_data.zip
Références :
R Project,"The R Project for Statistical Computing".
KDNuggets Polls :
- What Analytics, Data mining, Big Data software you used in the past 12 months for a real project? (May 2012)
- Programming languages for analytics / data mining? (Aug 2012)
- Tools / Languages for Data Cleaning (Sep 2008)