mercredi 8 août 2012

Manipulation des données avec R

Le logiciel R est à la fois un logiciel de statistique, sa bibliothèque de fonctions est quasi-infinie, et un langage de programmation, avec tous les attributs associés (types de données, branchements conditionnels, boucles, modularité…).

Mais, on le met peu souvent en avant, R est aussi un excellent outil de préparation des données. Il propose l’équivalent des fonctionnalités qui font la popularité des tableurs dans la phase de pré-traitement (filtres, filtres élaborés, élaboration de variables synthétiques, tris, tableaux croisés dynamiques, etc.).

Dans ce tutoriel, nous présentons succinctement les possibilités de R en matière de manipulation de données. Nous aborderons tour à tour : le filtrage, les statistiques descriptives ciblées sur des sous-populations, les tris et, très brièvement, les outils graphiques.

Mots-clés : logiciel R, package xlsx, fichier excel, filtrage, tri, graphiques, préparation des données
Fichier : r_manip_data.zip
Références :