Nos formations

Contactez-nous

Formation "Manipulation de données avec R"

Durée de la formation : 1 à 2 jours (selon le niveau des participants).

Objectifs : Acquérir les bonnes pratiques relatives à la manipulation de données avec R.

Pré-requis : Des bases de programmation avec R sont nécessaires pour suivre de manière optimale cette formation.

Public : Toute personne ayant déjà un peu utilisé R et souhaitant acquerir des bonnes pratiques pour manipuler et transformer ses données de manière performante et optimale.

Pédagogie : Les notions présentées seront mises en application sous forme d'exercices pratiques tout au long de la formation.

RDataManip

Plan de la formation :

  1. Charger des données dans R
    1. Depuis un fichier plat (txt, csv)
    2. Depuis Excel
    3. Depuis un autre logiciel de statistiques (SAS, SPSS)
    4. Depuis une base de données relationnelles (SQL)
    5. Depuis le web
  2. Manipuler des données dans R à l'aide du package "dplyr"
    1. Introduction au package "dplyr" : syntaxe et "pipe"
    2. Manipulation d'observations (lignes) : les fonctions "filter" et "arrange"
    3. Manipulation de variables (colonnes) : les fonctions "select" et "mutate"
    4. La fonction "summarize"
    5. La fonction "group_by"
    6. Jointures de données
  3. Introduction au cleaning de données avec le package "tidyr"
    1. Format large vers format long : la fonction "gather"
    2. Format long vers format large : la fonction "spread"
    3. Compléter les valeurs manquantes : la fonction "fill"
    4. Quelques autres exemples : les fonctions "separate" et "complete"


Revenir à la liste complète des formations