R et le big data — pour qui ?

La popularité du big data n’est plus à remettre en cause : comme nous, vous en entendez parler chaque jour, dans les médias classiques comme sur le web. Pourtant, pas facile de cerner cette thématique complexe, et surtout, difficile à approcher. Si vous souhaitez vous lancer dans l’aventure des bases de données massives, nous avons la formation qu’il vous faut !

Vous vous êtes déjà retrouvé impuissant devant un message de type « cannot allocate vector of size … gb» ? Alors notre formation est faite pour vous ! Vous vous sentez aujourd’hui limité face à la volumétrie des bases de données que vous avez à gérer ? Contactez-nous : « R et le big data » vous fournira toutes les bonnes pratiques pour travailler, depuis ce logiciel open source ultra puissant, ces bases immenses.

Composée sur mesure, cette session de formation s’intéressera à des problématiques précises : les vôtres. En échangeant avec nous en amont, nous pourrons identifier vos attentes et vos besoins. Et si vous nous transmettez vos propres contenus, nous pourrons les travailler ensemble — et ça, c’est encore mieux ! Rien de tel pour vous enseigner R que de traiter des cas concrets, en vous fournissant des solutions directement applicables.

De quoi parlera-t-on ?

De nombreux domaines d’activité ont aujourd’hui à faire face à l’ascension exponentielle des données. Et qui dit volume exceptionnel dit méthodes de gestion exceptionnelles. En 2016, il est devenu indispensable de développer des process spécifiques au traitement des bases immenses, là où les techniques classiques se trouvent dépassées face à cette volumétrie inédite. Sur deux jours de formation, nous vous donnerons toutes les clés pour vous lancer dans la manipulation et l’analyse de « big data ».

Pour ces vastes bases de données, il est indispensable d’avoir un code propre et clair, pour ne pas vous perdre face aux milliers de lignes que peut contenir votre espace de travail. Ainsi, cette formation vous permettra d’écrire du code dplyr lisible et efficace, de décoder la syntaxe data.table ainsi que mettre vos productions en packages. Nous aborderons également la recherche reproductible et le reporting automatique — ce qui vous permettra de gagner en pertinence et en efficacité.

Prérequis

Pour pouvoir suivre ce module sur R et le big data, il est indispensable d’avoir des bases solides pour l’utilisation du logiciel, notamment être familier avec les fonctions Xapply. Cette formation peut-être la suite d’une session déjà effectuée avec nous, mais vous pouvez également vous être formé par vous-même.

 

Programme :

Manipulation avancée de données

– Packages plyr, dplyr et tidyr
– Opérateur %>%
– Établir une connexion avec une base SQL et exécuter une requête

Les bonnes pratiques

– Présentation des guidelines de programmation en R

Manipulation de données pour grosses volumétries

– Package {dplyr}, {data.table}

Calcul en parallèle

– Utiliser toutes les capacités de sa machine

Programmation avec R – niveau avancé

– Programmation fonctionnelle
– Optimisation de code
– Méta-programmation

Création de package

– Utilisation de devtools et de roxygen2 pour la création de documentation
– Versioning de script avec Git pour RStudio

Industrialisation

– Installation et configuration de RStudio server, configurer son Rprofile
– Intégration de R dans une infrastructure préexistante

Appelez-nous au 01.85.09.14.03

Ou alors précisez ci-après votre besoin :

(on vous recontacte dans la journée)

Votre nom (obligatoire)

Votre email (obligatoire)

Votre téléphone (obligatoire)

Sujet

Votre message

Parcourir le catalogue de formation :