MOOC "Introduction à la statistique avec R"
Lien : https://www.fun-mooc.fr/fr/cours/introduction-a-la-statistique-avec-r/
Ce que vous allez apprendre
À la fin de ce cours, vous saurez :
- comprendre les principes de base de la statistique
- identifier les méthodes statistiques les plus couramment utilisées
- utiliser le logiciel libre R
Format
Le cours comprend deux volets :
- des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R
- des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.
Chaque semaine, 4 à 6 vidéos de cours d’une dizaine de minutes et un “lab” seront mis en ligne.
Prérequis
Il n’y a pas de pré-requis pour suivre ce cours. Des connaissances de base en algèbre ou en programmation sont utiles mais ne sont pas nécessaires. En revanche, la volonté d’apprendre à analyser un jeu de données par soi-même est essentielle.
Public visé
Ce cours s'adresse à un public francophone cherchant à se former aux bases de la statistique avec un logiciel libre (disponible gratuitement). Il vise aussi bien un public en formation initiale qu'un public en formation continue. Compte tenu des nombreux domaines d'application des statistiques et de la taille importante de la communauté R, ce cours concerne une large audience. Sciences fondamentales comme appliquées, sciences humaines, gestion de projet, les statistiques concernent potentiellement l'ensemble des professions.
Evaluation et Certification
L’évaluation comporte trois niveaux :
- des quiz “mémoire” (5 à 10 questions à la fin de chaque vidéo),
- des quiz “exercice” (le plus souvent des calculs simples à réaliser avec R),
- un devoir à rendre sous forme de script R.
Un badge numérique sera attribué par FUN et l'Université Paris-Saclay à l'issue du MOOC aux apprenants qui auront obtenu une note supérieure à 60 %.
- En ligne
Semaine 1 : Introduction aux statistiques et à R, description d’une variable
- Introduction
- Chapitre 1 : Définitions
- Chapitre 2 : Représentations graphiques
- Chapitre 3 : Mesures de position et de dispersion : les principes
- Chapitre 4 : Mesures de position et de dispersion : la pratique
- Lab 1 : Introduction à R studio, manipulation des fichiers et des variables
Semaine 2 : Intervalles de confiance, association entre variables
- Chapitre 5 : Intervalles de confiance
- Chapitre 6 : Coefficient de corrélation
- Chapitre 7 : Risque relatif et odds-ratio
- Lab 2 : Manipulation de données, résumés numériques et graphiques
- Lab 3 : RMarkdown et rapport automatisé
Semaine 3 : Tests statistiques et pratique des tests
- Chapitre 8 : Tests statistiques : le “p”
- Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson
- Chapitre 10 : Comparaison de deux pourcentages
- Chapitre 11 : Comparaison de deux moyennes
- Chapitre 12 : Test de nullité d’une corrélation, divers
- Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
Semaine 4 : Régression linéaire simple et multiple, régression logistique
- Chapitre 13 : Régression linéaire simple
- Chapitre 14 : Régression linéaire, corrélation et test t
- Chapitre 15 : Régression linéaire multiple, analyse de variance
- Chapitre 16 : Introduction à la régression logistique
- Chapitre 17 : Régression logistique multiple
- Lab 5 : Régression linéaire et logistique
Semaine 5 : Données de survie (censurées), méthodes exploratoires multidimensionnelles
- Chapitre 18 : Données de survie ou censurées
- Chapitre 19 : Tests et modèles pour données censurées
- Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles
- Chapitre 21 : Analyse en composantes principales
- Chapitre 22 : Classification hiérarchique