MOOC "Analyse des données multidimensionnelles"
Lien : https://www.fun-mooc.fr/fr/cours/analyse-des-donnes-multidimensionnelles/
Ce que vous allez apprendre
À la fin de ce cours, vous saurez :
- résumer et synthétiser des tableaux de données par des graphes simples ;
- utiliser des méthodes de visualisation adaptées à l'analyse exploratoire multidimensionnelle ;
- interpréter les résultats d'une analyse factorielle et d'une classification ;
- reconnaître, par rapport à la problématique et aux données, la méthode adaptée à l'exploration d'un jeu de données selon la nature et la structure des variables ;
- analyser les réponses à une enquête ;
- mettre en oeuvre une méthode d'analyse de données textuelles
- mettre en oeuvre les méthodes factorielles et de classification sur le logiciel gratuit R
En résumé, vous serez autonome sur la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.
Format
Conçu en vue des applications, ce cours donne une large place aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR et Factoshiny de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.
Prérequis
Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.
Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.
Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.
Enfin, une initiation au langage R est suffisante pour la mise en œuvre concrète des méthodes.
Evaluation et Certification
Pour suivre ce cours, vous avez le choix entre deux formules : le parcours découverte et le parcours certifiant.
Parcours découverte : si vous optez pour ce parcours, vous aurez accès aux vidéos, aux quiz et exercices auto-corrigés et aux échanges dans le forum. Ce parcours ne donnera pas lieu à la délivrance de badge numérique. L'inscription est gratuite.
Parcours certifiant : en complément des activités proposées dans le parcours découverte, le parcours certifiant vous permettra d'obtenir un certificat. Pour cela, vous devrez suivre un examen surveillé à distance d'une durée limitée, consistant en questions à choix multiples (QCM) et d'obtenir 50% de bonnes réponses.
- Asynchrone
- En ligne
Semaine 1 : Analyse en composantes principales
- Données, problématique et exemples
- Recherche d'une représentation des individus
- Interprétation de la représentation des individus grâce aux variables
- Représentation des variables
- Aides à l'interprétation
- Mise en œuvre sous FactoMineR
Semaine 2 : Analyse factorielle des correspondances
- Données, notations, questions
- Liaison et indépendance entre deux variables qualitatives
- Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
- Nuages des lignes et des colonnes et leur représentation
- Pourcentages d'inertie et inerties en AFC
- Représentation simultanée des lignes et des colonnes
- Aides à l'interprétation
- Mise en œuvre sous FactoMineR
Semaine 3 : Analyse des correspondances multiples
- Données, objectifs et problématique
- Transformation du tableau des données
- Représentation des individus
- Représentation des modalités comme aide à l'interprétation de la représentation des individus
- Nuage des modalités et sa représentation optimale
- Représentation simultanée des deux nuages
- Interprétation des valeurs propres
- Représentation des variables
- Aides à l'interprétation
- Tableau de Burt
- Mise en œuvre sous FactoMineR
Semaine 4 : Classification
- Données, définitions
- Principe de construction d'un arbre hiérarchique
- Algorithme de partitionnement : les K-means
- Consolidation des classes
- Classification sur données de grande dimension
- Analyse factorielle et classification
- Caractérisation des classes d'individus
- Mise en œuvre sous FactoMineR
Semaine 5 : Analyse Factorielle Multiple
- Données, problématique
- Equilibre des groupes et choix d'une pondération des variables
- Etude et représentation des groupes de variables
- Représentation des points partiels
- Représentation des analyses séparées
- Prise en compte de groupes de variables qualitatives
- Prise en compte de tableaux de contingence
- Aide à l'interprétation
- Mise en œuvre sous FactoMineR