MOOC "Analyse des données multidimensionnelles"

Lien : https://www.fun-mooc.fr/fr/cours/analyse-des-donnes-multidimensionnelles/


Ce que vous allez apprendre


À la fin de ce cours, vous saurez :

  • résumer et synthétiser des tableaux de données par des graphes simples ;
  • utiliser des méthodes de visualisation adaptées à l'analyse exploratoire multidimensionnelle ;
  • interpréter les résultats d'une analyse factorielle et d'une classification ;
  • reconnaître, par rapport à la problématique et aux données, la méthode adaptée à l'exploration d'un jeu de données selon la nature et la structure des variables ;
  • analyser les réponses à une enquête ;
  • mettre en oeuvre une méthode d'analyse de données textuelles
  • mettre en oeuvre les méthodes factorielles et de classification sur le logiciel gratuit R


En résumé, vous serez autonome sur la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.


Format


Conçu en vue des applications, ce cours donne une large place aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR et Factoshiny de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.


Prérequis


Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.

Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.

Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.

Enfin, une initiation au langage R est suffisante pour la mise en œuvre concrète des méthodes.


Evaluation et Certification


Pour suivre ce cours, vous avez le choix entre deux formules : le parcours découverte et le parcours certifiant.

Parcours découverte : si vous optez pour ce parcours, vous aurez accès aux vidéos, aux quiz et exercices auto-corrigés et aux échanges dans le forum. Ce parcours ne donnera pas lieu à la délivrance de badge numérique. L'inscription est gratuite.

Parcours certifiant : en complément des activités proposées dans le parcours découverte, le parcours certifiant vous permettra d'obtenir un certificat. Pour cela, vous devrez suivre un examen surveillé à distance d'une durée limitée, consistant en questions à choix multiples (QCM) et d'obtenir 50% de bonnes réponses.

Date
3 mars 2025 au 22 mai 2025
Type
  • Asynchrone
  • En ligne
Localité
En ligne
Thématiques
Données

Semaine 1 : Analyse en composantes principales

  • Données, problématique et exemples
  • Recherche d'une représentation des individus
  • Interprétation de la représentation des individus grâce aux variables
  • Représentation des variables
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR


Semaine 2 : Analyse factorielle des correspondances

  • Données, notations, questions
  • Liaison et indépendance entre deux variables qualitatives
  • Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
  • Nuages des lignes et des colonnes et leur représentation
  • Pourcentages d'inertie et inerties en AFC
  • Représentation simultanée des lignes et des colonnes
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR


Semaine 3 : Analyse des correspondances multiples

  • Données, objectifs et problématique
  • Transformation du tableau des données
  • Représentation des individus
  • Représentation des modalités comme aide à l'interprétation de la représentation des individus
  • Nuage des modalités et sa représentation optimale
  • Représentation simultanée des deux nuages
  • Interprétation des valeurs propres
  • Représentation des variables
  • Aides à l'interprétation
  • Tableau de Burt
  • Mise en œuvre sous FactoMineR


Semaine 4 : Classification

  • Données, définitions
  • Principe de construction d'un arbre hiérarchique
  • Algorithme de partitionnement : les K-means
  • Consolidation des classes
  • Classification sur données de grande dimension
  • Analyse factorielle et classification
  • Caractérisation des classes d'individus
  • Mise en œuvre sous FactoMineR


Semaine 5 : Analyse Factorielle Multiple

  • Données, problématique
  • Equilibre des groupes et choix d'une pondération des variables
  • Etude et représentation des groupes de variables
  • Représentation des points partiels
  • Représentation des analyses séparées
  • Prise en compte de groupes de variables qualitatives
  • Prise en compte de tableaux de contingence
  • Aide à l'interprétation
  • Mise en œuvre sous FactoMineR