Introduction à R

  • Introduction à l’analyse et visualisation de données avec le logiciel libre R :
    • Durée : 12h.
    • Horaires et dates : information disponible prochainement.
    • Lieu : EPHE, boulevard Raspail. 
      Pour celles et ceux qui ne résident pas à Paris ou qui sont en mission, il est possible d'assister aux séances à distance.
    • Enseignement : Daniel STOCKHOLM (EPHE, maître de conférence de la section SVT).
    • Inscription.

Ce cours est dédié à l’apprentissage de l’analyse et de la visualisation de données à partir de textes (littéraires ou autres). Il est conçu pour des étudiants sans expérience en programmation avec un niveau en mathématique de type bac littéraire.

Les techniques enseignées vous permettront d’importer des données issues de corpus de textes numériques accessibles par exemple via internet, de les organiser et de les analyser afin d’en extraire des informations quantitatives.

 




Exemple d’une analyse de la fréquence des mots d’un texte issus du roman « La Princesse de Clèves. ».





Exemple d’une analyse en composante principale permettant de distinguer des œuvres selon leur type (comédie/Tragédie) et selon l’auteur (Pierre Corneille/Thomas Corneille).





Exemple de représentation de type Arbre (clusterisation hiérarchique) afin de visualiser les relations de « distance » entre différents mots au sein d’une œuvre.





Exemple de représentation de type Diagramme en arc présentant les relations au niveau des dialogues entre les différents personnages des épisodes 4,5 et 6 de StarWars.



Références :