Introduction à R

  • Introduction à l’analyse et visualisation de données avec le logiciel libre R :
    • Durée : 12h.
    • Horaires et dates : les mardis de 15h à 17h, à partir du 21 février.
    • Lieu : EPHE, Immeuble le France, Paris XIIIe, salle 121.
    • Enseignement : Daniel STOCKHOLM (EPHE, maître de conférence de la section SVT).
    • Inscription.

Ce cours est dédié à l’apprentissage de l’analyse et de la visualisation de données à partir de textes (littéraires ou autres). Il est conçu pour des étudiants sans expérience en programmation avec un niveau en mathématique de type bac littéraire.

Les techniques enseignées vous permettront d’importer des données issues de corpus de textes numériques accessibles par exemple via internet, de les organiser et de les analyser afin d’en extraire des informations quantitatives.

 




Exemple d’une analyse de la fréquence des mots d’un texte issus du roman « La Princesse de Clèves. ».





Exemple d’une analyse en composante principale permettant de distinguer des œuvres selon leur type (comédie/Tragédie) et selon l’auteur (Pierre Corneille/Thomas Corneille).





Exemple de représentation de type Arbre (clusterisation hiérarchique) afin de visualiser les relations de « distance » entre différents mots au sein d’une œuvre.





Exemple de représentation de type Diagramme en arc présentant les relations au niveau des dialogues entre les différents personnages des épisodes 4,5 et 6 de StarWars.



Références :