Introduction à R

  • Introduction à l’analyse et visualisation de données avec le logiciel libre R :
    • Durée : 12h.
    • Horaires et dates : les mardis de 15h à 17h, du 23 janvier 2018 au 20 mai 2018.
    • Lieu : EPHE, boulevard Raspail, salle 05, sauf le 20/02, salle 26. 
      Pour celles et ceux qui ne résident pas à Paris ou qui sont en mission, il est possible d'assister aux séances à distance.
    • Enseignement : Daniel STOCKHOLM (EPHE, maître de conférence de la section SVT).
    • Inscription.

Ce cours est dédié à l’apprentissage de l’analyse et de la visualisation de données à partir de textes (littéraires ou autres). Il est conçu pour des étudiants sans expérience en programmation avec un niveau en mathématique de type bac littéraire.

Les techniques enseignées vous permettront d’importer des données issues de corpus de textes numériques accessibles par exemple via internet, de les organiser et de les analyser afin d’en extraire des informations quantitatives.

 




Exemple d’une analyse de la fréquence des mots d’un texte issus du roman « La Princesse de Clèves. ».





Exemple d’une analyse en composante principale permettant de distinguer des œuvres selon leur type (comédie/Tragédie) et selon l’auteur (Pierre Corneille/Thomas Corneille).





Exemple de représentation de type Arbre (clusterisation hiérarchique) afin de visualiser les relations de « distance » entre différents mots au sein d’une œuvre.





Exemple de représentation de type Diagramme en arc présentant les relations au niveau des dialogues entre les différents personnages des épisodes 4,5 et 6 de StarWars.



Références :