Philologie numérique et méthodes quantitatives

 

  • Durée : 24h réparties sur 4 journées
    • les 4, 11, 18 et 25 avril.
    • de 10h à 13h et de 14h à 17h.
  • Lieu : Ecole nationale des chartes, 65 rue de Richelieu, 3e ét. salle informatique.
  • Enseignement : Jean-Baptiste Camps (ENC) et Florian Cafiero.

Le cours Philologie numérique et méthodes quantitatives du programme E-Philologie aura lieu en avril à l'École des chartes. Ce cours sera dédié à la présentation de méthodes statistiques permettant l'analyse de textes, anciens ou modernes, dans une perspective de stylométrie (attribution et identification des auteurs, datation, localisation, …), sans exclure la prise en compte de questions liées à la tradition des textes ou à une analyse plus thématique. Si vous disposez d'un corpus sur lequel vous souhaitez expérimenter, vous aurez l'occasion de le faire lors des séances. Sinon, nous vous proposerons de travailler sur différents corpora (attribution des œuvres de Chrétien de Troyes ; datation des manuscrits de chanson de geste ; controverse Molière/Corneille ; …). Pour ceux qui comptent y assister, nous vous demandons de confirmer votre intérêt et votre présence à ce cours via le formulaire suivant : http://goo.gl/forms/ja5IRx5FM8.

 

Programme

Fondamentaux d'analyse quantitative, autour de la stylométrie

  • le 4 avril
    • 10h-13h : Fondamentaux 1 - Introduction et généralités ; installation des logiciels et présentation des corpora ; quelles approches pour l'analyse quantitative ?
    • 14h-17h : Fondamentaux 2 - Dater, localiser et attribuer les textes sans a priori 1/2 (méthodes de partitionnement, dont CAH, arbre de consensus, classification et description des classes).
  • le 11 avril
    • 10h-13h : Fondamentaux 3 - Dater, localiser et attribuer les textes sans a priori 2/2 (analyses factorielles et MDS) ;
    • 14h-17h    Fondamentaux 4 - Opposer et comparer des textes (contraster des textes, attribuer par comparaison avec des corpus de référence, etc.).

Séances thématiques et présentations d'outils

  • le 18 avril
    • 10h-13h : le module Stylo pour R 1/2
    • 14h-17h : le module Stylo pour R 2/2
  • le 25 avril
    • 10h-13h : TXM 1/2
    • 14h-17h : TXM 2/2

 

Si le nombre de personnes intéressées étaient suffisantes, nous pourrions consacrer une journée supplémentaire en mai à la stemmatologie et l'analyse de traditions textuelles.

 

Installation

Dans l'idéal, il serait souhaitable que les participants procèdent, autant que possible, à l'installation des différents logiciels requis avant la séance. Nous consacrerons néanmoins une partie de la première séance à la résolution des problèmes d'installation. Les logiciels nécessaires (libres et interopérables, fonctionnant au moins sous les trois systèmes d'exploitation les plus répandus) seront : R (langage d'analyse statistique), Rstudio (environnement de développement pour R), TXM (plateforme de textométrie). Pour les utilisateurs de Linux et d'Ubuntu, R est disponible dans les dépôts, et il vous suffit de taper la commande : sudo apt-get install r-base Et, pour TXM et Rstudio de récupérer les paquets .deb, pour TXM sur Sourceforge (http://sourceforge.net/projects/txm/) et pour Rstudio sur https://www.rstudio.com/products/rstudio/download/, et de les installer via la logithèque. Pour les utilisateurs de Mac ou d'autres systèmes d'exploitation, vous aurez la possibilité de bénéficier des postes sous Ubuntu de la salle informatique, mais vous pouvez également tout à fait installer ces paquets sur vos machines, nous vous renvoyons aux téléchargements de ces différents logiciels :