Python 2 : Applications aux humanités numériques

  • Horaires et dates : les mercredis de 16h à 18h, du 24 janvier au 30 mai 2018.
  • Lieu : EPHE, boulevard Raspail, salle 26.
  • Enseignement : Marc BUI (EPHE, directeur d'études cumulant de la section SVT)
  • Inscription.

Ce cours a pour objet de donner à l’étudiant des connaissances de base en algorithmique et en programmation.
Au terme de ce cours, l’étudiant aura acquis la maîtrise d’outils de traitement d’information pour diverses tâches orientées vers les thèmes des humanités numériques.
Il devrait, à la fin du cours, posséder une connaissance méthodologique pour concevoir une solution informatique, d’avoir une bonne compréhension des problèmes liés à la programmation et connaître des techniques de programmation et d’analyse.

Parmi les thèmes abordés, on trouvera :

  • Apprendre à manipuler de diverses manières une collection de fichiers texte, afin d’en extraire différentes informations et les visualiser.
  • Apprendre à récupérer des données textuelles à partir du web, à traiter les métadonnées afin de classifier ou regrouper un ensemble de textes.
  • Construire un système de recherche d’informations : s’initier à l’indexation de textes et la construction d’espace sémantique.
  • Elaborer des interfaces graphiques (avec la librairie Qt par exemple, module PyQt5) Concevoir une application destinée à être déployée sur le web à l’aide d’un module spécialisé (par exemple, Flask ou Django).
  • Exploiter des données géo-localisées et les visualiser sur un fond de card carte (par exemple, avec le module mapnik)
  • Explorer l’analyse de documents disponibles sous forme d’images. Ce sujet abordera les tâches de binarisation de l’image, la segmentation de zone de textes, ou encore la reconnaissance des caractères dans un texte-image (par exemple avec le module Ocropus).

La programmation se fera avec Python version 3 de préférence sauf cas particulier.

Undefined