Les enseignements du parcours SDHC
Structuration et exploitation des données (bases de données SQL/NoSQL)
Cet enseignement forme aux méthodes de modélisation et d'exploitation de l'information historique et patrimoniale sous forme de bases de données, afin que les étudiant·es soient autonomes dans la conception et l'utilisation d'une telle base. Après avoir posé les principes de la logique des bases relationnelles, les étudiant·es voient à travers des études de cas comment bien modéliser sources et objets historiques. On accorde ainsi une grande attention aux exigences d'une approche prosopographique, et à la dimension chronologique, spatiale, matérielle ou picturale des sources. L’apprentissage des requêtes en SQL permet d’analyser finement ses données pour les comprendre et les interpréter.
Cet enseignement se poursuit en M2, en abordant cette fois les modèles NoSQL de bases de données, pour en comprendre les principes, les bénéfices et les situations où ils sont pertinents.

Algorithmique et programmation (Python)

Au-delà de sa capacité à donner des instructions à un ordinateur, un programme informatique est avant tout le résultat d'un processus d'écriture par lequel une réflexion est menée sur un problème donné. En ce sens, la programmation est une pratique essentielle aux humanités numériques, car elle constitue une compétence clé pour manipuler les données numériques, tout en faisant appel à une forme de réflexivité similaire à celle utilisée dans les sciences humaines et sociales.
Fondé sur une pédagogie par la pratique destinée aux débutants·es, cet enseignement vise à rendre les participants·es autonomes dans l'utilisation du langage Python dans une variété de contextes susceptibles d'être rencontrés dans le cadre de la pratique des humanités numériques. Les participants·es acquerront ainsi un ensemble de compétences allant de l'utilisation d'un environnement de développement à la manipulation de données sous diverses formes en vue de constituer des jeux de données à partir de ressources en ligne ou numérisées.
Analyse des données textuelles
Cet enseignement a pour objectif de former les participants·es à un ensemble de méthodes permettant d'explorer et d'interpréter des corpus textuels variés. Les étudiants·es y découvriront des techniques et outils de traitement du langage naturel, de fouille de texte, mais aussi d'analyse et de visualisation des données textuelles. Une attention particulière sera portée aux méthodes traditionnelles de la textomérie et de la linguistique de corpus, mais aussi à celles du machine learning et du deep learning.
Pensées à travers des mises en œuvres pratiques, les séances mobiliseront des paquets et des bibliothèques R ou Python permettant ainsi aux participants·es d'acquérir des compétences concrètes et applicables dans le domaine des humanités numériques tout en développant leur capacité à mettre en place des protocoles adaptés à leurs objets de recherche et à interpréter les résultats de manière critique et problématisée.

Cartographie et SIG

Cette formation vise à vous transmettre les connaissances et les compétences nécessaires pour aborder les enjeux spatiaux et cartographiques d’une recherche en histoire, histoire de l’art ou archéologie.
Les étudiant·es y apprennent le fonctionnement d’un système d’information géographique (SIG) à travers l’utilisation du logiciel QGIS. Ce type de logiciel se caractérise par l’attribution de coordonnées aux phénomènes que l’on décrit, ce qui permet non seulement de localiser des phénomènes, mais également de découvrir des relations spatiales entre ces phénomènes.
Dans cette perspective seront successivement abordées les différentes étapes allant de l’acquisition des données à leur traitement et leur analyse avec les méthodes géomatiques, pour finalement envisager la création et l’édition concrète de cartes pouvant être publiées.
Statistiques (R)
Cette formation s’attache à enseigner des méthodes de manipulation et d’analyse de données permettant d’aller plus loin dans l’exploration d’un gisement de données (analyses factorielles, classifications, tests statistiques, régressions, analyse de séquences, etc.). Après quelques rappels de statistiques descriptives et inférentielles, cette approche sera croisée avec des outils de visualisation des données (analyses réseaux et cartographie). Les étudiant·es se familiariseront avec le logiciel R pour manipuler, analyser et visualiser leurs données. Le raisonnement statistique est ainsi mobilisé pour décrire des corpus, des jeux de données, et pour construire un raisonnement au service de la réflexion historique.

Edition scientifique (XML, Latex)

L’édition de documents relève pleinement des métiers des sciences humaines et sociales. Or, il y a une différence entre la manière dont on peut considérer les sources textuelles et la logique imposée par les logiciels de traitement de texte. Ces systèmes, en voulant réduire l’écart entre ce qui est affiché à l’écran et le résultat final (« What you see is what you get »), présentent un certain nombre de contraintes et limites : structuration et mise en forme du document, gestion des apparats critique et savant, intégration d'éléments graphiques ou iconographiques, de la bibliographie, interopérabilité avec des analyses informatisantes (base de données relationnelles, lexicométrie, cartographie, etc.), intégration dans une communauté scientifique, etc.
Pour répondre à ces besoins, cet enseignement forme les étudiant·es à l’usage de LATEX et de la Text Encoding Initiative (TEI), utilisés depuis plus de trente années pour l’édition critique de sources.
Analyse de réseaux sociaux
Des réseaux de toutes sortes peuvent être étudiés en sciences humaines : réseaux de villes, réseaux de transport, réseaux bibliographiques et évidemment réseaux de personnes. Ils sont analysés et représentés au moyen de la théorie des graphes qui permet de les caractériser, de les visualiser et d'en identifier les éléments structurants. Cet enseignement pose les bases de cette théorie et forme à l’étude des réseaux grâce aux logiciels Gephi ou R. En travaillant sur des réseaux sociaux reconstitués à partir de sources historiques, en lien avec l’historiographie, on voit comment les représenter et les interpréter autrement.

Web sémantique

Les technologies du web sémantique (RDF, SPARQL, etc.) s’inscrivent dans le mouvement de l’open data et donnent accès à d’immenses gisements de données qui peuvent être mobilisés ou investis par les chercheurs en SHS. Connaître les acteurs du web sémantique, les ressources qu’ils proposent, les outils existant pour les interroger, est ainsi un atout pour la recherche. C’est aussi l’occasion de réfléchir à la modélisation du réel sous forme de base de données graphe, et aux enjeux d’une bonne gestion des données dans la perspective de la science ouverte.
Mathématiques appliquées aux SHS
Une bonne compréhension des mathématiques permet de plus facilement s’approprier les méthodes statistiques et numériques utiles à la recherche en sciences humaines et sociales, en particulier si l’on veut saisir les évolutions rapides des algorithmes d’intelligence artificielle. Cet enseignement se concentre sur la compréhension du langage mathématique, afin de transmettre aux étudiant·es le vocabulaire et les concepts nécessaires pour se repérer dans la littérature scientifique.

Maîtrise avancée de l'ordinateur

Ce cours se concentre sur les compétences transversales qui permettent de s’approprier son ordinateur, d’en comprendre le fonctionnement, et de gagner en efficacité dans son travail. On y aborde par exemple la question du codage binaire de l’information, l’utilisation de la ligne de commande pour manipuler des fichiers en masse, les expressions régulières pour retrouver et transformer l’information textuelle, etc. On cherche ainsi à se libérer des procédures préétablies définies par les systèmes d’exploitation et logiciels modernes qui, pour faciliter l’utilisation de l’ordinateur, finissent par la brider.