ATELIER Digit_Hum 2023 : Manipuler des données en SHS : R, Python et les carnets interactifs
Jeudi 12 octobre 2023, salle Dussane, ENS PSL, 45 rue d’Ulm, 75005 Paris
Les captations vidéo des interventions de l’Atelier sont désormais consultables en ligne, ainsi que la BD du programme proposée par Pierre Nocérino : https://digithum.huma-num.fr/atelier/2023/
Organisés par le CAPHÉS (UMS 3610 — CNRS/ENS), l’AOROC (UMR 8546 — CNRS/ENS/EPHE) avec le soutien de l’EUR Translitterae, ces Ateliers se prolongent grâce à la publication, au fil de l’eau, d’articles dans le numéro spécial dédié du Journal of Data Mining and Digital Humanities : https://jdmdh.episciences.org/page/atelier-digit-hum
Vous pouvez non seulement y consulter les 10 articles déjà publiés, mais aussi participer à ce numéro en soumettant un article.
Retrouvez également l’enquête menée en préparation de cet atelier (avril 2023), qui visait à mieux connaître les usages de la programmation chez professionnels de la recherche en Sciences humaines et sociales.
RÉSUMÉ : En 2023, la thématique « Programmer en SHS » a été retenue. Il s’agit de dresser un panorama des possibilités offertes par les langages R ou Python et des environnements de programmation lettrés (literate programming) interactifs (Notebooks) pour se saisir des données et faciliter la reproductibilité des travaux de recherche. Les écosystèmes de programmation qui se sont développés dans le monde scientifique permettent de relier les données et d’accompagner l’utilisateur sur une variété de tâches, tels que les traitements statistiques, l’analyse de grands corpus historiques, littéraires, philosophiques, ethnographiques (…), la collecte de données sur les réseaux sociaux ou encore la réalisation d’interfaces interactives. Représentatifs de ces outils initiés dans le monde de la recherche, les carnets numériques bénéficient ainsi d’une communauté d’utilisateurs croissante, et au-delà de leurs différences partagent de nombreuses caractéristiques communes. Cette journée d’étude à destination d’un public non spécialiste propose d’ouvrir des perspectives, donner la possibilité de se familiariser avec les principales notions pour se repérer dans ces univers et partager des exemples de traitements possibles de données en SHS, autour de projets en cours.
Téléchargez le livret de l’atelier
PROGRAMME :
9h-9h15 : Accueil autour d’un café
9h15-9h30 : Ouverture
Marc Bui (EPHE, AOROC, CNRS, ENS PSL – Université Paris 8)
Matinée : R, Python et les usages interactifs de la programmation
Mots d’introduction par Marie-Laure Massot (CAPHES, CNRS, ENS PSL) & Agnès Tricoche (AOROC, CNRS, ENS PSL): les chiffres marquants de l’enquête Digit_Hum issus du sondage réalisé en avril 2023
9h30-10h15
Quelle place pour la programmation scientifique en sciences humaines et sociales ? Petit panorama des usages de Python
Emilien Schultz (SESSTIM) et Matthias Bussonnier (Quansight).
10h15-10h45
R en archéologie : la révolution n’aura pas lieu
Nicolas Frerebeau (Archéosciences Bordeaux, CNRS, Univ. Bordeaux Montaigne, Univ. Bordeaux)
10h45-11h15 : Pause
11h15-11h45
Des langages, des ressources, des formats et des logiciels libres pour la lexicométrie : IRaMuTeQ , python, R et tous les autres
Pierre Ratinaud (LERASS, Univ. Toulouse)
11h45-12h30
Table ronde : R, Python et quoi d’autre encore ? Le choix des outils pour le traitement des données en SHS
animée par Mariannig Le Béchec (URFIST de Lyon) et Matthieu Viry (RIATE, CNRS, Univ. Paris Cité).
12h30-13h30 : Buffet en Rotonde
Après-midi : Quelle place pour les carnets interactifs dans la recherche ?
13h30-14h15
Carnets numériques et Jupyter : un bref panorama
Nicolas M. Thiéry (Laboratoire Interdisciplinaire des Sciences du Numérique, Université Paris-Saclay)
14h15-14h45
Bonnes pratiques autour des carnets interactifs
Maxime Popineau (CESR, Université de Tours) et Emilien Schultz (SESSTIM), résultat du stage Digit_Hum 2023.
14h45-15h15
Explorer des réseaux dans un carnet interactif avec ipysigma
Béatrice Mazoyer et Guillaume Plique (médialab, Sciences Po)
15h15-15h30 : Pause
15h30-16h00
Garder trace de son travail et le partager en traitement automatique des langues
Caroline Koudoro-Parfait (ObTIC, STIH, SCAI, Sorbonne Université)
16h00-16h30
Le groupe de travail Notebooks d’Huma-Num : Présentation de l’initiative, retour d’expérience et perspectives du GT Notebook (2021-2024)
Membres du GT Notebook (https://gt-notebook.gitpages.huma-num.fr/site_quarto/)
16h30
Retours sur la journée et discussions
Avec Emile Gayoso (Guichet d’Assistance aux Projets Numériques, Bibliothèque
Ulm-Lettres ENS PSL), président de séance
[1] IRAMUTEQ est un logiciel d’analyse de textes et de tableaux de données, une Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Il s’appuie sur le logiciel de statistique R et sur le langage python.