Centre d’Archives en Philosophie, Histoire et Édition des Sciences
ActualitésAteliers Digit_HumDigit_Hum

ATELIER Digit_Hum 2023 : Manipuler des données en SHS : R, Python et les carnets interactifs

Jeudi 12 octobre 2023, salle Dussane, ENS PSL, 45 rue d’Ulm, 75005 Paris

Les captations vidéo des interventions de l’Atelier sont désormais consultables en ligne, ainsi que la BD du programme proposée par Pierre Nocérino  : https://digithum.huma-num.fr/atelier/2023/

Organisés par le CAPHÉS (UMS 3610 — CNRS/ENS), l’AOROC (UMR 8546 — CNRS/ENS/EPHE) avec le soutien de l’EUR Translitterae, ces Ateliers se prolongent grâce à la publication, au fil de l’eau, d’articles dans le numéro spécial dédié du Journal of Data Mining and Digital Humanities : https://jdmdh.episciences.org/page/atelier-digit-hum
Vous pouvez non seulement y consulter les 10 articles déjà publiés, mais aussi participer à ce numéro en soumettant un article. 

Retrouvez également l’enquête menée en préparation de cet atelier (avril 2023), qui visait à mieux connaître les usages de la programmation chez professionnels de la recherche en Sciences humaines et sociales.

RÉSUMÉ : En 2023, la thématique « Programmer en SHS » a été retenue. Il s’agit de dresser un panorama des possibilités offertes par les langages R ou Python et des environnements de programmation lettrés (literate programming) interactifs (Notebooks) pour se saisir des données et faciliter la reproductibilité des travaux de recherche. Les écosystèmes de programmation qui se sont développés dans le monde scientifique permettent de relier les données et d’accompagner l’utilisateur sur une variété de tâches, tels que les traitements statistiques, l’analyse de grands corpus historiques, littéraires, philosophiques, ethnographiques (…), la collecte de données sur les réseaux sociaux ou encore la réalisation d’interfaces interactives. Représentatifs de ces outils initiés dans le monde de la recherche, les carnets numériques bénéficient ainsi d’une communauté d’utilisateurs croissante, et au-delà de leurs différences partagent de nombreuses caractéristiques communes. Cette journée d’étude à destination d’un public non spécialiste propose d’ouvrir des perspectives, donner la possibilité de se familiariser avec les principales notions pour se repérer dans ces univers et partager des exemples de traitements possibles de données en SHS, autour de projets en cours.

Téléchargez le livret de l’atelier

PROGRAMME :  

9h-9h15 : Accueil autour d’un café

9h15-9h30 : Ouverture 
Marc Bui (EPHE, AOROC, CNRS, ENS PSL – Université Paris 8)

Matinée : R, Python et les usages interactifs de la programmation

Mots d’introduction par Marie-Laure Massot (CAPHES, CNRS, ENS PSL) & Agnès Tricoche (AOROC, CNRS, ENS PSL): les chiffres marquants de l’enquête Digit_Hum issus du sondage réalisé en avril 2023

9h30-10h15

Quelle place pour la programmation scientifique en sciences humaines et sociales ? Petit panorama des usages de Python
Emilien Schultz (SESSTIM) et Matthias Bussonnier (Quansight).

10h15-10h45

R en archéologie : la révolution n’aura pas lieu
Nicolas Frerebeau (Archéosciences Bordeaux, CNRS, Univ. Bordeaux Montaigne, Univ. Bordeaux)

10h45-11h15 : Pause

11h15-11h45

Des langages, des ressources, des formats et des logiciels libres pour la lexicométrie : IRaMuTeQ , python, R et tous les autres
Pierre Ratinaud (LERASS, Univ. Toulouse)

11h45-12h30

Table ronde : R, Python et quoi d’autre encore ? Le choix des outils pour le traitement des données en SHS
animée par Mariannig Le Béchec (URFIST de Lyon) et Matthieu Viry (RIATE, CNRS, Univ. Paris Cité).

12h30-13h30 : Buffet en Rotonde

Après-midi : Quelle place pour les carnets interactifs dans la recherche ?

13h30-14h15

Carnets numériques et Jupyter : un bref panorama
Nicolas M. Thiéry (Laboratoire Interdisciplinaire des Sciences du Numérique, Université Paris-Saclay)

14h15-14h45

Bonnes pratiques autour des carnets interactifs
Maxime Popineau (CESR, Université de Tours) et Emilien Schultz (SESSTIM), résultat du stage Digit_Hum 2023.

14h45-15h15

Explorer des réseaux dans un carnet interactif avec ipysigma
Béatrice Mazoyer et Guillaume Plique (médialab, Sciences Po)  

15h15-15h30 : Pause

15h30-16h00

Garder trace de son travail et le partager en traitement automatique des langues
Caroline Koudoro-Parfait (ObTIC, STIH, SCAI, Sorbonne Université)

16h00-16h30

Le groupe de travail Notebooks d’Huma-Num : Présentation de l’initiative, retour d’expérience et perspectives du GT Notebook (2021-2024)
Membres du GT Notebook (https://gt-notebook.gitpages.huma-num.fr/site_quarto/)

16h30

Retours sur la journée et discussions
Avec Emile Gayoso (Guichet d’Assistance aux Projets Numériques, Bibliothèque
Ulm-Lettres ENS PSL), président de séance


[1] IRAMUTEQ est un logiciel d’analyse de textes et de tableaux de données, une Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Il s’appuie sur le logiciel de statistique R et sur le langage python.