Event box

Découverte du Text and Data mining grâce à l'infrastructure Istex (Séance 2 / 2) En personne

 

Cette formation vous est proposée par l'Inist dans le cadre de DATA Doct, le programme de formation à destination des enseignants-chercheurs, des doctorants et des personnels d'appui à la recherche de l’atelier de la donnée CoDataSorb (Sorbonne Alliance).

 

Cette formation se déroule sous la forme de 2 séances : le vendredi 03 avril en distanciel et le jeudi 16 avril en présentiel. L'inscription vaut ici pour la séance 2 de cette formation.

Il est nécessaire d'avoir suivi la séance 1 pour s'inscrire. 

 

Cette formation est proposée par Mathilde Huguin et Léo Gaillard de l'Inist-CNRS. 

 

Description :

Le TDM (pour Text and Data Mining, ou fouille de textes et de données) est un enjeu pour la recherche, objet de débats politiques dans le cadre de la loi pour une République Numérique (2016). En fonction du type de projet et de la discipline, il permet d’extraire des connaissances à partir d’une grande quantité de données. Face à l’explosion des informations numériques, dont le volume et la diversité rendent impossible une analyse manuelle exhaustive, la fouille de textes s’impose comme un outil indispensable pour transformer cette masse de données en savoir exploitable.

Cette initiation générale vise à présenter le TDM, en combinant notions théoriques et aspects pratiques. Elle présente ainsi l’infrastructure Istex, combinant un réservoir de plus de 31M de publications scientifiques et des outils dédiés à la création corpus et au TDM : Istex Search, Istex TDM, Lodex, TDM Factory.

 

Mots clés : Text and Data Mining/fouille de textes, analyse de corpus, datavisualisation, web services, infrastructure Istex, Lodex

 

Programme :

  • La seconde session repose sur la mise en œuvre concrète des outils de l’infrastructure Istex. À partir de questions de recherche proposées à titre d’exemples, les participant·es construisent puis analysent un corpus en mobilisant Istex Search, Lodex et les web services TDM.

 

 

Note Bene : Une deuxième session pourra être ouverte l'après-midi si le nombre d'inscrits est supérieur à 25. 

 

 

Pré-requis pour participer à la formation :

avoir suivi la séance 1 avec les aspects théoriques (séance 1 vendredi 03/04, distanciel)

 

 

Date:
jeudi, avril 16, 2026
Heure:
09:30 - 12:30
Fuseau horaire:
Heure de l’Europe centrale (changement)
Lieu:
Centre La Chapelle - 1, avenue de la Porte de la Chapelle 75018 Paris
Période d'inscription terminée

Lieu de la formation : Centre La Chapelle, bibliothèque Hélène-Ahrweiler, salle de formation 333

Event Organizer

Atelier de la donnée CoDataSorb

More events like this...