Le Temps et l’EPFL collaborent à la création d’une base de données historiques

le 08.04.2013

Le laboratoire d’humanités digitales de l’Ecole polytechnique fédérale de Lausanne s’associe avec Le Temps pour la mise en place d’un moteur de recherche permettant d’explorer d’une nouvelle manière les informations contenues dans les archives du Journal de Genève, de la Gazette de Lausanne et du Nouveau Quotidien. Ensemble, ils commencent l’indexation sémantique de 4 millions d’articles de presse.

Pour construire ce moteur de recherche, chacun des 4 millions d’articles déjà numérisés sera indexé sémantiquement en y repérant des entités particulières comme les lieux ou les personnes. Cette grande base d’informations couvrira une période d’environ 200 ans.

A partir de cette nouvelle indexation une recherche sur le nom d’une personne ne se contentera pas seulement de donner les articles où elle apparaît, mais indiquera aussi les autres personnes, les lieux ou les institutions avec lesquels elle est en rapport. Chacune de ces entités liées pourra ainsi être le début d’une nouvelle recherche.

Caution méthodologique
Afin de garantir la méthodologie et les avancées sur le plan des algorithmes, les partenaires se sont dotés d’un comité scientifique pluridisciplinaire réunissant historiens, bibliothécaires et journalistes.

Le comité scientifique est composé des personnalités suivantes :
· Alain Clavien, Professeur, Histoire contemporaine, Université de Fribourg
· Marie-Christine Doffey, Directrice, Bibliothèque Nationale Suisse
· Frédéric Koller, Rédacteur en chef adjoint, Le Temps
· Joëlle Kuntz, Journaliste, Le Temps
· Enrico Natale, Directeur, Infoclio.ch
· Francois Vallotton, Professeur, Centre des sciences historiques et de la culture, Université de Lausanne



retour aux titres


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>