Guillaume Jacquet

guillaume.jacquet2@free.fr

Ingénieur de recherche
en Traitement Automatique des Langues Naturelles




Thèmes de recherche

       

Extraction d'information, désambiguïsation sémantique, entités nommées,
analyse distributionelle, traitement de grands corpus, méthodes hybrides, inférences textuelles.


Formation universitaire

Ecole Normale Supérieure / Université de Paris VI / Ecole Polytechnique

2005

Doctorat en Sciences Cognitives (spécialisation Linguistique Informatique)
Sujet: Polysémie verbale et calcul du sens
Dirigé par B. Victorri, laboratoire Lattice (CNRS-ENS).

2002

DEA de Sciences Cognitives (spécialisation Linguistique Informatique)

Recherche

       

2006-aujourd'hui: Ingénieur de recherche au sein du groupe de recherche Parsing & Semantics dirigé par F. Segond. Xerox Research Centre Europe (XRCE), Grenoble.

               

Sujet de recherche principal : extraction d’informations sémantiques à partir de données textuelles. En particulier :

- Traitement des entités nommées : reconnaissance, annotation fine, désambiguïsation, résolution de métonymie.

- Textual Entailment (inférences textuelles) : étude des relations d’inférence entre segments textuels.

- Méthodes hybrides : développement de méthodes combinant approches symboliques et approches statistiques.


       

Principaux projets de recherche depuis 2006

               

2009-aujourd’hui : projet européen SynC3
SynC3 est un projet européen impliquant 9 partenaires (centre de recherche, centre de journalisme, entreprises telles que Xerox et Google). (site web).

Description: l’objectif est de développer un outil capable de représenter les sentiments provenant de blogs qui parlent d’évènements mentionnés dans des articles de presse.

Dans ce projet, XRCE est impliqué dans deux principales tâches : l’extraction d’informations linguistiques à partir d’articles journalistiques ainsi que le regroupement d’articles journalistiques en clusters où chaque cluster correspond à un évènement.

Je suis fortement impliqué dans la première tâche et partiellement dans la seconde.


               

2006-2009: projet Infom@gic
Infom@gic est un projet labellisé par le pôle de compétitivité Cap Digital impliquant 30 partenaires (organismes publiques, PMEs et grands groupes tels que Xerox, EADS or Thalès). (site web).

Description: l’objectif du projet est de développer de nouveaux outils pour le traitement de l’information (extraction d’information, moteurs de recherche sémantique, etc.) avec une approche multimédia (combiner le traitement de différents supports tels que texte, image, vidéo, audio) et multimodale (combiner différentes approches pour un même traitement).

XRCE a été impliqué dans ce projet en tant que responsable de l’axe texte ainsi que dans différentes tâches telles que l’extraction d’information textuelle à l’aide de méthodes linguistiques ou encore la détection de risque. XRCE était aussi impliqué dans la mise en place d’une plateforme UIMA dont le but était d’intégrer les modules provenant des différents partenaires.

J’ai participé activement à l’ensemble de ces travaux.


       

Autres activités de recherche

               

2007: campagne d’évaluation Semeval2007
Semeval2007 est un workshop sur l’évaluation en sémantique. Nous (Brun et al., 2007) avons participé à la tâche “resolution de la métonymie pour les entités nommées” et notre système a été classé deuxième et troisième respectivement pour le traitement des entités nommées de type lieu et organisation.


               

2003-2005: projet ILF dirigé par J. François
Projet impliquant les laboratoires du LATTICE (Paris), CRISCO (Caen) et ERSS (Toulouse).

Description: étude de la polysémie verbale et du rôle de la construction syntaxique. Etude théorique mais aussi implémentation à partir de cette étude.

Dans ce projet, mon rôle était d’intégrer les modules provenant des différents intervenants : les analyseurs syntaxiques ‘Syntex’ (D. Bourigault) et ‘Wims’ (E. Giguet) avec le logiciel de visualisation ‘Visusyn’. J’ai aussi participé à l’implémentation du modèle de calcul du sens.


Enseignement

2006-aujourd'hui

Université Stendhal, Grenoble 3
- Chargé de cours (Master2 mention Sciences du langage) en "Sémantique pour le TAL"

       

2002-2005

Université de Paris-Dauphine
- Chargé de TD (Licence MASS et 2ème année IUP MIAGE) en "Recherche Opérationnelle" (Exploitation de la théorie des graphes pour la résolution de problèmes mathématiques)
- Chargé de TD/TP (1ère année DEUG MASS) en Informatique (programmation en JAVA)

Publications

Publications

Brevets

US Patent 20080319978: A Hybrid system for Named Entity metonymy resolution (co-inventor)
US Patent Pending: Clique-Based Clustering for improving Named Entity Recognition Systems (co-inventor)

Divers

2009-aujourd'hui

: Membre du CA de l’UFR Sciences du Langage (Grenoble 3)

2009-aujourd'hui

: Membre du CA de l’ATALA

2007-aujourd'hui

: Membre du jury pour l'évaluation des propositions de brevets à XRCE

Langages de programmation

: Matlab, Perl, Java, Python

bases de données

: MySQL

Plateforme

: UIMA

Langues

: Français et Anglais

Sport

: Escalade, ski, vélo

page d'accueil