Accueil - Home arrow Recherches - Research 10-04-2020  
 
 

 

 
Main Menu
Accueil - Home
Qui suis-je - Who am I
Cours
Recherches - Research
Alinea
Multi-Aligneur JAM
ConcQuest
AnaText
WebAlignToolkit
Chercher sur le site
Corpus multilingues - Multilingual corpus
Perl Corpus Processor (PCP)
Notes en vrac

 

 
Recherches

Thématiques de recherche


  • Développement et évaluation des techniques d'alignements de corpus parallèles pour la constitution automatique de bi-textes ou de multi-textes.
  • Utilisation des multi-textes pour la TAO, pour la lexicographie, la désambiguïsation lexicale, la segmentation des unités.
  • Traductologie et linguistique contrastive.
  • Lexicologie et sémantique lexicale.
  • TAL et apprentissage des langues.

Participation à des projets de recherche

 

2008 - Projet ParaStat

Financé par le centre Jacques Cartier et l'OLST de Montréal, ce projet a permis d'associer TermoStat (développé par Patrick Drouin de l'OLST) et ConcQuest (accessible depuis ce site) deux outils dédiés à la recherche terminologique et à la fouille de corpus.

2007-2009 - Projet Scientext

Ce projet a pour objectif de constituer un corpus d’écrits scientifiques variés permettant d’effectuer une étude linguistique du positionnement et du raisonnement dans l’article scientifique, à travers la phraséologie, les marques énonciatives et les marques syntaxiques liées à la causalité. Le projet répond au besoin des chercheurs intéressés par le texte scientifique qui ne disposent actuellement d’aucune ressource textuelle contemporaine facilement exploitable. Site du projet .

2006-2007 - Projet Kaleidoscope - IDILL

Projet en partenariat avec l'Université de Louvain-La-Neuve, financé par le réseau d'excellence Kaleidoscope, visant à mettre au point un logiciel pour l'exploration d'un corpus de production d'apprenant. Ce corpus, tiré du corpus Frida, a été étiqueté et porté au format XML. L'outil d'exploration, nommé eXXelant, est une application Web, développée en PHP, permettant d'extraire des concordances autour des erreurs identifiées et typées dans le corpus.

2002-2006 - Projet MIRTO

Le projet MIRTO vise à la mise en place d'une plateforme pédagogique pour l'apprentissage des langues. Cette plateforme fera intervenir des outils de traitement automatique des langues, aussi bien dans la génération d'activité que, à terme, pour la correction des productions d'apprenants.

2003-2004 - EMERGENCE 2003 (Région Rhône-Alpes 03 014909 01/02)

Acquisition automatique de traductions d’expressions semi-figées pour l’élaboration d’outils d’aide à la rédaction scientifique et technique.

2002-2005 - Projet Evalda - Arcade 2

Action de Recherche Concertée sur l’Alignement de Documents et son Evaluation. Dans le prolongement d'Arcade 1, vise à l'évaluation de techniques d'alignement aux niveaux phrastique et lexical.

2003-2005 - Projet CARMEL

Corpus Aligné comme Ressource Multilingue pour l’Etude du Langage naturel : projet soumis dans le cadre du volet "ressource" de l'appel Technolangue. Vise à la constitution d'un corpus littéraire multilingue aligné annoté au niveau sémantique.

1998 - Projet Arcade (deuxième campagne)

Evaluation des systèmes d'alignement de corpus multilingues (sur les corpus BAF et JOC).

 
© 2020 Site personnel de Olivier Kraif - Olivier Kraif's Homepage