Accueil - Home arrow Corpus multilingues - Multilingual corpus 10-04-2020  
 
 

 

 
Main Menu
Accueil - Home
Qui suis-je - Who am I
Cours
Recherches - Research
Alinea
Multi-Aligneur JAM
ConcQuest
AnaText
WebAlignToolkit
Chercher sur le site
Corpus multilingues - Multilingual corpus
Perl Corpus Processor (PCP)
Notes en vrac

 

 
Corpus multilingues - Multilingual corpora

Cette section pointe vers des ressources concernant la constitution et l'exploitation de corpus multilingues, comparables, parallèles ou alignés.

 

Pierre de Rosette - Hiéroglyphes Démotique Grec

 

La pierre de Rosette : un corpus trilingue Hiéroglyphe / Démotique / Grec

Un corpus multilingue est un corpus comprenant des textes en plusieurs langues.

Un corpus multilingue de textes comparables est un corpus multilingue comprenant, dans chaque langue, des textes comparables au niveau quantitatif et typologique.

Un corpus parallèle est un corpus multilingue comprenant des textes avec leurs traductions.

Un corpus aligné est un corpus parallèle pour lequel on a identifié des relations d'équivalence traductionnelle entre les segments qui le composent. Ces segments peuvent concerner différents grains : paragraphe, phrase, syntagme ou mot. En général, il est possible d'effectuer automatiquement un alignement au niveau des phrases, avec des résultats de bonne qualité.

Ces corpus sont utiles aux traducteurs et au terminologues, afin d'alimenter des mémoires de traduction. Ils sont également intéressant pour les llinguistes ou au lexicographes travaillant dans une perspective contrastive. Enfin, il peuvent alimenter des systèmes de traitement automatique, tels que les système de traduction basée sur l'example, ou de traduction basée sur des statistiques.

 
 
© 2020 Site personnel de Olivier Kraif - Olivier Kraif's Homepage