Université
de Neuchâtel
Logo UniNE
 
 
   UniNE > IIUN annuaire | plan du site | accès | contact  

Nouveauté Google :  la traduction automatique

Jacques Savoy

Afin de diversifier ses services et de nous permettre un accès encore plus aisé à toutes les informations mises à notre disposition sur Internet, le moteur de recherche Google annonce qu’il offre, toujours gratuitement, un outil de traduction.  Plus de tracas devant une page écrite par exemple en anglais ou en allemand, il suffit d’appeler le traducteur Google (http://translate.google.com) à la rescousse, d’introduire votre texte ou, encore mieux, de lui donner l’adresse de la page à traduire.  Quel bonheur de comprendre les discours de Tony Blair, la poésie japonaise ou les blogs chinois. 

Cependant, toutes les langues ne sont pas égales pour Google qui propose uniquement un accès aux langues présentant un intérêt économique indéniable.  Actuellement, nous pouvons obtenir une traduction pour les pages écrites en allemand, anglais, espagnol, français, italien et portugais.  Dans une version de test (version bêta), ce service est également disponible pour les langues arabe, chinoise, coréenne, japonaise ou russe.  Une restriction supplémentaire a été incluse.  Toute traduction doit, en principe, comprendre l’anglais ; ainsi, on nous offre une traduction directe de l’anglais au français (ou l’inverse) mais pas un passage direct du japonais au français.  On relèvera toutefois deux exceptions, à savoir la possibilité de passer directement de l’allemand au français et vice-versa, ainsi que du chinois traditionnel (Taiwan, Hong Kong) au chinois simplifié (Chine continentale).  Enfin, le volume traduit lors d’un appel demeure limité.  On ne peut pas espérer traduire une pièce de théâtre à l’aide d’un seul clic de souris.  Le volume traduit lors de chaque appel correspond approximativement aux 4 500 premiers mots d’une page (ou environ huit pages A4). 

Fidèle aux principes de Google, l’appel à ce nouveau service demeure gratuit et la réponse nous parvient très rapidement, en quelques secondes seulement.  Et au niveau de la qualité ?  Google annonce fièrement que son système a obtenu la première place lors de la campagne d’évaluation des systèmes de traduction automatique (National Institute of Standards and Technology, NIST MT-05). 

Peut-on alors considérer que la traduction automatique d’une langue vers une autre est un objectif atteint ou, pour le moins, en voie de l’être ?  Ce nouveau service en serait la preuve.  Toutes ces nouveautés s’avèrent être de très bonnes nouvelles afin de faciliter la compréhension entre les peuples.  Mais peut-on estimer la qualité des traductions fournies par Google ?  Je me suis interrogé sur la couverture du lexique (volume du dictionnaire bilingue sous-jacent) ainsi que sur la compréhension de mécanismes morpho-syntaxiques simples (marque du féminin, du pluriel, ou présence de la préposition adéquate).  Pour faciliter l’interprétation des réponses, j’ai interrogé ce nouveau service entre les langues française et anglaise, deux langues relativement proches. 

Prenons tout d’abord quelques cas simples.  Si l’on donne le mot « horse », le système répond « cheval », et avec la variante morphologique « horses », la réponse est bien « chevaux ».  Mais la présence de la forme « horse » en anglais ne s’apparie pas toujours à la forme « cheval » en français.  Le terme « horse-draw » est bien traduit en « hippomobile » mais le terme « horse-show » (concours hippique) est traduit en « cheval-montrer », le mot « horse-race » (course de chevaux) en « cheval-course » et le terme « horse-doctor » (vétérinaire) en « cheval-docteur ».  Lorsque l’on s’éloigne du lien sémantique « horse – animal à quatre pattes », la traduction doit clairement s’écarter aussi de la forme « cheval ».  Pour des formes figées ou des expressions idiomatiques, la machine poursuit sa stratégie de traduction mot à mot retournant des expressions ne reflétant plus l’intention de l’auteur.  Ainsi pour l’expression « horse sense » (bon sens), la machine fournit en retour « sens de cheval » ou pour « from the horse’s mouth » (de source sûre), on obtient « de la bouche du cheval ».  D’autres exemples corroborent cette constatation comme « horse-trading » (maquignonnage) qui retourne « cheval-commerce ». Si l’on choisit un autre animal avec l'expression « pigs may fly » (quand les poules auront des dents) le système retourne « les porcs peuvent voler ». 

Ce nouveau service de traduction enligne résout bien quelques problèmes classiques en traduction.  Ainsi l’expression « Made in Turkey » est bien traduite en « fabriqué en Turquie » mais avec la forme « Made in turkey », la réponse obtenue est « fait chez la dinde ».  Le système a tenu compte de la majuscule pour prendre la bonne décision ;  dans le premier cas en indiquant le nom d’un pays et dans le second celui de l’animal.  Si l’on introduit «MADE IN TURKEY », la réponse retournée est « FABRIQUÉ EN TURQUIE ».  La présence d’acronymes constitue aussi un obstacle à une bonne traduction.  A ce niveau, Google surmonte parfois ce problème.  Ainsi le terme « US Soldiers » sera traduit en « Soldats des USA » ou la forme « UN Soldiers » en « Soldats de l’ONU ». 

Par contre la présence d’ambiguïté constitue une des difficultés de toute traduction.  En effet, dans un contexte donné, un mot peut avoir une autre traduction que la forme la plus fréquente.  Ainsi la phrase « the ink is in the pen » sera traduite correctement en « l’encre est dans le stylo ».  Si je remplace le mot « ink » par « pig », la phrase devient « the pig is in the pen ».  Le sens attaché au mot « pen » change clairement dans ce contexte (enclos), ce que la machine ignore puisque sa réponse est « le porc est dans le stylo ».  Avec ce deuxième exemple incluant le mot « pig », on remarque également que le système privilégie systématiquement le terme « porc » au détriment de la forme « cochon ». 

Afin de compléter l’analyse de ce nouveau service offert par Google, je l’ai testé en lui donnant des titres courts d’article de presse récents.  Comme ces informations sont disponibles sur le Web, notre évaluation se situe bien dans les compétences souhaitables pour un système de traduction œuvrant sur Internet.  Les quelques exemples suivants illustrent clairement les limites de la traduction automatique.  Ainsi à l’expression « EU fishing quotas » (quotas de pêche imposés par l'UE) la machine répond dans un français approximatif « L'UE pêchant des quotes-parts » tandis que la phrase « German Spelling Reform » (la réforme allemande de l'orthographe) fournit la réponse « Réforme allemande d'épellation ».  Comme tous les mots d’un titre sont écrits en langue anglaise avec des majuscules, cette variation typographique peut induire le traducteur en erreur comme dans le titre « Russian TV Director Murder » (assassinat d'un directeur de la télévision russe) qui est traduit en « Directeur russe Murder de TV ». 

Lorsqu’un mot n’est pas présent dans son lexique, le système le retourne dans la traduction en faisant l’hypothèse qu’il s’agit d’un nom propre (de personne, pays, produit, etc.).  Ainsi, si l’on écrit « Jacques Chirac », le système renvoie ce nom sans aucune modification.  Par contre, face à « Successes of Ayrton Senna » (succès d’Ayrton Senna), le système répond par « Succès de séné d'Ayrton ».  Si l’on teste un peu ses capacités avec des expressions familières, on peut lui donner le titre de l’émission « Pimp my ride » (tune ma caisse, ou retape ma voiture) qui sera traduit en « Sont souteneurs mon tour ».  Les projets politiques peuvent nous révéler quelques surprises comme avec le titre « Common foreign policy » (la politique étrangère commune) que Google traduit en « Politique étrangère de terrain communal ».  Les expressions économiques et financières sont aussi malmenées ;  ainsi l’expression « European single currency » (la monnaie unique européenne) deviendra « Devise simple européenne ». 

Le service de traduction mis à notre disposition par Google constitue une avancée vers une meilleure compréhension des cultures et permettra peut-être une meilleure communication entre personnes.  Certes ce système n’est pas exempt de lacunes bien que souvent la traduction produite soit, au niveau lexical, compréhensible.  Par contre, au niveau de la syntaxe française, les choix actuels doivent encore être améliorés afin de faciliter la lecture du texte traduit.  Enfin d’autres possibilités similaires nous sont offertes sur Internet comme les multiples dictionnaires bilingues de Babylon (www.babylon.com/fre/), ou les traducteurs automatiques Systran (www.systran.fr), BabelFish (babelFish.altavista.com) ou Promt (www.promt.fr). 

Références

Pour connaître les résultats des campagnes d’évaluation organisées par le NIST (Washington, USA), voir http://www.nist.gov/speec


Prof. Jacques Savoy
Universite de Neuchatel
Computer Science Department
Rue Emile-Argand 11
CH-2009 Neuchâtel
Switzerland


+41 32 718 1375 (phone)
+41 32 718 2701 (fax)