Logo UniNE
 
 welcome
 
 research
 
 publications
 
 teaching
 
traducteur français-SMS

Introduction

Les adeptes du SMS n'hésitent pas à procéder à des raccourcis syntaxiques et orthographiques, parfois barbares, lorsqu'ils composent des messages avec leurs téléphones portables. Pour mieux comprendre ce phénomène, nous avons développé un logiciel permettant de transformer un texte français en une version "SMS" plus compacte dont la prononciation est similaire (copie d'écran).

Démarrer le logiciel

Si un bouton apparaît ci-dessous, il vous suffit de cliquer dessus pour démarrer le logiciel. Sinon, téléchargez le fichier SMSTranslator.jar, assurez-vous que vous avez une version récente de Java installée et démarrez le logiciel en double-cliquant sur le fichier (Windows) ou en entrant la commande java -jar SMSTranslator.jar dans une console.

Vous pouvez essayer de traduire certaines des phrases suivantes :

elle aimerait des bébés
j'ai acheté des cadeaux du pays
à un de ces quatre
c'est assez haut
elle s'est abaissée
rendez-vous demain matin

Comment ça marche ?

Le logiciel fonctionne de la manière suivante. Chacun des mots français est recherché dans une base de données lexicale. Si le mot n'est pas trouvé, aucune transformation n'est effectuée et le mot apparaît en rouge et italique dans la traduction. Si le mot est trouvé, on recherche tout d'abord un homophone de longueur minimale et de fréquence maximale dans la langue française. Par exemple, "dansent" sera replacé par "danse" dont la prononciation est identique.

Dans un second temps, on analyse les phonèmes et groupes de phonèmes de manière à remplacer certaines syllabes par des mots plus courts. Par exemple, "cassé" sera remplacé par "kc" ("k" pour la première syllable et "c" pour la seconde), "cadeau" sera remplacé par "kdo" ("do" est un mot français dont la prononciation est identique à "deau" et la syntaxe plus compacte). Seules les simplifications dérivables de la base de données lexicale sont appliquées.

Finalement, sur la base des tranformations effectuées, on choisira parmi l'ensemble des traductions possibles celle dont la longueur est minimale. Si une traduction a été trouvée, le mot apparaît en bleu et gras. Sinon, le mot original est reproduit tel quel dans la traduction.

Il est possible de définir certaines options de traduction. Les phonèmes "è" (ouvert) et "é" (fermé), ainsi que "e" et "eu" peuvent être considérés comme identiques, ce qui permet des transformations comme "de=2" ou "aimerait=mré". Il est aussi possible d'ignorer les "h" en début de mots lors de la traduction.

Il convient de relever que seules des transformations de mots individuels sont effectuées. Par exemple, le traducteur ne va pas transformer "a chaud" par "ho".

Le lexique peut être aisément étendu pour y ajouter de nouveaux mots, ainsi que des groupes de phonèmes qui ne correspondent pas à des mots français mais sont fréquemment utilisés dans le langage SMS (par exemple "m1" souvent utilisé pour "main", "rdv" pour "rendez-vous"). Toute nouvelle entrée au lexique est automatiquement prise en compte dans la traduction.

Liens

Contact

Vous avez des questions, remarques, suggestions ? Vous voulez contribuer à l'amélioration de la base de données lexicales ou du logiciel ? N'hésitez pas à nous envoyer un courriel pour nous en faire part.