Introduction
Les adeptes du SMS n'hésitent pas à procéder à des raccourcis
syntaxiques et orthographiques, parfois barbares, lorsqu'ils composent
des messages avec leurs téléphones portables. Pour mieux comprendre ce
phénomène, nous avons développé un logiciel permettant de transformer un
texte français en une version "SMS" plus compacte dont la prononciation
est similaire (copie d'écran).
Démarrer le logiciel
Si un bouton apparaît ci-dessous, il vous suffit de cliquer dessus
pour démarrer le logiciel. Sinon, téléchargez le fichier SMSTranslator.jar, assurez-vous que vous
avez une version récente de Java
installée et démarrez le logiciel en double-cliquant sur le fichier
(Windows) ou en entrant la commande java -jar
SMSTranslator.jar dans une console.
Vous pouvez essayer de traduire certaines des phrases suivantes :
elle aimerait des bébés
j'ai acheté des cadeaux du pays
à un de ces quatre
c'est assez haut
elle s'est abaissée
rendez-vous demain matin
Comment ça marche ?
Le logiciel fonctionne de la manière suivante. Chacun des mots
français est recherché dans une base de données lexicale. Si le mot
n'est pas trouvé, aucune transformation n'est effectuée et le mot
apparaît en rouge et italique dans la traduction. Si le mot est trouvé,
on recherche tout d'abord un homophone de longueur minimale et de
fréquence maximale dans la langue française. Par exemple, "dansent" sera
replacé par "danse" dont la prononciation est identique.
Dans un second temps, on analyse les phonèmes et groupes de phonèmes
de manière à remplacer certaines syllabes par des mots plus courts. Par
exemple, "cassé" sera remplacé par "kc" ("k" pour la première syllable
et "c" pour la seconde), "cadeau" sera remplacé par "kdo" ("do" est un
mot français dont la prononciation est identique à "deau" et la syntaxe
plus compacte). Seules les simplifications dérivables de la base de
données lexicale sont appliquées.
Finalement, sur la base des tranformations effectuées, on choisira
parmi l'ensemble des traductions possibles celle dont la longueur est
minimale. Si une traduction a été trouvée, le mot apparaît en bleu et
gras. Sinon, le mot original est reproduit tel quel dans la
traduction.
Il est possible de définir certaines options de traduction. Les
phonèmes "è" (ouvert) et "é" (fermé), ainsi que "e" et "eu" peuvent être
considérés comme identiques, ce qui permet des transformations comme
"de=2" ou "aimerait=mré". Il est aussi possible d'ignorer les "h" en
début de mots lors de la traduction.
Il convient de relever que seules des transformations de mots
individuels sont effectuées. Par exemple, le traducteur ne va pas
transformer "a chaud" par "ho".
Le lexique peut être aisément étendu pour y ajouter de nouveaux mots,
ainsi que des groupes de phonèmes qui ne correspondent pas à des mots
français mais sont fréquemment utilisés dans le langage SMS (par exemple
"m1" souvent utilisé pour "main", "rdv" pour "rendez-vous"). Toute
nouvelle entrée au lexique est automatiquement prise en compte dans la
traduction.
Liens
Contact
Vous avez des questions, remarques, suggestions ? Vous voulez
contribuer à l'amélioration de la base de données lexicales ou du
logiciel ? N'hésitez pas à nous envoyer un courriel
pour nous en faire part.
|