La Traduction Automatique

La Traduction Automatique

Introduction :

 

Partie I : Historique

A/ La TA avant et après le 20ème siècle

B/ Les différents produits

 

Partie II : Approche et fonctionnement

A/ Les différentes techniques mises en œuvres

B/ Les différents types de TA

  • Une explication du système neuronal de TA

C/ Les progrès au cours des années

 

Partie III : Les avantages et les inconvénients de la TA

A/ Les points positifs : Que peut faire la TA aujourd’hui ?

B/ Les limites de ces programmes

C/ Une comparaison avec l’humain

 

Conclusion : 

Ressources :

 

Introduction :

 

Il y a 40 ans la vision d’une traduction automatique était une vision irrationnelle mise en œuvre dans un monde de fantasy et de fiction comme sur des films de James Bond. Cependant très vite le rêve est devenu réalité avec ces « translation machines » utilisées pour la guerre froide afin de récupérer des informations pour la CIA ou pour la conquête spatiale utilisées par exemple par NASA. Elles se sont développées au cours des années et aujourd’hui elle sont à la portée de tout le monde avec des appareils, des sites voir même des applications proposant des combinaisons variées.

 

La traduction automatique (TA) et en anglais Machine Translation (MT) correspond à un recours de logiciel afin de traduire du texte ou de l’oral d’une langue à l’autre. De manière simple, il s’agit d’une simple substitution de mots d’une langue source à une langue cible mais dans la plus part des cas ceci ne correspond pas à une bonne traduction car une bonne traduction nécessite une reconnaissance de la phrase entière. Ce problème se résoud en partie par des stratégies de statistiques et techniques neuronales qui en utilisant des algorithmes se rapprochent de plus en plus de la réflexion humaine. Par conséquent, cela nous amène à de meilleures traductions au sens sémantique en isolant les anomalies.

 

Au cours de cette synthèse nous allons regarder en profondeur les TA afin de répondre à la question suivante : est-ce que l’intelligence artificielle peut à travers l’exemple des TA désormais remplacer l’intelligence humaine dans certains métiers considérés comme humainement complexes ? Afin d’y répondre nous allons d’abord voir l’historique de la traduction automatique avant et après la 20° siècle. Cela nous amènera dans un deuxième temps à réfléchir sur l’intérêt de tels programmes et les différents techniques mises en œuvre pour le processus de traduction elle-même. Enfin on pèsera le pour et le contre en examinant les avantages et les inconvénients de la TA face à la traduction humaine pour arriver à une conclusion finale.

 

Partie I : Historique

A. La notion de traduction automatique avant et après le 20° siècle

 

L’idée de la traduction automatique date du 17ème siècle. En 1629 René Descartes proposait une langage universelle avec des différentes langues partageant un symbole commun. En effet cela semblait être une bonne solution car la traduction serait nettement facilitée. Imaginons par exemple qu’on utilise une langue universelle (l’Esperanto) comme solution efficace face au problème de la traduction et qu’on souhaite les combinaisons pour traduire 5 langues : Français, Anglais, Allemand, Espagnol et Portuguais

Si on passe par une langue générique, on a que quatre possibilités sinon on a une factorielle en fonction du nombre de la langue cherchée : Factoriel de 5: 5 * 4 * 3 * 2 * 1

 

i.e.

Fr – Ang, Fr– All, Fr –Esp, Fr – Por

Ang – All, Ang – Esp, Ang – Por

Esp – All, Esp – Por

Por – All

 

En effet le nombre de combinaisons explosent. Ceci dit, il semble que peut-être la traduction automatique peut nous apporter par conséquent des pistes pour nous faciliter la vie.

 

L’idée de se servir d’un ordinateur pour traduire des langues naturelles fut proposé en 1946 par A. D. Booth. Le premier chercheur dans la domaine fut Yehosha Bar-Hillel à MIT en 1951.  Cela fut suivi par une équipe à l’université de Georgetown la même année puis par une démonstration d’un système de base en 1954. En 1955, des expériences ont suivi au Japon et en Russie et en 1956 la première conférence a eu lieu sur la TA. En 1962, des recherches ont continué avec la création d’une association en traduction automatique et la linguistique informatisée.

 

Deux ans plus tard en 1962, un groupe officiel fut formé (ALPAC) pour étudier plus en profondeur la traduction automatique. Malheureusement après un projet de 10 ans, les objectifs espérés ne furent pas atteints. L’échec du projet a montré un ralentissement dans l’évolution de la TA. Le financement a augmenté cependant avec le succès du système Logos qui avait comme but de traduire des documents militaires en vietnamien. En 1970 l’institut Textile Français a utilisé la TA pour traduire des résumés en Anglais, Allemand et Espagnol. Aussi, l’université de Brighton Young a traduit des textes Mormons par la TA.

Alors qu’est-ce qu’un traducteur électronique peut vous apporter concrètement? Avant de développer des propriétés sophistiquées de produits différents, il est important de comprendre l’intérêt d’un tel appareil ou programme.

 

Dans le début des années 80 avec l’accès de l’informatisation à un prix raisonnable on observe plus d’intérêt pour la traduction automatique.  En 1991 le premier système de TA en vente fut créé pour traduire le russe, l’anglais et l’allemand. Des innovations nouvelles sont apparues dans les années 90 comme l’apparition du site web Systran (1996) qui proposait des traductions gratuites de petits textes. Un an plus tard Babel fish est arrivée et a stimulé plus de 500, 000 demandes par jour. Ensuite dans les années 2000 avec l’arrivée des smartphones, des applications de traduction de SMS au Japon voient le jour. En 2009, on voit l’apparition d’un smartphone équipé d’une fonction de traduction de parole à parole.

 

 

B. Les différents produits:

 

Pour un appareil qui est censé simplifier la vie, il est surprenant comment ses produits peuvent rendre les choses plus difficiles et embrouillées. En explorant les différents produits proposés on s’aperçoit qu’il existe dans les années 90 dans la catégories de traducteurs électroniques portables essentiellement deux produits :  d’une part il y a des dictionnaires électroniques qui permettent de chercher la définition d’un mot et de par la suite de la traduire dans une autre langue. Même si cela peut être utile dans certaines circonstances, ils ne vous offrent aucun clarté à propos des structures de grammaire autour de la langue cible. Concrètement si je cherche la traduction pour le mot « sugar », le traducteur ne va pas vous donner un contexte d’utilisation comme « can I have some more sugar in my coffee ? ».

 

Ces limites sont surmontées cependant avec des traducteurs portables qui sont dotés de structures grammaticales autour des thématiques spécifiques : restaurants, hôtels, aéroports. Ces thématiques renvoient à des expressions ou phrases dotées de règles de syntaxe et de grammaire. Ces produits peuvent être utiles pour des gens qui veulent voyager sans apprendre une multitude de langues. Sinon si la personne est équipée d’un grande désir d’apprendre la langue comme un élève, alors les dictionnaires électroniques sont probablement plus attirants.

 

Si on se tourne vers les l’historique des types spécifiques traducteurs d’électroniques transportables, on peut observer trois configurations essentielles :

 

Des traducteurs non-parlants :

 

Ce sont les produits les plus standard : Ces produits viennent avec un clavier complet, un écran LCD qui s’ouvre avec un nombre spécifique de langues étrangères pré-téléchargées dans la machine. Une fois qu’une personne trouve un mot ou une phrase qu’il veut traduire dans la langue cible l’appareil l’affiche sur l’écran. Ensuite il peut soit lire la traduction soit laisser un natif lire la phrase ou mot.

Un exemple : Lingo World Traveler

Des traducteurs de texte vers la parole :

 

Ils peuvent faire tout ce qu’un traducteur non-parlant peut faire mais ils ont des applications supplémentaires comme le fait qu’ils peuvent prononcer la traduction dans la langue cible ce qui donne plus de possibilités à propos de la communication : comme répéter la phrase ou laisser un natif écouter la phrase.

Un exemple : Franklin Electronics 14 Language Speaking Global Translator

 

 

Des traducteurs de parole à parole :

 

Ces produits constituent un autre niveau de progrès et de complexité en laissant la personne par commande vocal contrôler le système. Certains produits dans cette catégorie possèdent un clavier avec la possibilité d’écrire et en plus une commande à l’oral. Avec un tel produit, la personne peut dire un mot ou une phrase et puis attendre pour que l’appareil vous renvoie une traduction appropriés qui est à la fois dite et affichée. Good idea, right ?

Un exemple : ECTACO Partner 900 series translators

 

 

Au cours des années et avec l’arrivée des smart phones et ordinateurs portables, les logiciels gratuits ou payants sont devenus le moyen le plus répandu de la TA. En France, les programmes principaux sont le logiciel Reverso et Power Translation. Aussi google possède son propre logiciel de traduction automatique ainsi que Babel Fish et Systran.

 

Partie II : Approche et fonctionnement de la TA

A. Les différentes techniques mises œuvres

 

Il faut dire qu’en deux mots ces logiciels sont constitués d’un moteur de recherche qui lui-même est lié à des dictionnaire et des règles syntaxiques. Nous allons maintenant rentrer dans une analyse un peu plus détaillée de cette organisation.

 

Il faut préciser qu’une fois qu’on sélectionne une catégorie de phrase on peut mettre l’accent sur des sous-catégories et puis sur des listes de phrases spécifiques. Sous cet angle, la précision de la TA augmente considérablement. Lorsqu’on dit «l’instituteur recula un peu sa chaise», dans la catégorie des mouvements, la machine recherche une plus petite liste de possibilités ce qui augmente les chances d’une bonne réponse. Il peut dans ce cas sortir en anglais avec « The teacher pushed back his chair a little » ce qui n’est pas une traduction directe mais qui est tout de même une représentation plus précise de ce qu’on voulez dire.

 

Phase 1 : Le texte source est analysé

 

Le programme analyse le texte d’arrivée, appelé le texte source en regardant la structure et en décortiquant les parties tels que le sujet, le verbe et ses compléments. Toutes ces parties sont ensuite envoyées à une base de traduction et puis analysées comme le ferait un humain.

 

Phase 2 : L’administration des règles

 

En seconde lieu, toutes ces observations et éléments sont mis en œuvre et ces règles appliquées. Autrement dit, les règles morphologiques, grammaticales et même sémantiques sont appliquées grâce à un séries d’algorithmes qui décortiquent les mots l’un après l’autre.

 

Pour faire cela le programme se sert d’indices linguistiques qu’il trouve dans la phrase comme la ponctuation ou les majuscules. Si par exemple le logiciel rencontre le mot « Nice » il sait que le mot correspond à une ville et non au nom commun. Par exemple si le mot est en début de la phrase, il analyse les mots qui suivent. Dans « Nice est une belle ville », comme Nice est suivie d’un verbe au singulier précédé d’un article alors le logiciel en déduit que le mot est bien un nom propre.

 

Comme deuxième exemple : « il la porte », le logiciel doit en déduire que porte, même s’il est précédé d’un article n’est pas un nom mais bien un verbe. Aussi dans « porter une voile » et « porter un voile » le logiciel doit en déduire et arriver à traduire la première expression par « to carry a sail » et la seconde par « to ware a veil ».

Dans une phrase ou aucun indice n’est donné sur le genre comme avec l’exemple « les voiles déferlent en vitesse », c’est là où entrent en jeu des données statistiques

 

Phase 3 : l’intervention des dictionnaires

 

Durant le procès de décortication et d’application de la TA, le logiciel cherche dans ses dictionnaires afin de trouver le meilleur mot possible en fonction du contexte. La richesse de cet outil linguistique se révèle essentiel car il va permettre d’éviter par des dictionnaires thématiques, des contre-sens. Par exemple le mot « serveur » désigne à la fois un serveur informatique ou un garçon de café. Si le logiciel comporte un dictionnaire thématique spécialisé en informatique et que l’utilisateur décide de s’en servir alors le programme interprèterait bien le mot  dans le sens de serveur pour un réseau informatique.

 

 

Si le logiciel n’est pas équipé d’un dictionnaire spécialisé des erreurs peuvent survenir. C’est d’ailleurs la présence de dictionnaires spécialisés qui évoque tout la différence entre un logiciel de traduction affinée et un simple service sur internet. C’est pourquoi les logiciels payant sont nettement plus élaborés que des applications gratuites. En outre, les logiciels développés ont la capacité d’apprendre de l’utilisateur afin de se souvenir de règles et de mots utilisés. Tout simplement il possède une mémoire qui permet d’enregistrer par exemple des textes déjà vues.

 

Phase 4 : Le transfert vers le texte cible

Une fois que le logiciel a analysé le texte source, il lui reste l’étape de « transfert » qui est la reconstruction de la phrase dans la langue cible. Cette étape peut apparaitre simple mais il doit respecter toute les subtilités des deux langues. Par exemple, les expressions entre langue change. Les expressions traduites mot à mot sont souvent révélatrices d’un contre sens. Par exemple si on traduit « se noyer dans un verre d’eau » par « to drown in a glass of water » le sens est complètement perdu.

C’est sur cet aspect-là que beaucoup de logiciels de traduction automatique se focalisent. On peut dire que la qualité d’une bonne traduction se base en effet pas simplement sur une simplicité syntaxique, l’absence de fautes d’orthographes avec des mots pertinents dans la langue source. Quels sont donc les enjeux de la TA ? Pour y répondre il faut évaluer d’abord les types de TA.

 

B. Les différentes types de TA

 

  • TA basée sur des dictionnaires

Ceci est une méthode basée sur des résultats de dictionnaires ce qui implique que les mots sont traduits par les définitions trouvées dans le dictionnaire.

 

  • TA interlingual

Un point évoqué au début concernant une langue universelle (et qu’on développera un peu plus tard) c’est-à-dire une langue neutre indépendante de n’importe qu’elle langue. Ceci permet la génération interlinguale vers la langue cible. Un avantage à cette technique classique est le nombre de langues cibles qui peuvent être générées à partir d’un interlangue.

Cette méthode a vu le jour par le KANT system qui fut utilisé pour traduire un anglais technique en d’autres langues.[1]

 

 

 

  • TA basée sur le transfère

Similaire de la méthode interlinguale, cette approche passe par une étape intermédiaire qui engendre le sens de la phrase originale. Cela est un des moyens le plus répandu de TA. Il fonctionne à partir de trois étapes : Il détermine la structure grammaticale du texte source afin de créer une représentation intérieure. Puis il transfère sa structure dans une structure adaptée dans la langue cible et finalement il génère le texte.  Des programmes se servant de ces systèmes utilisent des informations des deux langues. Cependant contrairement au modèle interlinguale, la TA basée sur le transfère fonctionne non à partir d’une langue intermédiaire mais se focalisant sur des paires linguistiques entre les deux langues.

 

 

Dans une approche directe, les mots sont traduits sans passer par une étape de représentation supplémentaire. Dans l’approche de transfert direct, le langage est transformé dans une forme plus abstraite et moins spécifique. On focalise sur les correspondances de langues avec sa grammaire.

 

  • TA basé sur les règles

 

Ceci mélange à la fois des techniques de transfère, d’interlingua et de dictionnaire.  Cette méthode utilisée pour des programmes syntaxiques se base sur une grande connaissance des informations linguistiques des deux langues en se servant des règles pour la traduction. Il cherche en effet à générer la même structure en entrée jusqu’à la sortie et puis dans un deuxième temps d’établir un transfère lexique.

 

  • TA basée sur des statistiques

 

Une méthode de traduction basée sur des statistiques qui génère si les données sont nombreuses et précises des traductions efficaces. Les premiers programmes basés sur cette approche fut Candide de IBM. En 2007, le géant google a basculé sur cette approche aussi. Ces programmes plus concrètement fonctionnent en détectant des modèles, configurations et styles similaires parmi des centaines de million de documents pré-traduits par des humains. A partir de cette étape la TA établie des suppositions intelligentes. Cela implique plus il y a de documents traduits dans une langue et plus la traduction sera pertinent.

 

  • TA hybride

 

Cette approche se base sur un mélange des méthodes statistiques et de règles. De nombreuses firmes et universités ont investi dans cette méthode dont Systran et l’université Polytechnique de Valence.  Il faut savoir que cette approche diffère dans son organisation. Il existe par exemple une méthode hybride qui s’appuie sur des règles et puis qui sont ajustées pour une meilleure qualité. Il existe aussi une organisation fondée sur des statistiques puis qui sont guidées par des règles. Cette approche est nettement plus effective à cause de sa flexibilité et son contrôle dans l’avant et l’après du processus de traduction. Plus récemment une nouvelles méthode hybride est en train d’émerger en combinant les avantages de règles, statistiques et aussi d’un support neuronal.

 

  • TA Neuronal

 

Une approche profonde de TA qui s’est répandue rapidement ses dernières années. Google a annoncé qu’il préfère désormais cette approche au-dessus de la stratégie statistique. Par conséquent il a  lancé le Google Neural Machine Translation (GNMT). D’autres firmes comme l’application mobile Microsoft Translator ou Skype Translator tente de rivaliser avec Google. Aussi Omniscien Technologies a annoncé la sortie de la TA neuronal en 2018.

 

 

Une traduction automatique neuronal nécessite une fraction de la quantité de mémoire comparée à l’approche statistique auparavant utilisée par ces grandes firmes. En outre toutes ces extensions sont reliées conjointement à un réseau neuronal afin de favoriser la qualité de la traduction. Ce réseau apprend en temps réel le sens des données afin qu’un auto-apprentissage ait lieu. On appelle cette intelligence artificielle Deep Learning. Plus spécifiquement après que les moteurs neuronaux examinent la grammaire et la syntaxe de la phrase en langue source, il analyse le contexte et le lexique afin d’obtenir une sortie de traduction bien meilleure que la méthode statistique ou hybride neuronale.

 

 

Une explication des étapes du système neuronal de la TA

 

  • Chaque mot est codé dans un vecteur de 500 cases représentant les caractéristiques uniques entre le mot dans les deux langues. Ces concepts peuvent par exemple être « féminin, masculin ou neutre », soit « verbe, nom, adjectif ». Ensuite après ce premier trie le mot passe un vecteur de 1000 cases qui le compare avec les autres mots dans la phrase.
  • Une fois que toutes les mots sont encodés dans des vecteurs de 1000 cases, le processus est répété plein de fois pour une meilleure précision du contexte de la phrase entière.
  • Ensuite un programme algorithmique utilise les sorties des données afin de déterminer quels mots de la langue source doivent être traduits. Ensuite ces calculs permettent aussi d’omettre des mots inutiles.

 

 

C. Les progrès aux cours des années

 

Depuis les années 50, un nombre considérable de chercheurs et savants ont débattu concernant la possibilité d’atteindre un logiciel de traduction automatique de haute qualité. Il faut admettre que les programmes d’aujourd’hui sont indéniablement meilleurs qu’il y a 10 ans.

 

La traduction automatique comme on l’a précisé en haut permet aujourd’hui une adaptation par thème, domaine ou par profession telle que l’informatique ou la météo. Cela se montre utile dans les domaines où une langage formelle est demandée tels que pour que des papiers gouvernementaux.

 

Pour améliorer la sortie de traduction, l’intervention humaine peut aussi rentrer en jeu. Par exemple si le logiciel est informé qu’un mot est un nom propre alors la tâche peut être facilitée.

 

Cela ne s’arrête pas là. Au cours des années, le progrès s’est développé encore plus. Désormais on a conçu des produits de  reconnaissance vocale qui permettent le développement de traducteurs de parole à parole. Dans un tel appareil, une carte de son convertit des ondes sonores similaires dans un format digital et décompose des mot dans des phonèmes[2] différents et enfin les compare à un dictionnaire de sons.

 

 

Partie III : Les avantages et les inconvénients de la TA

A. Les points positifs : Que peut faire la traduction automatique aujourd’hui ?

 

Depuis longtemps avec des traductions de mots calqués littéralement, la sortie des TA fut plus amusante qu’’utile. Les résultats furent des contresens, des incohérences et d’autres erreurs empêchant une phrase fluide et compréhensible. Cependant depuis quelques années les progrès de l’intelligence artificielle sont en vues de rectifier ces limites. Cette nouvelle conquête semble diriger par Google Translate qui propose la traduction en 103 langues soit la quasi-totalité des langues parlées.

 

 

Le  logiciel cette année fête ses 10 ans et avec plus de 500 millions d’internautes chaque mois, il cherche encore plus de perfection. Le Google Neural Machine Translation est maintenant intégré dans son application, cette nouvelle technologie conçue d’après le modèle du cerveau humain afin que l’application ne traduise plus mot à mot mais en intégrant le sens général afin d’obtenir une traduction plus fidèle. Depuis novembre 2017 Google affirme qu’avec le GNMT, les taux d’erreurs sont réduits entre 55% et 85%. Pour le moment le GNMT regroupe neuf langues : l’anglais, le français, l’allemand, l’espagnol, le chinois, le portugais, le japonais, le coréen et le turc.

 

 

En tête d’une équipe d’une cinquantaine d’ingénieurs travaillant sur Google Translate, Barak Turovsky, déclare voir une nouvelle étape conquise en terme de TA. Il mentionne

 

« En dix ans, nous sommes progressivement passés de la traduction mot-à-mot, utile mais hachée et imprécise, à une traduction basée sur des fragments de phrases, le Phrase-Based Machine Translation (PNMT). Le Google Neural Machine Translation (GNMT) permet aujourd'hui une approche plus globale de la traduction. »

 

Il faut préciser que google n’est pas la seul à exploiter le GNMT. Il y a aussi d’autres grande firmes de traduction comme l’entreprise française Systran. Par exemple Systran se concentre dans la domaine de la spécialisation et grâce à des algorithmes de terminologie de domaines d’activités, il attire des demandes du secteur de l’automobile, de l’industrie et bien d’autres. En ce qui concerne Google translate, ils sont réticents à révéler leurs secrets dans le domaine neuronale mais il livre tout de même le fait qu’ils sont équipés d’une nouvelles génération de puces (les TPU, ndlr) qui accélèrent énormément la vitesse de traduction.

 

 

Une autre nouveauté majeure dans le domaine c’est l’innovation de traduire une langue à partir d’autres langues aussi appelé multi-langues. Imaginons qu’on a des données pour le français et le coréen et qu’on a également des données pour le français et le japonais  mais pas entre le japonais et le coréen. Le modèle qu’on décrit nous permettra même sans les algorithmes préétablis à traduire entre ces deux langues une fois lancée.

 

Cela rejoins l’idée d’une langue universelle évoquée dans la première partie. Cette interlangue appelée « zero-shot » permettrait de contourner une quantité énorme de travail. Un tel exploit semble étonnant si il est mise en route sérieusement.

 

A part cela, le responsable de google translate Barak Turovsky a établi dans les années à venir l’objectif de conquérir d’avantage de personnes à se servir de ces logiciels et à élargir des nouvelles expériences de traduction comme Tap to Translate[3] qui est une application qui développe une rapidité d’échange et de discussions entre étrangers.

 

 

Pour que le mouvement avance concernant la TA, la contribution humaine est indispensable. Par exemple, le Kirghizistan eux ont réclamé une application pour leur langue. Google Translate leur a dit que ce ne saurait pas possible sauf s’ils avaient soumis deux millions de phrases traduites, ce qui semblait énorme. Néanmoins peu de temps après ils ont pu  faire cela et leur langue s’est finalement mise en place.

 

Sous une perspective ironique mais éducative, d’après les recherches faite par Dr. Ana Nino à l’université de Manchester, les inexactitudes de MA ont pu être utilisées comme un outil pédagogique. Selon son étude nommée « MA comme un mauvais modèle », ses résultats ont montré que les élèves en se réfléchissant sur les erreurs de la machine ont mieux saisi les règles et notions de la langue cible.

 

B. Les limites de ces programmes

 

Les progrès de grandes firmes comme google ces dernières années n’empêche pas l’occurrence d’erreurs de traductions voir d’obstruction de hackeur. Par exemple google translate a traduit le 5 janvier 2016 la Russie en l’Ukraine avec « mordor » ou « sad little horse » pour désigner le ministre étranger Russe Sergei Lavrov[4]. Même si cela fut probablement sous l’influence d’un hackeur tout de même la tension s’est accrue entre les deux pays. Cela montre donc l’obstruction possible que permet la TA.

 

Il est important de comprendre ce qu’on peut faire avec un traducteur électronique. On ne peut pas prendre un de ces traducteurs, lire une page « Des Misérables » et qu’il ressorte sur l’autre côté, la page de Victor Hugo parfaitement traduite dans la langue cible. Ceci nécessite ce qu’on appelle une traduction universelle qui en toute réalité n’existe pas.

 

Le processus de traduction peut se diviser en deux parties : Tout d’abord, l’humain ou la machine doit décoder le sens du texte source et puis seulement après on passe le re codage du sens dans le texte cible. Derrière cette procédure qui à l’air relativement simple à faire se cache des opérations cognitives complexes qu’une machine a toujours du mal à accomplir. Pour décoder le sens du texte source le traducteur doit prendre en compte tout les fonctionnalités du texte, une opération qui implique une connaissance habile d’outils sémantiques, syntaxiques et d’expressions idiomatiques y compris la culture des deux langues. C’est là où réside les limites de TA. Comment faire pour qu’une machine comprenne un texte comme une personne le fera ? Les limites du TA se posent avec le problème de la connaissance naturelle de la langue source.

 

L’inconvénient de l’approche de TA par des règles est que les phrases doivent être très explicites. La moindre ambiguïté doit être intégrée dans le programme auparavant sinon on trouve des incompréhensions.

 

Même si nos technologies ont évolué, le système de TA statistique est toujours implémenté par des logiciels. Les programmes recueillent des données de textes comme par exemple des documents analysés, des livres mais aussi des articles. Ces textes déjà traduits sur internet alimentent le modèle statistique à reproduire lors de la traduction, c’est-à-dire en cherchant des configurations spécifiques pour alimenter sa mémoire interne. Le souci d’une configuration purement statistique c’est qu’il est dépendant d’une énorme quantité de textes.

 

 

Aussi, même si on peut relier ces méthodes dans un contexte hybride, ceci reste tout de même complexe à mettre en œuvre. Enfin même la TA neuronale rencontre des difficultés face à la traduction de mots très techniques, rares voir des noms propres.

C. Une comparaison avec l’humain

 

Récemment Google Translate a annoncé qu’il traduit assez de texte pour remplir 1 million de livres en un seul jour. Cela est-t-il un signe de la fin des traducteurs officielles et diplômées ? Est-ce qu’on est arrivé à un nouveau stade où grâce à la technique qui constitue désormais la TA nous n’aurons bientôt plus besoin de traducteurs de langues spécialisés ? Plus crucialement encore, est-ce que la précision réalisée grâce à l’intelligence artificielle se rapproche si tellement de celles des humaines qu’on pourrait se passer d’êtres vivants dans encore un domaine prépondérant ?

 

En 2010 à l’Université de Western Sydney, une étude a été faite pour comparer des phrases traduites de Google Translate et puis parallèlement par des traducteurs humains. L’activité concernée la traduction d’anglais en chinois et fut évaluée par des correcteurs professionnels. Les résultats ont révélé en dehors de la vitesse  que la machine se montrait plus propice concernant trente-trois des cinquante-six phrases ce qui montrait l’avantage des machines de traductions.

 

L’occurrence avec google translate en Russie montre que notre dépendance envers les nouvelles technologie sont au stade ou une mauvaise  manipulation ou un virus peuvent chambouler notre vie quotidienne de manière considérable.

 

Si on compare la traduction humaine à une perspective de différenciation, on s’aperçoit que s’est extrêmement rare que deux individus traduisent le même texte de manière identique dans la langue cible. Cela montre que la traduction automatique peut générer une satisfaction complexe concernant sa production.

 

Sinon qu’est ce qui se passe  si un logiciel ne comprend pas le sens du texte ? Il semble que au lieu de faire une bonne traduction, il colle des règles sans une vision globale et même s’il fait l’analyse de toute la phrase, il peut ne pas offrir la pluralité de définitions comme ferait un homme avec un dictionnaire

 

Dans deux langues, l’humain doit gérer les nuances. L’humain doit connaître bien les deux langues pour voir la manière dont les gens présentent les images. L’ordinateur ne comprend peut-être pas ces nuances. Comme nous l’avons vu plus haut, la traduction automatique d’un « serveur informatique » peut se transformer en « serveur, garçon de café ». La compréhension du contexte permet de choisir le bon mot et l’ordinateur semble avoir encore du mal sur ce point.

 

 

La traduction automatique dans le processus de traduire un texte donné peut être analysé en examinant deux facteurs principaux :

 

  1. La degré de liberté de la traduction. Tandis que des traductions littérales peuvent être apprises relativement aisément, la traduction libre pose des problèmes sémantiques importants.

 

  1. L’étroitesses d’un domaine. Des thèmes pointus aboutissent le plus souvent à de bons résultats en TA. Cela semble être dû à l’étroitesse de la sélection des domaines lexicaux qui ne pose pas un vrai problème avec des termes qui se répètent fréquemment. Cela permet des traductions relativement précises.

 

La TA semble plus avantageuse dans les domaines techniques d’industrie mais il est loin d’accomplir une maturité et une précision en ce qui concerne la traduction littéraire.

 

Conclusion :

 

Nous avons vu dans cette étude d’abord l’historique de la TA depuis ses débuts jusqu’à aujourd’hui. On a mis en lumière l’intérêt de ces produits, allant de machines à définitions simples jusqu’à des applications toutes nouvelles comme Tap to Translate. Ensuite on a développé les différentes techniques mises en œuvre qui permettent de faire tourner ces programmes sans rentrer dans des détails techniques exhaustifs du sujet. Enfin en troisième lieu, on a étayé les avantages et les inconvénients de la TA. On a vu ce que la TA peut faire aujourd’hui suivie de ses limites. Finalement on a comparé la TA avec l’humain afin de répondre à notre problématique.

 

Est-ce que l’intelligence artificielle peut à travers l’exemple des TA désormais remplacer l’intelligence humaine dans certains métiers considérés comme humainement complexes ? En regardant la TA on peut conclure que plus le domaine est technique moins on a de liberté de traduction et donc plus valables sont ces machines. Donc il semble que la TA soit positive dans certains domaines. Cela explique pourquoi la TA fonctionne dans des documentations techniques. Néanmoins, les résultats sont nettement moins évident en ce qui concerne des domaines plus vastes et inattendues comme la traduction de romains littéraires voir des articles d’informations. Cela montre les limites de TA et donc le besoin toujours nécessaire de la traduction humaine.

 

Plus globalement on peut en déduire que l’intelligence artificielle n’est toujours pas aussi développé que l’on voudrait l’imaginer. Toutes les nuances qui sortent d’un être vivant sembles toujours inaccessibles par l’intelligence artificielle et donc universellement plus précieuses. Tout de même l’avenir de la TA semble avancer à un pas géant. On peut finir ce rapport en faisant peut-être tout simplement la distinction entre l’intelligence artificielle qui correspondrait au fait de connaitre la bonne réponse et l’intelligence humaine qui correspondrait plus au fait de poser la bonne question et puis de répondre avec culture.

 

Ressources :

 

Rangin, Magalie. Comment ça marche : la traduction automatique ?

http://www.01net.com/actualites/comment-ca-marche-la-traduction-automatique-293151.html

Consulté le 12 décembre 2017. Article d’un site d’information.

 

Trujillo, Elsa. L’intelligence artificielle au service de la traduction automatique.

http://www.lefigaro.fr/secteur/high-tech/2016/12/07/32001-20161207ARTFIG00005-l-intelligence-artificielle-au-service-de-la-traduction-automatique.php

Consulté le 12 décembre 2017. Article d’un site d’information.

 

YouTube, Traitement automatique des langues.

https://www.youtube.com/watch?v=2V92B9rmd3Y

Consulté le 14 décembre 2017. Vidéo explicative.

 

Microsoft. Microsoft Translation Speech API.

https://www.microsoft.com/en-us/translator/speech.aspx

Consulté le 16 décembre 2017. Site professionnel.

 

Encyclopedia, Wikipedia. Machine Translation.

https://en.wikipedia.org/wiki/Machine_translation

Consulté le 18 décembre 2017. Site d’encyclopédie.

 

Encyclopédie, Wikipedia. La Traduction Automatique.

https://fr.wikipedia.org/wiki/Traduction_automatique

Consulté le 18 décembre 2017. Site d’encyclopédie

 

Systran. What Is Machine Translation?

http://www.systransoft.com/systran/translation-technology/what-is-machine-translation/

Consulté le 21 décembre 2017. Site professionnel.

 

Harris,William. How Electronic Translators Work.

https://electronics.howstuffworks.com/gadgets/travel/electronic-language-translators1.htm

Consulté le 26 décembre 2017. Site de technologie explicative.

 

Studer, Xavier. Google lance la traduction automatique neural.

https://www.xavierstuder.com/2016/11/17/google-lance-traduction-automatique-neurale/

Consulté le 28 décembre 2017. Blog high-tech et télécom.

 

Garcia, Ignacio. Is machine translation ready yet?

https://benjamins.com/#catalog/journals/target.22.1.02gar/details

Consulté le 28 décembre 2017. Article universitaire.

 

Toral, Antonio & Way, Andy. Is Machine Translation ready for literature?

http://www.mt-archive.info/10/Asling-2014-Toral.pdf

Consulté le 2 janvier 2018. Article universitaire.

 

____________________________________________________________________________

 

[1] Nyberg and Mitamura, 1992

[2] les plus petites parties de sons de langage oral

[3] Tap to Translate est un application qui copie le texte et le traduit instantanément initialisé à partir d’une simple clique sur l’icon

[4] https://www.theguardian.com/technology/2016/jan/07/google-translates-russia-mordor-foreign-minister-ukrainian

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *