Logo Jurishop.fr

Jurishop, les prestataires des avocats, juristes, notaires...

Accueil > Actualités > Meilleures pratiques

Favicon-Jurishop

Appuyer sur un bouton pour générer une traduction ultra rapide, c’est désormais chose possible… (2nde partie)

Dernière mise à jour: 2021

Quel gain de temps, d’énergie et d’argent ! Surtout quand on sait combien il est difficile de trouver de bons traducteurs spécialisés capables de traiter les demandes des clients dans la minute avec un niveau de qualité toujours égal, une terminologie harmonieuse, un style respectueux de l’image « corporate ». Autant de paramètres présents dans le cahier des charges des utilisateurs des services de traduction, difficiles, voire impossibles à satisfaire malgré les promesses des agences. C’est surtout le facteur temps-qualité qui pose problème. Et si les outils d’aide à la traduction ont très largement permis d’améliorer les délais de traitement sans sacrifier la qualité, il est toujours impossible d’obtenir une traduction parfaite d’un texte spécialisé et technique de plusieurs milliers de mots en quelques heures. 

[ Première partie à lire ici ]

Pour aller plus loin après la première partie, nous vous livrons ci-dessous les observations de Pierre-Yves, traducteur spécialisé en droit et finance, anglais > français depuis 14 ans chez Tradewords qui a testé les outils de traduction automatique actuellement disponibles.

Contextualisation.

Même si les traducteurs automatiques sont en progrès constants sur ce point, grâce au word embedding (technique qui permet de représenter chaque mot d’un dictionnaire par un vecteur de nombres réels correspondant pour faciliter l’analyse sémantique des mots.), ce système montre ses limites dans un certain nombre de cas. Prenons par exemple le terme « equity » qui, dans le domaine de la finance, peut signifier notamment « actions » ou « capitaux propres » selon le contexte : même avec la technique du word embedding, les termes associés à equity dans le sens d’actions par vectorisation sont quasiment les mêmes que pour equity dans le sens de capitaux propres. Il est possible que le logiciel tombe par hasard sur la bonne traduction, mais il est peu probable que ce soit systématiquement le cas.

Connotation.

Il est peu probable qu’une machine puisse, à plus ou moins long terme, être capable de comprendre et de retranscrire le sens caché qui peut être véhiculé par l’emploi d’un terme dans un contexte particulier, un jeu de mots, une utilisation détournée d’un mot, etc. A titre d’exemple, la phrase “More generally, across the globe, central bank communication had a more dovish bias” était traduite par DeepL de la manière suivante : “De façon plus générale, dans le monde entier, les communications des banques centrales avaient un parti pris plus dovish », et par Systran de la façon suivante : « Plus généralement, dans le monde entier, la communication entre les banques centrales a eu un biais plus doviste. »

Problèmes liés aux erreurs dans le document source ou à sa qualité.

Des oublis, problèmes de ponctuation, coquilles (notamment dans le cas des conversions de documents scannés ou manuscrits) peuvent rendre le texte source incompréhensible pour une machine. Un traducteur humain sera en mesure de rectifier de lui-même ces erreurs afin de redonner au texte son sens d’origine, ce qui ne sera pas nécessairement le cas pour la traduction automatique. C’est à ce niveau qu’interviendra la post-édition ou post-editing, qui fera l’objet de la deuxième partie de notre article. La correction des coquilles, contresens, problèmes de ponctuation, etc. est généralement effectuée dans le cadre d’une post-édition partielle (light post-editing), qui a lieu si le document doit être traduit pour une utilisation interne ou uniquement à but informatif. Si le document est par exemple destiné à être publié, on effectuera alors une post-édition complète (full post-editing) qui implique alors une intervention humaine maximale pour atteindre un niveau de qualité comparable à une traduction « humaine ». A ce titre, il convient de noter qu’une étude de 2018 [1] a mis en évidence une limite de la traduction automatique faisant l’objet d’une post-édition.
L’auteur y indique avoir fait réaliser par 25 étudiants en traduction et 10 traducteurs professionnels un travail de post-édition (partielle, puis complète) d’une traduction d’un discours de Barack Obama traduit avec le moteur DeepL. Dans cette traduction s’était glissée l’erreur suivante : DeepL avait traduit « to deliver justice to the terrorist network » par « pour rendre justice au réseau terroriste ».
L’erreur venait du fait que l’expression « rendre justice » en français signifie le contraire de l’original anglais. Or, un seul étudiant sur les 25 avait pris la peine de modifier cette phrase lors de la post-édition partielle, et 20% des traducteurs professionnels avaient laissé cette erreur lors de la post-édition complète (et 28% d’étudiants), ce qui semblait élevé compte tenu de la gravité de l’erreur et du niveau d’expertise des post-éditeurs. L’auteur parvenait à la conclusion selon laquelle il semblerait que l’apparente fluidité d’une production automatique induise une sorte d’excès de confiance dans le chef des traducteurs, toutes expériences confondues, et favorise donc la présence résiduelle d’erreurs de sens moins visibles.

Problèmes liés à la structure du document source ou au découpage du document par le logiciel de TAO.

Sous Trados, le logiciel convertit d’emblée le document source au format propriétaire .sdlxliff en vue de sa traduction. A cette étape, il arrive fréquemment que des termes de phrases complètes figurant dans des tableaux (par exemple dans des états financiers) se retrouvent isolés. La conversion en .sdlxliff a notamment pour effet de fractionner le texte dans les colonnes de manière aléatoire et fait sauter les jonctions avec les segments d’avant et après, ou donne des jonctions qui n’ont pas lieu d’être, parce que les segments ne sont pas au bon endroit et n’ont donc, pour la machine, pas de raison d’être liés entre eux. Par exemple, « Fair Value USD » et « % of Net Assets » dans deux colonnes qui se suivent vont donner d’une part « Fair Value % » et « USD of Net Assets », ce qui peut conduire à des erreurs de traduction.

Problèmes liés à la rédaction du texte source.

Les abréviations, les acronymes, les tournures elliptiques, les raccourcis, le jargon interne aux entreprises, les mots nouveaux pour lesquels il n’existe pas encore de traduction « officielle », etc. peuvent poser des problèmes insurmontables aux traducteurs automatiques. Pour les phrases elliptiques, il est souvent nécessaire de rajouter en français des informations qui ne figurent pas dans la phrase d’origine. Parfois, une information déterminante (comme le genre d’un nom) ne figurera pas dans une phrase spécifique, mais aura été indiquée une ou plusieurs phrases auparavant : une machine ne pourra la reconnaître et la prendre en compte. Par exemple, « La voiture n’a pas démarré. Elle était en panne ». Pour l’instant, les phrases sont traduites de manière isolée. Dans cet exemple, le traducteur automatique sera incapable de traduire « it » par « il » ou « elle », l’information permettant d’arriver à la bonne traduction ne figurant pas dans la même phrase.

Style.

Il sera possible pour un traducteur automatique d’intégrer les préférences terminologiques ou stylistiques d’un client pour des termes spécifiques, mais un traducteur automatique ne sera pas en mesure de soigner le style global du texte cible et de l’adapter à son auditoire. A titre d’exemple, il est très peu probable qu’un traducteur automatique puisse, même à long terme, effectuer des traductions satisfaisantes de documents faisant appel à de l’écriture créative, tels que des communiqués de presse. En effet, ceux-ci doivent généralement être fortement retravaillés et le résultat final s’éloigne souvent du texte d’origine pour pouvoir obtenir un document qui interpelle le lecteur dans la langue cible.

Traduction orale/Interprétation.

Outre les problèmes qui peuvent se poser à l’écrit pour la traduction automatique, il existe également un certain nombre de difficultés qui peuvent se présenter à l’oral. L’accent de la personne qui parle, un défaut de prononciation, la qualité de l’enregistrement ou du signal, entre autres, sont autant de facteurs qui peuvent compliquer, voire rendre impossible la traduction automatique d’un discours ou d’une interview.

Fiabilité des sources.

Même avec le deep learning, la qualité de la traduction obtenue dépendra toujours de la qualité des traductions du corpus de textes. Pour avoir testé DeepL, qui est actuellement l’un des traducteurs automatiques les plus performants du marché, avec de courts extraits de documents financiers, les résultats sont effectivement assez impressionnants, bien meilleurs qu’avec Google translate, par exemple, mais la traduction n’est pas directement exploitable (mauvaise traduction d’un acronyme, problème d’harmonisation d’un terme-clé entre deux phrases qui se suivent, expressions mot-à-mot dont on comprend le sens mais qui nécessitent une adaptation en « bon » français, etc.). Si le principe et les résultats de la traduction neuronale proposée par DeepL sont très prometteurs, le problème principal du système réside dans la qualité de la base de données utilisée, à savoir Linguee, et la méthode de collecte de ces données, effectuée par robot d’indexation. En effet, Linguee, que nous utilisons régulièrement depuis quelques années pour rechercher la signification d’un terme ou d’une expression dans un contexte précis fait certes appel à des traductions de qualité pour certains documents (traductions officielles de textes de l’UE, par exemple), mais la recherche contextuelle d’un terme ou d’une expression aboutit très régulièrement à de mauvaises traductions (extraits de sites internet de sociétés bilingues traduits littéralement par Google translate, par exemple), voire à des textes sans aucun lien (vraisemblablement du fait de problèmes d’alignement des segments en langue source et cible par le robot d’indexation, ce qui peut être dû à des problèmes de ponctuation dans un texte ou l’autre, par exemple).

Le problème de la traduction automatique, peu importe la méthode retenue, tient au fait qu’une base de données importante est nécessaire pour assurer de bonnes traductions. Or, il paraît impossible d’obtenir un volume d’alignements de textes sources et de traductions cibles de qualité, validées par l’homme, suffisant pour permettre à une machine d’obtenir un degré de précision et de qualité égal à celui d’un traducteur professionnel. Si les logiciels de traduction automatique continuent à faire appel à des robots d’indexation pour intégrer des données provenant de textes non vérifiés, peu importe le volume des bases de données constituées, celles-ci comporteront toujours des erreurs et les traductions obtenues nécessiteront toujours, dans le meilleur des cas une révision/réécriture par un traducteur professionnel, et dans le pire des cas, une nouvelle traduction de zéro.

Article de Pierre-Yves, traducteur spécialisé en droit et finance, anglais > français
Tradewords
En savoir plus sur ce traducteur ici