Google vient de changer de système de traduction . Elle utilise maintenant sa propre méthode pour les 25 langues accessibles sur son site: la seule puissance de ses machines et les milliards de données qu’elles traitent, sans traducteur ni logiciel de traduction.
Ce système consiste à mettre en parallèle des mots dans chacune des deux langues et des textes traduits par les humains puis à leur appliquer des techniques d’apprentissage statistique, comme l’a expliqué Franz Och , un des chercheurs de l’équipe.
« Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars. Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model ».
[Si la citation originale vous gène, c’est le moment d’essayer Google Translate …]
Google avait déjà gagné des prix de l’agence de recherche du Pentagone (DARPA ) pour sa méthode appliquée d’abord au chinois et à l’arabe.
Cette nouvelle technologie remplace celle de Systran (la même que celle utilisée par Babelfish ).
Voici, à titre d’exemple, la première phrase de ce billet traduite à l’anglais, puis, de nouveau au français comme on le fait d’habitude pour tester ce type de service:
Google has changed the translation system. It now uses its own methodology to the 25 languages available on the site: the only power of its machines and the billions of data they handle, without a translator or translation software.
Google a modifié le système de traduction. Il utilise maintenant sa propre méthode pour les 25 langues disponibles sur le site: la seule puissance de ses machines et les milliards de données qu’ils traitent, sans un traducteur ou d’un logiciel de traduction.
Qu’en dites-vous?