Tech-News-Technologie

Google fügt „Neural Machine Translation“ für indische Sprachen hinzu: Das bedeutet es

Google hat neuronale maschinelle Übersetzungen für indische Sprachen angekündigt, und das wird dies für die Nutzer bedeuten

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Was ist Neural Machine Translation, Neuronale Netze, Machine LearningMelvin Johnson, Ingenieur und Forscher bei Googles Translate.

Google hat gerade einen großen Schritt angekündigt, wie Übersetzungen jetzt für indische Sprachen funktionieren werden. Die Neural Machine Translation (NMT) wird in Indien für neun Sprachen eingeführt; Hindi, Bengali, Marathi, Tamil, Telugu, Gujarati, Punjabi, Malayalam und Kannada. Dieses neue Übersetzungssystem wird auch die automatische Übersetzung in Google Chrome und die Überprüfungsfunktion in Google Maps unterstützen.



Wenn es um maschinelles Lernen und künstliche Intelligenz geht, gilt Google als unangefochtener Marktführer, und das Sprachen-Bit ist Teil dieser größeren Bemühungen. Was genau bedeutet NMT für indische Sprachen im Web und warum ist dieses neue Übersetzungssystem wichtig? Wir erklären unten.

Was genau ist neuronale maschinelle Übersetzung?



Einfach ausgedrückt, setzt die neuronale maschinelle Übersetzung von Google auf neuronale Deep-Learning-Netzwerke, um Übersetzungen durchzuführen. Es handelt sich um ein mehrsprachiges Modell, bei dem dem System beigebracht wird, zwischen mehr als einem Sprachpaar zu übersetzen.



Google startete das Projekt 2015 mit seiner eigenen TensorFlow-Bibliothek für maschinelles Lernen, um zu sehen, wie es die von Computern erstellten Übersetzungen verbessern könnte. TensorFlow ist die Open-Source-Bibliothek von Google für maschinelles Lernen.

Wie Googles Forschungsingenieur Melvin Johnson den Medien erklärte, ist ein neuronales Netz dem menschlichen Gehirn nachempfunden. So wie das menschliche Gehirn auf äußere Reize reagiert, wird diesen neuronalen Deep-Learning-Netzwerken beigebracht, auf bestimmte Eingaben zu reagieren.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Was ist Neural Machine Translation, Neuronale Netze, Machine LearningGoogle hat neuronale maschinelle Übersetzungen für neun indische Sprachen angekündigt.

Im Fall von neuronalen maschinellen Übersetzungsnetzen (NMT) werden diesen Systemen die Sprachen beigebracht und sind ein „End-to-End-System“. Das System wird mit Sätzen aus Sprachen gefüttert, die übersetzt werden sollen. Bei einer Übersetzung von Hindi ins Englische werden dem System beispielsweise dieselben Sätze in Hindi und seinem Gegenstück in Englisch beigebracht, um die Übersetzung zu verstehen.

Das System ähnelt dem, wie Google Computern beibringt, Bilder zu erkennen. In diesem Fall werden dem Netzwerk Millionen und Abermillionen von Bildern eines bestimmten Objekts, beispielsweise einer Katze, zugeführt, bis es selbst erkennen kann, was sich als Katze identifiziert.

Inwiefern ist das neue NMT-basierte System besser als das, was Google früher gemacht hat?

Laut Google ist das neuere Übersetzungssystem qualitativ viel besser und schneller. Das ältere Übersetzungssystem für Computer erforderte eine Phrase für Phrase, und da Google 103 Sprachen unterstützt, wurde der Prozess langsamer und mühsamer.

Das neue mehrsprachige NMT-System ist jedoch viel schneller, da dem gleichen Modell mehrere Sprachen beigebracht werden können, und ermöglicht es Google, viel schneller zu skalieren. Es lernt auch Übersetzungen von Satz zu Satz und nicht nur von Satz zu Satz. Laut Google ist es viel genauer und näher an menschlichen Übersetzungen als das vorherige System und verbessert die Übersetzung von 10 Sekunden pro Satz auf 0,2 Sekunden pro Satz.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Was ist Neural Machine Translation, Neuronale Netze, Machine LearningEinige der Skalierungsherausforderungen für die NMT-basierten Übersetzungen von Google.

Die neuen TPUs (TensorFlow Processing Units), die Google für diese neuronalen Übersetzungen verwendet, haben die Geschwindigkeit ebenfalls erheblich verbessert, sagt das Unternehmen, da diese speziell für solche Operationen entwickelt wurden. Die Idee von NMT besteht darin, die Lücke zwischen menschlichen und Computerübersetzungen zu schließen.

Ist das System also perfekt? Oder gibt es noch einige Herausforderungen?

Man muss bedenken, dass maschinelles Lernen, sei es rund um die Übersetzung oder die Bilderkennung, noch in den Kinderschuhen steckt. Wie Johnson erklärt, steht das NMT-System für die Übersetzung vor einigen Herausforderungen, insbesondere wenn es um Indien geht, das so viele Regionalsprachen hat.

Denken Sie daran, dass das System mit Sätzen gefüttert werden muss, um die Sprache zu verstehen und zu erkennen. Es braucht einen Parallelsatz in Englisch und Hindi, wenn dies das Paar ist, das von der Maschine übersetzt werden muss.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Was ist Neural Machine Translation, Neuronale Netze, Machine LearningDas neue System ermöglicht eine viel schnellere Übersetzung von Sätzen.

Wie Johnson manchmal betonte, ist es eine Herausforderung, parallele Inhalte im Web zu finden (dies sind Inhalte in einer regionalen Sprache). Er nennt es ein kleines Sahnehäubchen, da englische Inhalte das Web dominieren. Dies erschwert die Aufgabe, Maschinen für die Übersetzung zu trainieren, viel schwieriger. Google wird mehr Daten und mehr Inhalte in regionalen Sprachen benötigen, um die Leistung dieses Systems zu verbessern.

Dann gibt es das Problem der Nuancen und des Tons in Übersetzungen, die Menschen interpretieren und verstehen können, aber es wird viel schwieriger sein, dies einer Maschine beizubringen.

Was bedeutet das in Zukunft für die Nutzer?

Die Idee mit dem Modell besteht nicht darin, nur zwei Sprachpaare zu übersetzen, wie etwa Hindi ins Englische. Schließlich könnte es bedeuten, dass Google Translate Hindi direkt ins Tamil übersetzen kann, ohne dass dies speziell gelehrt wird.

Tatsächlich hatte Google im November letzten Jahres bekannt gegeben, dass sein System in der Lage ist, eine „Zero-Shot-Übersetzung“ durchzuführen, oder besser gesagt, Sprachpaare zu übersetzen, wenn es nicht speziell dafür gelehrt wurde. Google hatte enthüllt, dass das System Übersetzungen zwischen Koreanisch und Japanisch herausgefunden hat. In diesem Bereich des maschinellen Lernens bedeutet dies einen bedeutenden Sprung, denn das System hat das Übersetzen selbst herausgefunden. Das könnte in Zukunft den entscheidenden Unterschied machen.