Neurale machinevertalingen: tips en voordelen
voor uw digitale vertalingen

Iedereen heeft wel eens gebruik gemaakt van Google Translate, Reverso of Deepl om een website of tekst in een andere taal te begrijpen. Dit soort vertalingen worden automatische vertalingen, of machinevertalingen (machine translation, MT), genoemd: het vertalen van een tekst, van de ene taal naar de andere, door een computer zonder enige vorm van menselijke interventie.

Sommige van deze tools laten nog te wensen over en daarom zijn er over dit onderwerp veel vragen. Voldoet een generieke automatische vertaalmachine bijvoorbeeld aan mijn zakelijke verwachtingen? Is bij een machine translation de vertrouwelijkheid van mijn gegevens wel gewaarborgd? Wat is Neurale Machinevertaling precies en hoe kan ik het in mijn eigen specifieke workflow integreren?

Machinevertalingen: oorsprong, werking en ontwikkeling

Het zal u misschien verbazen, maar de eerste machinevertalingen werden al in de jaren vijftig van de vorige eeuw uitgevoerd. Sinds die tijd kunnen we drie verschillende systemen onderscheiden:

Vertaalsystemen gebaseerd op regels (jaren ‘80)

Deze systemen gebruiken specifieke software voor machinevertaling waarin woordenboeken met veel voorkomende woorden gecombineerd worden met linguïstische en grammaticale regels. Om de kwaliteit van de vertalingen te verbeteren, wordt wel aangeraden om woordenboeken van de specifieke gebruiker toe te voegen. Dit betekent echter niet dat het eindresultaat overeen zal komen met de verwachting van de gebruiker. Toch kunnen op regels gebaseerde systemen over het algemeen wel coherente en logische vertalingen produceren, mits er gespecialiseerde woordenboeken gebruikt worden.

Vertaalsystemen gebaseerd op statistieken (jaren ’80-’90)

In tegenstelling tot de op regels gebaseerde systemen, gebruiken de op statistiek gebaseerde systemen geen enkele linguïstische regel om tot een vertaling te komen. In plaats daarvan worden statistische modellen gebruikt die automatisch vanuit het corpus opgebouwd worden. Het automatische vertaalprogramma analyseert vervolgens de belangrijkste databanken voor elke taal, met als resultaat redelijk vloeiende, maar niet altijd logische vertalingen.

Vertaalsystemen gebaseerd op neurale algoritmen (2015)

Met de komst van deze systemen is niet alleen vertalen in real-time, maar ook het voorspellen van woordvolgorde werkelijkheid geworden. Met deze benadering leren vertaalmachines te vertalen door middel van neurale netwerken, gevormd door verbindingen. Deze verbindingen lijken sterk op de verbindingen die we kennen van het menselijk brein.  Automatische neurale vertaalsystemen maken vertalingen van hogere kwaliteit mogelijk: neurale vertalingen bevatten 50% minder fouten in woordvolgorde, 17% minder lexicale fouten en 19% minder grammaticale fouten. Neurale netwerken hebben zelfs geleerd om de juiste geslachten en grammatica toe te passen in verschillende talen (zonder dat iemand het die systemen geleerd heeft!). Neem bijvoorbeeld deze Engelse zin die in het Frans vertaald is. De zin is zowel door een generieke automatische vertaalmachine vertaald (die geen rekening houdt met de context van de zin) als door een neurale vertaalmachine die in dit domein getraind is:

NMT-example
Ontdek hoe Petit Bateau de gehele vertaalworkflow wist te centraliseren

Neural Machine Translation (NMT): een krachtig wapen op het gebied van automatische vertaling

Neurale machinevertaling verschilt van benaderingen die gebaseerd zijn op statistiek en regels. Neurale machinevertaling maakt, geholpen door kunstmatige intelligentie, gebruik van een groot neuraal netwerk dat net zo werkt als het menselijk brein.

Neurale machinevertaling is op dit moment de meest geavanceerde, door een computer gegenereerde vertaalmethode. Daarnaast heeft NMT de afgelopen jaren grote vooruitgang geboekt dankzij de op kunstmatige intelligentie, Big Data en Deep Learning gebaseerde zelflerende eigenschappen. Het is vandaag de dag dus mogelijk om neurale vertaalmachines in te zetten als basis voor professionele vertalingen.

De machine kan niet alleen betrouwbare vertalingen reproduceren, maar kan daarnaast ook talen leren. Hierdoor kan de kwaliteit van de vertalingen constant verbeterd worden. Om operationeel te worden, moet de machine wél door een mens getraind worden. Dit betekent dat het programma gevoed moet worden met een substantiële hoeveelheid data, waarmee de betrouwbaarheid van het eindresultaat verhoogd kan worden.

Ook is het mogelijk om het programma te trainen om in de behoeften van specifieke sectoren te voorzien, ongeacht of het nu de juridische, financiële of zelfs de medische sector met de daarbij horende specifieke vakgebonden terminologie betreft.

Twee van de grote vijf GAFAM-bedrijven (Google, Apple, Facebook, Amazon & Microsoft) werken al met hun eigen geverifieerde machinevertalingen:

  • Google met de Google Neural Machine Translation (GNMT): een neuraal netwerk dat in 8 talen beschikbaar is.
  • Microsoft met de Microsoft Translator mobiele applicatie die gebruikt kan worden om documenten naar zestig verschillende talen te vertalen.

Een ander voorbeeld is Skype die de Skype Translator op de markt bracht en daarmee chatgroepen tot wel 100 deelnemers faciliteert.

Het mag duidelijk zijn dat NMT erg nuttig is voor verschillende sectoren, met name voor de e-commerce sector. Een kanttekening daarbij is dat er wel aan een aantal criteria voldaan moet worden: zo moeten er voldoende herhalingen in de tekst zijn, moet er gespecialiseerde data beschikbaar zijn om de vertaalmachine te trainen en moet het te vertalen volume ook aanzienlijk groot zijn.

Er moet echter wel rekening gehouden worden met een aantal zaken…

De beperkingen van neurale machinevertalingen

Om aan de hand van NMT een kwalitatieve vertaling te verkrijgen moeten de zinnen in de brontekst niet alleen erg duidelijk, maar ook coherent zijn. Niet alleen NMT, maar ook de andere automatische vertalingssystemen kampen met dit nadeel. Zelfs de kleinste ambiguïteit moet in het programma worden geïntegreerd om onsamenhangende of zelfs onbegrijpelijke vertalingen te voorkomen. Zo heeft Neural Machine Translation moeite met het vertalen van zeer technische tekst, of als er zeldzame woorden of eigennamen in de tekst voorkomen. Aan het lanceren van een automatische neurale vertaling gaan daarom enkele stappen vooraf:

  • Duidelijkheid van de te vertalen tekst: om ambiguïteitsproblemen te voorkomen.
  • Training en menselijk oordeel: als men te maken heeft met een specifieke sector (juridisch, medisch, etc.).
  • Data privacy management: het is van groot belang om stil te staan bij het feit dat publiekelijk toegankelijke vertaalmachines alle data opslaan die zij verwerken op hun servers. Dit betekent dat het lastig is, of zelfs onmogelijk, om de vertrouwelijkheid van de data van de klant te garanderen.
  • Het creatieve aspect: een vertaalmachine traint zichzelf met wat de machine verstaat onder de norm. Daardoor stelt de machine dus altijd een vertaling voor die het beste past bij wat tot nu toe al geleerd is. Dit pakt echter niet altijd goed uit. Denk bijvoorbeeld aan verschillende merken in de e-commerce sector: een ‘top’ bij Topshop, zou goed een ‘T-shirt’ genoemd kunnen worden bij Zara, terwijl deze twee producten eigenlijk hetzelfde type product zijn.

Om het beste om te gaan met dit soort kwesties, is menselijke interactie essentieel.      

Waarom de mens onmisbaar is

We hebben gezien dat automatische vertalingen, dus ook neurale machinevertalingen, enkele tekortkomingen hebben als het gaat om context. Bepaalde subtiliteiten zijn nog altijd ongrijpbaar voor vertaalmachines en daarom is menselijke verificatie in dit proces dan ook essentieel. Menselijk expertise in projectmanagement en advies en kennis van neurale machinevertaling-specialisten moeten aanwezig zijn om van een project met automatische machinevertalingen een succes te kunnen maken.

Het is dus van belang dat automatische vertalingen worden geverifieerd; dit noemen we ook wel Post-Edited Machine Translation of PEMT. Deze activiteit wordt uitgevoerd door professionele vertalers die kennis hebben van de valkuilen van neurale machinevertaling. De vertaler corrigeert de door de machine gegenereerde automatische vertaling met als doel een zo coherent en vloeiend mogelijke doeltekst. Er bestaan twee soorten post-editing:

  • Lichte post-editing: bestaande uit het simpelweg corrigeren van de automatische vertaling, zonder de diepte in te gaan.
  • Volledige post-editing: bestaande uit een extensieve lezing en een volledige, diepgravende correctie van de tekst.

Bij lichte post-editing komen bijvoorbeeld spel- en grammaticale fouten, verkeerde vertalingen, beledigende of niet passende vertalingen en ontbrekende woorden aan het licht. Bij volledige post-editing zijn het juist fouten in terminologie, zinsstructuur, interpunctie en schrijfstijl die door de menselijke vertaler worden gecorrigeerd om de tekst natuurlijker en vloeiender te maken.

Lichte PEMT (light post-editing in het Engels) wordt dus gebruikt om een taal te begrijpen die de lezer niet beheerst, terwijl Volledige PEMT (full post-editing in het Engels) gebruikt wordt om zinnen die door automatische vertaalmachines geproduceerd zijn te perfectionerenvandaar de term geverifieerde, ofwel proofread, machinevertalingen.

De komst van neurale machinevertalingen is een stap voorwaarts op het gebied van effectiviteit en bruikbaarheid van automatische vertaalmachines. Deze vertaalmachines, die verrijkt en getraind zijn per industrie, zijn een hoogkwalitatieve bron voor vertalers die vertaalde teksten controleren en corrigeren. NMT heeft dus absoluut voordelen voor bedrijven: 

  • Allereerst kun je met machinevertalingen behoorlijk op de vertaalkosten besparen;
  • Daarnaast bespaart het aanzienlijk veel tijd: een menselijke professionele vertaler kan gemiddeld 2000 à 3000 woorden per dag vertalen, terwijl een vertaalmachine slechts een paar seconden nodig heeft om een groot volume te vertalen;
  • En tenslotte is een groot voordeel uiteraard de gewaarborgde kwaliteit dankzij menselijke expertise, zowel van het projectmanagement als van de professionele vertalers die de post-editing verzorgen.

Het werk uitgevoerd door neurale vertaalmachines kan dus niet uitgevoerd worden zonder menselijke begeleiding en de expertise van vertaalprofessionals zoals projectmanagers, linguïsten, developers, vertalers en proofreaders. Maar het eindresultaat liegt er niet om: door geverifieerde machinevertalingen komen snelle, coherente, goedkopere en op uw domein, merk en publiek afgestemde vertalingen binnen handbereik.

Heeft u een project?

Laten we het bespreken

Waarom TextMaster?

Eenvoudig & Modern

  • business-16px_globe Direct online bestellen
  • ui-16px-1_attach-86 Diverse bestandsformaten
  • ui-16px-2_chat-round-content Directe communicatie met vertalers

Kwaliteitsgarantie

  • ui-16px-2_favourite-31 Geverifieerde deskundige vertalers
  • ui-16px-1_zoom Extra proofreading op aanvraag
  • business-16px_award-48 50 expertisegebieden

Snel & Voordelig

  • ui-16px-3_metrics Gemiddelde levertijd is 24 u
  • shopping-16px_cart A la carte tarieven
  • business-16px_currency-euro Van €0.08 tot €0.12 per woord