Communicatie is een helder begrip
In iedere taal

Blog

Een korte geschiedenis van machinevertalingen in minder dan 700 woorden

mm

Geschreven op 2019-11-20
door Textwerk

Weet jij wel genoeg van de huidige stand van zaken in de vertaalsector?

In deze korte blogpost leggen we je in minder dan 700 woorden uit wat de verschillende generaties zijn in de ontwikkeling van machinevertalingen. Wil je na het lezen zien wat voor kansen machine-vertalen je biedt als ondernemer? Klik dan hier. Ben je na het lezen van dit artikel benieuwd hoe jij je als vertaler in de toekomst ook nog nuttig kunt maken in de wereld van machinevertalingen? Klik dan hier.

Verschillende generaties van machinevertalingen

Ten tijde van Web 1.0, toen Google Translate nog niet bestond (voor 2007), waren er vertaalsites zoals Babelfish:

Deze werkten met een oude manier van machine-vertalen: rule-based machine translation (RBMT). Dit vertaalde op basis van woordenboekdefinities en simpele grammatica. Deze manier van vertalen was erg rudimentair en kon slecht omgaan met metaforen en woorden die op meerdere manieren vertaalt kunnen worden. Voor die tijd was het echter een mooi begin om enigszins begrijpbare teksten te creëren zonder dat je een vertaler hoefde te zoeken.

Hierna kwam statistical machine translation (SMT). Tot ongeveer drie jaar geleden was dit de standaard in het gebruik van machinevertalingen. Deze manier was gebaseerd op percentages/kansberekening: een machine vertaalde fragmenten van zinnen op basis van bestaande vertalingen en analyses van grote volumes tweetalige teksten, kijkend naar statistische verbanden. Dit kostte veel rekenkracht.

De huidige technologie

Sinds begin 2017 is er een nieuwe manier van online vertalen: neural machine translation (NMT). Dit gebruikt neurale netwerken om patronen van eerdere menselijke vertalingen te identificeren en reproduceren. De software hiervan is zelflerend. Deze techniek vereist nog meer rekenkracht dan SMT en het duurt dan ook een stuk langer om een werkbare basis op te bouwen (soms meerdere maanden, afhankelijk van de tekst volumes), maar het is uiteindelijk wel effectiever dan de oudere modellen.

De neural machine translation die Google en Microsoft op dit moment gebruiken -een gamechanger voor de vertaalindustrie- is ontzettend krachtig, omdat het (in lijn met de mondiale trend) gebruik maakt van zelflerend vermogen (AI). Het NMT algoritme is gedemocratiseerd; iedereen kan er mee aan de slag. Google en Microsoft zijn dan ook zeker niet de enigen die een dergelijke machine (kunnen) bouwen: zo heeft de Europese Commissie er een laten bouwen, en laat Booking.com delen van hun content machine-vertalen (zonder menselijke corrector), aangezien naar hun mening de kwaliteitsdrempel (van minimaal 95% positieve menselijke feedback) gehaald is. Op dit moment is er ongeveer een dozijn kwalitatieve vertaalmachines op de markt die werken via NMT.

Hoe werkt het?

NMT vertaalt hele zinnen, in tegenstelling tot SMT, die de zin in stukjes hapte waardoor kromme zinnen konden ontstaan. Omdat NMT kijkt naar de context in de zin, zijn vertalingen gemiddeld gezien beter en klinken deze natuurlijker dan oudere generaties. Zinnen kloppen meestal en fouten worden alleen gezien door taalkenners zoals vertalers. Voor het algehele publiek zal deze nieuwe manier van vertalen voldoen aan de meeste wensen.

Echter, aangezien NMT geen kennis heeft van iets buiten de zin (wereldse kennis van spreekwoorden), worden spreekwoorden bijvoorbeeld nog steeds verkeerd vertaalt.

Vergelijk de volgende twee zinnen:

voorbeeld 1: “Paris has now set up emergency shelters for its rough sleepers”.

Dit wordt door NMT vertaalt met: 

“Parijs heeft nu noodopvanghuizen ingericht voor haar ruige dwarsliggers(Bing) of “…zware slapers(Google).

Er wordt echter met rough sleepers “mensen die op straat leven” bedoeld – dit wordt door de machine niet goed vertaalt; zulke kleurrijke phrases zijn (nog) niet goed bekend.

voorbeeld 2: “Mast cells reside in connective tissues and mucous membranes, and regulate the inflammatory response”.

Dit wordt door NMT vertaalt met:

“Mastcellen bevinden zich in bindweefsels en slijmvliezen en reguleren de ontstekingsreactie.”

Deze zin bevat echter een specialistische, medische term (mast cell), die in het Nederlands vertaalt naar mestcellen.

(voorbeelden Europese Commissie, maart 2018)

Hoewel het systeem nog niet perfect is biedt NMT kansen om op lange termijn veel simpel vertaalwerk te vervangen. Het creëert de mogelijkheid voor bedrijven om hun content snel internationaal beschikbaar te maken. Voor vertalers kan het betekenen dat ze zich meer bezig kunnen houden met minder goed vertaalbare specialistische content, waar ze zich verder in kunnen ontwikkelen!