Blogopmaak

Machinevertaling, aan welke kant sta jij?

Els Peleman • jan. 24, 2024

Ik heb al heel veel geschreven over mijn ervaring met machinevertalingen, te beginnen met GoogleTranslate en daarna DeepL en DeepLPro.  Dat is telkens vanuit mijn standpunt – een vertaler die zijn toekomst bedreigd ziet worden – bekeken, maar dat is slechts één perspectief. Het andere perspectief is misschien nog wel veel belangrijker voor de toekomst van ons beroep…

Appels met peren vergelijken: freelancevertalers versus vertaalbureaus

Om te beginnen wil ik eerst iets heel duidelijk stellen:

“Een vertaler die machinevertaalsoftware gebruikt doet dat om een geheel andere reden dan een vertaalbureau dat doet.”

Een freelancevertaler zal een machinevertaaltool inzetten als hulpmiddel om zijn productiviteit te verhogen, en om dus meer per uur te verdienen zonder dat dit ten koste gaat van de kwaliteit.

Een vertaalbureau echter gebruikt machine-vertaalsoftware, hierna afgekort als MT-software, om sneller , maar vooral goedkoper , vertalingen te kunnen leveren: kwantiteit gaat boven kwaliteit. Alleen aan de zijde van een vertaalbureau kan men spreken van Post-Editing Machine Translation, afgekort PEMT, of het ‘editen’ van machinevertalingen.

Als er al een PEMT plaatsvindt, dan is dat bijna altijd tegen veel te lage tarieven. Zo heb ik bijvoorbeeld al 45% van het normale vertaaltarief gehoord. Dat stemt overeen met het tarief voor het reviseren van menselijke vertalingen. Iets wat een heel andere aanpak vergt en wat – zo is de realiteit nu eenmaal – nog altijd veel sneller gaat dan de meest courante (commerciële) MT-software zoals DeepL(Pro) en Google Translate.  Machinevertalingen die door vertaalbureaus voor ‘ post-editing’ worden uitbesteed aan freelancevertalers blijven nog steeds veel meer werk vragen dan revisie van door professionele vertalers gemaakte vertalingen.

Dat is ook een van de redenen waarom lang niet alle freelancevertalers met een MT-software (willen) werken, laat staan dat ze open staan voor post-editing: het is soms veel sneller om het gewoon zelf te vertalen.

Dit onderscheid in gebruikers is een nuance die in discussies vaak ontbreekt maar die wel cruciaal is. In een lezing rond post-editing werd bijvoorbeeld gesteld dat PEMT sowieso noodzakelijk is bij machinevertalingen die menselijke vertaalkwaliteit willen evenaren. De realiteit die ik van collega’s hoor – ik doe tot op heden geen PEMT-werk voor vertaalbureaus – is dat vertaalbureaus niet tot nauwelijks waarde hechten aan kwaliteit, en dus aan post-editing, laat staan dat ze er een correcte prijs voor willen betalen.

Eén ervaring met machinevertaling heb ik wel en die bevestigt dit 100%: de vertaalkwaliteit van vertaalbureaus die met machinevertaling en post-editing werken, laat soms zeer te wensen over. In mijn geval – een websitevertaling Engels-Nederlands, moesten mijn team en ik zowat de hele vertaling opnieuw doen onder enorm tijdsdruk – de eindklant ging uit van een snelle naleesronde voor de puntjes op de i – en er werd een serieuze klacht neergelegd bij het vertaalbureau.

Verschillende machinevertaaltools

Ikzelf heb vanuit mijn eigen ervaringen – een jaarlijkse test met DeepL (Pro) en die ene slecht vertaalde websitevertaling – alleen nog maar kennisgemaakt met Google Translate, DeepL, DeepLPro. Ik vermoed dat die slecht vertaalde website ook van DeepL(Pro) afkomstig was, alhoewel ik soms gedacht heb: “Dit kan DeepL volgens mij beter”.

Ik weet dus niets over de verschillen in kwaliteit van andere machinevertaalprogramma’s die door vertaalbureaus ingezet worden.

Neural Machine Translation (NMT)

Neural Machine Translation (NMT) is de meest recente vorm van machinevertaling. In dit soort MT-software worden massaal veel corpora gestoken en de MT-software kijkt dan op basis van frequentie welke betekenis het beste in jouw zin past. Staat er in jouw zin iets over een auto, dan gaat hij zoeken in contexten met auto’s om jouw term te vertalen. Staat er in jouw zin iets over een woning, dan gaat hij in die context zoeken. En op basis daarvan geeft de MT-software aan wat de ‘meest waarschijnlijke’ vertaling is. Maar hij begrijpt de zin niet. Alles draait om frequentie.

Als een term dus maar heel zelden in het corpora voorkomt in de betekenis die jij zoekt – bijvoorbeeld omdat het een nieuwe uitvinding is – dan zal hij moeite hebben om hier een passende vertaling voor te vinden. Omschrijven, wat een menselijke vertaler zou doen als er geen woord voor bestaat, lukt MT-software niet omdat hij de zin niet begrijpt.

In een artikel van Marc Prior over machinevertalingen in een Duits vakmagazine werd terecht gesteld dat het wel nog eens jaren zou duren vooraleer alle probleemgevallen zijn opgelost (m.a.w. voldoende hits hebben in de corpora), als het al ooit zou lukken…. Net zoals machinevertaling evolueert, evolueert ook taal, de maatschappij, de technologieën. Denk maar aan inclusiviteit, #metoo, woke…

Omdat een MT-software niet kan begrijpen, niet kan denken zoals mensen, heeft hij het ook heel erg lastig met onduidelijke formuleringen: fouten of verwarrende zinnen heb je in elke tekst wel. Taal is nu eenmaal geen exacte wetenschap. Daarom kan je in mijn ogen bij een goede vertaling nooit 1-op-1 vertalen , en dat is nu net wat je bij machinevertalingen heel vaak ziet. In de websitevertaling kon je letterlijk elk woord uit het Engels terugvinden op nagenoeg dezelfde plaats in de Nederlandse zin, met ronduit zeer houterige zinnen tot gevolg.

Ook eigennamen worden door MT-software soms vertaald. In de websitevertaling werd zelfs de firmanaam niet consistent op dezelfde manier geschreven: dan eens met hoofdletters, dan alleen de eerste letterlijk een hoofdletter, dan ook nog het tweede deel van de samenstelling, en soms was het gewoon volledig in hoofdletters, zoals het hoorde. Waar ik nu heel erg benieuwd naar ben voor vervolgprojecten, is of de MT-software heeft ‘geleerd’ van zijn fouten. Gaat hij wat wij gecorrigeerd hebben volgende keer wel juist doen?

Geslachten is nog zo een thema waarvoor je de tekst moet begrijpen: in het Engels is het altijd ‘my cousin’ maar in het Nederlands ‘mijn neef’ of ‘mijn nicht’. Een menselijke vertaler leidt dat af uit de rest van de context maar MT-software kijkt (voorlopig) nog niet verder dan zinsniveau. Er wordt wel al geëxperimenteerd met MT die verder kijkt dan zinsniveau, maar dat is heel erg moeilijk want hoe weet de software waarnaar hij moet kijken? Bovendien geldt: hoe groter het fragment waarnaar hij moet kijken, hoe langer het duurt vooraleer hij een vertaling heeft. En laat snelheid nu net de grote troef zijn die MT-softwareontwikkelaars uitspelen.

Ook registers en stijl zijn een punt waar een MT-software het volgens dat artikel altijd zal laten afweten, want daarvoor moet je de tekst ‘aanvoelen’. Je moet weten waarvoor de tekst bedoeld is. Een inleiding van een tijdschrift moet catchy zijn en prikkelen. Een diepgaandere tekst over dat onderwerp moet dan weer een andere stijl hebben, die op zijn beurt kan afhangen van het doelpubliek. Als ik een boorddocument voor mobilhomes vertaal, dan schrijf ik anders dan wanneer ik een soortgelijke inhoud voor een garagemonteur vertaal.

Een vertaler wikt en weegt en beslist

Je wilt niet weten hoe vaak een vertaler keuzes moet maken. In het artikel zegt de auteur: “Soms is er gewoonweg geen 100% adequate vertaling .”

Elke taal heeft andere nuances. Soms kom je vaktermen tegen waarvoor in jouw moedertaal gewoonweg geen woord voor bestaat. In de verpakkingsindustrie is dat bijvoorbeeld zeer vaak het geval bij transportbandsystemen. Devertaler gaat dan vaak omschrijven en zet bijvoorbeeld de letterlijke vertaling tussen haakjes zodat hij die in de rest van de tekst kan gebruiken om steeds die beschrijving te vermijden.

Soms moet een vertaler ook duidelijker zijn dan in het origineel , omdat de lezer het anders niet gaat begrijpen. Vaak komt hij aan die extra kennis door research of door navraag te doen bij de auteur, omdat hij het tijdens het vertalen zelf al verwarrend vond.

Dat zijn allemaal zaken wat MT-software niet kan, en in mijn ogen ook nooit gaat kunnen.

Post-Editing Machine Translation

Al deze ‘struikelblokken’ zijn bekeken vanuit het standpunt dat je een volledige tekst door een MT-software haalt en vervolgens gaat corrigeren, gaat post-editen.

Dat lijkt mij een hele boterham voor een post-editor om een vertaling te krijgen die de vertaalkwaliteit van een menselijke vertaler evenaart, temeer omdat h et grote gevaar schuilt in zinnen die op het eerste zicht goed lijken, maar het toch niet zijn .

Je moet verder kijken dan wat er staat. Daarvoor moet je een bijzonder getraind oog hebben.

Veel van die zinnen doe je in je hoofd automatisch juist als je de zin from scratch vertaalt… Bij een machinevertaling moet je doorheen de reeds vertaalde tekst kunnen kijken en dezelfde redenering maken. Dat lijkt mij een zeer moeilijk proces…

Post-editing kan niet zonder vertaalskills en omgekeerd

Ik ben er dan ook van overtuigd dat Post-Editing een vak op zich is. Ik heb het zelf nooit geleerd en ik waag mij er ook niet aan totdat ik er een degelijke opleiding heb gehad. Helaas heb ik nog geen opleidingen gevonden voor de talencombinatie Duits-Nederlands. Bovendien is de verloning voor PEMT-werk zodanig laag op dit moment, dat een opleiding hierin zich niet loont.

En ook het omgekeerde is waar: je kan niet post-editen zonder een degelijke vertaalvaardigheid. Ik heb al verschillende ervaringen gehad met studenten die alleen maar met DeepL hebben leren vertalen. Als je aan hen vraagt een heel eenvoudige tekst zelf te vertalen, loopt het op verschillende vlakken mis.

Vlakken waar je als professionele vertaler totaal niet meer bij stilstaat omdat die zo evident zijn. Bijvoorbeeld: research. Hoe pak je dat aan? Hoe zoek je op een efficiënte manier op het internet naar informatie? Als je met PEMT dezelfde kwaliteit wilt bereiken, moet je dezelfde research doen als bij een gewone vertaling. Vertalers definiëren hun beroep vaak als volgt: een vertaler is iemand die het woord dat hij al kent, in het woordenboek opzoekt. Voor post-editors geldt dat eveneens, zo niet zelfs meer.

De mogelijke voordelen van post-editing

In de lezing werd ook aangekaart dat  sommigen post-editing minder inspannend vinden dan vertalen. Er zijn naar mijn gevoel zodanig veel factoren die allemaal positief moeten uitdraaien dat het bijna niet realistisch is:

  • De werking van het MT-systeem: een professioneel MT-systeem met NMT werkt beter dan het commerciële DeepL(Pro).
  • De kwaliteit van de machinevertalingen: is de kwaliteit alle corpora gegarandeerd?
  • De talencombinaties: voor Frans en Duits naar het Nederlands zijn mijn bevindingen niet echt positief, het Engels-Nederlands project was tot mijn verbazing eveneens van erbarmelijke kwaliteit.
  • De tekstsoort: het Engels-Nederlandse project was een websitevertaling zonder al te veel ingewikkelde zaken en zelfs daar ging het MT-systeem hopeloos de mist in.
  • De vertalers zelf: kunnen ze vertalen én post-editen, en worden ze naar waarde geschat en betaald?

 

Teufelskreis

In de lezing werd er duidelijk op gehamerd dat er altijd een grondige post-editing nodig is. In de praktijk is dat vaker niet dan wel het geval. En dan kom je bij het punt waar volgens Marc Prior de MT-software zijn eigen graf graaft:

Slecht vertaalde corpora – omdat het post-editing niet grondig is gedaan of omdat de menselijke vertaler niet de juiste vertaalkwaliteit levert (er zijn heel wat hobbyvertalers, vertaler is helaas geen beschermd beroep) – geven slechte machinevertalingen. Wie beoordeelt de kwaliteit van de opgeslagen vertalingen?

Laat staan dat de menselijke factor volledig wordt weggelaten – wat in de realiteit zéér vaak gebeurt – dan ontstaat er wat ze in het artikel een ‘Teufelskreis’ (*) noemen: de kwaliteit van de corpora wordt steeds slechter totdat ze uiteindelijk compleet onbruikbaar wordt.

(*) Ik zou Teufelskreis hier vertalen als ‘boemerangeffect’. Ik betwijfel of een MT-software dit uit de context zou kunnen halen…

MT-plugins als hulpmiddel voor de freelancevertaler

Laten we het nu ook eens van de keerzijde bekijken, van de kant van de freelancevertaler. Veel vertalers werken al met MT-plugins die ze integreren in hun CAT-tool zoals MemoQ. De machinevertaling wordt dan gecombineerd met hun eigen corpora.

Anderen gebruiken ze soms en nog anderen, zoals ik, vinden het tot op heden compleet nutteloos en tijdverdrijf: voor mijn vakgebied vind ik het nog altijd sneller gaan als ik from scratch vertaal, al moet ik er wel bij zeggen dat mijn laatste test is gebeurd met de gratis DeepL. Mijn bevindingen lees je in de blog ‘ De dag dat een machine kan denken, opzoeken, kneden, wissen en herbeginnen, gooi ik de handdoek in de ring ‘. Maar als het vertaalbureau waarover ik het hierboven heb met DeepL(Pro) heeft gewerkt, betwijfel ik dat ten zeerste.

Uit de lezing bleek ook meteen dat het commerciële DeepLPro zeer beperkt is en dat er daarin maar weinig aanpassingen/verbeteringen mogelijk zijn. Er zijn andere meer professionele MT-plugins die betere resultaten zouden opleveren. Ik zeg wel “zouden”, want ik heb ze nog niet uitgeprobeerd. Ik ben dat wel van plan. Er werd gesproken over:

  • ModernMT
  • OpenNMT
  • MultiModal Post-Editing
  • (*)

ModernMT ben ik van plan om binnenkort uit te proberen. Gek genoeg lijkt de kostprijs van ModernMT niet zo heel veel te verschillen van het commerciële DeepLPro. Ik ben heel benieuwd of dat met de kwaliteit van de machinevertaling wel het geval is…De filosofie van het bedrijf achter deze MT-tool is volledig in lijn met een tool voor vertalers (en dus niet voor vertaalbureaus): ‘ We believe that human creativity is underrated. We believe that the world is not leveraging the full creative potential of humans. We believe that machines should aim to free your time to let you express your creativity, rather than trying to replace you. We believe that if done right, machines and humans are better together.’ 

MultiModal Post-Editing (MMPE) ziet er net als OpenNMT weliswaar bijzonder interessant uit maar het vergt in mijn ogen een zodanig grote IT-kennis dat dit voor veel vertalers te hoog gegrepen is. Bovendien heb je, om MMPE optimaal te gebruiken, veel randapparatuur nodig, wat een extra investering vraagt die misschien niet voldoende rendeert.

(*) Lilt, het derde pakket dat werd aangehaald, is zoals hierboven al gezegd niet beschikbaar voor vertalers. Alleen als je voor het vertaalbureau Lilt werkt, kan je van deze software gebruikmaken, niet voor je andere klanten dus.

Voetnoot: Als ik me in Lilt zou vergissen hoor ik het graag, want de werkwijze van deze tool is precies wat ik van een hulpmiddel zou verwachten: het reikt je oplossingen aan maar jij beslist nog altijd zelf hoe je het uiteindelijk wilt vertalen (je gaat het dus niet corrigeren).

Door vertaalbureaus ontwikkelde MT-tools 

Uit de lezing bleek dat Lilt net zoals DeepLPro en TradosNMT in Trados werkt, d.w.z. als een soort ‘AutoSuggestDictionary’: jij typt en de MT-software stelt een vertaling voor. Staat het je aan, neem je het over, staat het je niet aan, typ je gewoon je vertaling verder tot op het punt dat het voorstel wel klopt. Als Lilt dan ook nog zou leren van je vertaalgeheugens – iets wat Muse in MemoQ dus doet (al vind ik het machinevertaalkarakter van Muse maar zeer gering) -, dan zie ik hier heel veel potentie in voor freelancevertalers.

Maar zoals gezegd denk ik dat het puur voor het vertaalbureau Lilt en zijn freelancers bedoeld is. Mijn eerste idee was dat ze de software misschien ook verkochten aan vertaalbureaus, maar gezien de PEMT-strategie van vertaalbureaus waarover ik het hierboven al heb gehad, heb ik die idee snel overboord gegooid: vertaalbureaus halen immers de tekst door een MT-programma en vragen vervolgens aan de post-editor om de machinevertaling te corrigeren.

De eigenlijke vertaling gebeurt dus door de machine, niet door de onderaannemers, zijnde de freelancevertalers.

Een ander nadeel van door vertaalbureaus ontwikkelde MT-tools is dat ze gebonden zijn aan een onlineplatform, waardoor de vertaler zijn eigen werkmiddelen zoals vertaalgeheugens, termbases, QA-tools, Regular Expressions,… niet kan inzetten. Dat geldt trouwens niet alleen voor MT-platformen, ook online vertaalprogramma’s hebben dat nadeel. Voor veel freelancevertalers is dat een no-go.

Sneller met machinevertaling?

Er werd ook aangekaart dat MT het vertaalproces zou versnellen: afhankelijk van een heleboel factoren is uit studies gebleken dat men 13 tot 86% sneller kan werken . Naar mijn mening zijn er een heleboel factoren, te veel om op te noemen, die dit kunnen beïnvloeden, laat staan om dit in cijfers te gieten.

In het vakartikel kwam dit vanuit een ander standpunt – het standpunt van de vertaalbureaus – ook aan bod: vertaalbureaus gaan er vanuit dat machinevertalingen minder werk vragen dan louter menselijke vertalingen (en gebruiken dat als argument voor een lager tarief). Maar niets is minder waar :

 
“Als de MT-software 9 van de 10 zinnen goed vertaalt, dan is dat geen tijdswinst van 90%, want in de meeste gevallen is het net die ene verkeerd vertaalde zin die de menselijke vertalers het meeste hoofdbrekens kost.”

 

Bovendien – er zijn nog andere manieren om je productiviteit op te drijven buiten machinevertalingen, manieren die je als hulpmiddel in je vertaalproces kunt integreren zonder dat je het risico loopt geniepige fouten over het hoofd te zien. Uit onderzoeken is bijvoorbeeld gebleken dat je met Dragon Naturally Speaking tot wel zes keer sneller kan werken. In mijn artikel ‘ Vertaalsnelheid wat is een goed gemiddelde ’ ga ik hier dieper op in.

Het businessmodel werkt het boemerangeffect in de hand

Het businessmodel van vertaalbureaus die met PEMT werken, vertrekt zoals gezegd niet van onderaannemers in de zin van freelancevertalers die de vertaling maken, maar van onderaannemers, de ‘post-editors’, die de machinevertaling naar dezelfde kwaliteitstandaard moeten brengen.

Het vakartikel stelt dat precies deze ondernemingsstrategie de ondergang van machinevertaling en PEMT zal inluiden: vertalers haken af en zoeken een andere job of weigeren PEMT-werk omwille van die bedrijfsstrategie. Wie dan nog overblijft, zijn vaak hobbyvertalers die dus niet de gewenste kwaliteit kunnen leveren en vertalers die zich er rap vanaf maken vanuit het standpunt: “Als ik hier niet correct voor betaald word, mag je van mij ook niet verwachten dat ik correcte kwaliteit ga leveren.” En daar loert de Teufelskreis alweer om de hoek.

Bronnen:

MemoQ is een systeem dat je helpt bij het vertalen. Je kan hieraan ook DeepLPro koppelen.
door Els Peleman 13 mrt., 2024
"ChatGPT gaat jouw job overbodig maken". Ik ben daar nog niet zo zeker van... Maar hoe goed is geavanceerde AI zoals AGT? Lees hier mijn eerste bevindingen.
Hoeveel kost een goede vertaling?
door Els Peleman 05 mrt., 2024
Hoeveel kost een goede vertaling? Lees hier waar je op moet letten en wat een realistische prijs is voor een vertaling gemaakt door een professionele vertaler.
Vertalingen in meerdere talen
door Els Peleman 31 jan., 2024
Stel, je bent een groot internationaal bedrijf en je hebt vertalingen nodig in verschillende talen. In dat geval klop je waarschijnlijk het beste aan bij een vertaalbureau. Maar waar moet je allemaal op letten? Dit artikel is gebaseerd op een waargebeurd verhaal van een internationaal bedrijf dat aan den lijve ondervonden heeft hoe belangrijk het is om daar bij stil te staan - en wat er gebeurt als je dat niet doet...
door Els Peleman 26 jan., 2024
Een vertaling uitbesteden is meer dan alleen maar de tekst doorsturen naar de vertaler. De projectmanager moet de tekst bekijken, analyseren en vaak ook nog extra vragen stellen vooraleer je echt de vertaling kan opstarten.
door Els Peleman 22 nov., 2023
Je hoort de gekste verhalen over hoeveel woorden een vertalers per uur aankan, van 3000 tot zelfs 6000 woorden. Maar er zijn zoveel factoren die hierbij een rol spelen, dat je hier zeker geen vast cijfer op kan plakken.
door Els Peleman 17 nov., 2023
Wil je starten als zelfstandig vertaler en jezelf meteen verzekeren van een lange en mooie toekomst als zelfstandig vertaler? Focus je dan op eindklanten.
Meer posts
Share by: