Hoe Werkt een Vertaalgeheugen (Translation Memory)?
Stel u voor: u laat elk kwartaal een productcatalogus van 50 pagina’s vertalen. Elke editie bevat grotendeels dezelfde productbeschrijvingen, met hier en daar een aanpassing of nieuw artikel. Zonder vertaalgeheugen betaalt u elke keer opnieuw voor het vertalen van teksten die al eerder zijn vertaald. Met een vertaalgeheugen worden die eerder vertaalde passages automatisch herkend en hergebruikt, wat u tijd, geld en consistentieproblemen bespaart.
Maar wat is een vertaalgeheugen precies? Hoe werkt deze technologie onder de motorkap? En hoe profiteert u als opdrachtgever maximaal van een translation memory? In dit artikel duiken we diep in de wereld van vertaalgeheugens en leggen we uit waarom het een onmisbaar instrument is in de moderne vertaalindustrie. Professionele bureaus zoals Ecrivus International, dat vertaaldiensten met geavanceerde TM-technologie aanbiedt, zetten translation memory standaard in om de best mogelijke resultaten te leveren.
Wilt u eerst een breder overzicht van de vertaalwereld? Lees dan onze complete gids over vertaalbureaus en hun diensten.
Wat is een vertaalgeheugen?
Een vertaalgeheugen, in het Engels “translation memory” (afgekort TM), is een database die eerder gemaakte vertalingen opslaat in de vorm van taalparen. Elke opgeslagen eenheid, een zogenaamd “segment”, bestaat uit een stukje brontekst en de bijbehorende vertaling in de doeltaal. Deze segmenten worden automatisch opgeslagen tijdens het vertaalproces en vormen samen een groeiende kennisbank die bij elk volgend project wordt geraadpleegd.
Het concept is verrassend eenvoudig: als een vertaler een zin vertaalt, wordt die zin samen met de vertaling opgeslagen. Wanneer dezelfde of een vergelijkbare zin later opnieuw voorkomt, in hetzelfde document of in een toekomstig project, stelt het systeem de eerder goedgekeurde vertaling automatisch voor. De vertaler hoeft het wiel niet opnieuw uit te vinden en kan zich concentreren op nieuwe of gewijzigde content.
Het verschil tussen exact matches en fuzzy matches
Vertaalgeheugens werken met twee typen overeenkomsten:
Exact matches (100% match): De brontekst in het nieuwe document is identiek aan een segment dat al in het vertaalgeheugen staat. De eerder goedgekeurde vertaling wordt automatisch voorgesteld en hoeft in principe alleen gecontroleerd te worden.
Fuzzy matches (gedeeltelijke overeenkomst): De brontekst lijkt op een opgeslagen segment, maar is niet identiek. Het systeem toont het meest vergelijkbare segment en geeft een percentage aan dat de mate van overeenkomst weergeeft. Een fuzzy match van 85% betekent dat de tekst voor 85% overeenkomt. De vertaler past de voorgestelde vertaling aan op basis van de verschillen.
Daarnaast herkennen moderne TM-systemen ook context matches en 101% matches, waarbij niet alleen het segment zelf, maar ook de omringende context identiek is. Dit biedt een nog hogere betrouwbaarheid van de voorgestelde vertaling.
Hoe werkt een vertaalgeheugen in de praktijk?
Om te begrijpen hoe een vertaalgeheugen functioneert, is het nuttig om het volledige proces stap voor stap te doorlopen. Het team van Ecrivus International met jarenlange ervaring in vertaaltechnologie hanteert dit soort workflows dagelijks voor hun opdrachtgevers.
Stap 1: Segmentatie van de brontekst
Wanneer een nieuw document wordt geladen in een CAT-tool (Computer-Assisted Translation tool), wordt de brontekst automatisch opgesplitst in segmenten. Een segment is doorgaans een zin, maar kan ook een titel, een bullet point of een tabelcel zijn. Deze segmentatie vormt de basis voor het opslaan en ophalen van vertalingen.
Stap 2: Analyse en matching
Het systeem vergelijkt elk brontekstsegment met de inhoud van het vertaalgeheugen. Voor elk segment worden eventuele exact matches of fuzzy matches geidentificeerd. Het resultaat van deze analyse geeft een helder overzicht van:
- Hoeveel segmenten al volledig vertaald zijn (exact matches)
- Hoeveel segmenten gedeeltelijk overeenkomen (fuzzy matches met percentages)
- Hoeveel segmenten volledig nieuw zijn (geen match)
Deze analyse is ook direct relevant voor de kostencalculatie: exact matches en hoge fuzzy matches worden doorgaans tegen een gereduceerd tarief berekend, omdat ze minder vertaalwerk vereisen.
Stap 3: Vertaling met TM-ondersteuning
Tijdens het vertaalproces werkt de vertaler segment voor segment door het document. Bij elk segment gebeurt het volgende:
- Bij een exact match: De eerder goedgekeurde vertaling wordt automatisch ingevuld. De vertaler controleert of deze in de huidige context nog correct is en bevestigt het segment.
- Bij een fuzzy match: De voorgestelde vertaling wordt weergegeven met de verschillen gemarkeerd. De vertaler past de vertaling aan op basis van de afwijkingen.
- Bij geen match: De vertaler maakt een volledig nieuwe vertaling. Deze wordt vervolgens automatisch aan het vertaalgeheugen toegevoegd.
Stap 4: Opslag en verrijking
Na afronding van het project worden alle nieuwe en aangepaste vertalingen opgeslagen in het vertaalgeheugen. Het TM groeit dus bij elk project en wordt steeds waardevoller. Na verloop van tijd bevat het een uitgebreide database van goedgekeurde vertalingen die specifiek is afgestemd op uw terminologie, stijl en branche.
De voordelen van een vertaalgeheugen
Het gebruik van een vertaalgeheugen biedt aanzienlijke voordelen voor zowel het vertaalbureau als de opdrachtgever. Hieronder bespreken we de belangrijkste.
Consistentie in terminologie en stijl
Een van de grootste uitdagingen bij vertaalprojecten, vooral bij langlopende samenwerkingen of projecten met meerdere vertalers, is het waarborgen van consistente terminologie en schrijfstijl. Een vertaalgeheugen fungeert als een centraal referentiepunt dat ervoor zorgt dat dezelfde termen en formuleringen steeds op dezelfde manier worden vertaald.
Dit is van bijzonder belang bij technische vertalingen, waar terminologische consistentie essentieel is. Een technische handleiding waarin dezelfde knop op drie verschillende manieren wordt benoemd, leidt tot verwarring bij de gebruiker. Met een vertaalgeheugen wordt dit probleem structureel voorkomen.
Kostenbesparing
Vertaalgeheugens leveren directe kostenbesparingen op. Doordat eerder vertaalde segmenten worden hergebruikt, hoeft de vertaler minder nieuwe tekst te vertalen. De meeste vertaalbureaus hanteren een gedifferentieerd tariefmodel:
| Type match | Typische korting |
|---|---|
| 100% match / exact match | 60-80% korting |
| 95-99% fuzzy match | 40-60% korting |
| 85-94% fuzzy match | 25-40% korting |
| 75-84% fuzzy match | 10-25% korting |
| Geen match (nieuw segment) | Volledig tarief |
Bij documenten met veel herhalingen of bij regelmatige updates van bestaande content kunnen de besparingen oplopen tot 30-50% van de totale vertaalkosten.
Snellere doorlooptijden
Doordat een deel van het vertaalwerk al is gedaan, neemt de doorlooptijd van projecten af. Een vertaler die 3.000 woorden per dag vertaalt, kan met een goed gevuld vertaalgeheugen een document van 10.000 woorden verwerken in twee dagen in plaats van vier, mits een groot deel van de content al eerder is vertaald.
Kennisbehoud
Een vertaalgeheugen fungeert als een institutioneel geheugen voor uw vertalingen. Zelfs als een vertaler niet meer beschikbaar is, blijft de kennis bewaard in het TM. Een nieuwe vertaler kan naadloos aansluiten bij de bestaande terminologie en stijl, zonder dat er een langdurig inwerktraject nodig is.
Vertaalgeheugen versus machinevertaling
Een veelvoorkomend misverstand is dat een vertaalgeheugen hetzelfde is als machinevertaling. Het zijn echter fundamenteel verschillende technologieen.
Vertaalgeheugen is een opslagsysteem dat eerder door mensen gemaakte en goedgekeurde vertalingen hergebruikt. Het genereert geen nieuwe vertalingen, maar stelt bestaande, gevalideerde vertalingen voor wanneer de brontekst overeenkomt. De kwaliteit van de voorgestelde vertaling is dus inherent hoog, omdat deze al eerder is gecontroleerd.
Machinevertaling (MT) daarentegen genereert nieuwe vertalingen op basis van statistische modellen of neurale netwerken. Systemen zoals DeepL, Google Translate of Microsoft Translator analyseren patronen in grote hoeveelheden taaldata om vertalingen te produceren. De kwaliteit is wisselend en vereist altijd menselijke controle, het zogenaamde post-editing.
In de praktijk worden beide technologieen vaak gecombineerd. Een CAT-tool raadpleegt eerst het vertaalgeheugen. Als er geen bruikbare match wordt gevonden, kan het systeem een machinevertaling voorstellen als startpunt voor de vertaler. De menselijke vertaler blijft echter altijd de eindverantwoordelijke voor de kwaliteit.
Wanneer heeft TM de voorkeur boven MT?
Translation memory verdient de voorkeur bij:
- Gereguleerde content zoals juridische, medische of financiele documenten, waar nauwkeurigheid en bewezen vertalingen cruciaal zijn
- Merkgevoelige teksten waar consistentie in toon en terminologie essentieel is
- Langlopende projecten met regelmatige updates van bestaande content
- Sectoren met vaste terminologie zoals techniek, farmacie of luchtvaart
Machinevertaling is geschikter voor:
- Grote volumes informatieve tekst waar snelheid belangrijker is dan perfectie
- Interne communicatie die niet extern gepubliceerd wordt
- Eerste concepten die later door een vertaler worden nabewerkt
Integratie met CAT-tools
Vertaalgeheugens functioneren niet als losstaande systemen, maar zijn geintegreerd in CAT-tools. De meest gebruikte CAT-tools in de professionele vertaalindustrie zijn:
- SDL Trados Studio: De marktleider met uitgebreide TM-functionaliteit en geavanceerde matchingalgoritmen
- MemoQ: Populair om de gebruiksvriendelijke interface en sterke serverfunctionaliteit voor teams
- Phrase (voorheen Memsource): Een cloudgebaseerde oplossing die samenwerking vergemakkelijkt
- Wordfast: Een toegankelijke tool die vaak wordt gebruikt door freelance vertalers
- Across: Een geintegreerd vertaalplatform met ingebouwde workflowfunctionaliteit
Al deze tools bieden de mogelijkheid om vertaalgeheugens te beheren, te doorzoeken en te delen tussen vertalers. Bij projecten met meerdere vertalers kan een server-based TM worden ingezet, zodat alle vertalers in real-time toegang hebben tot dezelfde vertaalgegevens. Dit voorkomt dat vertalers onafhankelijk van elkaar dezelfde termen op verschillende manieren vertalen.
Terminologiebeheer als aanvulling
Naast het vertaalgeheugen is een termbase, een gestructureerde terminologiedatabase, een essentieel hulpmiddel. Waar het vertaalgeheugen complete zinnen opslaat, richt een termbase zich specifiek op individuele termen en hun goedgekeurde vertalingen. De combinatie van een goed onderhouden TM en een actuele termbase vormt de ruggengraat van consistente, hoogwaardige vertalingen.
Het vertaalgeheugen onderhouden en optimaliseren
Een vertaalgeheugen is geen statisch bestand dat u eenmalig aanmaakt en vervolgens vergeet. Het vereist regelmatig onderhoud om optimaal te blijven functioneren.
Periodieke opschoning
Na verloop van tijd kan een vertaalgeheugen verouderde of incorrecte segmenten bevatten. Terminologie evolueert, productnamen veranderen en schrijfstijlen worden aangepast. Het is daarom raadzaam om uw TM periodiek, bijvoorbeeld jaarlijks, te laten reviewen en opschonen. Hierbij worden:
- Verouderde vertalingen verwijderd of bijgewerkt
- Inconsistenties gecorrigeerd
- Dubbele segmenten samengevoegd
- Segmenten met lage kwaliteit verwijderd
Segmentatie-afspraken
De kwaliteit van een vertaalgeheugen hangt direct samen met de segmentatieregels die worden gehanteerd. Consistente segmentatie, dezelfde regels voor het opsplitsen van tekst in segmenten, zorgt voor betere matches in toekomstige projecten. Bespreek de segmentatie-instellingen met uw vertaalbureau en zorg dat deze gedocumenteerd worden.
Eigendom en back-up
Een belangrijk punt dat vaak over het hoofd wordt gezien: wie is de eigenaar van het vertaalgeheugen? In de meeste gevallen is het vertaalgeheugen eigendom van de opdrachtgever, aangezien het is opgebouwd op basis van de teksten en investeringen van de klant. Zorg dat dit contractueel is vastgelegd en dat u regelmatig een back-up van uw TM ontvangt.
Dit aspect is ook een belangrijk criterium bij het kiezen van het juiste vertaalbureau als uw vertaalpartner: vraag altijd naar het eigendomsbeleid ten aanzien van vertaalgeheugens. Voor beëdigde vertalingen van officiële documenten is het vertaalgeheugen eveneens waardevol: het waarborgt dat juridische terminologie consistent wordt vertaald in opeenvolgende vertaalprojecten.
Vertaalgeheugen bij zeldzame taalcombinaties
Het opbouwen van een bruikbaar vertaalgeheugen vergt een zekere hoeveelheid vertaalwerk in een specifieke taalcombinatie. Bij veelvoorkomende combinaties zoals Nederlands-Engels of Nederlands-Duits is dat doorgaans geen probleem: er is voldoende volume om snel een waardevol TM op te bouwen.
Bij zeldzame taalcombinaties ligt dit anders. Als u slechts incidenteel vertaalt van het Nederlands naar bijvoorbeeld het Georgisch, Khmer of Ijslands, groeit het vertaalgeheugen langzamer en levert het minder directe besparingen op. Desondanks is het ook bij zeldzame talen waardevol om een TM op te bouwen, met name voor de consistentie en het kennisbehoud.
Sommige vertaalbureaus beschikken over gedeelde of branchespecifieke vertaalgeheugens voor minder gangbare talen, die als startpunt kunnen dienen voor nieuwe projecten. Dit verkort de opbouwfase en biedt direct enige mate van consistentie.
Praktische tips voor opdrachtgevers
Als opdrachtgever kunt u actief bijdragen aan de effectiviteit van uw vertaalgeheugen. Hieronder vindt u concrete tips.
1. Lever bewerkbare bestanden aan
Vertaalgeheugens werken het best wanneer de brontekst in een bewerkbaar formaat wordt aangeleverd, zoals Word, Excel, XML of HTML. Gescande documenten of afbeeldingen met tekst kunnen niet direct door een CAT-tool worden verwerkt en moeten eerst worden omgezet, wat de TM-opbouw bemoeilijkt.
2. Schrijf consistent in de brontaal
Hoe consistenter uw bronteksten zijn geschreven, hoe effectiever het vertaalgeheugen functioneert. Als u dezelfde technische term in uw Nederlandse bronteksten afwisselend “configuratiescherm”, “instellingenmenu” en “setup-interface” noemt, zal het vertaalgeheugen drie verschillende segmenten opslaan. Consistentie in de bron leidt tot consistentie in de vertaling.
3. Centraliseer uw vertaalwerk
Werk bij voorkeur met een vast vertaalbureau voor al uw vertaalprojecten. Dit zorgt ervoor dat al uw vertalingen in een centraal vertaalgeheugen terechtkomen, wat de waarde van het TM maximaliseert. Het versnipperen van vertaalwerk over meerdere bureaus leidt tot gefragmenteerde vertaalgeheugens en inconsistenties.
4. Geef feedback en correcties terug
Wanneer u correcties aanbrengt in een opgeleverde vertaling, geef deze dan terug aan het vertaalbureau. Zij kunnen de wijzigingen verwerken in het vertaalgeheugen, zodat dezelfde fouten in toekomstige projecten worden voorkomen.
5. Investeer in een termbase
Naast het vertaalgeheugen is een termbase een waardevolle investering. Stel een lijst op van belangrijke termen, productnamen, merknamen en hun goedgekeurde vertalingen. Dit vormt samen met het vertaalgeheugen de basis voor consistente communicatie in alle talen.
6. Vraag regelmatig om een TM-export
Vraag uw vertaalbureau periodiek om een export van uw vertaalgeheugen. Standaardformaten hiervoor zijn TMX (Translation Memory eXchange) en XLIFF. Deze bestanden kunt u archiveren als back-up of meenemen als u van vertaalbureau wisselt.
Veelgestelde vragen over vertaalgeheugens
Is een vertaalgeheugen hetzelfde als Google Translate? Nee. Google Translate genereert nieuwe vertalingen met kunstmatige intelligentie. Een vertaalgeheugen hergebruikt eerder door mensen gemaakte en goedgekeurde vertalingen. De betrouwbaarheid van TM-matches is daardoor inherent hoger.
Hoeveel kost het opbouwen van een vertaalgeheugen? Het opbouwen van een TM brengt geen extra kosten met zich mee. Het wordt automatisch gevuld tijdens het reguliere vertaalproces.
Kan ik mijn vertaalgeheugen meenemen naar een ander vertaalbureau? Ja, mits contractueel is vastgelegd dat u eigenaar bent van het TM. Vertaalgeheugens kunnen worden geexporteerd in standaardformaten zoals TMX, die door alle gangbare CAT-tools worden ondersteund.
Werkt een vertaalgeheugen ook voor creatieve teksten? Bij creatieve teksten is de meerwaarde beperkter, omdat deze doorgaans uniek zijn. Toch kan een TM nuttig zijn voor terugkerende elementen zoals disclaimers, bedrijfsinformatie en standaardzinnen.
Hoe groot moet mijn vertaalgeheugen zijn om nuttig te zijn? Er is geen minimale omvang vereist. Zelfs enkele honderden segmenten kunnen al nuttig zijn. De waarde neemt toe naarmate het TM groeit.
Conclusie
Een vertaalgeheugen is een van de krachtigste instrumenten in de moderne vertaalindustrie. Het verhoogt de consistentie, verlaagt de kosten, verkort de doorlooptijd en bewaart waardevolle vertaalkennis voor de toekomst. Of u nu incidenteel een handleiding laat vertalen of structureel grote volumes content publiceert, een goed beheerd vertaalgeheugen betaalt zich altijd terug.
De sleutel tot succes ligt in het kiezen van een vertaalbureau dat professioneel omgaat met TM-technologie en u transparantie biedt over het eigendom en beheer van uw vertaalgeheugen. Wilt u meer weten? Bezoek het kennisbank en blog van Ecrivus International voor actuele inzichten over vertaaltechnologie.
Terug naar onze complete gids over vertaalbureaus voor meer informatie over vertaaldiensten, kwaliteitsnormen en het kiezen van de juiste vertaalpartner.