Neue Werkzeuge Zur Autorenunterstuetzung

,Tite/thema.----

Becherhalterung

50// .\ter ZIns

herh aße

c Basiszins Soll

Translation-Memory-Systeme und die Möglichkeiten, die sie zur Produktivitätssteigerung

bieten, sind aus dem Übersetzeralltag nicht mehr wegzudenken. Auf der Suche nach weiterem

Optimierungspotenzial im Übersetzungsprozess ist nun der Quelltext in den Blickpunkt der

Hersteller gerückt.

10 MDU 4 12009

Tite/thema "-

.:l

Abb.1: Dialog in acrocheck, dem (Iient vonacrolinx . Der Prüferkann für eine Quellsprache (hier: Deutsch)entsprechende Prüfoptionen (Terminologie,Grammatik, Stil, Rechtschreibung) und einbestimmtes Regelsetauswählenr

I!!'.:lMo!<PlM.._l.......~.. iI'I_I\,d>'__-............__

textes einen Zugriff auf ein bereits vorhandenes Translation Memory (Abb. 2). Die Tatsache allein, dass ein Satz bereits in einem anderen Text verwendet wurde, sagt jedochnoch nichts über dessen Qualität aus (s. Lehmann et al.2009). Folglich steht und fällt der sinnvolle Einsatz einesAuthoring Memory mit der Qualität des Translation Memory, damit sich sprachliche Fehler nicht ungehindert inneuen Texten fortpflanzen.

Paradoxerweise kann beim Einsatz eines CLC gerade dieOptimierung eines Quelltextes zu zusätzlichen Übersetzungskosten führen. Ein Beispiel: Angenommen, ein bereits vorhandener Text, für den auch schon Übersetzungenvorliegen, wird geprüft und sprachlich verbessert. Falls dieKorrekturen nicht gleichzeitig in das TM eingepflegt werden, ist der Ausgangtext zwar von sprachlich höherer Qualität, die Matchrate im TM kann jedoch drastisch sinken.Das heißt, wenn Texte nicht komplett neu erstellt (undsomit auch komplett neu übersetzt) werden, ist die Synchronisation zwischen CLC und TM-System von großerBedeutung. Grundsätzlich besteht der große Vorteil einesAuthoring Memory darin, dass es keine sprachspezifischenRegeln erfordert und somit für alle Sprachen verwendet

Abb. 2: Echtzeitprüfung in crossAuthor, dem Authoring Memory vonAcross. Bereits bei der Eingabe eines deutschen Quellsatzes im Editorprüft crossAuthor, ob identische oder ähnliche quellsprachliche Sätzeim TM abgespeichert wurden. Hier wurde ein 55-%- Match gefunden.Die britische Flagge zeigt, dass für diesen deutschen Satz bereits eineÜbersetzung in crossTank, dem TM von Across, vorhanden ist

Effektives Übersetzen fängt bereits beim Quelltext an:Je verständlicher und konsistenter ein Text verfasstist, desto einfacher und günstiger ist die anschlie-

ßende Übersetzung. Übersetzungsgerechtes Schreiben bedeutet vor allem, auf Konsistenz bei Wort-, Satz- und Textebene zu achten (vgl. Drewer 2009). Vor allem in größerenRedaktionsteams, die möglicherweise an verschiedenenStandorten arbeiten, ist das nicht immer einfach. Auf Textebene lässt sich diese Konsistenz durch den Einsatz vonContent-Management-Systemen und die Definition entsprechender Textmodule erreichen. Zur Standardisierungauf Wort- und Satzebene dienen dagegen Werkzeuge wieControlled Language Checker (CLC) oder Authoring Memory. Durch den Einsatz dieser Tools lässt sich das Potenzial von Translation-Memory-Systemen (TMS) besserausschöpfen, da sich die Trefferquote im Translation Memory durch eine konsistente Terminologie und eine Standardisierung auf Satzebene erheblich steigern lässt. Insofern ist es nur konsequent, dass die Hersteller der "großen"TM-Systeme (SDL Trados, Across, STAR) den Funktionsumfang ihrer Systeme in Richtung Quelltexterstellung erweitert haben und mittlerweile auch Anwendungen zurAutorenunterstützung anbieten, mit denen sich die Translation Memories auch als Authoring Memories nutzenlassen.

Im Bereich der Technischen Redaktion haben in denletzten Jahren sogenannte Controlled Language Checkers(CLe) an Bedeutung gewonnen. Zu den bekannten CLCsauf dem deutschen Markt gehören acrolinx IQ von acrolinx und CLAT (Controlled Language Authoring Technology) vom lAI (Institut der Gesellschaft zur Förderung derAngewandten Informationsforschung e.v.).

CLCs führen eine umfassende linguistische Qualitätsprüfung des Quelltextes durch, welche Terminologie, Stil,Grammatik und Rechtschreibung umfasst. Mit Hilfe vonCLCs lassen sich neben der Terminologie auch die Anforderungen an Stil und Grammatik, die in einer bestimmtenkontrollierten Sprache (z. B. Simplified English) oder firmenspezifischen Stilrichtlinien aufgestellt wurden, überprüfen. Ein Controlled Language Checker muss für jedeSprache gesondert entwickelt werden, was - aufgrund derTiefe der linguistischen Analyse - entsprechend aufwändig ist. Folglich stehen derartige Systeme bislang auch nurfür wenige Quellsprachen zur Verfügung.

Während CLCs die Qualität des Quelltextes steigern sollen, um anschließend die (maschinelle) Übersetzung desTextes zu erleichtern, zielen Authoring Memories vorallem darauf, durch die Wiederverwendung bereits übersetzter Segmente die Quelltexte zu standardisieren und dadurch die Übersetzungskosten zu senken. Ein AuthoringMemory ermöglicht dem Autor beim Erstellen des Quell-

MOÜ 4 I 2009 11

" Titelthema

mit denen sich firmenspezifische Stilrichtlinien abbildenlassen. Seit 2008 umfasst acrolinx IQ außerdem eine webbasierte begriffsorientierte Terminologieverwaltung, densogenannten Termmanager, der auch zur Termextraktion herangezogen werden kann. Der Termmanager verwendet aUF als natives Format zur Terminologieverwaltung; über verschiedene Filter ist jedoch auch der Importund Export von Terminologieeinträgen in andere Formate

werden kann, für die bereits quellsprachliche Segmente imTM abgespeichert wurden. Allerdings stehen dem Redakteur in einem typischen Authoring-Memory-System neuequellsprachliche Sätze erst nach der Übersetzung zur Verfügung, was unter Umständen Wochen oder Monate dauern kann. An diesem Punkt setzt die Autorenunterstützung [iJ-match von der Firma itl AG an, die den Zugriffauf Satzbanken auch ohne Anbindung an ein TM-Systemermöglicht.

Wie funktioniert ein Controlled language Checker?

Für den Einsatz eines CLC müssen linguistische Ressourcen in der Quellsprache zur Verfügung stehen, die entweder direkt vom Hersteller geliefert oder vom linguistischenAdministrator des Systems konfiguriert werden. Stil- undGrammatikregeln werden prinzipiell vom Hersteller entwickelt, da die Entwicklung dieser Regelsets fundiertescomputerlinguistisches Wissen erfordert. Terminologieressourcen können dagegen vom Anwender selbst gepflegt werden. Die Textprüfung findet grundsätzlich nachder TextersteIlung statt. Dazu wählt der Autor die entsprechenden Prüfoptionen aus (Abb. 1) und erhält ein Prüfergebnis, in dem gefundene Fehler farbig markiert und mitErläuterungen versehen werden (Abb. 3). Controlled Language Checking wird bislang vorrangig in der TechnischenRedaktion eingesetzt. Prinzipiell könnten aber auch Übersetzer und Lektoren diese Werkzeuge zur Textprüfungnutzen. Schließlich sollten für alle Texte die gleichen Qualitätsanforderungen gelten, unabhängig davon, ob es sichum Ausgangstexte oder Übersetzungen handelt.

Nun stellen wir einige Werkzeuge zur Autorenunterstützung vor. Die wichtigsten Kennzeichen der hier untersuchten Systeme finden Sie in Tabelle 1.

acrolinx 10

Das Programm acrolinx IQ von acrolinx basiert auf einer Client-Server-Architektur und ist modular aufgebaut.Zentrale Komponenten des Systems sind das sogenannteDashboard, die Clients zur Textprüfung, der Terminologiemanager zur webbasierten Terminologieverwaltung sowie die intelligente Wiederverwendung zur Erstellung vonSatzbanken. Das browserbasierte Dashboard fungiert alsSteuerzentrale zur Systemkonfiguration. Hier kann derlinguistische Administrator die linguistischen Ressourcen(Terminologie, Satzbanken, Regelsets) pflegen und Benutzer mit verschiedenen Rechten und Rollen verwalten.Für die Grammatik- und Stilprüfung bietet acrolinx gängige kontrollierte Sprachen wie ASD Simplified Englishan, entwickelt jedoch auch kundenspezifische Regelwerke,

12

IPrüffunktionen

Sprachen

Textprüfung

Integration in TM-Systeme

Verfügbarkeit von Sätzenfür die Wiederverwendung

Unterstützte Editoren und Formate

Anbieter

Terminologie, Stil, Grammatik, Rechtschreibung,intelligente Wiederverwertung von Standardsätzen

Deutsch (TÜV DocCertRegelset, acrolinx TechnischesDeutsch), Englisch (Simplified English, Global English),Französisch, Japanisch

Nachträgliche Prüfung(d. h. Textprüfung erfolgtnach der Texterstellung)

Import von TMX-Dateien, Import und Export von Terminologieeinträgen (OUF, andereXML-basierte Formate, CSV)

Neue Sätze stehen zurVerfügung, sobald derRedakteur einen Satz in derSatzbank abspeichert hat

MS Word, Excel, PowerPoint,Adobe FrameMaker und InDesign, PTC Arbortext, JustSystems XmetaL, AuthorIT;Batch Checker für TMX,HTML, XML, GML, PDF

http://www.acrolinx.de/

MOÜ 4 I 2009

I

Titelthema "-(z. B. TBX oder MultiTerm XML) möglich. Texte können

nach der Textprüfung in Satzbanken abgespeichert wer

den, damit sie für die Wiederverwendung zur Verfügung

stehen.

Hier bietet acrolinx mit der sogenannten intelligenten

Wiederverwertung eine neue Funktion, die in dieser Form

in anderen Systemen noch nicht vorhanden ist. Die Ent

wickler von acrolinx übertragen damit einen Ansatz, wie

er vielen Anwendern bereits aus der praktischen Ter

minologiearbeit vertraut ist, von der Wortebene auf die

Satzebene. Beim Aufbau einer Unternehmensterminolo

gie führt ein Terminologe in der Regel zunächst eine Ter

minologiebereinigung durch, d. h., er identifiziert Syno

nyme, legt Vorzugsbenennungen fest und dokumentiert

verbotene Benennungen, also Benennungen, die in den

Texten des Unternehmens nicht verwendet werden dür-

Terminologie, Stil,Grammatik, Rechtschreibung, Authoring Memory

fE!I3Terminologie, Authoring Memory, einfacheGrammatik- und erweiterbare Stilprüfungen

Terminologie, Authoring Memory

II~

Terminologie,Satzbanken

....oUII

L..", .!'i!!Il1I: -

o •1."'" 'olfrlllO

Terminologie, Stil,Grammatik, Rechtschreibung

l

Deutsch, EnglischIn Vorbereitung: Französisch und Spanisch

Linguistische Prüfung: siehe CLATAuthoring Memory:Beliebige Quellsprachen, die im TMvorhanden sind

Linguistische Prüfung:Englisch; stilistischePrüfung: Englisch,Deutsch, FranzösischAuthoring Memory:Beliebige Quellsprachen, die im TMvorhanden sind (mitEinschränkungen fürbidirektionale undostasiatische Sprachen)

Authoring-Memory undTerminologie: beliebigeQuellsprachen, die imTM bzw. im Wörterbuch vorhanden sind.

Authoring Memory,aber mit linguistischerPrüfung: Quellsprachen mit Code 1252(alle westeuropäischenSprachen), die in derSatz- oder Termbankvorhanden sind

Nachträgliche Prüfung Echtzeitprüfung odernachträgliche Prüfung

Nachträgliche Prüfung Echtzeitprüfung Echtzeitprüfung odernachträgliche Prüfung

Integration in Acrossüber crossAuthorLinguistic

Direkte Integration inAcross Language Server

Integration in SDLTrados 2007; Integrationin SDL Trados Studio2009 in Vorbereitung

Integration in STARTransit und Term-Star; Transit-Projektekönnen im MindReaderempfangen werden

Import und Export vonSätzen in TMX undCSV; Import und Exportvon Terminologie inMARTIF und CSV

http://www.imatch.itl.info/

MS Word, Adobe FrameMaker

Neue Sätze stehen zurVerfügung, sobaldder Redakteur einenSatz in der Satzbankabgespeichert hat

Authoring Memory:Neue quellsprachliche Sätze stehen zurVerfügung, sobald sieals Referenzmaterialeingelesen wurden.

MS Word, AdobeFrameMaker, Arbortext EditorRedaktionssystemStar GRIPS

http://www.sdLcom

Authoring Memory:neue quellsprachlicheSätze stehen erst nachder Übersetzung zurVerfügung, wenn siein einem Translation Memory abgespeichert wurden

MS Word, AdobeFrameMaker, Arbortext Editor, JustSystems XMetaL

http://www.across.net

Authoring Memory:Neue quellsprachlicheSätze stehen erst nachder Übersetzung zurVerfügung, wenn siein einem Translati-on Memory abgespeichert wurden

MS Word, PowerPoint,Adobe InDesign, Adobe FrameMaker, PTCArbortext, JustSystemsXmetaL, MadCap Flare

CLAT-ins für MS Word2003, PTC ArbortextEditor, Adobe FrameMaker; CLAT-in für MSWord 2007 in Vorbereitung; Batch Checkerfür SGML, HTML,XML, Interleaf; JAVAAPI zur Anbindung anRedaktionssysteme

http://www.iai-sb.de/iai!

Kein Aufbau vonSatzbanken möglich

http://www.stargroup.net

Tabelle 1: Übersicht über die in diesem Artikel untersuchten Systeme zur Autorenunterstützung

MDÜ 4 I 2009 13

" Titelthema

fen. Genau dasselbe macht acrolinx IQnun auf Satzebene: BedeutungsgleicheSätze werden automatisch in sogenannten Clustern zusammengefasst und vomlinguistischen Administrator validiert,der einen "Vorzugssatz" als Repräsentant auswählt (Abb. 4). Dieser Satz stehtden Autoren in Zukunft als Standardformulierung zur Verfügung. Kommt imText ein synonymer Satz vor, der nichtdem Standard entspricht, wird dem Autor bei der Textprüfung stattdessen der"Vorzugssatz" vorgeschlagen. Auf dieseWeise soll sich die Entstehung typischerInkonsistenzen auf Satzebene innerhalbeines Translation Memory vermeidenlassen (Tabelle 2).

Dieses Konzept einer intelligentenWiederverwendung setzt zweifellos eineanspruchsvolle linguistische Analyse aufsyntaktischer und semantischer Ebene

voraus. Insofern ist es nicht überraschend, dass acrolinxim Systemtest irrtümlicherweise auch nicht bedeutungsgleiche Sätze in einem Cluster gruppierte.

Nach Angaben des Herstellers wird jedoch die Clustering-Funktion der intelligenten Wiederverwendung fürdie nächste Version grundlegend überarbeitet und ihrePräzision somit noch gesteigert. In der nächsten Versionsoll es dann auch möglich sein, Sätze in den Satzbankenzu editieren.

Größe

Niemals

Niemals

Niemals

Niem.,ls

Now switch on the machine.

Switch the macnine on.JJJJJJ

.... S~"ltch on the machine. 0

ReRrasentant

Abb.3: Textprüfung mit acrocheck. Im Kontextmenü werden für den aktuellen Fehler (gelbunterlegt) Erläuterungen angeboten. Bei einigen Fehlertypen werden konkrete Korrekturvorschläge unterbreitet, die per Mausklick übernommen werden können

Abb.4: Bedeutungsgleiche Sätze werden in acrolinx zu einem Clusterzusammengefasst. Der unterste Satz wurde als Repräsentant, d. h. alsStandard, ausgewählt

ClAT

•Nach Abschluss der Installationstarten Sie den Server neu.

Nach Abschluss derSystemeinrichtung startenSie den Server neu.-------------- Please restart serverNach Abschluß der after the installation.Installation müssen Sieden Server neu starten.

Starten Sie den Zentralrechner neu nach Abschlussder Installation.

Tabelle 2: Inkonsistenzen in einem Translation Memory:Im deutschen Text wurden vier Varianten gefunden.Beispiele aus lehmann et al. (2009)

14

Auch CLAT basiert auf einer Client-Server-Architekturund bietet ebenfalls eine Textprüfung im Bereich Rechtschreibung, Terminologie, Stil und Grammatik sowie eineTermextraktion an. Für die Konfiguration der linguistischen Ressourcen (Terminologie, Regelwerke, Benutzerwörterbücher, Synonyme) steht mit dem UMMT (Utilityfor Mandate Management Tasks) ein eigenes Werkzeugzur Verfügung, dessen Funktionen mit denen des Dashboards von acrolinx vergleichbar sind.

Anders als in acrolinx arbeitet der linguistische Administrator im UMMT nicht nur mit kompletten Regelsets,sondern kann einzelne Regeln für projektspezifische Anwendungen ein- und ausschalten (Abb. 5). In die Entwicklung der Stil- und Grammatikregeln sind die Erfahrungen aus zahlreichen Technischen Redaktionen undRedaktionsleitfäden eingeflossen; im Unterschied zuacrolinx wird jedoch keine spezifische kontrollierte Sprache modelliert.

MDÜ 4 I 2009

rite/thema "-

1'00" Durch die Integration von CLA'T: wird crossAuthor dankcrossAlJ!lor UnO\) stIc um eine ~1st1sche InteUIg<!nz erweitert -VI!~ ~

+ •

- c y ~ l"'!I

~ ;;:ehwQ'-V IJ..::JClAT 0-v1!Jcrctu~Q""1l

Iigenz

.7.

Ch..II.lR.t1521d.aus t_NIlII1(R.~ I~

""..·IIAI Sl2~._ 11.... R SIOde'8Iß 17

""

·7··30--.!.. 11

Pt.S1t:lofl WordJ:)l' (itnn.n[Gt",,'~ ~

~.,t.OWl:.,

, VT.1fI'IItlOlo9le._....-......-...T_T__

'9-...-,,""-,-......-.-----"'-'9-,-DTD

Rnl~r.m

~--......""-

Diese erweiterten l-unKtlonen von crossAuthor L1ngulstlc sind nahtlos in •..' ",,,mit ",in " . (' ,~

L~~. Horne ~~Itrt Pa~t';'~ut Iltftr,ncu Io4IUongs RNitw V1tw Otwtoptr Adc'-inl

~ J, Mal -11.0 - ==-1="·,-:- ~~ ~ &. ~

~ :IB r 11 ..... ",-""",1_ .. '"' •. 1E:1 1 AaB 1.1 Aa 1.1.1 J • 'RPlI~tt '::/ ~. A. Al ,., ~ • ~~~:~ fd~nSl

(llpbOolul r;Jl fo T__:TobIl('l2)~Itd(l2)WJtlo:rit::d:(12) .~

"; =:':...-",,""" ~. ijI1iiiiiiiii...........-;<:l-1

1.1 Acre ~ !~=i:: Ij ~Durch die Int T""".'......."""""",••__"""'.,, ssAuthor Ling

IWormllllonen;nl',.a,bdmlden"nor1'rlfllefl«OU~-"~en.netYMnSiebl:le ~

Intelligenz er __.......20. ~ eibung, Grarr

und Abkürzu ~~-i.-.io,p~~~~~~~~~~1 [prÜfUngen -maschinellellliltiMB# 4!&iM 5 1::1 lieren, DarübELinguisticdie iJ s bestehendeund die entsl und dort als

~~

Abb.5: 5tilregeln im Konfigurationswerkzeug UMMT. Rot markierte Regeln sind Kernregeln, die standardmäßig in CLAT enthalten sind und quasi einen Best-Practice-Regelsatzdarstellen. Grün markierte Regeln ergänzen diesen Bestand. Alle Regeln sind ein- und ausschaltbar. Für einige Regeln kann der linguistische Administrator einen 5chwellenwert setzen, z. B. kann er eine Obergrenze für im Satz erlaubte Präpositionalphrasen festlegen

Sowohl das lAI als auch acrolinx arbeiten im tekom-Arbeitskreis "Technisches Deutsch" mit und planen, dieRegeln des "Technischen Deutsch nachtekom", das sich zurzeit noch in derEntwicklung befindet, in Zukunft auchin den Regelsets des jeweiligen CLCabzudecken.

Genau wie bei acrolinx gilt aber auchfür CLAT: Eine linguistische Regel kannvom Anwender nicht geändert werden, da in einem komplexen Systemwie der Linguistic Engine eines Controlled Language Checker schon kleine Änderungen ungeahnte Folgen nachsich ziehen können. Mit CLAT können allerdings keine Satzbanken aufgebaut werden. Außerdem verfügt CLATüber keine Terminologieverwaltung mitfrei definierbarer Eintragsstruktur. Inden Projektressourcen des UMMT können in den Terminologielisten lediglichvorgegebene Felder wie Genus, Wortartund Numerus ausgefüllt werden. Weitere Felder sind nicht vorgesehen.

Interessant ist jedoch, wie die imUMMT gespeicherten Synonymlistenzur Terminologie- und Konsistenzprüfung verwendet werden können. EinBeispiel: Angenommen, im UMMT sindBautyp und Baureihe als Synonyme hinterlegt. Falls in der Terminologieliste Ty

penreihe als Vorzugsbenennung enthalten ist, erkennt die Terminologieprüfungim Text Artenreihe als Variante von Ty

penreihe. Die Konsistenzkontrolle würdeim Text Fahrzeugtyp und Fahrzeugart alsmögliche Inkonsistenz anzeigen.

Abb.6: Termextraktion in crossAuthor linguistic. Treffer im Authoring Memory undderTerminologieverwaltung crossTerm werden dem Autor in separaten Fenstern angezeigt. Die ausgewählten Termkandidaten können zusammen mit dem Kontextsatz aus derAutorenumgebung in crossTerm eingepflegt werden

crossAuthor linguistic

Die neue Version 5.0 des Across Language Server, die Across im August 2009 aufden Markt gebracht hat, beinhaltet einedeutliche Erweiterung der bisherigenAutorenunterstützung crossAuthor.

Neben dieser Autorenunterstützung, die auch weiterhinangeboten wird, präsentiert Across mit der neuen Anwendung crossAuthor Linguistic eine Integration von CLAT incrossAuthor, die die Stärken von beiden Ansätzen zur Autorenunterstützung, CLC und Authoring Memory, vereint.

CrossAuthor Linguistic bietet die gleichen Möglichkeitenzur Stil-, Grammatik- und Terminologieprüfung wie CLAT;gleichzeitig kann der Autor jedoch über das Authoring Memory von crossAuthor auf bereits im Translation Memorygespeicherte Sätze und ihre Übersetzung zugreifen (Abb. 2).

MOÜ 4 I 2009 15

" Tite/thema

SOL AuthorAssistant

oo

Abb.7: Terminologieprüfung im SOL AuthorAssistant. Das System erkennt zu vermeidende Termini im Ausgangstext, die in MultiTerm hinterlegt wurden, und schlägt die jeweilige Vorzugsbenennung vor

Abb.8: Beispiel für einen einfachen Terminologieeintrag in MultiTerm. Über das Feld Status lassen sich Vorzugsbennungen von verbotenen Benennungen unterscheiden

Außerdem steht dem Anwender mit crossTerm eine begriffsorientierte Terminologiedatenbank zur Verfügung.Ein weiteres Plus ist die Termextraktion: Mit dem ToolcrossAuthor Linguistic lassen sich Termkandidaten ausdem Quelltext extrahieren und zusammen mit Kontextsätzen direkt in crossTerm einpflegen (Abb. 6).

Bislang konnte in Across eine Termextraktion lediglich im Rahmen des Workflows "Terminologiearbeit und-übersetzung" durchgeführt werden, wobei weder Terminologielisten exportiert noch Kontextsätze generiertwerden konnten. Dank der linguistischen Intelligenz vonCLAT erzeugt die neue Funktion zur Termextraktion incrossAuthor Linguistic auch qualitativ deutlich bessereTerminologielisten als die bisherige Funktion.

Die Terminologieverwaltung erfolgt hier grundsätzlichin crossTerm; die notwendige Synchronisation zwischenden Terminologieressourcen im UMMT und den Terminologieeinträgen in crossTerm lässt sich nach Angaben desHerstellers über die ebenfalls ab Version 5.0 erstmals angebotene Anwendung crossAutomate auch automatisieren.

16

Der SDL AuthorAssistant Client ist als zentrale Komponente des SDL-Global-Authoring-Management-Systems direktin die Autorenumgebung integriert. Der Author-Assistantumfasst eine Terminologieprüfung, ein Authoring Memory, das Translation Memories aus SDLX und SDL Tradosverwenden kann, sowie verschiedene Prüfungen für unternehmensspezifische Stilvorgaben, die allerdings im Funktionsumfang nicht mit denen eines Controlled LanguageChecker vergleichbar sind. Systeme wie CLAT oder acrolinx enthalten jeweils weit über 100 verschiedene Grammatik- und Stilregeln, beim AuthorAssistant sind es ungefahrein Dutzend. Eine linguistische Prüfung wird derzeit nur fürEnglisch als Quellsprache angeboten, stilistische Prüfungengibt es außer für Englisch auch für Deutsch und Französisch. Für die linguistische Prüfung sollten die Entwicklerjedoch die linguistischen Regeln noch etwas verfeinern. ImSystemtest löste der AuthorAssistant mehrmals falschenAlarm aus. Auch die Option "Passiv" ist in der derzeitigenVersion noch etwas zu undifferenziert: Nachdem diese Prüfoption gewählt wurde, wurde jeder englische Satz, der eineVerbform im Passiv enthielt, als potenzieller Fehler gemeldet, was aus Autorensicht doch etwas zu restriktiv ist. Fürdie Terminologieprüfung kann auf lokale und serverseitige MultiTerm-Datenbanken zugegriffen werden (Abb. 7).Außerdem lassen sich mit dem AuthorAssistant umfangreiche Berichte erstellen, darunter auch ROI-Analysen, diedas Einsparpotenzial übersetzungsgerecht verfasster Textedeutlich machen.

STAR MindReader

Auch der MindReader von STAR ermöglicht den Echtzeitzugriff auf bereits vorhandene quellsprachliche Sätzeund eine Terminologieprüfung. Genau wie beim TM-System Transit verfolgt STAR auch beim MindReader einendateiorientierten Ansatz. Das Referenzmaterial für denMindReader besteht aus kompletten Dateien und nichtaus einer Datenbank mit Satzpaaren, wie es bei den meisten TM-Systemen bzw. Authoring Memories der Fall ist(Abb. 10). Dieses Referenzmaterial kann entweder direktim MindReader erstellt oder aus Transit-Projektdateienempfangen werden, welche über das Netzwerk, per E-Mailoder FTP zur Verfügung gestellt werden. Dieser dateiorientierte Ansatz hat den Vorteil, dass der Autor bei derTextersteIlung nicht nur satzweise Vorschläge aus demAuthoring Memory bekommt, sondern auch Informationen über deren Kontext und Herkunft erhält und ggf. sogar komplette Absätze übernehmen kann. Wörterbücherfür die Terminologieprüfung können entweder in Mind-

MDÜ 412009

Tite/thema "-Reader erstellt werden oder aus TermStar - dem Terminologieverwaltungssystem von STAR - oder anderen Formaten wie MARTIF/TBX importiert werden.

[i]-match

Modul zur Termextraktion und eine Erweiterung der Benutzerverwaltung vorgesehen.

Standardisierung auf Wortebene:die Terminologieprüfung

Anzeige

39,90 €1)

ab 97,20 €1)

ab 48,60 € 1)2)

ASSEKURANZVersicherungsmakler für den BOÜ

BOSS ·

35 Jahre

41,18 €49,74 €

25 Jahre

32 ,08 €36,38 €

In den letzten Jahren ist das Bewusstsein für die Notwendigkeit von Terminologiearbeit gewachsen. Laut der SDLTerminologie-Umfrage 2009 sind 95 % der Befragten der

Eintrittsalter

Deckungssumme 200.000 €

Männer

Frauen

Jahresbeitrag in Abhängigkeit von Jahresnettoumsatzund Laufzeit

Jahresbeitrag für Existenzgründer

1) zzgl. 19% Versicherungssteuer2) Der Beitrag gilt für ein Jahr und bis zu einem Jahresnettoumsatz von 19.000 €

Berufshaftpflichtversicherung bei der Generali

VersicherungsrahmenverträgePreiswert - Leistungsstark

Vermögensschadenhaftpflichtversicherung bei der R+V

Private Krankenversicherung• Vermittlung von privaten Vollkrankenversicherungen, Zusatzversicherungen für Mitglieder

gesetzlicher Krankenversicherungen und Auslandsreisekrankenversicherungen• Beitrags- und Leistungsvergleiche aller privaten Krankenversicherer unter Einbe

ziehung der bestehenden Gruppenverträge für BDÜ-Mitglieder mit der Gothaerund der DKV.

Altersvorsorge• Vermittlung von Rürup-, Riester- und privaten Rentenversicherungen• Kostenloser Service für BDÜ-Mitglieder: produktunabhängige Altersvorsorgeplanung

Abschluss und Umstellung bestehender Verträge nur über die Boss-Assekuranz

Boss-Assekuranz • Versicherungsmakter für den BOO • Tauentzienstraße 1

10789 Berlln • Telefon: 030-885 68 50 • Telefax: 030-88 56 85 88E-Mail: info@boss·assekuranz.de • Beratungszeiten: Montag bis Freitag von10.00 bis 18.00 Uhr

Alle Informationen und Dokumente zum Download unter

www.boss-assekuranz.com

•

Service für BDÜ-Mitglieder

•

•

•

•

Die Authoring Memories, die in Werkzeugen wie crossAuthor Linguistic, SDL AuthorAssistant oder MindReader enthalten sind, basieren auf der TM-Technologie derjeweiligen Hersteller. Das heißt, dassder sinnvolle Einsatz dieser Systemegleichzeitig die Verwendung des je-weiligen TM-Systems voraussetzt.Doch nicht jedes Unternehmen hatoder möchte jedoch ein TM-System.Hier setzt die Autorenunterstützung[i]-match von der Firma itl AG an, dieseit 2008 angeboten wird.

Das Produkt [i]-match basiert aufeiner Client-Server-Architektur undumfasst folgende zentrale Komponenten: Clients für Word und FrameMaker, ein Webportal, eine Suchmaschine sowie Datenbanken zurVerwaltung von Terminologie undSätzen. Die Grundidee besteht darin,dass Autoren Terminologie und Sätze für die Wiederverwendung abspeichern können, ohne ein TMS verwenden zu müssen.

Im Unterschied zu TM-basiertenAuthoring-Memory-Systemen stehendem Redakteur die neuen quellsprachlichen Sätze schon zur Wiederverwendung zur Verfügung, sobald ersie in der Satzbank abgespeichert hatund nicht erst nach der Übersetzung.Außerdem setzt [i]-match Suchalgorithmen ein, die auch in Suchmaschinen wie Yahoo! verwendet werden.Diese Algorithmen verbessern lautAngaben der Hersteller die unscharfeSuche in den Datenbanken, was sichu. a. auch auf die Terminologieprüfung positiv auswirkt (Abb. 9). Quellsprachliche Sätze und Termini lassensich in [i] -match bei der Texterstellung direkt aus dem jeweiligen Editorin die Datenbank einpflegen.

Für die Version 2.0, die im Herbst2009 eingeführt werden soll, ist ein

MOÜ 4 I 2009 17

" Tite/thema

. .... ...

Drei-Liter-Auto Dreiliterauto, 3-Liter-Auto Bindestrichvariante, evtl. noch mit Ziffern

BecherhalterRückfuhrventil

BecherhalterungRückführungsventil

Morphologische Variante (zusätzlichesSuffix)

Einkommenssteuer

Basiszins Soll

Terminologiemanagement

Einkommensteuer

Sollzins

Terminologieverwaltung

Unterschiedliche Fugenelemente

Mehrwort- versus Einwortbenennung

Synonyme

Serverkonfiguration Konfiguration des Servers Nominalphrase statt Kompositum

Öltransportsystem Öltrasportsytem Rechtschreibfehler

Tabelle 3: Varianten bei der Benennungsbildung. Die erste Spalte enthält die gewünschten Vorzugsbenennungen, die jeweils in die Terminolo

giedatenbank aufgenommen wurden. Getestet wurde, ob die in der zweiten Spalte aufgelisteten Varianten bei der Terminologieprüfung auto

matisch als Terminologiefehler erkannt wurden

_...-

Systeme eine Terminologieprüfung an. Im Mittelpunkt desTests stand, wie die einzelnen Systeme mit sogenannten"Unwörtern" oder "Negativtermen" umgehen. Die Fragewar: Reicht es für die Terminologieprüfung aus, die Vorzugsbenennungen in die Terminologiedatenbank aufzu-

nehmen, oder müssen Schreibvariantenund verbotene synonyme Benennungenexplizit eingepflegt und mit einem entsprechenden Feld zum Verwendungsstatus als verboten gekennzeichnet wer-den (Abb. 8), wie es beispielsweise incrossAuthor der Fall ist?

In allen getesteten Systemen gibt es einderartiges Feld, und als verboten markierte Benennungen werden zuverlässigals Terminologiefehler erkannt. Jedochgerade bei längeren Komposita, deren Bestandteile auch Ziffern und Einheiten umfassen, lassen sich im Deut-schen häufig mehr als fünf verschiedeneVarianten finden (man denke nur an diemöglichen Schreibweisen von Drei-Li

ter-Auto). Hier ist es aus Sicht des Terminologen wünschenswert, den Arbeitsaufwand bei der Terminologieerfassungzu reduzieren. Eine weitere Frage ist, obdie jeweilige Terminologieprüfung auch

..Je'

Die Einkommensteuer ist eine Steuer, die auf das Einkommen von

Personen erhoben wird.

e-(I'..tU'I'~ • 11 • A" "," ~ r-' 1=' .~. ijr: ~ tt .. ' ..1bCc.0Il11 ..1ba:0d1 AaBbC.. ~ ~=.~J FIIl· ...... l('Ju·~·A· •••• ':I- "_' IliIt.__ lltlI'll"_Ulltn<lu'_.~" i: ............

M _ ,

I"'""'-..--........-----

Abb.9: Echtzeitprüfung in [i]-match. Das untere Fenster enthält Treffer in der Satzbank [i]

write. Im Unterschied zu anderen Authoring Memories rechnet [i]-match nicht mit 100-%Matches, sondern nimmt eine feinere Abstufung vor. Im rechten Fenster werden die Trefferaus der Terminologiedatenbank [i]-term angezeigt. Das Wort Einkommensteuerfindet [i]

match trotz anderer Schreibweise und kennzeichnet dies mit einer Warnung

Auffassung, dass "terminologische Inkonsistenzen Auswirkungen auf die übersetzungsqualität haben" (Wetzel 2009). Zum Abschluss wird deswegen die Terminologieprüfung in den einzelnen Werkzeugen nochmalsnäher beleuchtet. Grundsätzlich bieten alle untersuchten

18 MDÜ 4 I 2009

Titelthema "---~

al°ri.loplUd-

Stefanie Geldbach

Als Linguistin mit mehrjähriger Erfahrung in der Entwicklungvon MÜ-Systemen verfolgt Dr. Stefanie Geldbach neue Entwicklungen im Bereich Übersetzungstechnologie mit großemInteresse. Seit 2006 bietet sie als freiberufliche Beraterin Terminologie- und Sprachdienstleistungen im Bereich TechnischeDokumentation und Übersetzung an. Im Wintersemester200912010 ist sie außerdem als wissenschaftliche Mitarbeiterinin dem Projekt "Redaktionsschnittstellen in TM-Umgebungen"an der Hochschule Anhalt tä[email protected]

LiteraturDrewer, Petra: "Übersetzungsgerecht schreiben", in: technische kommunikation 312009, S. 28-33Lehmann, Sabine I Siegel, Melanie I Collmann, Oliver: "Intelligente Wiederverwertung statt blinden Kopierens", acrolinx White Paper Juni 2009, www.acrolinx.de/uploads/documents/whitepapers/Whitepaper_IntelligenCReuse2009-06-[de].pdfWetze!, Michael: "SDL-Terminologie-Umfrage 2009", in:eDITion 112009, S. 18-20, www.iim.fh-koeln.de/dtt/Dokumenteledition_2009_liedition-2009-1-wetzel-web.pdf

.. _... .. = .._.

Betonmischanlag8">Transportbetonwert<wrerdenfOr ~~ I~ldieverschiedooonBetonblKtan<iellerezeptlKgenau,~~ -:::==;---'=====?"""'",.. .' "r""I~

100% C:\ProarammelMindReadeOprojects\Betonmischer (

I~ ,

100% C\Pro rammelMindReade ro'ects\8etonmischerMischen von Kleinmengen [<"Betonmischert.action~

Bearbeiten

100% C.\Pro ramme\MindReade ro"ecls\Betonmischer

• ,.N

100% C\Pro ramme\MindReader\or6ects\Setonmlscher (+l

Weblinks <"Betonmischer&action=edit&secbon=10" "Abschnitt bearbeiten: Weblinks">Bearbeilen100% C:\Pronramme\MindReader\nro"ects\Betonmischer +

TrockendosIerung und Fahrmischer-Mischung [<"Betonmischer&acbon=edit&section=4". "Abschnitt bearbeiten:Trockendosierunn und Fahrmischer-Mischuno":>Bearbeilen

Abb.10: Im MindReader können ganze Ordner oder Dateien als Referenzmaterial für dieredaktionelle Arbeit ausgewählt werden. Bei der Textsuche werden die Sätze, in denen dergesuchte String (hier: Betonmischer) vorkommt, in ihrem Kontext angezeigt

Fazit

mit Rechtschreib- oder Tippfehlern umgehen kann. Tabelle 3 führt die Varianten an, die für die Terminologieprüfungvon Bedeutung sind.

Grundsätzlich lassen sich bei der Terminologieprüfung zwei Ansätze unterscheiden: Eine Möglichkeit besteht darin, linguistisches Wissen einzusetzenund mögliche Terminologievariantenüber entsprechende linguistische Regeln zu erfassen. Diesen Ansatz verfolgen die Controlled Language Checkers,die zumindest mit einigen der beschriebenen Varianten gut zurechtkamen. Sowohl die acrolinx-Suite als auch CLATund crossAuthor Linguistic konnten Varianten der Vorzugsbenennung Drei-Liter-Auto wie 3-Liter-Auto oder Dreiliterauto problemlos identifizieren. DieErkennung der Variante Konfigurati-

on des Servers versus Serverkonfiguration funktioniert inCLAT bzw. crossAuthor Linguistic über die sogenanntenHinterlegungsoptionen im UMMT. Hier kann der linguistische Administrator bestimmte Hinterlegungsmuster wieAB -7 BxA auswählen, welche die Nominalphrase Konfigu

ration des Servers in Form einer Phrasenstrukturregel vondem Kompositum Serverkonfiguration ableiten. Auch einige der morphologischen Varianten wie Dichtheit versusDichtigkeit oder Heizelement versus Heizungselement können CLCs im Prinzip erkennen.

Eine anderer Ansatz für die Terminologieprüfung istdie unscharfe Suche (Fuzzy-Suche) in der Terminologiedatenbank, bei der Abweichungen in der gesuchten Zeichenkette (Permutationen, ausgelassene Zeichen etc.) berücksichtigt werden. Eine derartige Fuzzy-Suche wirdbeispielsweise von [i]-match verwendet, so dass im Testalle Varianten außer Terminologiemanagement versus Ter

minologieverwaltung erkannt werden konnten. Somit können auch Rechtschreib- oder Tippfehler bei der Terminologieprüfung erfasst werden. Der Nachteil gegenüber demlinguistischen Ansatz liegt in einer geringeren Präzision,da das System - je nach Unschärfegrad - auch unsinnigeVorschläge liefert.

Im Bereich Autorenunterstützung hat sich auf Seiten derHersteller in den letzten Jahren einiges getan. Aufgrundder steigenden Anforderung an die Standardisierung vonTexten ist auch zu erwarten, dass diese Werkzeuge an Verbreitung gewinnen werden. •

MDÜ 4 I 200919

Documents

Neue Werkzeuge Zur Autorenunterstuetzung