DE19930403A1 - Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner - Google Patents

Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner

Info

Publication number
DE19930403A1
DE19930403A1 DE19930403A DE19930403A DE19930403A1 DE 19930403 A1 DE19930403 A1 DE 19930403A1 DE 19930403 A DE19930403 A DE 19930403A DE 19930403 A DE19930403 A DE 19930403A DE 19930403 A1 DE19930403 A1 DE 19930403A1
Authority
DE
Germany
Prior art keywords
terminology
terms
extraction
language
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19930403A
Other languages
German (de)
Inventor
Uwe Muegge
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19930403A priority Critical patent/DE19930403A1/en
Publication of DE19930403A1 publication Critical patent/DE19930403A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Abstract

The automatic process provides translation of machine read text in one language into another language. Data can be provided by a scanner and is then handled by a text recognition program. Terms not present in the system data base are identified and sorted into an extraction list. The text is researched and classified in the target language and then used to expand the data base. Independent claims are included for a terminology listing device.

Description

Stand der TechnikState of the art

Die Erfindung geht aus von einem Verfahren zur Erstellung projektbezogener Terminologielisten (Terminologieextraktion) im Rahmen computergestützter Übersetzungen von Texten nach der Gattung des Anspruch 1 und von einer Vorrichtung zur Durchführung einer Terminologieextraktion nach der Gattung des Anspruch 8.The invention is based on a production method project-related terminology lists (terminology extraction) in the context of computer-assisted translations of texts the genus of claim 1 and a device for Execution of a terminology extraction according to the genus of claim 8.

Eine solche Terminologieextraktion aus einem zu übersetzenden Text dient der Vorbereitung der eigentlichen Übersetzung, insbesondere zum Abschätzen des Aufwandes für die Terminologiearbeit und zur Erleichterung/Beschleunigung der Übersetzung im Team. Bei den in der heutigen Praxis der Textübersetzungen einsetzbaren Verfahren wird ein Ausgangstext vom Übersetzer gelesen oder vielmehr überflogen. Dabei erfaßt der Übersetzer sämtliche Termini, die eventuell recherchiert werden müssen. Anhand der Anzahl unbekannter Termini kann der zeitliche und finanzielle Anteil der Terminologiearbeit am Gesamtaufwand für ein Übersetzungsprojekt abgeschätzt werden. Die bekannten Verfahren zur Terminologieextraktion fallen in zwei Gruppen:
Die erste Gruppe stellen sogenannte Indexwerkzeuge dar. Mit den Indexwerkzeugen sind sämtliche in einem Text vorkommende Wörter automatisch auflistbar, wobei die Indexwerkzeuge den Nachteil haben, daß sie weder zwischen allgemeinem und Fachwortschatz unterscheiden können noch bereits bestehende Terminologiedatenbestände ohne weiteres berücksichtigen und deshalb bei der Terminologierecherche keine wesentliche Erleichterung darstellen. Die zweite Gruppe stellen Extraktionswerkzeuge dar, welche in der Korpuslinguistik für die Textanalyse verwendet werden. Einige dieser Werkzeuge können zwischen allgemeinem und Fachwortschatz unterscheiden, dennoch sind auch diese Werkzeuge nicht auf die speziellen Bedürfnisse von Übersetzungsprojekten angepasst und unterstützen insbesondere nicht die eigentliche Terminologierecherche, das heißt das effiziente Eingeben von Entsprechungen des jeweiligen Terminus in ein Terminologieverwaltungssystem. Deshalb ist heute die manuelle Terminologieextraktion die gebräuchlichste Methode zur Terminologieextraktion, die allerdings sehr zeitaufwendig, fehlerbehaftet und vielfach von Redundanzen gekennzeichnet ist. Fehler können dem Übersetzer bei den manuellen Verfahren dadurch unterlaufen, dass einerseits unbekannte Termini übersehen werden und andererseits schon bekannte Termini in die Extraktionsliste aufgenommen werden. Dies führt zu unnötiger Doppelarbeit, nämlich die manuelle Eliminierung bekannter Termini und das manuelle Hinzufügen nicht auf der manuell erstellten Extraktionsliste enthaltener Termini.
Such an extraction of terminology from a text to be translated is used to prepare the actual translation, in particular to estimate the expenditure for terminology work and to facilitate / accelerate the translation in the team. In the methods that can be used in today's text translation practice, the source text is read by the translator or rather scanned. The translator records all terms that may need to be researched. Based on the number of unknown terms, the time and financial share of terminology work in the total effort for a translation project can be estimated. The known methods for terminology extraction fall into two groups:
The first group are so-called index tools. With the index tools, all words that occur in a text can be listed automatically, whereby the index tools have the disadvantage that they can neither differentiate between general and technical vocabulary nor take existing terminology data into account without further ado and therefore do not take them into account when searching for terminology represent significant relief. The second group are extraction tools used in corpus linguistics for text analysis. Some of these tools can distinguish between general and specialist vocabulary, but these tools are not adapted to the specific needs of translation projects and in particular do not support actual terminology research, i.e. the efficient entry of correspondences of the respective term in a terminology management system. That is why manual terminology extraction is the most common method of terminology extraction today, but it is very time-consuming, error-prone and often characterized by redundancies. The translator can make mistakes in the manual process by ignoring unknown terms on the one hand and including already known terms in the extraction list on the other. This leads to unnecessary duplication of work, namely the manual elimination of known terms and the manual addition of terms not contained in the manually created extraction list.

Die Erfindung und ihre VorteileThe invention and its advantages

Das erfindungsgemäße Verfahren mit den kennzeichnenden Merkmalen des Anspruchs 1 und die erfindungsgemäße Vorrichtung mit den kennzeichnenden Merkmalen des Anspruchs 8 haben demgegenüber den Vorteil, dass die Terminologieextraktion automatisch durchführbar ist, dass die automatische Terminologieextraktion wesentlich schneller, zuverlässiger und kostengünstiger als die gegenwärtig praktizierten Verfahren ist und dabei insbesondere unnötige Doppelarbeiten vermieden werden. Das erfindungsgemäße Verfahren erleichtert es dem Übersetzer insbesondere, eine Forderung der DIN 2345 Übersetzungsaufträge zu erfüllen, die vorsieht, dass der Übersetzer vor dem Übersetzungsprozeß feststellen muß, inwieweit die benötigte Terminologie bereits vorliegt oder noch erarbeitet werden muß. Mit dem erfindungsgemäßen Verfahren sind folglich computergestützte Übersetzungen schneller und kostengünstiger durchführbar, insbesondere wenn im Team übersetzt wird, d. h. das Projekt in mehrere Teile aufgeteilt ist und diese Teile von verschiedenen Übersetzern bearbeitet werden. Damit sind Übersetzungsprojekte vorab transparenter zu kalkulieren, sowohl in finanzieller wie terminlicher Hinsicht. Außerdem sind sie terminologisch konsistenter ausführbar. Mit dem erfindungsgemäßen Verfahren wird die Terminologiearbeit sehr effizient gestaltet, da mit Hilfe von Datenimport und Schnittstellen sogar eine manuelle Eingabe entfallen kann.The inventive method with the characteristic Features of claim 1 and the invention  Device with the characteristic features of the Claim 8 have the advantage that the Terminology extraction is feasible automatically automatic terminology extraction much faster, more reliable and less expensive than the current one is practiced and in particular unnecessary Duplicate work can be avoided. The invention Procedures make it easier for the translator in particular to Requirement of DIN 2345 to fulfill translation orders that provides that the translator prior to the translation process must determine to what extent the terminology required is available or still needs to be worked out. With the The methods according to the invention are consequently computer-aided Translations can be carried out more quickly and cost-effectively, especially when translating as a team, d. H. the project in is divided into several parts and these parts of different ones Translators can be edited. With that Calculate translation projects in advance more transparently, in both financial and scheduling terms. Also are they can be carried out more consistently. With the The method according to the invention becomes very terminological designed efficiently, with the help of data import and Interfaces even manual entry can be omitted.

Nach einer vorteilhaften Ausgestaltung der Erfindung werden im Verfahrensschritt b) "Extrahieren" die in der Terminologiedatenbank nicht vorhandenen Termini alphabetisch sortiert, Doppeleinträge werden entfernt und jedem unbekannten Terminus wird der Satz zugeordnet, in dem er vorkommt. Dadurch werden zur Erstellung der Extraktionsliste Redundanzen entfernt und die im nächsten Verfahrensschritt vorzunehmende Terminologierecherche vereinfacht, da die Extraktionsliste effizienter abgearbeitet werden kann und für den Übersetzer wichtige Kontextinformationen zur Verfügung stehen. Außerdem ermöglicht die somit entstandene, maschinenlesbare Extraktionsliste X eine computergestützte Terminologierecherche.According to an advantageous embodiment of the invention Process step b) "extract" the in the Terminology database of non-existent terms sorted alphabetically, double entries are removed and each sentence is assigned the sentence in which it occurs. This will help create the Extraction list redundancies removed and those in the next Terminology research to be carried out simplified because the extraction list is processed more efficiently can become important for the translator Context information is available. Moreover enables the resulting, machine-readable  Extraction list X a computerized Terminology research.

Nach einer weiteren vorteilhaften Ausgestaltung der Erfindung wird im Verfahrensschritt b) die Extraktionsliste X zur Ermittlung der Anzahl der in der Terminologiedatenbank nicht vorhandenen Termini statistisch ausgewertet. Dadurch kann der Übersetzungsaufwand auch hinsichtlich der Terminologiearbeit in einem frühen Projektstadium abgeschätzt werden, was eine präzisere Planung und Durchführung der Terminologierecherche und der daran anschließenden eigentlichen Übersetzung ermöglicht.According to a further advantageous embodiment of the invention In process step b) the extraction list X becomes No determination of the number in the terminology database existing terms statistically evaluated. This allows the Translation effort also with regard to terminology work can be estimated at an early project stage, which is a more precise planning and implementation of the Terminology research and the following actual translation enables.

Nach einer weiteren vorteilhaften Ausgestaltung der Erfindung enthält das Extraktionsglossar X neben dem extrahierten Terminus und dem Kontext sämtliche projektrelevanten Informationen wie beispielsweise Entsprechung des Terminus in der Zielsprache B, Wortart, Definition, Kontext, Fundort usw. Diese bei der Recherche erhobenen Zusatzinformationen gehen zusammen mit den extrahierten Termini in die Terminologiedatenbank ein, womit dem Übersetzer bei der anschließenden eigentlichen Übersetzung eine wichtige Hilfestellung gewährt wird.According to a further advantageous embodiment of the invention contains the extraction glossary X in addition to the extracted one Term and the context of all project-relevant Information such as the equivalent of the term in the target language B, part of speech, definition, context, location, etc. This additional information collected during the research go together with the extracted terms in the Terminology database, with which the translator at subsequent actual translation an important one Assistance is granted.

Nach einer weiteren vorteilhaften Ausgestaltung der Erfindung wird zwischen dem Verfahrensschritt c) und d) eine redaktionelle Überarbeitung und Überprüfung des Extraktionsglossars C vorgenommen. Dadurch werden Fehler beim Ergänzen der Terminologiedatenbank und bei der computergestützten Übersetzung vermieden. Auch letzte Unklarheiten und stilistische Feinheiten sind so vom Übersetzer oder Benutzer des Verfahrens auffindbar.According to a further advantageous embodiment of the invention is between process steps c) and d) editorial revision and review of the Extraction glossary C made. This will make mistakes when completing the terminology database and at the computer-aided translation avoided. Last ones too Uncertainties and stylistic subtleties are thus from the translator or users of the method can be found.

Nach einer weiteren vorteilhaften Ausgestaltung der Erfindung ist die Ergebnissprache B eine Fremdsprache, eine Fachsprache oder eine begrifflich normierte Sprache. Das Verfahren ist auf diese Weise zur Übersetzung von fremdsprachigen Texten gleichermaßen anwendbar wie zur Übersetzung von fachspezifischen Texten in eine allgemeinverständliche Sprache oder zur begrifflichen Überarbeitung und Anpassung von allgemeinen Texten an eine beispielsweise unternehmensintern genormte Sprache. In vielen Bereichen ist es notwendig, dass Texte zur Vermeidung von Mißverständnissen und zum geregelten Dokumentationsmanagement eine einheitliche Terminologie aufweisen.According to a further advantageous embodiment of the invention the result language B is a foreign language, a technical language or a conceptually standardized language. The procedure is up  this way to translate foreign language texts equally applicable as for the translation of subject-specific texts in a generally understandable language or for conceptual revision and adaptation of general texts to a company, for example standardized language. In many areas it is necessary that Texts to avoid misunderstandings and regulated documentation management a uniform Show terminology.

Nach einer weiteren vorteilhaften Ausgestaltung der Erfindung wird der Verfahrensschritt c) im Internet oder einem anderen Online-Medium vorgenommen. Aus Datenbanken im Internet und Online-Medien kann die Recherche nach den in der zu verwendenden Terminologiedatenbank nicht vorhandenen Begriffen anhand der Extraktionsliste X erheblich schneller als in der heutigen Praxis durchgeführt werden.According to a further advantageous embodiment of the invention the process step c) on the Internet or another Made online media. From databases on the Internet and online media can do the research for those in the terminology database that does not exist Concept based on the extraction list X much faster than be carried out in today's practice.

Nach einer vorteilhaften Ausgestaltung der erfindungsgemäßen Vorrichtung ist ein Computer vorgesehen zur Ermittlung nicht in der Terminologiedatenbank vorhandener Termini des Ausgangstextes, welcher über eine Einleseeinrichtung in den Computer einlesbar ist und eine Speichereinheit zur Abspeicherung der Terminologiedatenbank hat. Die Vorrichtung ermöglicht so eine vollständig automatisierte Terminologieextraktion von maschinenlesbaren Texten, die in eine Zielsprache zu übersetzen sind. Die vom Computer als unbekannt ermittelten Termini sind über eine Anzeigeeinrichtung in Form einer Extraktionsliste anzeigbar und die Vorrichtung weist Schnittstellen auf für den Import von extern recherchierten Termini in die Terminologiedatenbank.According to an advantageous embodiment of the invention A device is not provided for the determination Existing terms in the terminology database Source text, which is read into the Computer can be read and a storage unit for Has saved the terminology database. The device thus enables a fully automated Terminology extraction of machine readable texts that are in to translate a target language. The from the computer as unknown terms are over a Display device can be displayed in the form of an extraction list and the device has interfaces for the import of externally researched terms in the terminology database.

Nach einer weiteren vorteilhaften Ausgestaltung der erfindungsgemäßen Vorrichtung ist eine mobile Einlesevorrichtung zur externen Terminologierecherche und Terminologieeingabe vorgesehen, welche mit dem Computer verbindbar ist zum Import von recherchierten Termini in den Computer. Beispielsweise kann die mobile Einlesevorrichtung in Bibliotheken zum Einlesen von projektbezogenen linguistischen Informationen (z. B. Entsprechung des Terminus in der Zielsprache B, Wortart, Definition, Kontext, Fundort) zu den Termini der Extraktionsliste X aus gedruckten Dokumenten verwendet werden und später das Ergebnis in die Vorrichtung übernommen werden.According to a further advantageous embodiment of the The device according to the invention is a mobile device Reading device for external terminology research and Terminology input provided using the computer  can be connected to import researched terms into the Computer. For example, the mobile reading device in Libraries for reading project-related linguistic Information (e.g. correspondence of the term in the Target language B, part of speech, definition, context, location) to the Extract list X terms from printed documents be used and later the result in the device be taken over.

Nach einer weiteren vorteilhaften Ausgestaltung der erfindungsgemäßen Vorrichtung ist die mobile Einleseeinrichtung ein handschriftliche Eingaben erkennender Kleincomputer (Palm Pilot® o. dgl.) mit einer Schnittstelle zur Übertragung recherchierter Termini der Extraktionsliste X an den Computer.According to a further advantageous embodiment of the The device according to the invention is the mobile Reading device recognizing handwritten entries Small computer (Palm Pilot® or the like) with an interface to Transfer of researched terms from extraction list X to the computer.

Nach einer weiteren vorteilhaften Ausgestaltung der erfindungsgemäßen Vorrichtung ist ein Anschluss vorgesehen um die Vorrichtung an ein Datennetz anzuschließen. Dadurch sind auch an einem entfernten Ort gespeicherte Terminologiedatenbanken zum Beispiel über das Internet recherchierbar, was die Recherche beschleunigt, die Qualität des Recherchenergebnisses verbessert und wodurch computergestützte Übersetzungen ebenfalls schneller durchführbar sind.According to a further advantageous embodiment of the A device is provided according to the invention to connect the device to a data network. Thereby are also stored in a remote location Terminology databases, for example via the Internet researchable, which speeds up research, quality of the search result improved and what computer-aided translations also faster are feasible.

Weitere Vorteile und vorteilhafte Ausgestaltungen der Erfindung sind der nachfolgenden Beschreibung, der Zeichnung und den Ansprüchen entnehmbar.Further advantages and advantageous configurations of the invention are the following description, the drawing and the Removable claims.

Zeichnungdrawing

Ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens ist in der Zeichnung dargestellt und im folgenden näher beschrieben. Es zeigt: An embodiment of the method according to the invention is shown in the drawing and in more detail below described. It shows:  

Fig. 1 ein Ablaufdiagramm der automatischen Terminologieextraktion des erfindungsgemäßen Verfahrens. Fig. 1 is a flowchart of the automatic terminology extraction of the method according to the invention.

Beschreibung des AusführungsbeispielsDescription of the embodiment

Ausgangspunkt des Verfahrens ist ein maschinenlesbarer Text in der Ausgangsprache A, welcher in eine Zielsprache B zu übersetzen ist. Liegt der Text nicht in maschinenlesbarer Form, d. h. als Datei in einem geeigneten Datenformat, vor, kann der zu übersetzende Text beispielsweise über einen Scanner in Verbindung mit einem Texterkennungsprogramm eingelesen werden. In diesem maschinenlesbaren Text werden unbekannte Termini, d. h. in der verwendeten Terminologiedatenbank nicht erfasste Termini identifiziert, bearbeitet (automatisch alphabetisch sortiert, Doppeleinträge entfernt, Satz in dem er vorkommt zugeordnet) und es wird eine Extraktionsliste X mit diesen Informationen erstellt. Die Recherche kann sowohl extern in Präsenzbibliotheken vorgenommen werden, als auch intern direkt am Übersetzerarbeitsplatz, beispielsweise in Internet zugänglichen Terminologiedatenbanken. Als Ergebnis erhält man das Extraktionsglossar C, das neben den extrahierten Informationen auch das Rechercheergebnis enthält (Entsprechung in der Zielspache B, Wortart, Definition, Kontext, Fundort u. dgl.). Die inhaltliche Struktur des Extraktionsglossars wird von der Struktur der zu verwendenden Terminologiedatenbank bestimmt. Das Extraktionsglossar C wird in einem nächsten Schritt als Ergänzung in die zu verwendende Terminologiedatenbank aufgenommen, so dass eine terminologisch konsistente Übersetzung des Ausgangstextes in die Zielsprache B erfolgen kann.The starting point of the process is a machine-readable text in the source language A, which translates into a target language B. translate is. If the text is not in a machine-readable form, d. H. as a file in a suitable data format, before, the Text to be translated, for example using a scanner in Read connection with a text recognition program become. In this machine-readable text unknown Termini, d. H. not in the terminology database used recorded terms identified, processed (automatically sorted alphabetically, double entries removed, sentence in which he occurs assigned) and there is an extraction list X with created this information. Research can be both be made externally in reference libraries, as well internally directly at the translator's workplace, for example in Terminology databases accessible on the Internet. As a result you get the extraction glossary C, which is next to the extracted Information also contains the search result (Correspondence in target language B, part of speech, definition, context, Location u. Like.). The content structure of the extraction glossary is used by the structure of the Terminology database determined. The extraction glossary C will in a next step as a supplement in the terminology database using, so that a terminologically consistent translation of the Source text in the target language B can be made.

Alle in der Beschreibung, den nachfolgenden Ansprüchen und der Zeichnung dargestellten Merkmale können sowohl einzeln als auch in beliebiger Kombination miteinander erfindungswesentlich sein.All in the description, the following claims and The features shown in the drawing can be both individually  as well as in any combination with each other be essential to the invention.

Claims (11)

1. Verfahren zur Erstellung projektbezogener Terminologielisten im Rahmen computergestützter Übersetzungen eines maschinenlesbaren Ausgangstextes von einer Ausgangssprache A in eine Zielsprache B, wobei Entsprechungen in der Zielsprache B für die in einer Extraktionsliste X enthaltenen unbekannten Termini sowie weitere Kontextinformationen in einer zu verwendenden Terminologiedatenbank gespeichert sind, gekennzeichnet durch die Verfahrensschritte:
  • a) Automatisches Extrahieren von in der Terminologie­ datenbank nicht vorhandenen, unbekannten Termini des Ausgangstextes A mit den Kontextinformationen und Erstellen einer Extraktionsliste X,
  • b) Recherchieren der unbekannten Termini anhand der Extraktionsliste X, Erhebung der durch die Struktur der zu verwendenden Terminologiedatenbank vorgegebenen Informationen und Erstellen eines Extraktionsglossars C aus der Extraktionsliste X und den recherchierten Informationen (Entsprechung extrahierter Terminus in der Zielsprache B, Wortart, Definition, Kontext, Fundort u. dgl.)
  • c) Ergänzen der zu verwendenden Terminologiedatenbank um das Extraktionsglossar C und
  • d) Übersetzen des Ausgangstextes in die Zielsprache B.
1. A process for the preparation of project-related terminology lists in the context of computer-based translations of a machine-readable source text from a source language A to a target language B, said correspondences are stored in the target language B for the information contained in an extraction list X unknown termini as well as further context information a to be used terminology database in through the process steps:
  • a) automatic extraction of unknown terms of the source text A that do not exist in the terminology database with the context information and creation of an extraction list X,
  • b) Researching the unknown terms using the extraction list X, collecting the information given by the structure of the terminology database to be used and creating an extraction glossary C from the extraction list X and the researched information (equivalent of extracted term in the target language B, part of speech, definition, context, Location and the like)
  • c) Supplementing the terminology database to be used with the extraction glossary C and
  • d) Translate the source text into the target language B.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Verfahrensschritt b) die Termini alphabetisch sortiert, und doppelt eingetragene Termini entfernt werden.2. The method according to claim 1, characterized in that in process step b) the terms are sorted alphabetically, and duplicate terms are removed. 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass im Verfahrensschritt a) die Extraktionsliste X statistisch ausgewertet wird zur Ermittlung der Anzahl der unbekannten Termini.3. The method according to claim 1 or 2, characterized in that in process step a) the extraction list X is statistically evaluated to determine the number of unknown terms. 4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass das Extraktionsglossar C flexibel an die inhaltliche Struktur der zu verwendenden Terminologiedatenbank anpassbar ist, um jeweils erforderliche projektbezogene Informationen (Entsprechung des extrahierten Terminus in der Zielsprache B, Wortart, Definition, Kontext, Fundort u. dgl.) zu enthalten.4. The method according to any one of the preceding claims, characterized characterized that the extraction glossary C flexible to the content structure of the to be used Terminology database is customizable to each required project-related information (correspondence the extracted term in the target language B, part of speech, Definition, context, location and. Like.) Contain. 5. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass zwischen dem Verfahrensschritt b) und c) eine redaktionelle Überarbeitung und Überprüfung des Extraktionsglossars C vorgenommen wird.5. The method according to any one of the preceding claims, characterized characterized in that between process step b) and c) an editorial revision and review of the extraction glossary C. 6. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Zielsprache B eine Fremdsprache, eine Fachsprache oder eine begrifflich normierte Sprache ist.6. The method according to any one of the preceding claims, characterized characterized that the target language B is a foreign language, a technical language or a conceptually standardized language is. 7. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass der Verfahrensschritt b) im Internet oder einem anderen Online-Medium vorgenommen wird. 7. The method according to any one of the preceding claims, characterized characterized that process step b) on the Internet or another online medium.   8. Vorrichtung zur Erstellung projektbezogener Terminologielisten im Rahmen computergestützter Übersetzungen eines maschinenlesbaren Ausgangstextes von einer Ausgangssprache A in eine Zielsprache B, wobei projektrelevante Informationen (Wortart, Definition, Kontext, Fundort, u. dgl.) für Termini sowohl in der Ausgangssprache A wie auch seiner Entsprechung in der Zielsprache B in einer Terminologiedatenbank gespeichert sind, insbesondere zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet,
dass ein Computer vorgesehen ist, zur automatischen Ermittlung nicht in der zu verwendenden Terminologiedatenbank vorhandener Termini des Ausgangstextes,
dass eine Einleseeinrichtung vorgesehen ist zum Einlesen des Ausgangstextes,
dass eine Speichereinheit vorgesehen ist zur Abspeicherung der Terminologiedatenbank,
dass eine Anzeigeeinrichtung vorgesehen ist, zur Anzeige nicht vorhandener Termini in Form einer Extraktionsliste und
dass der Computer Schnittstellen aufweist zum Import von extern recherchierten Termini in die Terminologiedatenbank.
8.Device for creating project-related terminology lists in the context of computer-assisted translations of a machine-readable source text from a source language A into a target language B, whereby project-relevant information (part of speech, definition, context, location, and the like) for terms both in the source language A and its Correspondence in the target language B are stored in a terminology database, in particular for carrying out the method according to one of claims 1 to 7, characterized in that
that a computer is provided for automatically determining terms of the source text that are not in the terminology database to be used,
that a reading device is provided for reading in the source text,
that a storage unit is provided for storing the terminology database,
that a display device is provided for displaying non-existent terms in the form of an extraction list and
that the computer has interfaces for importing externally researched terms into the terminology database.
9. Vorrichtung nach Anspruch 8, dadurch gekennzeichnet, dass eine mobile Einleseeinrichtung vorgesehen ist zur externen Terminologierecherche und Terminologieeingabe, welche mit einer Schnittstelle zur Übertragung der recherchierten Termini an den Computer ausgestattet ist.9. The device according to claim 8, characterized in that a mobile reading device is provided for external Terminology research and terminology input, which ones with an interface for transmission of the researched Termini to the computer is equipped. 10. Vorrichtung nach Anspruch 9, dadurch gekennzeichnet, dass die mobile Einleseeinrichtung ein handschriftliche Eingaben erkennender Kleincomputer (Palm Pilot® o. dgl.) ist mit einer Schnittstelle zur Übertragung recherchierter Termini an den Computer.10. The device according to claim 9, characterized in that the mobile reading device makes handwritten entries recognizing small computer (Palm Pilot® or the like) is with a  Interface for the transfer of researched terms to the Computer. 11. Vorrichtung nach einem der Ansprüche 8 bis 10, dadurch gekennzeichnet, dass ein Anschluß vorgesehen ist, um die Vorrichtung an ein Datennetz anzuschließen.11. The device according to one of claims 8 to 10, characterized characterized in that a connection is provided to the Connect device to a data network.
DE19930403A 1999-05-21 1999-07-02 Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner Withdrawn DE19930403A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19930403A DE19930403A1 (en) 1999-05-21 1999-07-02 Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19923570 1999-05-21
DE19930403A DE19930403A1 (en) 1999-05-21 1999-07-02 Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner

Publications (1)

Publication Number Publication Date
DE19930403A1 true DE19930403A1 (en) 2000-11-30

Family

ID=7908893

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19930403A Withdrawn DE19930403A1 (en) 1999-05-21 1999-07-02 Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner

Country Status (1)

Country Link
DE (1) DE19930403A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
US5850561A (en) * 1994-09-23 1998-12-15 Lucent Technologies Inc. Glossary construction tool
EP0887748A2 (en) * 1997-06-27 1998-12-30 International Business Machines Corporation Multilingual terminology extraction system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
US5850561A (en) * 1994-09-23 1998-12-15 Lucent Technologies Inc. Glossary construction tool
EP0887748A2 (en) * 1997-06-27 1998-12-30 International Business Machines Corporation Multilingual terminology extraction system

Similar Documents

Publication Publication Date Title
DE60029732T2 (en) Phrase translation method and system
DE69726339T2 (en) Method and apparatus for language translation
DE102005032046A1 (en) A method, system, and computer program product for transferring data from a document application to a data application
Reichert et al. Mehrsprachige Schreibende-mehrsprachiges Schreiben?
EP2221735A2 (en) Method for automatic classification of a text with a computer system
EP1412875B1 (en) Method for processing text in a computer and computer
DE19930403A1 (en) Terminology listing method for text in automatic computer controlled language translation system, involves using text recognition program for data provided by scanner
DE102016114265A1 (en) Method for at least partially machine transferring a word sequence written in a source language into a word sequence of a target language
DE102011103305A1 (en) Method of data fusion and provision of information in a computer system
DE102016217191A1 (en) Method for selecting and evaluating a plurality of data records from at least one data source
DE102014201540A1 (en) Method and device for analyzing texts
DE102006002911B4 (en) Method and device for processing parameters of an automated system for a search system
EP1610194A2 (en) Method and system for supplying context sensitive product informations
DE10210553A1 (en) Automatic text classification method is computer based and involves determination of word property occurrence frequencies so that it is more qualitative than existing methods which are purely quantitative
Barteld Dealing with Spelling Variation in Non-Standard Texts
DE4124024A1 (en) Processing of keyboard input of computer, typewriter or similar - by associating capitals in entered words with comparison list to simplify input esp. of text
DE102022125607A1 (en) Robot system with electronic operating instructions
DE202005021922U1 (en) Computerized tool for a method of creating documents
DE10142379B4 (en) Process for creating hyperlinks and using them to call up target documents from a source document
DE102022118492A1 (en) Method for recognizing objects intended for producing products, electronic computing device, computer program and computer-readable medium
DE102020109953A1 (en) Method and computer system for determining the relevance of a text
DE102020210872A1 (en) DATA PROCESSING DEVICE AND DATA PROCESSING METHOD
DE102013000620A1 (en) Method for identifying product description texts on web pages in websites, involves analyzing visitors visible text and/or lists and/or tables to determine meaningful texts and saving meaningful texts
Weichert Kurztitelkataloge
DE102013000694A1 (en) Automatic method for examining character strings whether character strings are about designation for products or services, involves selecting to-be analyzed character strings from existing data base or from other data sources

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee