CN1608259B

CN1608259B - 机器翻译

Info

Publication number: CN1608259B
Application number: CN028216970A
Authority: CN
Inventors: 斯蒂芬·克利福德·阿普尔比
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 2001-10-29
Filing date: 2002-10-29
Publication date: 2010-10-06
Anticipated expiration: 2022-10-29
Also published as: EP1306775A1; JP2005507525A; CN1608259A; WO2003038664A2; CA2465329A1; EP1446732A2; US7565281B2; US20050015240A1; WO2003038664A3

Abstract

一种计算机自然语言翻译系统，其包括：用于输入源语言文本的装置；用于输出目标语言文本的装置；转换装置，用于使用根据源语言文本和对应的目标语言文本的范例生成的所存储的翻译数据从所述源语言文本生成所述目标语言文本，该转换装置的特征在于所述存储的翻译数据包括多个翻译组成部分，每一个翻译组成部分都包括：表示所述组成部分中的语言单元出现顺序的表面数据；与所述组成部分中的多个语言单元之间的语义关系相关的依赖关系数据；以及将所述源语言的语言组成部分的依赖关系数据与对应的所述目标语言的语言组成部分的依赖关系数据进行链接的链接数据，以及所述转换装置被设置为用来使用所述源语言的所述表面数据分析所述源语言文本，并使用所述目标语言的表面数据生成所述目标语言文本，并且使用所述依赖关系数据和链接数据将所述源文本的分析变换为所述目标语言的分析。

Description

机器翻译

技术领域

本发明涉及机器翻译。更具体地，本发明涉及基于范例的机器翻译。机器翻译是语言处理的一个分支。

背景技术

在大多数机器翻译系统中，语言学家帮助编写与源语言(要被翻译的语言)和目标语言(要翻译成的语言)的语法相关的一系列规则，以及用于将与源文本相关的数据转换成与目标文本相关的数据的转换规则。在经典的“转换”体系结构中，首先应用源语法规则来去除源语言的语法依赖关系，并获得更接近于文本的语义(含意)的一些数据，然后将其转换成目标语言，在此，应用目标语言的语法规则来生成语法上正确的目标语言文本。

但是，为这些系统手写规则昂贵、费时并且容易出错。一种减少这些问题的方法是采用源语言文本的多个范例以及它们到目标语言的翻译，并且试图从它们中提取适当的规则。在一种方法中，手工对源语言和目标语言范例文本进行标记以指出对应关系。

例如在以下文献中描述了本领域的现有技术：Brown P F，Cocke J，della Pietra S A，della Pietra V J，Jelinek F，Lafferty J D，MercerR L和Roossin P S 1990，“A Statistical Approach to MachineTranslation”，Computational Linguistics，16 2 PP.79-85；BergerA，Brown P，della Pietra S A，della Pietra V J，Gillett J，LaffertyJ，Mercer R，Printz H和Ures L 1994，“Candide System for machineTranslation”，in Human Language Technology：Proceedings of theARPA Workshop on Speech and Natural Language；Sato S和Nagao M 1990，“Towards Memory-Based Translation”，COLING’90；Sato S 1995，“MBT2：A Method for Combining Fragments of Examples inExample-Based Translation”，Artificial intelligence，75 1 PP.31-49；Güvenir H A和Cicekli I 1998，“Learning TranslationTemplates from Examples”，Information Systems，23 6 PP.353-636；Watanabe H 1995，“A Model of a Bi-Directional Transfer MechanismUsing Rule Combinations”，Machine Translation，10 4 PP.269-291；Al-Adhailen M H和Kong T E，“A Flexible Example-based Parser Basedon the SSTC”，in Proceedings of COLING-ACL’98，pp.687-693。

Sato和Nagao开发了一种系统，该系统将源文本和目标文本表示为平面依赖关系树。依赖关系树是一种特殊类型的依赖关系图。在依赖关系图中，文本的单词与相互链接的多个节点相对应，以通过(有向)依赖关系来链接依赖于另一个单词(即，修改另一个单词的含意或与另一个单词有某种关系)的单词。如果每一个节点(除一个唯一的“根”节点外)精确地依赖于另外一个节点(虽然一个节点可能具有依赖于它的多个节点；换句话说，可以支配多个其它节点)，则依赖关系图为树。平面树是下述的这种树：当以单词的原始顺序排列单词时，满足“投影约束”；换句话说，在各节点范围(span)内的每一个单词都由该节点支配；换句话说，在图形上，没有依赖线相互交叉。平面树的计算效率特别高，因此使用它们是优选的。

但是，只有当在源文本和目标文本中相互依赖的单词邻接时，平面树才易于使用；换句话说，通过目标文本中的单词的邻接顺序来翻译源文本中的单词的邻接顺序。在语句级，这可以成立，但是由于较短的短语通常更适用，并且这样使得能够从较少数量的范例获得较大的翻译覆盖率，所以希望减小要被翻译的翻译单元(即，诸如短语的语句的多个部分)(也称为翻译组成部分)的最大大小。在现有技术中已对该问题采用了不同的方法。因为该问题，不能通过连接这些短语的起始单词的连接数据来简化对源语言短语和目标语言短语的排列。

Sato的MBT2方法将源文本和目标文本都作为简单平面树来进行分析，并且使用简单树排列来表述源语言和目标语言的树之间的关系。通过允许进行某些特殊的转换来归纳这些范例中发现的树，例如添加和删除节点；并且使用于与现有翻译相同的尺度对由Sato的系统产生的翻译进行分级。

发明内容

本发明采用源文本和目标文本的两级表达，第一级依赖于文本的表面形式(包括单词顺序)，而第二级依赖于单词之间的语义依赖关系。源语言分析和目标语言生成使用第一级。使用第二级进行从源语言到目标语言的转换。

在一个方面，本发明提供了一种翻译系统，该翻译系统被设置用来使用该过程进行分析。在另一方面，本发明提供了一种用于根据范例翻译文本开发这种类型的翻译系统的系统。在任一情况下，本发明可以实现为计算机程序，并涵盖这种程序以及有其使用的数据结构。

在另一方面，本发明提供了一种用于根据一依赖关系图推断文本分析的表面树表达的方法，该方法包括以下步骤：

以依赖于源依赖关系图和目标依赖关系图之间的排列的方式简化该依赖关系图；

根据以上经简化的依赖关系图生成初始(不必是平面的)表面树；以及

根据以上表面树生成最终平面表面树。

虽然可以根据用于生成表面单词顺序的平面树表达的自动处理的规定(provision)为用于翻译的依赖关系表达保留一些链接，但是该规定使得该翻译系统能够使用简单逻辑编程进行操作。

在另一方面，本发明提供了一种生成用于计算机自然语言翻译系统的翻译单元的方法，该方法包括以下步骤：

(a)提供源语言文本到目标语言文本的多个翻译范例，并且对于每一个这种范例都执行下面的步骤；

(b)为源语言文本和目标语言文本生成相应的依赖关系图，其中保留了各语言单元的顺序；

(c)将源语言依赖关系图的语言单元与目标语言依赖关系图的各个相应的语言单元进行链接，其中这些语言单元被认为是可以直接翻译的。

(d)使用转换算法对这些依赖关系图进行处理，以检测多个根节点，并且检测到这种节点，就使该多个根节点中的一个成为子节点，由此生成具有单个根节点的相应的多个树；

(e)对所述相应的多个树进行处理，以检测违反平面树投影约束的任何父/子节点依赖关系，一旦检测到这种节点依赖关系，就使相关的子节点依赖于该树的一更高节点；以及

(f)如果作为步骤(d)和(e)的操作的结果，存在依赖关系的变化以及与依赖关系的变化相关的数据，则对于每一个语言单元的链接对，生成包含作为相应的起始语言单元的这些链接语言单元以及子语言单元的相应翻译单元。

本发明总的来说适用于机器翻译的翻译途径和方法。本发明的实施例能够根据相对小的数量的文本的范例进行归纳，并且这使得这些实施例能够与例如保存在一种翻译存储器中的文本一起使用，该翻译存储器在文献Melby A K和Wright S E 1999，“Leveraging Terminological DataFor Use In Conjunction With Lexcographical Resources”，InProceeding of the 5^th International Congress on Terminology andKnowledge Representation，PP.544-569。

附图说明

现将参照附图仅通过范例的方式描述本发明的实施例，其中

图1是表示根据第一实施例的计算机翻译系统的组成部分的方框图；

图2是表示图1的计算机组成部分的部件的方框图；

图3是表示图2的计算机内的程序和数据表达(data present)的简图；

图4是表示根据本发明的文本翻译的各阶段的示意性简图；

图5是表示通过图1的装置进行的注释处理，以帮助人类用户对范例文本进行标记的流程图；

图6示出了在图5的处理过程中所产生的画面，以使得能够编辑；

图7是给出在第一实施例中执行的后续处理步骤以产生用于后续翻译的示意性概览的流程图；

图8示出了显示冗余级别的由图5的处理产生的屏幕显示；

图9是表示用于消除图8的冗余级别的处理的流程图；

图10示出了在执行图9的处理后与图8的结构相对应的结构；

图11示出了由图5的处理产生的包含相关子句的源文本(英语)的依赖关系图；

图12示出了在遇到这种相关子句时由第一实施例执行的处理的流程图；

图13与图11相对应，并且示出了由图12的处理所产生的结构；

图14示出了由图5的处理所产生的包含主题转换短语(topicshifted phrase)的源文本的结构；

图15是表示由第一实施例响应于主题转换短语而执行的处理的流程图；

图16与图14相对应，并且示出了由图15的处理所产生的结构；

图17是表示由图1的实施例执行的翻译处理的概览的流程图；

图18(包括图18a和18b)是更详细地表示第一实施例的翻译处理的流程图；

图19a-19f示出了在本发明第二实施例中使用的翻译组成部分，以生成用于归纳的附加翻译组成部分；

图20是表示在第二实施例中生成这些附加组成部分的处理的流程图；

图21是表示根据本发明第三实施例的生成可能的翻译单元组合之间的限制的处理的第一阶段的流程图；

图22是表示第三实施例中的第二阶段的流程图；以及

图23(包括图23a和23b)是表示第三实施例中的第三阶段的流程图。

具体实施方式

第一实施例

图1示出了适合于实现本发明的装置。在工作站100的构成中包括键盘102、计算机104、以及可视显示单元106。例如工作站100可以是高性能个人计算机或者sun工作站。

图2显示了图1的计算机104的各部件，包括：CPU 108(该CPU 108可以是Pentium III或者精简指令集(RISC)处理器108)。外围芯片组112与该CPU相连，用于与键盘、VDU和其它部件进行通信；内存114，用于存储执行的程序和工作数据；以及存储器110，用于存储后续执行的程序和数据。该存储器110包括硬盘驱动器；如果该硬盘驱动器不是可移动的，则存储器110号包括诸如软盘驱动器的可移动存储装置，以使得能够输入所存储的文本文件。

图3示出了存储在存储器110上用于由CPU 108执行的程序和数据。它们包括扩展(development)程序220和翻译程序230。

该推导程序包括用于对源文本文件224和目标文本文件226进行操作的对应关系程序(mapping program)222。在本实施例中，该推导程序还包括：源词典234，用于存储源语言的单词及其语法和语义特性；以及目标语言词典236，用于存储与目标语言相似的信息以及链接相互翻译的源单词和目标单词的对应关系数据(例如Eurowordnet词典系统的共享标识符)。

该翻译程序包括翻译数据存储器232，用于存储PROLOG规则形式的翻译数据，该PROLOG规则通过由对应关系程序222建立的关系进行定义。翻译逻辑程序238(例如PROLOG程序)定义由该翻译程序使用规则232采用的步骤，并且逻辑解释器程序239将翻译逻辑和规则解释为由CPU108执行的代码。

最后，操作系统237提供图形用户界面、输入/输出功能以及众所周知的功能。该操作系统例如可以是Microsoft Window^TM或者结合X-Windows工作的UNIX或LINUX。

图4为翻译处理的概览。对源语言文本(A)进行解析，以提供表示源表面树(B)的数据，该源表面树(B)与定义源依赖关系结构(C)的数据相对应，该源依赖关系结构(C)与目标依赖关系结构(D)相关联。然后应用该目标依赖关系结构来生成目标表面树(E)结构，根据该目标表面树结构生成目标语言文本(F)。

这些步骤将在后面更详细的讨论。然而，首先将讨论在提供在后续的翻译中使用的数据时由扩展程序220执行的处理。

翻译扩展程序

参照图5，在步骤402中，对应关系程序222生成包括源文档的第一句和翻译文档的相应句子的单词的屏幕显示(在这种情况下，源文档具有英语句子“I like to swim”，而目标文档具有相应的德语句子“Ichschwimme gern”)。在图形框1002-1008、1010-1014内显示各个单词。该对应关系程序使得用户能够垂直地移动这些单词，但不能改变它们地相对水平位置(该相对水平位置与源文本和目标文本中的单词出现的实际顺序相对应)。

然后该用户(翻译者或语言学家)可以拖动(使用鼠标或其它光标控制设备)包含这些单词的框之间的依赖关系线(“链接”)。在这种情况下，该用户通过将依赖关系线从头节点1008拖到多个子节点1002-1006中的每一个，来选择“swim”(1008)作为英语文本中的“头节点”单词，而“I”(1002)、“like”(1004)、“to”(1006)作为“子节点”。

在这一点上，应该注意源语言中的所有子节点1002-1006在这种情况下位于头节点1008的左侧；将它们称为“左子节点”。将多个头节点中的一个标记为整个句子(或者，以更通用的术语，文本框)的表面根节点。

继续编辑源图(步骤404)，直到该用户链接了所有所需的单词(步骤406)为止，然后对目标语言文本(1012-1014)重复该处理(步骤408、410、412)。

一旦已经为源语言文本和目标语言文本构造了依赖关系图，则在步骤414中，程序222使得用户能够提供表示源语言文本和目标语言文本中的单词之间的结合的连接(链接)，这些单词可以作为相互翻译进行配对。在这种情况下，“I”(1002)与“Ich”(1010)配对，而“swim”(1008)与“schwimme”(1012)进行配对。

不是源文本中的每一个单词都可以通过目标文本中的一个单词直接翻译，通常，用户将只连接能够较好地相互直接翻译的那些单词。然而，用户将连接位于直接翻译的一对短语的头部的那些单词，即使那些头单词本身不能直接翻译。为了本发明的目的，这种连接的头单词构成语言单元被认为可以直接翻译。

但是，在本实施例中，通称存在下述的情况：该连接(结合)不但表示该单词下面的多个短语(如果有)为翻译配对，而且头单词本身也形成翻译配对。

当该用户结束时(步骤416)，确定源语言文件和目标语言文件中是否还有要进行处理的句子，如果没有，则终止用户的干涉并关闭用户界面。如果还有要处理的句子，则选择下一个句子并如步骤402继续该处理。在该阶段，表示翻译范例的数据现包括一组表示语言单元的节点、一组各节点之间的有向链接，这些节点的链接定义了依赖关系图、以及一组表示两种语言中的节点之间的结合的链接。该结构将被称为翻译范例记录。

处理翻译范例记录

参照图7，在本实施例中由扩展程序220执行的处理如下。在步骤502中，选择翻译范例记录中的一依赖关系图，并且在步骤504中，去除冗余结构(见下文)。

在步骤510中，执行相关子句转换处理(在下文中更详细说明)。这通过产生已生成的依赖关系图数据的副本，然后对该副本进行转换来实现。其结果为树结构。

在步骤550中，对所编辑的图的副本执行主题转换处理(topic shifttransform process)(下文中更详细地说明)。其结果为保留了这些单词的表面顺序的平面树，在步骤580中将该结果与原始依赖关系图数据一起进行存储。

最后，在步骤590中，将各翻译范例记录分成将被称为翻译单元的分离单元。各翻译单元记录包括源语言和目标语言中的一对头单词，以及对于每个头单词包括该头单词的左侧的表面子节点列表(左子节点)、该头单词的右侧的表面子节点列表(右子节点)和该依赖关系图中的字节点列表。这种翻译单元也被称为翻译组成部分对(源语言的一个组成部分以及目标语言的一个组成部分)。在步骤582中，选择下一个依赖关系图，直到处理了所有的依赖关系图为止。

去除冗余层

现将更详细的说明步骤504。图8显示了英语短语“I look for thebook”和法语翻译“Je cherche le livre”的翻译范例记录。

在英语源文本中，单词“for”(1106)不与法语目标文本中的单词结合，因此没有定义可翻译的单词或短语。不存在由“for”支配的单词的子集(包括其本身)，该单词的子集是目标语言中的单词的子集的翻译。因此单词“for”支配“book”的事实对于翻译没有帮助。

因此，在本实施例中，消除了由“look”1104和“book”1110之间“for”表示的冗余结构。直接在依赖关系数据上进行这些修改，以简化该依赖关系图。

参照图9和10，在步骤505中，选择一“叶子”节点(即，不支配任何其它节点的节点)，然后在步骤506中，访问上面的下一个节点。如果该节点本身是翻译节点，即与其它语言的一节点相关，(步骤507)，则该处理返回到步骤505以读取更上面的下一个节点。

如果该上面的节点不与其它语言中的一节点相关(步骤507)，则读取更上面的下一节点(步骤508)。如果该更上面的下一节点是一个相关的节点(步骤509)，则将在步骤505选择的原始节点解除链接，并且重新连接到该相关的节点上(步骤510)。如果不是，则读取更上面的下一节点(步骤508)，直到到达一翻译节点为止。从“叶子”节点向上层依次为每一个节点重复该处理，直到处理了所有的节点为止。图10示出了节点1106和1110之间的链接被从节点1104到节点1110的链接替代。

由于如下所述可以使各翻译组成部分包括头及其紧接着的依赖关系，所以该冗余结构的消除大大简化了该翻译系统的实现。不存在紧接着的多个层。这使得翻译组成部分看起来象相关的语法规则(与Rosetta系统中使用的那些翻译组成部分相比较)，这意味着可以使用普通的语法分析程序进行源分析，并且由此生成翻译。

如刚说明的该转换假设该依赖关系图中的各节点具有任意的父节点。然而，存在具有多于一个父节点或者根本没有父节点的不相关节点，可以在必要的地方执行相关性转换。这确保了只有相关的节点精确地具有一个父节点。

生成表面树

由扩展程序220执行的下一步骤是对以上导出的依赖关系图进行处理，以生成相关联的表面树。图6所示的依赖关系图已经为平面树的形式，但是该情况并不是一定的。

以下步骤将使用依赖关系图，通过生成如上所述导出的经处理的依赖关系图信息的副本，然后对该副本进行转换，来生成表面树结构。

相关子句转换(“相关性”)

图11示出了可以由用户为英语短语“I know the cat that Marythought John saw”构造的依赖关系图，包括节点1022-1038。在诸如图11的相关子句中，该依赖关系图具有多于一个的根节点，对应于主动词(“know”)和依赖子句的动词(“thought”)。由于具有两个根节点，并且由于“cat”(1028)由两个节点(“know”(1024)和“saw”(1038))支配，所以该结果为该依赖关系图不是树。我们假设该依赖关系图具有以下属性：

它们是弱连接的、有向、非循环图，

对于具有n个节点的图，存在n-1个链接，

如果节点A和B具有多于一个的父节点，则不存在从A到B或者从B到A的路径。

这些假设意味着该依赖关系图对于各子句都包括通过共享公共节点连接的一个树的连接集。我们考虑这些树中的一个作为主树，并且该树的根节点作为主根节点。

参照图12和13，用于将该依赖关系图转换成树的算法如下：

将主根节点作为当前节点开始。

将当前节点标记为“已处理”。

对于当前节点的每一个子节点，

检查该子节点是否具有为处理的父节点。

对于每一个未处理的父节点，找到支配该父节点的根节点(从属根节点)。

断开该未处理父节点支配该子节点的链接，并且

插入一链接，该子节点通过该链接支配该从属根节点。

对于当前节点的每一个子节点，

使该子节点成为当前节点，并继续该过程直到不再有节点为止。

在存在从B到A的链接的情况下，节点A被称为节点B的“子节点”。另选地，节点B被称为节点A的“父节点”。

如图12所示，在步骤512中，确定是否处理了依赖关系图中的最后一个节点，如果是，则终止该处理。如果不是，则在步骤514中选择下一个节点，并且在步骤516中，确定该节点是否具有多于一个的父节点。大多数节点都只有一个父节点，在这种情况下，处理返回到步骤514。

然而，在遇到诸如“cat”(1028)的节点(该节点具有两个父节点)的情况下，确定更下级树(步骤518)(作为远离该句子的根节点的更多数量的节点)，并且在步骤520中，删除来自它的链接(即，在图11中，1038和1028之间的链接)。

在步骤522中，生成从该节点到该更下级树的根节点的链接。图13示出了当前生成的从表示“cat”(1028)的节点到表示“thought”(1034)的节点的链接。

然后该处理返回到步骤516，以去除任何其它的链接，直到该节点只具有一个父节点为止，在此，步骤516使得流程返回到步骤514，以处理下一个节点，直到处理了该句子的所有节点。

因此，该处理具有从原始依赖关系图生成相关联的树结构的作用。这样，在该阶段，翻译范例记录包括原始的源依赖关系图和目标依赖关系图的简化版本，以及目前具有树拓扑结构并保留了表面结构的经转换的源图和目标图。

主题移动变换(“主题性”)

图13的树为平面树，但是不总是这种情况；例如在以短语(主题)从其“逻辑”位置移动到在文本中更早出现的位置。这在英语中的“Wh-”疑问句中会出现，例如图14中所示的，图14示出了由节点1042-1054构成的英语疑问句“What did Mary think John saw？”，这些节点与这些单词向对应。虽然依赖关系图在这里为树，但是它不是平面树，因为“saw”(1052)支配“what”(1042)的依赖关系违反了投影约束。

现将参照图14到16更详细的说明步骤550的主题移动转换阶段。该算法对具有树拓扑结构的图进行操作，因此希望在上述的相关性转换之后执行该步骤。

该通用算法从一“叶子”(即，不支配任何其它节点的节点)节点开始，

对于每一个节点，(当前头)，识别违反投影(即，平面)约束的任何子节点(即，是否存在该节点即不直接支配也不间接支配的中间节点？)。

对于每一个这种子节点，去除依赖关系(链接)并且

将该子节点连接到当前节点的父节点。

继续该处理直到不再存在违反投影约束

对于每一个节点，直到最后一个节点(步骤552)，对于所选择的节点(步骤544)，对于到一子节点的每一个链接，直到最后一个链接(步骤556)，选择到一子节点(首先选择最左边的节点)的链接(步骤558)。然后该程序检查该链接是否违反平面性约束，换句话说，是否在头单词和子单词之间的单词序列中存在既不由该节点直接支配也不由该节点间接支配的中间单词。如果满足投影约束，则选择下一个链接(步骤558)，直到最后一个链接(步骤556)。

如果不满足投影约束，则断开到该子节点的链接，并重新连接到从当前节点向上的下一个节点上，并且再次检查(步骤560)是否满足平面性条件，直到该子节点连接到当前节点上面的不违反平面性约束的节点上。

然后选择到一子节点的下一个链接(步骤558)直到最后一个链接(步骤556)，并且随后选择下一个节点(步骤554)直到最后一个节点(步骤552)。

因此，在执行图15的主题性转换以后，得到的结果为图16中所述的结构，该结构为保留了表面结构的平面树，并且该结构与原始依赖关系图相对应。

将多个图分成多个翻译单元

在执行相关性和主题性转换以后，所存储的数据记录对于每一个句子都包括源语言依赖关系图和表面树、以及目标语言依赖关系图和表面树。这种结构只能用于翻译其中逐字逐句地出现那些句子的新文本。将这些句子分成多个更小的翻译组成部分(相应地，例如分成多个短的短语)更为有用，这些翻译组成部分各由“头”单词开始(headed)，这些头单词由源语言和目标语言之间的相关节点表示。

因此，在步骤590中，扩展程序220将各翻译范例分成多个翻译单元记录，每一对相关的节点都由一个翻译单元记录。

每一个翻译单元记录包括源语言和目标语言中的一对头单词，以及对于每一个单词具有右表面子节点列表和左表面子节点列表、以及依赖关系图子节点列表。这些列表可以是空的。

各个头单词和它们相关的列表可以看作为各个语言组成部分，并且对它们进行配对，以形成翻译单元记录。该翻译单元的多个语言组成部分可以存储在一起，例如，在相邻的存储位置中。由于各个依赖关系数据的相关性，所以在它们被存储在不相邻的存储位置的情况下，它们仍然形成单个逻辑翻译单元。

表示这些子节点的多个字段可以包含字面单词(literal word)(例如“like”)或者由位置标志符变量和最初占据该子节点字段的翻译单元的记录形成的对(duple)，例如该对与头单词对“I”-“Ich”相关。还提供了多个附加结构，这些附加结构表示依赖关系与表面子节点之间的关系。这些将被称为“间隙栈操作(gap stack operation)”并将在后面进行说明。允许这种位置标志符变量的作用如下：在诸如由以上原始句子中的“swim”-“schwimme”开始的翻译单元中，原来由“I”-“Ich”占据的位置现在可以由另一个翻译单元占据，允许它加入到其它的句子中，例如“red fish swim”。尽管在具有人工制定的规则的翻译系统中，可以在语法上限定可以占据各位置标志符变量的多个语言单元(以使得例如只有单个名词或名词短语能够位于特定的位置)，但是在本实施例中，在该阶段没有这种约束。

现在可以将该源表面结构作为直接语法规则来处理，使得可以使用简单的图表分析程序来生成要翻译的新文本的表面分析树，如将在下面详细说明的。

应该注意，由于生成该表面树的处理可能会改变多子节点对头节点的依赖关系，所以在每一种情况下，该表面树内的子节点列表将不会完全一致地匹配依赖关系图中的那些子节点列表，由于在该表面树中一个节点的子节点可能会转移到另一个节点，所以会导致它从一个翻译组成部分转移到另一个翻译组成部分；处理这种情况的方式如下：

在形成导出该表面结构的转换的结果使得表面表示中的一节点从一个翻译组成部分转移到另一个翻译组成部分的情况下，通过使用堆栈或相应的数据结构对此进行计算(使用被称为“线程”的多对列表在PROLOG中进行模拟)。

间隙栈操作与各翻译组成部分和各表面子节点相关联。在翻译组成部分中的表面子节点的列表包含不包括在依赖关系子节点中的子节点的情况下，由多个表面子节点中的一个将一项压入该间隙栈。与该操作相关的子节点依赖于导致该额外表面子节点的转换。该项表示翻译组成部分的头(在相关性转换的情况下)或者该额外子节点(在主题性转换的情况下)。

当翻译组成部分包含附加到表面子节点中的依赖关系子节点时，将从与该翻译组成部分相关的间隙栈中弹出一项。该项将与该附加依赖关系子节点合并。

因此，在翻译中的后续使用中，当源表面结构匹配输入源文本并且包含不能由其相关的依赖关系图说明的相时，将该项压入栈，并且取回以与不同的翻译单元的依赖关系图合并。

由于该实施例以PROLOG编写，所以可以通过变量的统一使得表面树、间隙栈、以及依赖关系图结构之间的表示简化。由于由此表面树和依赖关系图结构之间的关系完全双向化，所以这是适宜的。为了实现反向翻译，我们简单地颠倒翻译单元中的两个组成部分。

在以下文献中描述了以与本实施例相同的方式使用间隙栈：PereiraF 1981，“Extraposition Grammars”，American Journal ofComputational Linguistics，74 pp.243-256，以及Alshawi H 1992，“The Core Language Engine”，MIT Press Cambridge，在此引入作为参考。

再次考虑由图14和16中的图所示的主题性转换。根据这些图导出的翻译单元的源侧为(为了清楚起见稍微进行了简化)：

component #0：

头＝‘think’

左表面子节点＝[‘what’，‘did’，‘mary’]，

右表面子节点＝[(#1，X)]

依赖子节点＝[‘did’，‘mary’，(#1，X)]

component#1：

头＝‘saw’，

左表面子节点＝[‘john’]，

右表面子节点＝[]

依赖子节点＝[‘john’，‘what’]

可以看到，在组成部分#0中，我们在表面子节点列表中具有‘what’，而不是在依赖子节点列表中。相反，组成部分#1在其依赖子节点列表中具有‘what’，而不是在其表面子节点列表中。

在组成部分#0中，当进行依赖关系图到表面树的映射时，标记为(#1，X)的字节点被用作为额外表面子节点。所以，我们希望将‘what’加入到该子节点的间隙栈中。相反，在组成部分#1中，我们必须能够从与该额外依赖子节点(‘what’)相对应的间隙栈中去除一项，以完全能够使用该组成部分。因此将从该间隙栈中弹出该组成部分的头，该头将与‘what’的表达合并。经修改的源侧组成部分的表达看起来如下：

component#0：

头＝‘think’

左表面子节点＝[‘what’，‘did’，‘mary’]，

右表面子节点＝[(#1，X)：push(Gapstack，‘what’)]

依赖子节点＝[‘did’，‘mary’，(#1，X)]

component#1：

头＝‘saw’，pop(Gapstack，‘what’)，

左表面子节点＝[‘john’]，

右表面子节点＝[]

依赖子节点＝[‘john’，‘what’]

这些用于相关性转换的组成部分看起来有点不同。为了说明这点，考虑图11和13中的示例。在该示例中，在依赖关系结构中存在额外的根节点。这意味着存在具有额外表面子节点的组成部分，并且该表面子节点将导致该组成部分的头被压入间隙栈中。在该示例中，‘cat’为相关组成部分的头，而‘thought’为将要把‘cat’的表达压入其间隙栈中的表面子节点(‘cat’的表面子节点)。这具有使‘thought’成为依赖关系图中的局部根节点，以及使‘cat’成为任何一个将其弹出间隙栈的头的依赖子节点(在该例中为‘saw’)。

则图11和13中的图的源侧的表达为(为了清楚起见再次进行了简化)：

component#0：

头＝‘know’

左表面子节点＝[‘I’]，

右表面子节点＝[(#1，Y)]

依赖子节点＝[‘I’，(#1，Y)]

component#1：

头＝‘cat’，

左表面子节点＝[‘the’]，

右表面子节点＝[(#2，Z)：push(Gapstack，’cat’)]

依赖子节点＝[‘the’]

component#2：

头＝‘thought’

左表面子节点＝[‘that’，‘mary’]，

右表面子节点＝[(#3，W)]

依赖子节点＝[‘that’，‘mary’，(#3，W)]

component#3：

头＝’saw’：pop(Gapstack，V)，

左表面子节点＝[‘john’]，

右表面子节点＝[]

依赖子节点＝[‘john’，V]

该示例示出了‘cat’被加入组成部分#1的子节点#2的间隙栈中。此外，从组成部分#3的头处的间隙栈中弹出一项(在该例中为一变量)。该项与组成部分#3的依赖子节点合并。

在本发明中，“语言单元”一词包含单词和位置标志符变量两者，而“单词”一词包含实际或字面的单词和语态。

因此，在以上示例中，对于组成部分#0，其左表面子节点为实际单词‘I’，而其右表面子节点为由位置标识符变量‘Y’和最初占据该子节点字段‘#1’的翻译单元的记录形成的对；对于组成部分#1，其左表面子节点为实际单词‘the’，而其右表面子节点为由位置标识符变量‘Z’和最初占据该子节点字段‘#2’的翻译单元的记录形成的对；对于组成部分#2，其左表面子节点为实际单词‘that’和‘mary’，而其右表面子节点为由位置标识符变量‘W’和最初占据该子节点字段‘#3’的翻译单元的记录形成的对；而对于组成部分#3，其左表面子节点为实际单词‘john’，它没有右表面子节点，但是因为从间隙栈中弹出该项，所以它的依赖子节点为实际节点‘john’和具有值“V”的变量。

如果存在另一个组成部分，例如#21，则对于‘the black dog’，即，头＝‘dog’；左表面子节点＝‘the’而右表面子节点＝‘black’，则所有出现的与#1相关的位置标志符变量都可以用于举例说明#21，以生成另一个可翻译的源文本。

翻译

稍后将考虑该扩展程序的其它方面。然而，为了更好的理解这些方面，在该阶段引入翻译程序230的操作的说明示适宜的。将相应地对此进行说明。

在本实施例中将翻译组成部分内的源字面结构看作简单语法规则，以便利用简单的图分析程序来产生字面分析树，例如如在James Allen，“Natural Language Understanding”，second edition，BenjaminCummings Publications Inc.，1995中所述那样，不过在这里修改为从头节点或根节点向外而非从右到左或从左到右进行操作。分析程序尝试按照要翻译的文本的顺序为针对每个单词的每个翻译单元来匹配源字面树结构的头节点。这产生了使用源字面结构的压缩边沿的数据库，该数据库在以后被解压以发现一分析。

使用栈来提供字面树术语和依赖关系树术语的统一的效果确保在解压过程中同时地创建了源依赖关系结构。

虽然由逻辑解释程序239确定了由字面和依赖关系结构所表达的规则实现的实际顺序，图17和18在概念上示出了该处理。

在图17的步骤602中，选择要翻译的源语言文件的句子。在步骤610中，使用分析程序来导出语言组成部分的源字面树，该字面树再现了所述输入源文本中的单词顺序。在步骤620中，确定了对应的依赖关系图。在步骤692中，根据源字面依赖关系图，确定了目标依赖关系图。在步骤694中，根据目标依赖关系图，确定了目标字面树，并且使用该目标字面树来产生目标语言文本，在步骤696中，存储所述目标语言文本。该处理将继续进行至源文本的结尾(步骤698)。

图18a和18b更详细地示出了步骤610到694。在步骤603中，依次对每个字面结构与所述输入文本进行比较。每个文字字面子节点(用于存储文字单词的节点)必须精确地与源文本串中的一个单词相匹配。把每个对齐的字面子节点(即，与进一步的翻译单元相对应的字面子节点)与翻译单元的源头记录联合起来，以便为所述源文本创建一字面树。

然后，对于字面分析中的每个单元，使用为该单元所存储的栈操作，来操作该栈(步骤608)以推入或弹出任何额外的或错过的子节点。如果(步骤610)不能为所述依赖关系结构检索到正确数目个术语，那么就拒绝所述候选结构，并且选定下一个，直至最后(步骤612)。在存在正确翻译组成部分的情况下，恰好所述正确数目个子节点将通过所述栈。

在找到匹配的字面和依赖关系结构(即，对句子的分析)的情况下(步骤610)，接着，参照图18b，对于组成的依赖关系结构中的每个翻译单元，检索对应的目标头节点(步骤622)，以构成对应的目标依赖关系结构。这样源语言和目标语言之间的转换就在依赖关系结构层次上进行，因此相对来说不受源和/或目标语言中的单词位置的难以预料的变化所影响。

在步骤626中，对栈进行操作，以推入或弹出子节点。在步骤628中，根据目标依赖关系结构来确定目标字面结构。

在步骤630中，通过沿着链接遍历整个目标字面结构来确定该结构的根节点。最后，在步骤632中，通过从目标字面根节点组成部分开始遍历所述目标字面结构来递归产生目标文本，以从目标字面头节点和子节点组成部分中提取所述目标文本。

根据上面的说明，应该理解，本发明通过利用两个不同的图来表达每种语言的范例文本，在这点上与本领域内的前述工作(例如，Sato的MBT2)是不同的。其中一幅图是平面树，用于表达单语字面约束，例如单词排序和一致规则；另一幅图是更通用的有向非循环图，用于为范例文本提供依赖关系图。两种语言之间的这种对齐被表达为依赖关系图之间的对齐。

本发明的一个优点是可以对齐不连续的单词序列。另一个优点是表现出易变限制的单词在表达上是“邻居”。这使得可以从非常少的范例中学习到约束。

第二实施例一翻译单元的归纳

在对第一实施例的核心操作进行讨论之后，下面说明进一步优选的特征(可独立于上述特征而使用)。

由上述处理所形成的翻译组成部分对于目标和源语言包括一个文字头节点和多个子节点，所述多个子节点可以是文字或非文字(即，上述的duple)，非文字表示对于其他翻译组成部分的连接点。使用一翻译组成部分时，每个文字子节点必须与要精确翻译的的文本相匹配，每个非文字子节点必须支配另一翻译组成部分。

规则集(这是所述翻译单元记录现在包括的规则集)是从范例文本中导出的。因此，不可以使用一特定名词(假定带有一个形容词)来翻译出现时带有零个或者两个或更多个形容词的名词。本实施例提供了一种用于从给定的范例进行归纳的归纳装置。这就减少了有效翻译系统所需的、或者看起来不同的范例的数目，增强了给定范例集的翻译能力。

图19(包括图19a-19f)显示了六个法语-英语翻译单元的范例文本。在图19a中，源头节点是“car”，其带有两个左子节点“the”和“white”；目标头节点是“voiture”，其带有左子节点“la”和右子节点“blanche”。类似地，图19b显示了文本“the white hat”(“le chapeau blanc”)，图19c显示了文本“the car”(“la voiture”)，图19d显示了文本“the hat”(“le chapeau”)，图19e显示了文本“the cat”(“lechat”)，图19f显示了文本“the mouse”(“la souris”)。

仅仅根据这些范例文本，上述翻译系统将不能翻译诸如“whitemouse”或“white cat”的短语。

通过添加“伪翻译单元”来进行归纳，以减少下面将要说明的头节点单词对的不同行为的数目，所述归纳使系统可以翻译上面所述的范例。

根据每个翻译单元将导出一替换形式。这由去除头节点单词后的所述翻译单元组成。如果可以通过重命名两个替换形式中所包含的翻译单元的占位符变量和引用(值)来使该两个替换形式等同，那么就说这两个替换形式是相似的。对于每个头节点单词对存在一替换形式集。我们认为该集描述了所述头节点单词对的“行为”。如果描述两个头节点单词对的行为的大量替换形式是相似的，那么就说两个头节点单词对行为方式是相似的。为了允许所需的归纳，创建了新的翻译单元(伪翻译单元)，以使相似头节点单词对的行为一致。

参照图20，在步骤702中，扩展程序220读取存储在存储装置232中的翻译单元以查找相似单元。为了确定两个翻译单元是否相似，要检查它们的替换形式的相似性。

参照图19a到19f中的翻译范例，发现图19d所示的单元与图19e所示的单元相似，图19c所示的单元与图19f所示的单元相似。尽管所有这四个的源侧是等同的(因为英语中的定冠词没有阳性和阴性之别)，但是它们的目标子列表中的两对却不等同。

对于源和目标头节点单词不同的、已经标识出的每对相似翻译单元，在步骤704中创建第三翻译单元，该第三翻译单元具有与所述相似翻译单元对中的一个相同的源-目标头节点单词对，但是具有不同的子节点。例如，对于由图19d和19e所形成得对，在步骤704中将选择图19b，因为，图19b具有与图19d的单元相同的头节点单词。

在步骤706中，创建新的翻译单元记录，该新的翻译单元记录将所述相似翻译单元对中的另一个的源和目标头节点单词(换句话说，不是第三翻译单元的头节点单词)与第三翻译单元的子节点列表组合起来。在此情况下，在步骤706中使用图19b的翻译单元为图19d和19e的相似翻译单元对所产生的翻译单元是：

SH7＝Cat

SD1＝The

SD2＝White

TH7＝Chat

TD1＝Le

TD2＝Blanc

类似地，使用图19a的翻译单元根据图19c和19f的相似翻译单元对所形成得新的翻译单元如下所示：

SH8＝Mouse

SD1＝The

SD2＝White

TH8＝Souris

TD1＝La

TD2＝Blanche

这样，翻译扩展程序220能够产生新的翻译范例，这些新的翻译范例中的许多在源和目标语言中句法上都是正确的。

在上面的范例中，可以看出，将诸如限定词(“the”、“le”、“la”)的功能单词留作范例的源和目标文本中的文字串，而非将它们标记为语言单元，有益于防止过归纳(例如，忽略形容词名次一致)。

尽管如上所述的实施例有效地发挥作用，不过在该实施例中还可以利用源和目标语言词典234、236来限制被选为相似的翻译单元对的数目。

例如，仅在两对中的源头节点单词(同样还有目标头节点单词)处于相同的句法范畴的情况下，才认为这两对是相似的。附加地或者另选地，可使第三单元的选择取决于以下条件：该第三单元的子节点与第一和第二单元的子节点属于相同的句法范畴或范畴。这就有可能减少所产生的错误归纳对的数目，而又不大大减少有用归纳的数目。

在针对第一实施例采用上述实施例的归纳的情况下，将在图7所示的处理之后采用所述归纳。比较方便的是，在翻译过程中将恶化与伪翻译单元的使用关联起来，以在其它译文可能的情况下阻止翻译系统使用这些伪翻译单元。

应该明白，该第二实施例的归纳法通过使用单词行为之间的相似性来假设在范例中未曾见到的新翻译单元，这不同于本领域中的前述工作。

第三实施例-创建和使用头/子节点限制

如果如在第一实施例中所述，在翻译过程中，任何子节点可以选择任何头节点，那么就将产生许多不正确的翻译(除可能产生的任何正确翻译之外)。如果采用在前面的实施例中所述的归纳处理，就进一步增加了这种可能性。如果产生了很多翻译，希望消除在语言上不发声或者产生了语言学上不正确的目标文本的翻译。

翻译系统不能担保源文本本身是符合语法的，因此，目的并不在于提供拒绝产生不合语法的目标文本的系统，而是提供在给定多个可能翻译输出的情况下导致语法上更正确的和可靠的翻译输出的系统。

不过，本实施例的系统不对规定哪个头节点应与哪个子节点相组合的句法或语义信息进行访问。本实施例的目的在于，通过对所呈现的翻译单元的组合进行归纳，更具体来说，通过对可能尚未在范例文本中出现的翻译单元的组合进行归纳，来获取用于执行与这种句法或语义信息相类似功能的数据。

因此，在本实施例中，对由上述扩展程序220从所标记的源和目标翻译文本产生的数据范例进行了处理，以导出对在翻译过程中所允许的头节点和子节点翻译单元组合的限制。

推理限制

因此，在本实施例中，由扩展程序220来扩展限制。

参照图21，在步骤802中，扩展程序220使翻译器程序230对存储在文件224、226中的源和目标语言范例文本执行操作。

在翻译设备仅单向地进行操作(即，从源语言到目标语言)的情况下，只需对源语言范例文本进行操作，但是应该清楚，在双向翻译系统中，如在本实施例中，也在其它方向上执行了处理。

在步骤804中，选择了多个译文(对于每个句子可能有几个竞争的译文)中的一个，并且将其与全部目标范例文本进行了比较。如果在分析操作过程中由翻译系统所产生的源-目标文本对出现在任何范例中(步骤808)，则将该分析添加到“正确”列表中(步骤810)。反之，就将所述分析添加到“不正确”列表中(步骤812)。

如果尚未处理过最后的译文(步骤814)，则在步骤804选择下一译文。然后对于所有源文本范例的所有译文重复所述处理。

下一阶段的目标是消除不正确的范例文本分析。

相应地，参照图22，选择来自由图21的处理所产生的列表中的每个不正确分析(步骤822)，接着在步骤824，遍历源分析字面结构图(树)和源分析依赖关系结构，以产生在所述结构中找到的头节点和子节点对的分离列表。结果得到了对于源和目标文本的字面头/子节点对的列表、和依赖头/子节点对的列表(共用于两种语言)。这三个列表通常是不同的，因为如上所指出的那样，字面和依赖子节点对于许多翻译单元来说都是不一致的。

对于每个分析都重复该处理，直到完成了最后一个分析(步骤826)。

在对每个不正确分析编辑了字面和依赖头/子节点对集后，在步骤828中，选择头/子节点对的一子集，以使该子集是将去除最大量(优选地，全部)不正确分析的最小集合。

当把原图分成翻译组成部分时，将对每一个来存储占据子节点位置的组成部分的identity。为了避免消除实际存在于注释过的源-目标范例中的任何头/子节点对，从对列表中去除了这些原始的组合。

最佳化程序反复进行迭代，来确定不在原始范例中的头/子节点对的子集的效果，由此来执行发现要禁用的头/子节点对的最小子集的处理，该最小子集将消除最大量的不正确分析。

例如，可以通过选择在最多的不正确译文中的头/子节点对并消除它们来执行上述处理；然后，在剩下的译文中，选择出现次数最多的头/子节点对并消除它们；以此类推，或者，在某些情况下，可以使用“强力”最佳化方法。

因此，该步骤的成果是不能组合的成对头单词和子单词的三个列表(一个用于源表达，一个用于目标表达，一个用于公共的依赖关系表达)。

这样，在该阶段，可以存储这些列表以备接下来在翻译中使用，从而在翻译的分析阶段，就不对相对的组合进行尝试，因此，通过减少可能的另选分析的数目而减少了分析所花的时间，并且消除了不正确的分析。

不过，当在步骤830中发现并标记禁用的对时，接下来，优选的是，归纳对能够在对于超出存储在范例文件224中的、至今未见得源文本的竞争分析之间进行选择的头/子节点配对的限制。

为此，需要一条能够从所有可能的归纳中选择“最佳”归纳的原则。根据本实施例，优选的归纳是最简单的(在某种意义上)并且与范例数据保持连贯的归纳。

这通过如下步骤来实现：将一数据结构与每个翻译单元和每个对齐的子节点关联起来；在本实施例中，该数据结构是属性值矩阵(这通常用来表征语言学术语)，也可以使用其它的结构。

如果所关联的数据结构在某种意义上“匹配”(例如，由PROLOG联合来测试)，那么一个对齐的子节点可以仅支配一个翻译单元。

通过选择以最小化产生于原始翻译范例相连贯的译文所需的不同属性值矩阵的数目，来归纳出所述限制。如果可以统一头节点和子节点属性值矩阵，则在翻译过程中一子节点可以只选择一个特定头节点。如果并且仅仅如果两个翻译单元不能连接到的翻译单元的集合是一致的，则该两个翻译单元可以共享相同的属性值矩阵。因此，为了最小化属性值矩阵的数目，希望最小化子节点不能连接到的头节点的不同集合的数目，并且最小化头节点不能连接到的子节点的不同集合的数目。因此，目标在于添加其它的不合理头/子节点对以减少这种不同集合的数目。

因此，在下面的处理中，遵循以下原则：在第一头节点不能与第一子节点集相组合、第二头节点不能与第二子节点集相组合、并且在所述两个子节点列表之间存在高度的重合的情况下，那么所述两个头节点有可能在语言学上行为类似，并且因此，防止每个头节点与另一头节点不能组合的所有子节点相组合是合适的。

对于每个子节点不能组合的头节点的集合也完全一样。这样的效果就是强迫类似的头节点行为一致，类似的的子节点行为一致，由此减少了不同行为的数目，并且从受限的翻译范例集中归纳出了行为。

参照图23a，在步骤832中，查找不合理头/子节点对的集合内的第一头节点(对于字面集合和依赖关系集合都执行所述处理，但是为清楚起见这里只描述一个处理)。与所述集合中的头节点的所有其它实例一起出现的子节点被集中到针对该头节点的不合理子节点集中(步骤834)。

当已对所述集合中的每个不同头节点重复了所述操作时(步骤836)，接着在步骤842中，从不合理对的集合中选择第一子节点，并且(类似地)把与所述不合理对的集合中的子节点的所有实例一起出现的相应头节点汇编成针对该子节点的不合理头节点集(步骤844)。当汇编完所有的子节点和头节点集(既针对字面对列表又针对依赖关系对列表)时(步骤846)，处理进展到图23b的步骤852。

在步骤852中，将头节点集(每个头节点具有一个可以与其相组合的子节点集)分成多个子集。将具有一致的子节点集的所有头节点归到一组并一起存储这些头节点以形成一子集。结果得到了与头节点的不同行为的数目相对应的多个子集。

在步骤854中，对于多个子节点的集合重复相同的处理，以便将该多个子节点分成具有相同头节点集的组。

接下来，在步骤856中，确定所有的头节点和子节点子集彼此是否充分地不相似。例如，如果没有子集具有任何与另一子集共有的子节点，就认为它们是不相似的。在这种情况下(步骤856)，结束所述处理。

另外，找到了两个具有最相似子节点集(即，最大量的子节点是公共的——最大的交集)的头节点子集(步骤857)。类似地，在步骤858，找到了两个最相似的子节点子集(通过它们所共有的头节点的数目来测度)。

在步骤859，测试是否允许所述两个头节点集合所述两个子节点集的合并。除非合并将使范例文本中所出现的头节和子节点的组合不合理(并且因此禁止有效的译文)，否则就允许合并。如果不允许，则查找下一最相似的集合(步骤857、858)。

如果允许合并，那么(步骤860)就合并两个头节点集合，并且合并后的子集的所有头节点的子节点集就变成两个先前子集的子节点集的并集(即，每个头节点都从两个子集继承了所有子节点)。类似地，合并所述两个子节点集，并且对于每个字节点的头节点集就变成了所述两个先前的头节点集合的并集。

然后，处理返回到步骤856，直到所得子集是正交的为止(即，在它们的列表中不共用公共的成员)。在此，处理结束，并且组合所得的子集，以产生翻译中不能组合的头/子节点对的最终集合。

然后将此存储在规则数据库232中，并且再随后的译文中加以应用，以限制在分析过程中被选定来与每个子节点相联合的头节点。如上所述，对于字面表达和依赖关系表达保持分离集合。

这样，如最后所述，本实施例简化并且归纳了翻译组成部分所表现出来的行为。前述归纳实施例是通过操作来扩展可能翻译单元的范围，本实施例所不同的是，通过归纳对翻译单元组合的限制，进行操作来限制可以产生的合理译文的范围。

应该明白，第三实施例的方法不同于本领域内的前述工作，后者是通过推理约束来消除对训练范例文本的不正确的再译的

结论

本发明在其各个实施例中提供了一种翻译系统，该翻译系统不需要手写语言学规则，而是能够根据范例集学习翻译规则，所述范例是由人工使用用户接口标记出来的。然后对标记出的范例进行预处理，以归纳所述翻译，并且对可能另外产生的不合文法的翻译另选形式的数目进行限制。

限制和归纳范例都依赖于这样的原则：使用与所述范例数据相一致的最简单的模型。

在简单的句型分析程序与PROLOG语言或类似语言的联合特征相结合时可以直接执行翻译的情况下，所用的形式将导致模仿了正常语法或逻辑规则的多个翻译单元。

本发明的多个实施例可以分开使用，但是优选地是一起使用。

尽管已经说明了包括扩展程序220和翻译程序230的装置，应该清楚的是，可将这两个程序设为分离的装置，扩展装置用于扩展随后可在多个不同的翻译装置中使用的翻译数据。尽管已经对装置进行了说明，不过显而易见的是，通过如下方式将容易地实现所述程序：提供包含用于执行扩展过程的程序的盘，和/或用于执行翻译过程的程序的盘。所述程序可以与翻译数据分开提供，并且可以被提供为诸如盘的记录载体上的数据结构。另选地，可以采用电子方式，例如通过经由因特网从Web服务器下载，来提供程序和数据。

比较方便的是，连同由译员所做的翻译工作的翻译存储器一起提供本发明以备使用，以便本发明能够使用所述存储器中的文件来扩展翻译数据。

可以期望的是，提供一种语言预处理器和后处理器程序，用于检测源文本中的专有名称、数字和日期，并将它们正确地转换成目标文本。

尽管针对机器翻译的应用对本发明进行了说明，但是并不排除在自然语言处理中的其它应用，例如，在源文本语法检查方面的应用，或者在向计算机提供自然语言输入方面的应用。尽管已经针对文本输入和输出进行了说明，不过也可提供一种具有语音到文本和/或文本到语音接口的翻译设置，以使可以进行语音输入和/或文本输出。

尽管已对具体的实施例进行了说明，不过应该清楚的是，可以进行许多其它的变型和修改。本发明将包括对于熟练的读者显而易见的任何和所有这种变型、和修改及替换，不管这些变型、和修改及替换是否被所附权利要求所覆盖。为了避免怀疑，请求对任何和所有新的主题及其组合的保护。

除非根据语境清楚地需要其它意思，否则，贯穿说明书和权利要求，单词“包括(comprise)”等都被解释为与排除或穷尽的意义相对的包括的意义，即，被解释为“包括，但不限于”。

贯穿说明书中的任何对现有技术的讨论都决不应被视为承认这种现有技术是广泛公知的或者构成了部分本领域内的公共知识。

Claims

1.一种计算机自然语言翻译系统，其包括：

计算机实施的输入装置，用于输入源语言文本；

计算机实施的输出装置，用于输出目标语言文本；

计算机实施的转换装置，用于使用所存储的根据源语言文本和对应的目标语言文本的范例生成的翻译数据从所述源语言文本生成所述目标语言文本，

该计算机实施的转换装置的特征在于所述存储的翻译数据包括多个翻译单元，每一个翻译单元包括：

表示所述源语言和目标语言的语言单元的出现顺序的各自的表面数据；

与所述源语言和目标语言的所述语言单元之间的语义关系相关的各自的依赖关系数据；以及

所述源语言的语言单元的依赖关系数据与所述目标语言的语言单元的对应依赖关系数据对准，

所述计算机实施的转换装置的特征还在于所述计算机实施的转换装置包括：

分析装置，其使用所述源语言的所述表面数据分析所述源语言文本；

生成装置，其使用所述目标语言的所述表面数据生成所述目标语言文本；以及

变换装置，其使用所述依赖关系数据将所述源文本的分析变换为所述目标语言的分析。

2.根据权利要求1的系统，其中，对于某些所述翻译单元，所述表面语言单元的数量与对应的所述依赖关系语言单元的数量不同。

3.根据权利要求1的系统，其中对于每一个所述翻译单元，所述表面数据和所述依赖关系数据对于每一种语言分别包括一头语言单元以及用于存储多个子语言单元的数据结构，这些子语言单元各链接到所述头语言单元。

4.根据权利要求3的系统，其中所述语言单元包括用于定义单词的恒定数据。

5.根据权利要求3或权利要求4的系统，其中所述语言单元包括位置标志符变量。

6.根据权利要求1的系统，其中所述翻译单元包括可以以图的方式表示的数据，根据该数据可以构造所述源语言分析。

7.根据权利要求6的系统，其中所述转换装置被设置为用来尝试使用所述表面数据生成源表面分析图，以及使用所述依赖关系数据生成源依赖关系图。

8.根据权利要求6或权利要求7的系统，其中所述转换装置被设置为用来尝试使用所述依赖关系数据生成目标依赖关系图，以及使用所述表面数据生成目标表面分析图。

9.根据权利要求6的系统，其中所述表面数据是下述的数据：所述表面图或每一个所述表面图被约束为具有树结构。

10.根据权利要求9的系统，其中所述树是平面树。

11.根据权利要求9或权利要求10的系统，其中所述依赖关系数据是下述的数据：所述依赖关系图或每一个所述依赖关系图未被约束为具有平面树结构。

12.根据权利要求1的系统，其中所述源语言的多个语言单元的所述依赖关系数据与所述目标语言的多个语言单元的对应依赖关系数据的对准关系包括在单个配对记录中把对应的所述多个源语言单元和目标语言单元进行配对。

13.一种计算机自然语言翻译方法，该方法包括以下步骤：

输入源语言文本；

转换步骤，用于使用所存储的根据源语言文本和对应的目标语言文本的范例生成的翻译数据从所述源语言文本生成所述目标语言文本；以及

输出目标语言文本，

其中，所述存储的翻译数据包括多个翻译单元，每一个翻译单元包括：

所述源语言的语言单元的依赖关系数据与所述目标语言的语言单元的对应依赖关系数据对准，并且

其中，所述转换步骤包括：

使用所述源语言的所述表面数据分析所述源语言文本；

使用所述依赖关系数据将所述源文本的分析变换为所述目标语言的分析；以及

使用所述目标语言的所述表面数据生成所述目标语言文本。