CN101131691B

CN101131691B - 翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法

Info

Publication number: CN101131691B
Application number: CN2007101424398A
Authority: CN
Inventors: 金永吉; 梁成一; 金昌显; 徐英爱; 洪文杓; 崔承权; 李起荣; 权五郁; 卢玧亨; 朴相奎
Original assignee: Electronics and Telecommunications Research Institute ETRI
Current assignee: Electronics and Telecommunications Research Institute ETRI
Priority date: 2006-08-25
Filing date: 2007-08-27
Publication date: 2012-10-24
Anticipated expiration: 2027-08-27
Also published as: KR20080019126A; KR100837358B1; US20080052061A1; US8219382B2; CN101131691A

Abstract

提供了一种使用动态翻译资源的用于隐藏式字幕的领域自适应便携机器翻译设备及其方法。该设备和方法通过自动地识别字幕语句的风格和领域、自动地构建专用翻译模块和知识、并且利用适合于对应的语句的最佳翻译资源执行自动翻译，来相对于各种专门领域改进翻译性能。该用于隐藏式字幕的领域自适应便携机器翻译设备不仅对于各种领域的语句表现出改进的翻译性能，而且其还可以通过输入/输出端子自由地与各种媒体设备链接。

Description

翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法

相关申请的交叉引用

本发明要求2006年8月25日提交的韩国专利申请第2006-80921号的优先权和利益，通过引用将该申请的全部内容合并于此。

技术领域

本发明涉及一种使用动态翻译资源用于隐藏式字幕(closed caption)的领域自适应便携机器翻译设备及其方法。更具体地，本发明涉及一种机器翻译设备及其方法，其可以通过动态地构建适合于自动识别的字幕语句的风格和领域的特定的翻译模块和知识，以及利用优化的翻译资源自动地翻译对应的语句，来改进在各个专门领域的翻译性能。

背景技术

虽然已经成功地将日语-韩语/韩语-日语机器翻译系统商业化，但是用于在诸如韩语-英语/英语-韩语以及韩语-汉语/汉语-韩语翻译等的完全不同的样式(heterogeneous pattern)的语言之间的翻译的大多数机器翻译系统只取得了很小的商业成功。其原因在于：虽然翻译性能依赖于要翻译的目标语言和段落而变化，但当在完全不同的样式的语言之间翻译时，机器通常呈现出较差的性能。

近来，通过创建为在特定领域的应用中的语句特性编程的专门的机器翻译系统，而做出尝试以增强输出质量。作为这样的努力的结果，已经以不同程度的成功对用于诸如技术手册领域、专利领域、圣经翻译领域等的部分专门的领域的翻译系统实现了商业化。

具体地，通过卫星TV的广泛传播的推动，存在对于用于隐藏式字幕的机器翻译系统的不断增长的需求，其可通过自动翻译从广播信号中提取的字幕信号而为观众提供选择他/她们的语言的字幕。

这里，隐藏式字幕指从广播站输出的包含字幕信号的图像信号。近来，许多广播公司为听力受损提供这样的隐藏式字幕。1990年，美国要求13英尺或更大的电视机必须具有隐藏式字幕功能，本地电视广播站和CATV公司也正在扩展隐藏式字幕节目。同样，预计继续扩展由CNN、NHK、AFKN提供的外语的隐藏式字幕的节目。

然而，在TV上的隐藏式字幕中，口语风格和书面风格在各种类型中混合，例如，戏剧、文化和时事、娱乐等等、以及新闻。特别地，在新闻中，几乎使用来自所有领域的各种技术术语和表述，因此开发可提供商业规模的高质量输出的用于隐藏式字幕的机器翻译系统存在技术上的困难。

为了克服此技术困难，韩国专利公开第1997-56985号(公开日：1997年7月31日)公开了具有用于翻译隐藏式字幕的功能的TV。该TV将韩语和外语翻译部分分开，从而以观众选择的语言显示字幕数据，因此便利地满足观众的需要。

然而，具有隐藏式字幕功能的TV执行以下处理：从输入广播信号提取字幕数据，将该字幕数据翻译为所选择的语言，接着在TV屏幕上显示翻译的结果。因此，其缺点在于：必须单独购买支持隐藏式字幕的TV，而且当广播信号是从另一媒体设备(例如，卫星机顶盒、视频播放器、DMB终端等)输入时，无法提供字幕功能。

此外，具有隐藏式字幕功能的TV只对字幕数据执行翻译，因此对于口语风格、书面风格的语句、以及在有字幕的节目中处理的各种技术领域中使用的语句，其不能提供高输出质量。

例如，在新闻中，通常将“die”用作意思为“停止生命”的动词，但在科学领域中，最经常地将“die”用作意思为“模具”的名词。因此，如果在科学领域字幕中将“die”误翻译为意思为“停止生命”的动词，这是因为翻译是在没有考虑应用领域的情况下执行的。

也就是说，因为具有翻译隐藏式字幕的功能的TV将相同的翻译模块和知识作为一个整体应用于所有的领域，因此当输入各种风格和技术的语句时，显然翻译质量将会降级。

因此，进行了许多考虑技术领域而改进翻译质量的尝试。代表性的方法是用户自适应机器翻译方法，其中校正翻译的结果中的错误，将校正的结果存储为补充的翻译知识，并在下次自动应用该翻译知识，借此改进相似输入语句的翻译质量。

作为上述的用户自适应机器翻译方法，通常使用基于翻译存储器的自适应翻译方法，其中用户添加他/她自己的翻译词典，或手动注册基于样式的翻译集(corpus)，并接着将结果应用于语句翻译。

韩国专利公开第2004-0111188号(公开日：2004年12月31日)公开了一种相关的、传统的自适应机器翻译方法。在韩国专利公开第2004-0111188号中公开的自适应机器翻译方法通过防止重复错误而改进翻译质量。这通过机器翻译系统的用户直接校正错误、将校正的结果转换为系统的输入知识格式、并接着将转换的结果再次应用于翻译系统来完成。

然而在上面的方法中，用户必须持续地校对，校正大量的机器翻译的文档。小规模的校对对于改进各种领域的文档的机器翻译性能是无效的。

同样，自适应机器翻译方法使用数据驱动的机器翻译引擎，以避免翻译数据或规则的冲突。在此情况下，由于存在对于添加逐词翻译校正知识以改进翻译性能的限制，需要从大量翻译知识建立的单独的统计数据库。

因此，为了使用于隐藏式字幕的便携机器翻译系统商业化，需要通过自动识别目标领域和风格以及构建专门的翻译环境来改进翻译性能，并且使得能够与各种类型的媒体设备链接。

发明内容

本发明针对提供一种用于隐藏式字幕的领域自适应便携机器翻译设备及其方法，其能够通过自动识别字幕的风格和领域，动态地构建专用翻译模块和知识，并且利用优化的翻译资源自动翻译相应的语句，来相对于各种专门领域改进翻译性能。

本发明还针对提供一种用于隐藏式字幕的领域自适应便携机器翻译设备及其方法，其可以独立于其它媒体设备(诸如连接到因特网的PC、卫星TV的机顶盒、有线TV、视频播放器、USB盘等等)工作，也可以通过输入/输出端子不受限制地与这样的媒体设备链接。

本发明的一方面提供了一种用于隐藏式字幕的领域自适应便携机器翻译设备，包括：关键词提取部件，提取用于识别输入广播信号中的字幕语句的风格和领域的关键词；风格和领域识别部件，基于提取的关键词、预构建的谓语结束/风格统计词典和预构建的词汇/领域统计词典识别字幕语句的风格和领域；动态翻译知识构建部件，基于识别的风格和领域动态地构建翻译知识，随后将结果载入到主存储器的动态翻译DB中；动态翻译模块构建部件，基于识别的风格和领域动态地构建翻译模块；语素(morpheme)分析部件，在动态翻译模块构建部件的控制下分析字幕语句的语素；语句样式应用部件，通过在动态翻译模块构建部件的控制下将语句样式应用到字幕语句，来执行逐句翻译；语法分析部件，在动态翻译模块构建部件的控制下分析字幕语句的语法；以及基于样式的翻译生成部件，基于语法分析结果产生基于样式的字幕语句的翻译。

本发明的另一方面提供了一种用于隐藏式字幕的领域自适应便携机器翻译设备的翻译方法，包括以下步骤：(a)提取用于分析输入广播信号中的字幕语句的风格和领域的关键词；(b)基于提取的关键词、预构建的谓语结束/风格统计词典和预构建的词汇/领域统计词典识别字幕语句的风格和领域；(c)基于识别的风格和领域动态地构建翻译知识，并将该知识载入到主存储器的动态翻译DB中；(d)基于识别的风格和领域动态地构建翻译模块；(e)基于识别的风格和领域分析字幕语句的语素；(f)通过基于识别的风格和领域将语句样式应用到字幕语句，来执行逐句翻译；(g)基于识别的风格和领域分析字幕语句的语法；以及(h)基于语法分析结果产生基于样式的字幕语句的翻译。

附图说明

通过参照附图详细描述本发明的示例实施例，本发明的上面的和其他的目标、特性和优点对于本领域普通技术人员将变得更加显而易见。附图中：

图1是根据本发明的用于隐藏式字幕的领域自适应便携机器翻译设备的结构的框图；以及

图2是图示根据本发明的用于隐藏式字幕的领域自适应便携机器翻译设备的翻译方法的流程图。

具体实施方式

从下面的、如在附图中所示的本发明的示例实施例的更具体的描述，本发明的前述和其它目标、特性和优点将显而易见。

图1是根据本发明的用于隐藏式字幕的领域自适应便携机器翻译设备的结构的框图。

如图1所示，用于隐藏式字幕的领域自适应便携机器翻译设备包括：输入端子IN，用于输入广播信号；语句提取部件101，从通过输入端子IN的输入广播信号提取字幕语句；关键词提取部件102，从由语句提取部件101提取的字幕语句中提取关键词；风格和领域识别部件103，基于提取的关键词、预构建的谓语结束/风格统计词典301和预构建的词汇/领域统计词典302，识别字幕语句的风格和领域；动态翻译知识构建部件104，利用识别的风格和领域动态地构建翻译知识，并将构建的结果载入主存储器的动态翻译DB206；动态翻译模块构建部件105，利用识别的风格和领域动态地重构翻译模块；语素分析部件106，分析字幕语句的语素；语句样式应用部件107，将语句样式应用到字幕语句，从而执行逐句翻译；语法分析部件108，当语句样式应用失败时分析字幕语句的语法；基于样式的翻译生成部件109，产生字幕语句的基于样式的翻译；翻译合并部件110，合并输入广播信号和翻译；以及输出端子OUT，输出在翻译合并部件110中合并的广播信号。

输入端子IN可提供用于输入广播信号的USB端口/视频端子/音频端子/同轴电缆端子，输出端子OUT可包含用于输出广播信号的USB端口/视频端子/音频端子/同轴电缆端子。

语句提取部件101从通过输入端子IN的输入广播信号提取字幕语句，并将提取的结果作为翻译目标语句输出。

同样，当将USB盘连接到USB端口以更新翻译知识并传送控制信号时，翻译提取部件101通过分离USB盘中的控制文件和翻译知识文件，从翻译目标文件中提取要翻译的语句。

这里，控制文件包含稍后动态地构建翻译模块和翻译知识所需的所有信息，例如用户数据、领域数据等等，其中可由控制文件手动地设置用户和领域数据。

而且，在翻译知识文件中，将翻译知识以“补充的词汇/翻译的补充词汇/处理类型(添加/删除/修改)/用户ID”的形式写入，借此可将新的词条(entry)添加到用户词典。

关键词提取部件102参考在主存储器中存储的公用语素分析词典201，分析从语句提取部件101中接收的字幕语句的语素，并从语素分析结果中提取对应于名词或格变化(declinable)的词语的关键词。

风格和领域识别部件103基于从关键词提取部件102中提取的关键词、预构建的谓语结束/风格统计词典301和词汇/领域统计词典302，识别字幕语句的风格和领域。下面将更详细地描述识别风格和领域的方法。

首先，识别风格的方法如下。风格和领域识别部件103通过根据谓语结束/风格统计词典301、将字幕语句的最后一个词语在书面风格中出现的频率与该字幕语句的最后一个词语在口语风格中出现的频率进行比较，来确定字幕语句符合书面风格还是口语风格。

也就是说，谓语结束/风格统计词典301从口语集和书面集的语素分析结果提取谓语结束和语气的频率统计数据，并通过将它们分为{最后一个词语/口语风格频率/书面风格频率}，来存储提取的结果。因此，通过将对应的最后一个词语在口语风格中出现的频率与该对应的最后一个词语在书面风格中出现的频率进行比较，可确定字幕语句的最后一个词语是书面风格还是口语风格。

在本发明的示例实施例中，风格是口语风格和书面风格之一。口语风格分为5个领域：戏剧、脱口秀、娱乐、访谈、以及其它，而书面风格分为3个领域：新闻、教育、以及其它。而且，新闻领域再分为10个子领域：政治、经济、社会、生活和文化、国际、科学、娱乐、体育、天气、以及其它。

其次，识别领域的方法如下。风格和领域识别部件103通过基于预构建的词汇/领域统计词典302，比较提取的关键词在特定领域中的频率，来确定字幕语句的领域。如下地实现用于确定领域的词汇/领域统计词典302。

首先，收集对应于各自领域的培训集，并从其中提取诸如名词和格变化的词语之类的语素词汇。将关于每个术语的领域的提取的数据构建为{对应术语/领域1、频率1/领域2、频率2/.../领域n，频率n}的形式的数据并存储在词汇/领域统计词典302中。

也就是说，由于将一个术语用于许多领域，可通过提取每个术语在每个领域中使用的频率并将其与字幕语句中包含的关键词在特定领域中出现的频率进行比较，来简单地确定字幕语句的领域。

当确定字幕语句的风格和领域时，动态翻译知识构建部件104在将语句以口语风格写入时将口语语素分析词典303载入主存储器的动态翻译DB206，或者在将语句以书面风格写入时将书面语素分析词典304载入主存储器的动态翻译DB206。

而且，在动态翻译知识构建部件104中，将特定用户词典306与在控制信号中包含的用户数据一起载入动态翻译DB206。将预分析的特定领域语境词典305、特定领域技术术语翻译词典307和特定领域词汇/意思同现词典308与识别的领域数据一起载入动态翻译DB206。

也就是说，识别输入字幕语句的风格和领域，接着动态地构建合适的翻译知识，并将其载入动态翻译DB206中，其与使用公用翻译知识的传统系统相比较造成改进的翻译质量。

接着，动态翻译模块构造部件105从风格和领域识别部件103接收字幕语句的风格和领域数据，并借此控制语素分析部件106、语句样式应用部件107、语法分析部件108以及基于样式的翻译生成部件109以适合于所述风格和领域。这就是动态构造翻译模块的意思，如下面将更详细描述的。

语素分析部件106用于通过基于专用于每个风格和领域的启发式(heuristic)规则执行自适应语素分析，以语素为单位标记(tokenize)输入字幕语句。该启发式规则由动态翻译模块构建部件105形成，可包括关于删节的形式、谓语结束等的处理的规则，其适合每个风格和领域。

这里，语素分析部件106基于主要载入到主存储器的公用语素分析词典201和预分析的语素统计词典204、以及载入到主存储器的动态翻译DB206的口语语素分析词典303、书面语素分析词典304、预分析的特定领域语境词典305、用户词典306、特定领域技术术语翻译词典307和特定领域词汇/意思同现词典308，执行语素分析。

下面将讨论语素分析部件106中使用的预分析的语素统计词典204和预分析的特定领域语境词典305的知识格式和例子。

【预分析的语素统计词典】

知识格式：：{对应词语频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域1>...频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域2>...频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域n>}示例1){

176

0.64

0.28

0.08<书面风格/普通>320

0.12

0.85

0.03<书面风格-新闻-体育>123

0.08

0.91

0.01<口语风格-戏剧>}({长度176长/N+为/J0.64长度/N0.28长度/A0.08<书面风格/普通>320长/N+为/J0.12长度/N0.85长度/A0.03<书面风格-新闻-体育>123长/N+为/J0.08长度/N0.91长度/A0.01<口语风格-戏剧>})

【预分析的特定领域语境词典】

知识格式：：{对应词语_左语素词汇1_左语素词汇2_^*_右语素词汇预分析的频率}

示例2

({长度_新_就_*_希望打开/N+为/J3})

示例3

({长度_新_就_^*_测定长度/N2})

如上所述，基于适合输入字幕语句的风格和领域的预分析的语素统计词典204和预分析的特定领域语境词典305执行自适应语素分析。结果，改进了翻译性能。

接着，如果以语素为单位通过语素分析部件106标记字幕语句，语句样式应用部件107基于语句样式词典203执行逐句翻译，所述语句样式词典203基于标记序列(token sequence)以语素为单位被载入主存储器。

这里将每个风格和领域中频繁出现的公用翻译样式存储在语句样式词典203中，因此可执行技术手册、专利文献、广播新闻、以及口语风格的语句中频繁出现的公用表述的高质量翻译。语句样式词典203的示例如下：

【语句样式词典】

示例4)

>从N1报告的通信者N2。

示例5)

>现在，全国大多数地区晴，但大量的云正逐渐从我国的NP1前来。

示例6)

>你什么时候回到NP1？

下面，如果在语句样式词典203中不存在可以以语素为单位应用到标记序列的语句样式，语法分析部件108基于格变化的词语分析字幕语句的语法并产生分析树。

这里，当产生字幕语句的语法分析树时，语法分析部件108基于用于结构分析的特定领域词语同现词典310确定每个语素节点和语法之间的依赖。

用于结构分析的特定领域词语同现词典310的示例如下：

【用于结构分析的特定领域词语同现词典】

知识格式∷{前面的部分讲话(POS)1_后面的POS2_最后一个词语1前面的部分最后一个词语2后面的部分频率1<领域1>频率2<领域2>...频率n<领域n>}

示例7>{如果

5<书面风格-普通>4<书面风格-新闻-经济>2<口语风格-戏剧>}({如果pvg_pvg_那么_就5<书面风格-普通>4<书面风格-新闻-经济>2<口语风格-戏剧>})

示例8>{如果

1<书面风格-普通>2<书面风格-新闻-社会>3<口语风格-戏剧>}({如果pvg_pvg_那么_将1<书面风格-普通>2<书面风格-新闻-社会>3<口语风格-戏剧>})

示例9>{20.5<书面风格-普通>40<书面风格-新闻-体育>32<口语风格-戏剧>}({将_系统_开发20.5<书面风格-普通>40<书面风格-新闻-体育>32<口语风格-戏剧>}

基于样式的翻译生成部件109基于特定领域的谓语短语翻译样式词典309和词汇/意思语境词典205，使用谓语短语的翻译样式，产生字幕语句的基于样式的翻译。特定领域的谓语短语翻译样式词典309和词汇/意思语境词典205的示例如下：

【特定领域谓语短语翻译样式词典】

示例10){

勇气72使用_一种_工具

17<书面风格-普通>使用_一种_工具

74勇气

0<书面风格-科学>}({勇气勇气＾感情72使用_一种_工具＾碗17<书面风格-普通>使用_一种_工具＾碗74勇气＾感情0<书面风格-科学>})

【词汇/意思语境词典】

示例11){

勇气

3}({鼓-起-勇气勇气八感情3})示例12){

使用_一种_工具

2}({将-容器-冷却使用_一种_工具＾碗2})

接着，当在基于样式的翻译生成部件109中产生字幕语句的翻译时，翻译合并部件110合并输入广播信号和翻译并通过输入端子IN输出。

这里，对于隐藏式字幕，合并视频/音频/字幕文本/翻译的字幕文本，将通过USB端口输入的文本文档与翻译的文本文档一起输出。

接着，将从翻译合并部件110输出的广播信号输出到通过输出端子OUT连接的外部媒体设备。

如上所述，将本发明中的用于隐藏式字幕的领域自适应便携机器翻译设备构建为能够独立连接到任何媒体设备，并通过自动识别字幕语句的风格和领域以及构建专门用于风格和领域的翻译知识和模块，来提供最佳的翻译环境。因此，根据这些动态翻译资源的应用，对于诸如技术手册、专利文献、隐藏式字幕、一般文本等等的所有风格和领域，可以执行高质量的专门翻译。

现在将参照附图详细描述用于隐藏式字幕的领域自适应便携机器翻译设备的翻译方法。

为求方便，将假定将用于隐藏式字幕的便携机器翻译设备连接到另一媒体设备(例如，通过输入/输出连接端子，将PC连接到因特网、卫星TV的机顶盒、有线TV、视频播放器、USB盘等等)，来描述本方法。

首先，当通过另一媒体设备将广播信号输入(S210)时，从输入广播信号中提取字幕语句(S220)。

分析提取的字幕语句的语素，并从其中提取对应于名词或格变化的词语的关键词(S230)。

接着，基于提取的关键词、预构建的谓语结束/风格统计词典301和预构建的词汇/领域统计词典302识别字幕语句的风格和领域(步骤S240)。上面参照图1充分描述了识别语句的风格和领域的方法，因此下面将简要描述。

通过根据谓语结束/风格统计词典301，将字幕语句的最后一个词语在口语风格出现的频率与该字幕语句的最后一个词语在书面风格出现的频率进行比较，确定字幕语句是以口语风格还是书面风格写的。接着，通过基于预构建的词汇/领域统计词典302、比较每个领域的关键词的频率，确定字幕语句的领域。

在本发明的示例实施例中，风格是口语或书面之一。将口语风格分为5个领域(戏剧、脱口秀、娱乐、访谈、以及其它)，将书面风格分为3个领域(新闻、教育、以及其它)。将新闻领域再分为10个子领域(政治、经济、社会、生活/文化、国际、科学、娱乐、体育、天气、以及其它)。

同时，如果识别了字幕语句的风格和领域，则基于识别的风格和领域数据动态地构建翻译知识，并将构建的知识载入动态翻译DB206(S250)。下面将详细描述翻译知识的动态构造。

如果以口语风格写入字幕语句，则将口语风格语素分析词典303载入主存储器的动态翻译DB206。但是，如果以书面风格写入字幕语句，则将书面风格语素分析词典304载入动态翻译DB206。

使用识别的领域数据，将预分析的特定领域语境词典305载入动态翻译DB206。

使用用户数据，将特定用户词典306载入动态翻译DB206。

因此，将翻译知识动态地构建为适合于字幕语句的风格和领域，然后载入动态翻译DB206。

结果，与使用公用翻译知识的传统机器翻译系统相比较，增强了翻译质量。

接着，基于识别的风格和领域数据动态地构建翻译模块，然后进行翻译(S260)，下面将更详细地描述这点。

首先，基于专门用于识别的风格和领域的启发式规则执行自适应语素分析，借此以语素为单位标记输入字幕语句(S261)。

这里，在语素分析中，可基于主要载入到主存储器的公用语素分析词典201和预分析的语素统计词典204、以及载入到主存储器的动态翻译DB206的书面风格语素分析词典304、预分析的特定领域语境词典305、用户词典306、特定领域技术术语翻译词典307和特定领域词汇/意思同现词典308，进行分析。启发性规则可包括适合每个风格和领域的规则，诸如删节的形式的处理、谓语结束处理等等。

当以语素为单位标记字幕语句时，基于载入主存储器的语句样式词典203、通过相对于以语素为单位的标记序列应用语句样式，执行逐句翻译(S263)。

这里，将在每个风格和领域中频繁出现的公用的翻译样式存储于语句样式词典203中，借此可执行在技术手册、专利文献、广播新闻以及口语语句中频繁出现的公用表述的高质量翻译。

如果在语句样式词典203中不存在适用于以语素为单位的标记序列的语句样式，则基于格变化词语分析字幕语句的语法，并产生分析树(S265)。

这里，在产生字幕语句的语法分析树时，可基于用于结构分析的特定领域词语同现词典310确定语法和每个语素节点之间的依赖。

在产生了谓语短语的分析树之后，基于特定领域的谓语短语翻译样式词典309和词汇/意思语境词典205、使用谓语短语的翻译样式，将字幕语句翻译为目标语言(S267)。

在产生了字幕语句的翻译之后，将翻译和输入广播信号合并，随后输出到连接的外部媒体设备(S270)。

这里，对于隐藏式字幕，合并视频/音频/字幕文本/翻译的字幕文本，将通过USB端口输入的文本文档和翻译的文本文档一起输出。

如此，根据用于隐藏式字幕的领域自适应便携机器翻译设备的翻译方法，自动识别隐藏式字幕的风格和领域，动态地构建合适的专用翻译模块和知识，借此使用适合于对应的语句的最佳翻译资源来执行自动翻译。因此，可执行各种专门领域中的高质量翻译。

同时，可将上述示例实施例写成存储在计算机可读介质上的、由标准计算机执行的计算机程序。

如上所述，自动识别隐藏式字幕的风格和领域，动态地构建合适的专用翻译模块和知识，借此利用适合于对应的语句的最佳翻译资源来执行自动翻译。因此，可执行各种专门领域中的高质量翻译。

同样，根据本发明，可独立于连接到因特网、卫星TV的机顶盒、有线TV、视频播放机、USB盘等等的PC运行该用于隐藏式字幕的领域自适应便携机器翻译设备，也可以将其通过输入/输出端子自由地链接到这样的媒体设备。

此外，根据本发明，将适合字幕语句的风格和领域的翻译词典载入主存储器以翻译字幕语句。因此，减少了翻译词典存取时间，因此与传统机器翻译系统相比较，可执行高速翻译。

虽然已经参照本发明的特定示例实施例示出和描述了本发明，本领域技术人员将理解：在不偏离由附加的权利要求所限定的本发明的精神和范围的情况下，可在其中做出形式上和细节上的各种变化。

Claims

1.一种用于隐藏式字幕的领域自适应便携机器翻译设备，包括：

关键词提取部件，提取用于识别输入广播信号中的字幕语句的风格和领域的关键词；

风格和领域识别部件，基于所述提取的关键词、预构建的谓语结束/风格统计词典和预构建的词汇/领域统计词典识别所述字幕语句的风格和领域；

动态翻译知识构建部件，基于所述识别的风格和领域动态地构建翻译知识，随后将结果载入到主存储器的动态翻译数据库DB；

动态翻译模块构建部件，基于所述识别的风格和领域动态地构建翻译模块；

语素分析部件，在所述动态翻译模块构建部件的控制下分析所述字幕语句的语素；

语句样式应用部件，通过在所述动态翻译模块构建部件的控制下将语句样式应用到字幕语句，来执行逐句翻译；

语法分析部件，在所述动态翻译模块构建部件的控制下分析所述字幕语句的语法；以及

基于样式的翻译生成部件，基于所述语法分析结果、特定领域的谓语短语翻译样式词典、以及词汇/意思语境词典产生基于样式的所述字幕语句的翻译，

其中所述动态翻译知识构建部件基于所识别的风格数据，将口语语素分析词典或者书面语素分析词典载入所述动态翻译数据库DB，将用户词典载入所述动态翻译数据库DB，以及基于所识别的领域数据，将预分析的特定领域语境词典、特定领域技术术语翻译词典和特定领域词汇/意思同现词典载入所述动态翻译数据库DB，

其中所述动态翻译模块构建部件配置为从所述风格和领域识别部件接收字幕语句的风格和领域数据，并借此控制语素分析部件、语句样式应用部件、语法分析部件以及基于样式的翻译生成部件以适合所述风格和领域。

2.根据权利要求1所述的机器翻译设备，还包括：

输入端子，用于输入所述广播信号；以及

输出端子，用于输出合并的广播信号。

3.根据权利要求1所述的机器翻译设备，还包括：

语句提取部件，从所述输入广播信号提取字幕语句；以及

翻译合并部件，将输入广播信号和通过基于样式的翻译生成部件产生的翻译合并。

4.根据权利要求1所述的机器翻译设备，其中所述风格和领域识别部件通过基于所述谓语结束/风格统计词典，将字幕语句的最后一个词语在所述口语风格中出现的频率与该字幕语句的最后一个词语在所述书面风格中出现的频率进行比较，来确定所述字幕语句符合书面风格还是口语风格。

5.根据权利要求4所述的机器翻译设备，其中所述谓语结束/风格统计词典的知识格式为{最后一个词语/口语风格的频率/书面风格的频率}。

6.根据权利要求1所述的机器翻译设备，其中所述风格和领域识别部件通过基于所述词汇/领域统计词典比较提取的关键词在不同领域中的频率，来确定所述字幕语句的领域。

7.根据权利要求6所述的机器翻译设备，其中所述词汇/领域统计词典的知识格式为{对应术语/领域1，频率1/领域2，频率2/.../领域n，频率n}。

8.根据权利要求1所述的机器翻译设备，其中所述语素分析部件通过基于从适合专门用于所识别的风格和领域的启发式规则、公用语素分析词典、和预分析的语素统计词典、以及通过所述动态翻译知识构建部件载入所述动态翻译DB的口语语素分析词典、书面语素分析词典、和预分析的特定领域语境词典构成的组中选择的至少一个执行语素分析，以语素为单位标记所述字幕语句。

9.根据权利要求8所述的机器翻译设备，其中所述预分析的语素统计词典的知识格式为{对应词语频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域1>频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域2>...频率预分析1概率1频率1预分析2概率2频率2...预分析n概率n频率n<领域n>}。

10.根据权利要求8所述的机器翻译设备，其中所述预分析的特定领域语境词典的知识格式为{对应词语_左语素词汇1_左语素词汇2_*_右语素词汇预分析频率}。

11.根据权利要求1所述的机器翻译设备，其中当不存在适用于所述字幕语句的语句样式时，所述语法分析部件通过基于用于结构分析的特定领域词语同现词典分析所述字幕语句的语法，产生语法分析树。

12.根据权利要求11所述的机器翻译设备，其中用于结构分析的所述特定领域词语同现词典的知识格式为{前面的部分讲话POS_1后面的POS_2最后一个词语1前面的部分_最后一个词语2后面的部分频率1<领域1>频率2<领域2>...频率n<领域n>}。

13.一种用于隐藏式字幕的领域自适应便携机器翻译设备的翻译方法，包括以下步骤：

(a)提取用于识别输入广播信号中的字幕语句的风格和领域的关键词；

(b)基于提取的关键词、预构建的谓语结束/风格统计词典和预构建的词汇/领域统计词典识别字幕语句的风格和领域；

(c)基于所述识别的风格和领域动态地构建翻译知识，并将所述知识载入到主存储器的动态翻译数据库DB中；

(d)基于所识别的风格和领域动态地构建翻译模块；

(e)基于所识别的风格和领域分析所述字幕语句的语素；

(f)通过基于所识别的风格和领域将语句样式应用到所述字幕语句，来执行逐句翻译；

(g)基于所识别的风格和领域分析所述字幕语句的语法；以及

(h)基于所述语法分析结果、特定领域的谓语短语翻译样式词典以及词汇/意思语境词典产生基于样式的所述字幕语句的翻译，

其中所述动态地构建翻译知识步骤包括：基于所识别的风格数据，将口语语素分析词典或者书面语素分析词典载入所述动态翻译数据库DB，将用户词典载入所述动态翻译数据库DB，以及基于所识别的领域数据，将预分析的特定领域语境词典、特定领域技术术语翻译词典和特定领域词汇/意思同现词典载入所述动态翻译数据库DB，

其中所述动态地构建翻译模块步骤包括：从所述风格和领域识别部件接收字幕语句的风格和领域数据，并借此控制语素分析步骤、语句样式应用步骤、语法分析步骤以及基于样式的翻译生成步骤以适合所述风格和领域。

14.根据权利要求13所述的翻译方法，还包括以下步骤：

从输入广播信号提取所述字幕语句，以及

合并所述输入广播信号和通过步骤(h)产生的翻译。

15.根据权利要求13所述的翻译方法，其中步骤(b)包括以下步骤：

通过基于所述谓语结束/风格统计词典，将字幕语句的最后一个词语在口语风格中出现的频率与该字幕语句的最后一个词语在书面风格中出现的频率进行比较，确定字幕语句是以所述书面风格还是所述口语风格写入；以及

通过基于所述词汇/领域统计词典，比较所述提取的关键词在不同领域中的频率，确定所述字幕语句的领域。

16.根据权利要求13所述的翻译方法，其中步骤(e)包括以下步骤：

基于从专门用于所识别的风格和领域的启发式规则、公用语素分析词典、和预分析的语素统计词典、以及载入所述动态翻译DB的所述口语语素分析词典、所述书面语素分析词典、和所述预分析的特定领域语境词典构成的组中的至少一个，通过执行语素分析，以语素为单位标记所述字幕语句。

17.根据权利要求13所述的翻译方法，其中步骤(g)包括以下步骤：当不存在适用于所述字幕语句的语句样式时，

基于用于结构分析的特定领域词语同现词典，分析所述字幕语句的语法；以及

产生语法分析树。