CN101981566B - 语言内统计机器翻译 - Google Patents

语言内统计机器翻译 Download PDF

Info

Publication number
CN101981566B
CN101981566B CN200980112180.XA CN200980112180A CN101981566B CN 101981566 B CN101981566 B CN 101981566B CN 200980112180 A CN200980112180 A CN 200980112180A CN 101981566 B CN101981566 B CN 101981566B
Authority
CN
China
Prior art keywords
language
model
phrase
translation
translation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980112180.XA
Other languages
English (en)
Other versions
CN101981566A (zh
Inventor
X·李
Y·菊
G·茨威格
A·埃西罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101981566A publication Critical patent/CN101981566A/zh
Application granted granted Critical
Publication of CN101981566B publication Critical patent/CN101981566B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Abstract

可提供训练数据,该训练数据包括源短语和目标短语对。这些对可用于训练语言内统计机器翻译模型,其中该语言内统计机器学习模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给搜索引擎的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。

Description

语言内统计机器翻译
背景
基于网络的搜索服务、因特网搜索引擎、语音搜索、本地搜索、以及用于搜索和检索信息的各种其他技术已变得对于帮助人们找到信息越来越重要。语音搜索涉及语音识别与信息检索的耦合。说出的短语被自动识别为文本,并且该文本作为查询提交给搜索服务。例如,一个人可使用配备语音搜索应用程序的移动电话,通过将餐馆名称说到移动设备中来找到餐馆,并且该移动设备可识别说出的餐馆名称(即,将其转换成文本)并将餐馆名称的文本传送到诸如商家目录等远程搜索服务。本地搜索是一种特殊搜索情况,其中已经使用了商家设施、企业、组织或其他实体的列表以使移动设备能够搜索它们。考虑以下示例:
用户可能对找到关于作为“Kung Ho Cuisine of China(更好小馆)”列在目录中的商家的信息感兴趣。然而,该用户将查询制定为“Kung Ho Restaurant(更好餐厅)”。当前,对该列表的搜索将不利用查询和列表形式的各部分之间的统计并行。此外,错误的列表,例如“Kung Ho Grocery(更好杂货店)”可作为相关匹配而返回。
以下讨论涉及用于语音识别、搜索和其他技术的统计语言内机器翻译及其应用的技术。
概述
以下概述仅是为了介绍在以下详细描述中讨论的某些概念而包括的。本概述并不是全面的,并且不旨在描绘所要求保护的主题的范围,该范围由所附的权利要求书来阐明。
可以提供训练数据。该训练数据可包括源短语和目标短语对。这些对可用于训练语言内统计机器翻译模型,其中该语言内统计机器学习模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给搜索引擎的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。
许多附带特征将参考以下的详细描述并结合附图考虑以在下文解释。
附图简述
根据附图阅读以下详细描述,将更好地理解本发明,其中在所附描述中使用相同的附图标记来指代相同的部分。
图1示出了用于语言内统计机器翻译的一般过程。
图2示出了用于构建基于n元语法的模型的过程。
图3示出了用于使用统计翻译模型来改进搜索系统和/或语音识别系统的语言模型的安排。
详细描述
概览
以下描述涵盖涉及使用统计机器翻译模型来在相同的人来语言的句子或短语之间进行翻译的实施例。本说明书从对如何使用相对较小的训练句子或短语集来训练统计翻译模型的讨论开始。然后描述语言内机器翻译模型的应用,包括搜索、自动语音识别(ASR)以及语音识别结果显示的应用。
语言内统计机器翻译模型
统计模型已经用于将句子从一种语言翻译成另一种语言。然而,未训练这些模型或未使用这些模型来在相同语言的短语或句子之间进行翻译。即,统计建模先前未用于将例如英语短语翻译成也是英语的在语义上类似的短语。
统计翻译模型是某一文本样本的一般化,该文本样本可以是诸如查询串和对应的目录列表等并行短语。某些类型的统计翻译模型给出目标句子或短语是源句子或短语的翻译的概率,并且这些概率反映从训练文本导出的统计模式。实际上,该模型是从训练句子的统计度量反映出的特性或趋势的概率性一般化。注意,贯穿本说明书,术语“句子”和“短语”将可互换地用来指相对较短的单词排列。商家的正式和非正式名称、用户输入的查询串、语法句子、从句等是句子或短语的示例。还注意,虽然本说明书讨论如适用于基于短语的搜索(尤其是语音和/或地理位置搜索)的语言内统计机器翻译,但概念不限于这些搜索应用。此外,较短短语的搜索列表也适用于除本地搜索之外的其他类型的搜索,包括产品搜索、职位搜索等。
图1示出了用于语言内统计机器翻译的一般过程。最初,训练100统计机器翻译模型。训练100将在稍后详细描述。训练100使用可来自各种源的训练数据样本来执行。该训练数据将包括相同人类语言的并行(成对)短语。训练100将可用于计算短语的候选翻译的概率或可能性的统计数据(例如,n元语法)通知给翻译模型。对基于n元语法的模型的特定训练100将在下文中描述。
在训练100模型后,使用该模型来将源短语翻译102成目标短语。翻译102涉及从源短语开始并获取语义上类似或等价的目标短语。例如,源短语“Kung Ho Cuisine of China”可能被翻译成目标短语“Kung Ho ChineseRestaurant(更好中国餐馆)”或“Kung Ho Restaurant”。获取不同形式的候选目标短语。该统计翻译模型用于找出一个或多个最有可能的候选目标短语。考虑以下对基于语音的搜索以及该搜索如何与语言内机器翻译相关的概览。
语音搜索系统可涉及两个组件:语音识别组件和信息检索(搜索)组件。说出的话语o使用自动语音识别(ASR)来转换成文本查询q,即
q x = arg max Q p ( o | q ) p ( q ) - - - ( 1 )
其中p(o|q)和p(q)分别表示声学模型和语言模型(LM)。统计LM(例如,n元语法模型)经常用于允许用户能说什么方面的灵活性。即,这些模型允许ASR组件识别各种言语。接着,最佳(或n个最佳)q被传递至搜索引擎以检索最相关的文档d,即
d x = arg max Q p ( d | q ) - - - ( 2 )
在本地搜索的上下文中,文档d可具有商家列表的形式(商家、组织或其他实体的名称),该列表通常较短,例如“Kung Ho Cuisine of China”。
给定该用于基于语音的搜索的框架,因为列表和查询都相对较短,所以它们被视作类似于在双语翻译训练中找到的“句子对”的对。可使用适于语言内翻译的双语统计翻译模型来自动将原始形式的列表自动转换成其查询形式(即,用户可能期望在搜索列表时输入的形式),进而可使用该查询形式来构建更稳健的LM以便进行语音搜索、语法检查或其他应用。方便地,统计翻译模型可使用少量转录或人工产生的查询来训练,而不必获取匹配列表。虽然各种类型的统计模型可用于机器翻译,但接下来将描述基于n元语法的模型。
尽管查询短语及其预期列表短语在形式上可以不同,但在这两个短语之间通常存在单词级语义对应性。换言之,查询中的单词可以映射到列表中的单词或空单词,反之亦然。机器翻译方法可用于预测列表的查询形式,并且然后利用所预测的查询形式来改进语言建模。具体而言,如下文中所讨论的,可对单词对使用n元语法来对列表和查询的联合(条件)概率建模。
图2示出了用于构建基于n元的模型的过程。接收120相同人类语言的源句子和目标句子对。通过计算这两个句子之间的编辑距离来获取122源句子和目标句子之间的对齐。然后将对齐的句子的单词和/或短语配对124并将其视作语义单元。配对可通过找出在语义/字面上相似/等价的单词或短语来形成。然后使用这些配对来训练126n元语法模型。可针对不同的源句子和目标句子重复该过程的各个步骤。虽然较小的训练句子集对于某些应用可能足够,但使用更多训练数据将创建更稳健的模型。还注意,对齐和n元语法模型可以在最大似然的意义上迭代地更新和细化。
现在将描述生成基于n元语法的模型的细节。为了训练100基于n元语法的模型,提供初始训练数据。这些数据可以是并行文本(d,q)的主体,其中列表d和查询q分别用作源句子和目标句子。句子d和q可以单调对齐,其中在必要时添加空单词以解决出现在对齐中的插入或删除。该单调对齐将被表示为a。注意,在另一实施例中,可使用非单调对齐。
一旦对齐,就生成来自d和q的单词对序列,其被表示为(d,q,a)=((d1,q1),(d2,q2),...,(dL,qL)),其中(di,qi)被视作单个语义单元。可以在必要时合并连续单词对以形成短语对。
然后可使用单词对序列来训练n元语法模型。因此,如下计算对齐句子对的概率
Π i p M ( d , q , a ) = p ( ( d i , q i ) | ( d i - n + 1 , q i - n + 1 ) , . . . , ( d i - 1 , q i - 1 ) ) - - - ( 3 )
其中M表示单调条件。注意,初始对齐a可使用d和q之间的Levenshtein距离来计算。该对齐和n元语法模型的参数可以在最大似然的意义上更新。重新对齐可基于例如配对频率。
给定经训练的n元语法模型,可执行列表到查询翻译。给定列表形式d并且给定查询形式q(来自稍后讨论的解码器),搜索查询形式以找出具有最高条件概率的查询形式:
q x ≈ max Q max Q p M ( d , q , a ) - - - ( 4 )
其中p(d,q,a)使用等式(3)来求值。
该翻译不仅充分利用如由单一语法建模的单词级语义对应性,而且还通过使用更高阶的n元语法来考虑单词上下文。对最佳或n个最佳查询形式的搜索可通过应用最佳优先搜索算法来高效地实现,该算法由Russell和Norvig在Artificial Intelligence:A Modern Approach(人工智能:一种现代方法)(PrenticeHall,2003年第二版)中描述。使用这种类型的搜索,可应用修剪技术以降低计算复杂性。返回到用于语音识别的语言模型(LM),一旦对于列表获取n个最佳查询形式,就可将这些查询形式用作训练句子以便进行LM估算。
要考虑两个实现细节。第一,允许在d中使用空单词在解码时引起潜在问题-搜索空间显著地扩展,因为可以在源句子的任何位置存在或缺少空单词。为了避免该问题,对于qi的各个值优选消除将(di=空单词,qi)用作语义单元。具体而言,在训练时,(di=空单词,qi)可以与其前导或后继语义单元合并,这取决于哪一个短语,qi-1qi还是qiqi+1,在训练数据中具有更多出现次数。然后,(di+1,qi-1qi)或(di+1,qiqi+1)可被视作单个语义单元。在解码时,空单词并非显式地被插入在d中,因为使用语义单元(di-1,qi-1qi)或(di+1,qiqi+1)等价于在源句子中添加空单词。
第二个实现细节关于d中的词汇表外(OOV)单词。当出现OOV时,产生任何查询形式可能不可行,因为对于qi的任何值,p(di=OOV,qi)=0。为了处理这些情况,只要di=OOV,就可将正概率分配给单一语法(di,qi=di)。这暗示如果从未在训练数据中看见列表单词,则将该列表单词翻译成其本身。
应当注意,具有非单调对齐的实施例也是可能的。此外,可使用重排序策略。这可以在单调对齐之前通过在保持q的次序的同时对d进行重新排序来实现。在训练翻译模型时,对源形式中的单词进行重新排序的最佳方式通过计算所得联合n元语法模型可能性来确定。只考虑作为原始次序的移位的次序,并且构建对应于这些次序的最大熵分类器,其中该分类器的输入是源形式,而次序是输出。在翻译之前,应用该分类器来对源形式进行重新排序。
语言内统计翻译模型的应用
图3示出了用于使用统计翻译模型来改进搜索系统和/或语音识别系统的语言模型的安排。搜索引擎152被配置成搜索列表154,例如商家列表。搜索引擎152接收由用户生成并提交给搜索引擎152的文本查询或转录的口头查询156。对应的相关列表158由搜索引擎152来检索。注意,训练对还可通过TF-IDF(项频率-逆文档频率)来用算法获取。
文本或转录查询156和对应的搜索引擎检索到的列表158被传递至训练统计翻译模型162的训练组件160,该训练模型162可以是基于n元语法的模型或另一种类型的模型。如上所述,训练组件160迭代通过转录查询156和列表158的源-目标对。在基于n元语法的模型的情况下,给定(源、目标)对,通过计算编辑距离来在源形式和目标形式之间获取初始单调对齐。给定该对齐,训练组件160发现单词级对并基于这些单词级对来构建n元语法翻译模型162。可迭代地细化该对齐以及翻译模型162的n元语法模型参数以改进翻译模型162。此外,训练可实现补偿策略,该策略假设单词可被翻译成其本身,如对于语言内翻译是可能的。换言之,其中WORD(单词)可以是单词或短语的对齐单元WORD-WORD将具有正概率。
翻译模块164使用翻译模型162来测试已解码优选(可能的翻译)。给定经训练的翻译模型162和源形式,可使用最佳优先搜索算法来获取前n个最佳目标形式(根据翻译模型162具有最高概率的n个已解码目标形式)。每一个目标形式的权重通过翻译模型所产生的p(目标|源)来确定。不太可能可修剪单词级对以加速翻译。
给定翻译模型162和翻译模块164,可如下改进后续搜索。给定用户查询q和搜索引擎152找到的列表d,在测量列表d与用户查询的相关度时考虑列表d的经翻译的查询形式x。令s(,)成为相关度(或相似度)的函数或度量,相关度的度量可以是s(q,d)=sum_x{p(x|d)s(q,x)}。或者,相关度可以直接从翻译列表中测得,在这一情况下s(q,d)=p(q,d)。在一个实施例中,如果可能翻译的相关度度量低于指定阈值,则可以过滤掉这些可能翻译。
此外,不仅可以如上所述的那样改进搜索,而且还可使用语言内翻译来构建或扩充语言模型168。语言模型在诸如ASR、机器翻译和语法分析等许多自然语言处理应用中使用。翻译模型162和翻译模块164所提供的语言内翻译可通过将列表翻译成查询形式并在估算语言模型168时使用相同语言的经翻译的查询形式来在语言建模时使用。在估算语言模型168时,可将经翻译的查询形式的计数设为其后验概率乘以其原始列表计数。
在一个实施例中,基于服务器或客户机的语音识别器可设置有语言模型168,该语言模型168将允许语音识别器对涉及列表154的话语或列表执行更准确且更全面的语音识别。翻译模型162还可以在服务器或移动客户机处用于将在移动设备处输入(无论是通过ASR还是其他方式)的串翻译成显示形式。
结论
以上讨论的实施例和特征都可用储存在易失性或非易失性计算机或设备可读介质中的信息的形式来实现。这被认为至少包括诸如光学存储(例如,CD-ROM)、磁介质、闪速ROM、或存储数字信息的任何现有或未来装置等介质。所存储的信息可采用机器可执行指令(例如,经编译的可执行二进制代码)、源代码、字节代码、或任何其它可用于允许或配置计算机设备来执行上述各实施例的信息的形式。这还被认为至少包括诸如RAM和/或在程序的执行期间存储诸如CPU指令等信息以实现一实施例的虚拟存储器等易失性存储器,以及存储允许程序或可执行代码被加载和执行的信息的非易失性介质。实施例和特征可在任何类型的计算设备上执行,这些计算设备包括便携设备、工作站、服务器、移动无线设备等。以上讨论的模块、组件、过程和搜索引擎152可以在一个计算设备或多个协作计算设备上实现。

Claims (20)

1.一种用于人类语言的短语的语言内机器翻译的计算机实现的方法,所述方法包括:
接收训练数据,所述训练数据包括源短语和目标短语对(120、156、158);
使用训练数据对来训练(100)语言内统计机器翻译模型(160、162),其中所述语言内统计机器翻译模型在被给予所述人类语言的文本输入短语时能够计算所述输入短语与所述人类语言的输入短语的可能翻译在语义上等价的概率(102),所述训练包括:
通过计算编辑距离来在源形式和目标形式之间获取初始单调对齐;
生成来自源短语和目标短语的单词对序列;以及
使用所述单词对序列来训练所述语言内统计机器翻译模型;以及
使用所述统计机器翻译模型来在查询和列表之间进行翻译(164),其中所述查询包括提交给搜索引擎(156)的所述人类语言的文本串,其中所述列表包括将由所述搜索引擎搜索以找出对所述查询串的匹配(158)的真实世界实体的正式名称的文本串。
2.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与用户查询相匹配的列表(158);
通过使用所述翻译模型来将所述列表中的一个翻译成查询形式来生成所述列表中的一个的查询形式(164、166);
使用所述翻译模型来计算所述查询形式与所述用户查询的相关度,并且基于计算出的相关度来确定所述列表不匹配所述用户查询。
3.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与用户查询相匹配的列表(158);
使用所述模型(162)来找出所述列表是所述用户查询的翻译的概率;以及
基于所述概率来确定所述列表是否匹配所述用户查询。
4.如权利要求1所述的方法,其特征在于,所述语言内统计翻译模型包括基于n元语法的翻译模型(126)。
5.如权利要求4所述的方法,其特征在于,所述训练包括重新排列训练对中的所述源短语和/或目标短语以使得所述源短语和目标短语的在语义上等价的单词被对齐(122);以及
迭代地更新所述对齐和所述基于n元语法的翻译模型的参数。
6.如权利要求1所述的方法,其特征在于,还包括使用所述语言内统计翻译模型来生成所述人类语言的语言模型(168),所述语言模型能够确定所述人类语言的串的可能性。
7.如权利要求6所述的方法,其特征在于,所述使用所述语言内统计翻译模型来生成所述语言模型包括:
与来自所述语言内统计翻译模型的语言模型翻译包括在一起。
8.如权利要求6所述的方法,其特征在于,还包括用所述语言模型来执行自动语音识别。
9.如权利要求1所述的方法,其特征在于,查询形式包括提交给搜索引擎(152)的所述人类语言的短语,并且其中列表形式包括可由所述搜索引擎搜索的组织和/或商家的所述人类语言的正式名称。
10.如权利要求9所述的方法,其特征在于,所述使用所述统计机器翻译模型包括计算查询形式和列表形式之间的相关度。
11.如权利要求9所述的方法,其特征在于,给定用户输入的所述人类语言的用户查询(156),给定由所述搜索引擎(152)找到的所述人类语言的对应的列表,并且给定所述列表的一组候选翻译,所述候选翻译也是所述人类语言的,所述使用所述统计机器翻译模型包括计算所述候选翻译的概率。
12.如权利要求11所述的方法,其特征在于,还包括基于计算出的概率来为所述给定用户查询生成搜索结果。
13.如权利要求9所述的方法,其特征在于,还包括基于由所述统计机器翻译模型计算出的概率来生成或修改所述搜索引擎的搜索结果,所述搜索结果对应于用户输入的查询形式。
14.如权利要求13所述的方法,其特征在于,还包括使用所述概率来排列或消除搜索结果。
15.一种用于将人类语言的短语翻译成所述语言的其他短语的方法,所述方法包括:
访问包括所述人类语言的源短语和目标短语对的训练对(120、156、158);
用所述训练对来训练统计机器翻译模型(160),所述统计机器翻译模型能够计算所述人类语言的目标串是所述人类语言的给定源串的有效翻译的概率,所述训练包括:
通过计算编辑距离来在源形式和目标形式之间获取初始单调对齐;
生成来自源短语和目标短语的单词对序列;以及
使用所述单词对序列来训练所述统计机器翻译模型;
接收所述人类语言的文本短语,将所述文本短语解码成所述文本短语的不同候选翻译(102),并使用所述统计机器翻译模型来计算所述候选翻译是所述文本短语的翻译的概率;以及
基于所述概率,由计算机来存储和/或显示所述候选翻译中的一个或多个。
16.如权利要求15所述的方法,其特征在于,所述训练对包括用户提交的与列表配对的查询串,搜索引擎将所述列表与所述查询串进行匹配。
17.如权利要求15所述的方法,其特征在于,所接收到的文本短语包括用户输入的查询串,所述查询串包括所述人类语言的文本,并且所述方法还包括使用所述统计机器翻译模型来标识所述查询串的多个可能的翻译,所述可能的翻译包括所述人类语言的文本。
18.如权利要求15所述的方法,其特征在于,所接收到的文本短语包括从用于搜索商家/组织名称的列表的搜索引擎获取的组织或商家实体的名称,所述名称已根据用户输入的查询来从所述搜索引擎获取,并且其中所述方法还包括使用所述统计机器翻译模型来确定所述名称是所述查询串的有效翻译并基于所述概率来确定所述列表与所述查询的相关度。
19.如权利要求15所述的方法,其特征在于,还包括使用所述统计机器翻译模型来构建所述人类语言的统计语言模型,其中所述统计语言模型提供所述人类语言中的短语的概率。
20.如权利要求15所述的方法,其特征在于,所述方法还包括使用所述统计机器翻译模型来将由语音识别器识别的文本查询翻译成显示形式。
CN200980112180.XA 2008-03-28 2009-02-27 语言内统计机器翻译 Active CN101981566B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/058,328 2008-03-28
US12/058,328 US8615388B2 (en) 2008-03-28 2008-03-28 Intra-language statistical machine translation
PCT/US2009/035389 WO2009120449A1 (en) 2008-03-28 2009-02-27 Intra-language statistical machine translation

Publications (2)

Publication Number Publication Date
CN101981566A CN101981566A (zh) 2011-02-23
CN101981566B true CN101981566B (zh) 2015-04-15

Family

ID=41114273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980112180.XA Active CN101981566B (zh) 2008-03-28 2009-02-27 语言内统计机器翻译

Country Status (5)

Country Link
US (1) US8615388B2 (zh)
EP (1) EP2269148B1 (zh)
KR (1) KR101543992B1 (zh)
CN (1) CN101981566B (zh)
WO (1) WO2009120449A1 (zh)

Families Citing this family (196)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9002869B2 (en) * 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
FR2932942B1 (fr) * 2008-06-23 2011-03-18 Alcatel Lucent Procede de recuperation d'une information depuis un terminal telephonique via un serveur de communication et serveur de communication associe.
US8301437B2 (en) 2008-07-24 2012-10-30 Yahoo! Inc. Tokenization platform
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20100153366A1 (en) * 2008-12-15 2010-06-17 Motorola, Inc. Assigning an indexing weight to a search term
US20100250335A1 (en) * 2009-03-31 2010-09-30 Yahoo! Inc System and method using text features for click prediction of sponsored search advertisements
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
EP2534585A4 (en) * 2010-02-12 2018-01-24 Google LLC Compound splitting
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US20110264437A1 (en) * 2010-04-26 2011-10-27 Honeywell International Inc. System and method for translating an english language message into another language
US20110295897A1 (en) * 2010-06-01 2011-12-01 Microsoft Corporation Query correction probability based on query-correction pairs
US8612205B2 (en) * 2010-06-14 2013-12-17 Xerox Corporation Word alignment method and system for improved vocabulary coverage in statistical machine translation
KR101682207B1 (ko) 2010-08-23 2016-12-12 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US9454962B2 (en) 2011-05-12 2016-09-27 Microsoft Technology Licensing, Llc Sentence simplification for spoken language understanding
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8838434B1 (en) * 2011-07-29 2014-09-16 Nuance Communications, Inc. Bootstrap call router to other languages using selected N-best translations
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US9009148B2 (en) 2011-12-19 2015-04-14 Microsoft Technology Licensing, Llc Clickthrough-based latent semantic model
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9104733B2 (en) * 2012-11-29 2015-08-11 Microsoft Technology Licensing, Llc Web search ranking
US9183197B2 (en) 2012-12-14 2015-11-10 Microsoft Technology Licensing, Llc Language processing resources for automated mobile language translation
CN103092831B (zh) * 2013-01-25 2015-08-19 哈尔滨工业大学 一种用于统计机器翻译的参数调整方法
EP2954514B1 (en) 2013-02-07 2021-03-31 Apple Inc. Voice trigger for a digital assistant
US20140350931A1 (en) * 2013-05-24 2014-11-27 Microsoft Corporation Language model trained using predicted queries from statistical machine translation
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) * 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) * 2014-05-30 2017-09-12 Apple Inc. Predictive text input
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
RU2639684C2 (ru) * 2014-08-29 2017-12-21 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9817808B2 (en) * 2014-09-29 2017-11-14 International Business Machines Corporation Translation using related term pairs
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
WO2016054552A1 (en) * 2014-10-04 2016-04-07 Proz.Com Knowledgebase with work products of service providers and processing thereof
WO2016065327A1 (en) * 2014-10-24 2016-04-28 Google Inc. Neural machine translation systems with rare word processing
US10452786B2 (en) * 2014-12-29 2019-10-22 Paypal, Inc. Use of statistical flow data for machine translations between different languages
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10545958B2 (en) 2015-05-18 2020-01-28 Microsoft Technology Licensing, Llc Language scaling platform for natural language processing systems
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
CN106484681B (zh) 2015-08-25 2019-07-09 阿里巴巴集团控股有限公司 一种生成候选译文的方法、装置及电子设备
CN106484682B (zh) 2015-08-25 2019-06-25 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US9830384B2 (en) 2015-10-29 2017-11-28 International Business Machines Corporation Foreign organization name matching
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
KR102195627B1 (ko) 2015-11-17 2020-12-28 삼성전자주식회사 통역 모델 생성 장치 및 방법과, 자동 통역 장치 및 방법
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
KR102565274B1 (ko) 2016-07-07 2023-08-09 삼성전자주식회사 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치
CN107704456B (zh) * 2016-08-09 2023-08-29 松下知识产权经营株式会社 识别控制方法以及识别控制装置
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN107885716B (zh) 2016-09-29 2020-02-11 腾讯科技(深圳)有限公司 文本识别方法及装置
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
CN108304412B (zh) * 2017-01-13 2022-09-30 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US10803256B2 (en) 2017-12-29 2020-10-13 Paypal, Inc. Systems and methods for translation management
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10747962B1 (en) 2018-03-12 2020-08-18 Amazon Technologies, Inc. Artificial intelligence system using phrase tables to evaluate and improve neural network based machine translation
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
CN112602098A (zh) 2018-05-08 2021-04-02 谷歌有限责任公司 对比序列到序列数据选择器
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN111597800B (zh) * 2019-02-19 2023-12-12 百度在线网络技术(北京)有限公司 同义句的获取方法及装置、设备及存储介质
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US20210209315A1 (en) * 2019-03-29 2021-07-08 Google Llc Direct Speech-to-Speech Translation via Machine Learning
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
CN110147558B (zh) * 2019-05-28 2023-07-25 北京金山数字娱乐科技有限公司 一种翻译语料处理的方法和装置
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11410667B2 (en) 2019-06-28 2022-08-09 Ford Global Technologies, Llc Hierarchical encoder for speech conversion system
CN110852324A (zh) * 2019-08-23 2020-02-28 上海撬动网络科技有限公司 一种基于深度神经网络集装箱箱号检测方法
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
JP7332486B2 (ja) * 2020-01-08 2023-08-23 株式会社東芝 記号列変換装置および記号列変換方法
CN111680527B (zh) * 2020-06-09 2023-09-19 语联网(武汉)信息技术有限公司 基于专属机翻引擎训练的人机共译系统与方法
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991710A (en) * 1997-05-20 1999-11-23 International Business Machines Corporation Statistical translation system with features based on phrases or groups of words
JPH11143877A (ja) * 1997-10-22 1999-05-28 Internatl Business Mach Corp <Ibm> 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム
US20060143007A1 (en) * 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
US6999932B1 (en) * 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
AUPR082400A0 (en) * 2000-10-17 2000-11-09 Telstra R & D Management Pty Ltd An information retrieval system
US6885985B2 (en) 2000-12-18 2005-04-26 Xerox Corporation Terminology translation for unaligned comparable corpora using category based translation probabilities
US6934683B2 (en) * 2001-01-31 2005-08-23 Microsoft Corporation Disambiguation language model
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
US6721728B2 (en) * 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US7295965B2 (en) * 2001-06-29 2007-11-13 Honeywell International Inc. Method and apparatus for determining a measure of similarity between natural language sentences
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US7177814B2 (en) * 2002-02-07 2007-02-13 Sap Aktiengesellschaft Dynamic grammar for voice-enabled applications
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
CN100380373C (zh) * 2002-10-29 2008-04-09 埃里·阿博 知识系统方法和装置
WO2005033909A2 (en) * 2003-10-08 2005-04-14 Any Language Communications Inc. Relationship analysis system and method for semantic disambiguation of natural language
US7593843B2 (en) * 2004-03-30 2009-09-22 Microsoft Corporation Statistical language model for logical form using transfer mappings
US20060036438A1 (en) * 2004-07-13 2006-02-16 Microsoft Corporation Efficient multimodal method to provide input to a computing device
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US7698124B2 (en) * 2004-11-04 2010-04-13 Microsoft Corporaiton Machine translation system incorporating syntactic dependency treelets into a statistical framework
JP2006268375A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳メモリシステム
US7672931B2 (en) * 2005-06-30 2010-03-02 Microsoft Corporation Searching for content using voice search queries
US20070061335A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer Multimodal search query processing
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US7813926B2 (en) * 2006-03-16 2010-10-12 Microsoft Corporation Training system for a speech recognition application
US8943080B2 (en) * 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US7949514B2 (en) * 2007-04-20 2011-05-24 Xerox Corporation Method for building parallel corpora
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9002869B2 (en) * 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Caroline Lavecchia等.Using inter-lingual triggers for machine translation.《8th Annual Conference of the International Speech Communication Association》.2007,1-4. *

Also Published As

Publication number Publication date
KR20100135757A (ko) 2010-12-27
EP2269148B1 (en) 2018-09-05
WO2009120449A1 (en) 2009-10-01
US20090248422A1 (en) 2009-10-01
KR101543992B1 (ko) 2015-08-13
CN101981566A (zh) 2011-02-23
US8615388B2 (en) 2013-12-24
EP2269148A4 (en) 2011-06-29
EP2269148A1 (en) 2011-01-05

Similar Documents

Publication Publication Date Title
CN101981566B (zh) 语言内统计机器翻译
US10346540B2 (en) Self-learning statistical natural language processing for automatic production of virtual personal assistants
US20220214775A1 (en) Method for extracting salient dialog usage from live data
US9330661B2 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
US8560300B2 (en) Error correction using fact repositories
Hahn et al. Comparing stochastic approaches to spoken language understanding in multiple languages
JP5346279B2 (ja) 検索による注釈付与
US8713037B2 (en) Translation system adapted for query translation via a reranking framework
WO2018157789A1 (zh) 一种语音识别的方法、计算机、存储介质以及电子装置
US9336298B2 (en) Dialog-enhanced contextual search query analysis
JP5822432B2 (ja) 機械翻訳の方法およびシステム
US11481387B2 (en) Facet-based conversational search
AU2018250372B2 (en) Method to construct content based on a content repository
US9940355B2 (en) Providing answers to questions having both rankable and probabilistic components
CN111159381B (zh) 数据搜索方法及装置
WO2023033942A1 (en) Efficient index lookup using language-agnostic vectors and context vectors
Zhang et al. Chinese-English mixed text normalization
Timofeev et al. Architecture of Software for Automated Generation of Technical Specifications
Moyal et al. Phonetic Search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150730

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150730

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.