CN101981566A - 语言内统计机器翻译 - Google Patents
语言内统计机器翻译 Download PDFInfo
- Publication number
- CN101981566A CN101981566A CN200980112180XA CN200980112180A CN101981566A CN 101981566 A CN101981566 A CN 101981566A CN 200980112180X A CN200980112180X A CN 200980112180XA CN 200980112180 A CN200980112180 A CN 200980112180A CN 101981566 A CN101981566 A CN 101981566A
- Authority
- CN
- China
- Prior art keywords
- language
- model
- translation
- translation model
- tabulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
可提供训练数据,该训练数据包括源短语和目标短语对。这些对可用于训练语言内统计机器翻译模型,其中该语言内统计机器学习模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给搜索引擎的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。
Description
背景
基于网络的搜索服务、因特网搜索引擎、语音搜索、本地搜索、以及用于搜索和检索信息的各种其他技术已变得对于帮助人们找到信息越来越重要。语音搜索涉及语音识别与信息检索的耦合。说出的短语被自动识别为文本,并且该文本作为查询提交给搜索服务。例如,一个人可使用配备语音搜索应用程序的移动电话,通过将餐馆名称说到移动设备中来找到餐馆,并且该移动设备可识别说出的餐馆名称(即,将其转换成文本)并将餐馆名称的文本传送到诸如商家目录等远程搜索服务。本地搜索是一种特殊搜索情况,其中已经使用了商家设施、企业、组织或其他实体的列表以使移动设备能够搜索它们。考虑以下示例:
用户可能对找到关于作为“Kung Ho Cuisine of China(更好小馆)”列在目录中的商家的信息感兴趣。然而,该用户将查询制定为“Kung Ho Restaurant(更好餐厅)”。当前,对该列表的搜索将不利用查询和列表形式的各部分之间的统计并行。此外,错误的列表,例如“Kung Ho Grocery(更好杂货店)”可作为相关匹配而返回。
以下讨论涉及用于语音识别、搜索和其他技术的统计语言内机器翻译及其应用的技术。
概述
以下概述仅是为了介绍在以下详细描述中讨论的某些概念而包括的。本概述并不是全面的,并且不旨在描绘所要求保护的主题的范围,该范围由所附的权利要求书来阐明。
可以提供训练数据。该训练数据可包括源短语和目标短语对。这些对可用于训练语言内统计机器翻译模型,其中该语言内统计机器学习模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给搜索引擎的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。
许多附带特征将参考以下的详细描述并结合附图考虑以在下文解释。
附图简述
根据附图阅读以下详细描述,将更好地理解本发明,其中在所附描述中使用相同的附图标记来指代相同的部分。
图1示出了用于语言内统计机器翻译的一般过程。
图2示出了用于构建基于n元语法的模型的过程。
图3示出了用于使用统计翻译模型来改进搜索系统和/或语音识别系统的语言模型的安排。
详细描述
概览
以下描述涵盖涉及使用统计机器翻译模型来在相同的人来语言的句子或短语之间进行翻译的实施例。本说明书从对如何使用相对较小的训练句子或短语集来训练统计翻译模型的讨论开始。然后描述语言内机器翻译模型的应用,包括搜索、自动语音识别(ASR)以及语音识别结果显示的应用。
语言内统计机器翻译模型
统计模型已经用于将句子从一种语言翻译成另一种语言。然而,未训练这些模型或未使用这些模型来在相同语言的短语或句子之间进行翻译。即,统计建模先前未用于将例如英语短语翻译成也是英语的在语义上类似的短语。
统计翻译模型是某一文本样本的一般化,该文本样本可以是诸如查询串和对应的目录列表等并行短语。某些类型的统计翻译模型给出目标句子或短语是源句子或短语的翻译的概率,并且这些概率反映从训练文本导出的统计模式。实际上,该模型是从训练句子的统计度量反映出的特性或趋势的概率性一般化。注意,贯穿本说明书,术语“句子”和“短语”将可互换地用来指相对较短的单词排列。商家的正式和非正式名称、用户输入的查询串、语法句子、从句等是句子或短语的示例。还注意,虽然本说明书讨论如适用于基于短语的搜索(尤其是语音和/或地理位置搜索)的语言内统计机器翻译,但概念不限于这些搜索应用。此外,较短短语的搜索列表也适用于除本地搜索之外的其他类型的搜索,包括产品搜索、职位搜索等。
图1示出了用于语言内统计机器翻译的一般过程。最初,训练100统计机器翻译模型。训练100将在稍后详细描述。训练100使用可来自各种源的训练数据样本来执行。该训练数据将包括相同人类语言的并行(成对)短语。训练100将可用于计算短语的候选翻译的概率或可能性的统计数据(例如,n元语法)通知给翻译模型。对基于n元语法的模型的特定训练100将在下文中描述。
在训练100模型后,使用该模型来将源短语翻译102成目标短语。翻译102涉及从源短语开始并获取语义上类似或等价的目标短语。例如,源短语“Kung Ho Cuisine of China”可能被翻译成目标短语“Kung Ho ChineseRestaurant(更好中国餐馆)”或“Kung Ho Restaurant”。获取不同形式的候选目标短语。该统计翻译模型用于找出一个或多个最有可能的候选目标短语。考虑以下对基于语音的搜索以及该搜索如何与语言内机器翻译相关的概览。
语音搜索系统可涉及两个组件:语音识别组件和信息检索(搜索)组件。说出的话语o使用自动语音识别(ASR)来转换成文本查询q,即
其中p(o|q)和p(q)分别表示声学模型和语言模型(LM)。统计LM(例如,n元语法模型)经常用于允许用户能说什么方面的灵活性。即,这些模型允许ASR组件识别各种言语。接着,最佳(或n个最佳)q被传递至搜索引擎以检索最相关的文档d,即
在本地搜索的上下文中,文档d可具有商家列表的形式(商家、组织或其他实体的名称),该列表通常较短,例如“Kung Ho Cuisine of China”。
给定该用于基于语音的搜索的框架,因为列表和查询都相对较短,所以它们被视作类似于在双语翻译训练中找到的“句子对”的对。可使用适于语言内翻译的双语统计翻译模型来自动将原始形式的列表自动转换成其查询形式(即,用户可能期望在搜索列表时输入的形式),进而可使用该查询形式来构建更稳健的LM以便进行语音搜索、语法检查或其他应用。方便地,统计翻译模型可使用少量转录或人工产生的查询来训练,而不必获取匹配列表。虽然各种类型的统计模型可用于机器翻译,但接下来将描述基于n元语法的模型。
尽管查询短语及其预期列表短语在形式上可以不同,但在这两个短语之间通常存在单词级语义对应性。换言之,查询中的单词可以映射到列表中的单词或空单词,反之亦然。机器翻译方法可用于预测列表的查询形式,并且然后利用所预测的查询形式来改进语言建模。具体而言,如下文中所讨论的,可对单词对使用n元语法来对列表和查询的联合(条件)概率建模。
图2示出了用于构建基于n元的模型的过程。接收120相同人类语言的源句子和目标句子对。通过计算这两个句子之间的编辑距离来获取122源句子和目标句子之间的对齐。然后将对齐的句子的单词和/或短语配对124并将其视作语义单元。配对可通过找出在语义/字面上相似/等价的单词或短语来形成。然后使用这些配对来训练126n元语法模型。可针对不同的源句子和目标句子重复该过程的各个步骤。虽然较小的训练句子集对于某些应用可能足够,但使用更多训练数据将创建更稳健的模型。还注意,对齐和n元语法模型可以在最大似然的意义上迭代地更新和细化。
现在将描述生成基于n元语法的模型的细节。为了训练100基于n元语法的模型,提供初始训练数据。这些数据可以是并行文本(d,q)的主体,其中列表d和查询q分别用作源句子和目标句子。句子d和q可以单调对齐,其中在必要时添加空单词以解决出现在对齐中的插入或删除。该单调对齐将被表示为a。注意,在另一实施例中,可使用非单调对齐。
一旦对齐,就生成来自d和q的单词对序列,其被表示为(d,q,a)=((d1,q1),(d2,q2),...,(dL,qL)),其中(di,qi)被视作单个语义单元。可以在必要时合并连续单词对以形成短语对。
然后可使用单词对序列来训练n元语法模型。因此,如下计算对齐句子对的概率
其中M表示单调条件。注意,初始对齐a可使用d和q之间的Levenshtein距离来计算。该对齐和n元语法模型的参数可以在最大似然的意义上更新。重新对齐可基于例如配对频率。
给定经训练的n元语法模型,可执行列表到查询翻译。给定列表形式d并且给定查询形式q(来自稍后讨论的解码器),搜索查询形式以找出具有最高条件概率的查询形式:
其中p(d,q,a)使用等式(3)来求值。
该翻译不仅充分利用如由单一语法建模的单词级语义对应性,而且还通过使用更高阶的n元语法来考虑单词上下文。对最佳或n个最佳查询形式的搜索可通过应用最佳优先搜索算法来高效地实现,该算法由Russell和Norvig在Artificial Intelligence:A Modern Approach(人工智能:一种现代方法)(PrenticeHall,2003年第二版)中描述。使用这种类型的搜索,可应用修剪技术以降低计算复杂性。返回到用于语音识别的语言模型(LM),一旦对于列表获取n个最佳查询形式,就可将这些查询形式用作训练句子以便进行LM估算。
要考虑两个实现细节。第一,允许在d中使用空单词在解码时引起潜在问题-搜索空间显著地扩展,因为可以在源句子的任何位置存在或缺少空单词。为了避免该问题,对于qi的各个值优选消除将(di=空单词,qi)用作语义单元。具体而言,在训练时,(di=空单词,qi)可以与其前导或后继语义单元合并,这取决于哪一个短语,qi-1qi还是qiqi+1,在训练数据中具有更多出现次数。然后,(di+1,qi-1qi)或(di+1,qiqi+1)可被视作单个语义单元。在解码时,空单词并非显式地被插入在d中,因为使用语义单元(di-1,qi-1qi)或(di+1,qiqi+1)等价于在源句子中添加空单词。
第二个实现细节关于d中的词汇表外(OOV)单词。当出现OOV时,产生任何查询形式可能不可行,因为对于qi的任何值,p(di=OOV,qi)=0。为了处理这些情况,只要di=OOV,就可将正概率分配给单一语法(di,qi=di)。这暗示如果从未在训练数据中看见列表单词,则将该列表单词翻译成其本身。
应当注意,具有非单调对齐的实施例也是可能的。此外,可使用重排序策略。这可以在单调对齐之前通过在保持q的次序的同时对d进行重新排序来实现。在训练翻译模型时,对源形式中的单词进行重新排序的最佳方式通过计算所得联合n元语法模型可能性来确定。只考虑作为原始次序的移位的次序,并且构建对应于这些次序的最大熵分类器,其中该分类器的输入是源形式,而次序是输出。在翻译之前,应用该分类器来对源形式进行重新排序。
语言内统计翻译模型的应用
图3示出了用于使用统计翻译模型来改进搜索系统和/或语音识别系统的语言模型的安排。搜索引擎152被配置成搜索列表154,例如商家列表。搜索引擎152接收由用户生成并提交给搜索引擎152的文本查询或转录的口头查询156。对应的相关列表158由搜索引擎152来检索。注意,训练对还可通过TF-IDF(项频率-逆文档频率)来用算法获取。
文本或转录查询156和对应的搜索引擎检索到的列表158被传递至训练统计翻译模型162的训练组件160,该训练模型162可以是基于n元语法的模型或另一种类型的模型。如上所述,训练组件160迭代通过转录查询156和列表158的源-目标对。在基于n元语法的模型的情况下,给定(源、目标)对,通过计算编辑距离来在源形式和目标形式之间获取初始单调对齐。给定该对齐,训练组件160发现单词级对并基于这些单词级对来构建n元语法翻译模型162。可迭代地细化该对齐以及翻译模型162的n元语法模型参数以改进翻译模型162。此外,训练可实现补偿策略,该策略假设单词可被翻译成其本身,如对于语言内翻译是可能的。换言之,其中WORD(单词)可以是单词或短语的对齐单元WORD-WORD将具有正概率。
翻译模块164使用翻译模型162来测试已解码优选(可能的翻译)。给定经训练的翻译模型162和源形式,可使用最佳优先搜索算法来获取前n个最佳目标形式(根据翻译模型162具有最高概率的n个已解码目标形式)。每一个目标形式的权重通过翻译模型所产生的p(目标|源)来确定。不太可能可修剪单词级对以加速翻译。
给定翻译模型162和翻译模块164,可如下改进后续搜索。给定用户查询q和搜索引擎152找到的列表d,在测量列表d与用户查询的相关度时考虑列表d的经翻译的查询形式x。令s(,)成为相关度(或相似度)的函数或度量,相关度的度量可以是s(q,d)=sum_x{p(x|d)s(q,x)}。或者,相关度可以直接从翻译列表中测得,在这一情况下s(q,d)=p(q,d)。在一个实施例中,如果可能翻译的相关度度量低于指定阈值,则可以过滤掉这些可能翻译。
此外,不仅可以如上所述的那样改进搜索,而且还可使用语言内翻译来构建或扩充语言模型168。语言模型在诸如ASR、机器翻译和语法分析等许多自然语言处理应用中使用。翻译模型162和翻译模块164所提供的语言内翻译可通过将列表翻译成查询形式并在估算语言模型168时使用相同语言的经翻译的查询形式来在语言建模时使用。在估算语言模型168时,可将经翻译的查询形式的计数设为其后验概率乘以其原始列表计数。
在一个实施例中,基于服务器或客户机的语音识别器可设置有语言模型168,该语言模型168将允许语音识别器对涉及列表154的话语或列表执行更准确且更全面的语音识别。翻译模型162还可以在服务器或移动客户机处用于将在移动设备处输入(无论是通过ASR还是其他方式)的串翻译成显示形式。
结论
以上讨论的实施例和特征都可用储存在易失性或非易失性计算机或设备可读介质中的信息的形式来实现。这被认为至少包括诸如光学存储(例如,CD-ROM)、磁介质、闪速ROM、或存储数字信息的任何现有或未来装置等介质。所存储的信息可采用机器可执行指令(例如,经编译的可执行二进制代码)、源代码、字节代码、或任何其它可用于允许或配置计算机设备来执行上述各实施例的信息的形式。这还被认为至少包括诸如RAM和/或在程序的执行期间存储诸如CPU指令等信息以实现一实施例的虚拟存储器等易失性存储器,以及存储允许程序或可执行代码被加载和执行的信息的非易失性介质。实施例和特征可在任何类型的计算设备上执行,这些计算设备包括便携设备、工作站、服务器、移动无线设备等。以上讨论的模块、组件、过程和搜索引擎152可以在一个计算设备或多个协作计算设备上实现。
Claims (20)
1.一种用于人类语言的短语的语言内机器翻译的计算机实现的方法,所述方法包括:
接收训练数据,所述训练数据包括源短语和目标短语对(120、156、158);
使用训练数据对来训练(100)语言内统计机器翻译模型(160、162),其中所述语言内统计机器翻译模型在被给予所述人类语言的文本输入短语时能够计算所述输入短语与所述人类语言的输入短语的可能翻译在语义上等价的概率(102);以及
使用所述统计机器翻译模型来在查询和列表之间进行翻译(164),其中所述查询包括提交给搜索引擎(156)的所述人类语言的文本串,其中列表串包括将由所述搜索引擎搜索以找出对所述查询串的匹配(158)的真实世界实体的正式名称的文本串。
2.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与用户查询相匹配的列表(158);
通过使用所述翻译模型来将所述列表中的一个翻译成查询形式来生成所述列表中的一个的查询形式(164、166);
使用所述翻译模型来计算所述查询形式与所述用户查询的相关度,并且基于计算出的相似度来确定所述列表不匹配所述用户查询。
3.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与所述用户查询相匹配的列表(158);
使用所述模型(162)来找出所述列表是所述用户查询的翻译的概率;以及
基于所述概率来确定所述列表是否匹配所述用户查询。
4.如权利要求1所述的方法,其特征在于,所述语言内统计翻译模型包括基于n元语法的翻译模型(126)。
5.如权利要求4所述的方法,其特征在于,所述训练包括重新排列训练对中的所述源短语和/或目标短语以使得所述源短语和目标短语的在语义上等价的单词被对齐(122);以及
迭代地更新所述对齐和所述基于n元语法的翻译模型的参数。
6.如权利要求1所述的方法,其特征在于,还包括使用所述语言内统计翻译模型来生成所述人类语言的语言模型(168),所述语言模型能够确定所述人类语言的串的可能性。
7.如权利要求6所述的方法,其特征在于,所述使用所述语言内统计翻译模型来生成所述语言模型包括与来自所述语言内统计翻译模型的语言模型翻译包括在一起。
8.如权利要求6所述的方法,其特征在于,还包括用所述语言模型来执行自动语音识别。
9.一种或多种存储使计算设备能够执行一种过程的信息的计算机可读介质,所述过程用于将人类语言的短语翻译成所述语言的其他短语,所述过程包括:
访问包括所述人类语言的短语对的训练对(120、156、158);
用所述训练对来训练统计机器翻译模型(160),所述统计机器翻译模型能够计算所述人类语言的目标串是所述人类语言的给定源串的有效翻译的概率;
接收所述人类语言的文本短语,将所述文本短语解码成所述文本短语的不同候选翻译(102),并使用所述统计机器翻译模型来计算所述候选翻译是所述文本短语的翻译的概率;以及
基于所述概率,由计算机来存储和/或显示所述候选翻译中的一个或多个。
10.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所述训练对包括用户提交的与列表配对的查询串,搜索引擎将所述列表与所述查询串进行匹配。
11.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所接收到的文本短语包括用户输入的查询串,所述查询串包括所述人类语言的文本,并且所述过程还包括使用所述统计机器翻译模型来标识所述查询串的多个可能的翻译,所述可能的翻译包括所述人类语言的文本。
12.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所接收到的文本短语包括从用于搜索商家/组织名称的列表的搜索引擎获取的组织或商家实体的名称,所述名称已根据用户输入的查询来从所述搜索引擎获取,并且其中所述过程还包括使用所述统计机器翻译模型来确定所述名称是所述查询串的有效翻译并基于所述概率来确定所述列表与所述查询的相关度。
13.如权利要求9所述的一种或多种计算机可读介质,其特征在于,还包括使用所述统计机器翻译模型来构建所述人类语言的统计语言模型,其中所述统计语言模型提供所述人类语言中的短语的概率。
14.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所述过程还包括使用所述统计机器翻译模型来将由语音识别器识别的文本查询翻译成显示形式。
15.一种由一个或多个计算机执行的方法,所述方法包括:
提供被配置成计算相同人类语言的短语的翻译的概率的统计机器翻译模型(162);以及
使用所述统计机器翻译模型来在组织和/或商家的查询形式和列表形式之间进行翻译,其中所述查询形式包括提交给搜索引擎(152)的所述人类语言的短语,并且其中所述列表形式包括可由所述搜索引擎搜索的组织和/或商家的所述人类语言的正式名称。
16.如权利要求15所述的方法,其特征在于,所述使用所述统计机器翻译模型包括计算查询形式和列表形式之间的相关度。
17.如权利要求15所述的方法,其特征在于,给定用户输入的所述人类语言的用户查询(156),给定由所述搜索引擎(152)找到的所述人类语言的对应的列表,并且给定所述列表的一组候选翻译,所述候选翻译也是所述人类语言的,所述使用所述统计机器翻译模型包括计算所述候选翻译的概率。
18.如权利要求17所述的方法,其特征在于,还包括基于计算出的概率来为所述给定用户查询生成搜索结果。
19.如权利要求15所述的方法,其特征在于,还包括基于由所述统计机器翻译模型计算出的概率来生成或修改所述搜索引擎的搜索结果,所述搜索结果对应于用户输入的查询形式。
20.如权利要求19所述的方法,其特征在于,还包括使用所述概率来排列或消除搜索结果。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/058,328 | 2008-03-28 | ||
US12/058,328 US8615388B2 (en) | 2008-03-28 | 2008-03-28 | Intra-language statistical machine translation |
PCT/US2009/035389 WO2009120449A1 (en) | 2008-03-28 | 2009-02-27 | Intra-language statistical machine translation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101981566A true CN101981566A (zh) | 2011-02-23 |
CN101981566B CN101981566B (zh) | 2015-04-15 |
Family
ID=41114273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980112180.XA Active CN101981566B (zh) | 2008-03-28 | 2009-02-27 | 语言内统计机器翻译 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8615388B2 (zh) |
EP (1) | EP2269148B1 (zh) |
KR (1) | KR101543992B1 (zh) |
CN (1) | CN101981566B (zh) |
WO (1) | WO2009120449A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704456A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 识别控制方法以及识别控制装置 |
CN110147558A (zh) * | 2019-05-28 | 2019-08-20 | 北京金山数字娱乐科技有限公司 | 一种翻译语料处理的方法和装置 |
CN110852324A (zh) * | 2019-08-23 | 2020-02-28 | 上海撬动网络科技有限公司 | 一种基于深度神经网络集装箱箱号检测方法 |
CN112204653A (zh) * | 2019-03-29 | 2021-01-08 | 谷歌有限责任公司 | 通过机器学习的直接的语音到语音翻译 |
Families Citing this family (192)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7904595B2 (en) | 2001-01-18 | 2011-03-08 | Sdl International America Incorporated | Globalization management system and method therefor |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US9002869B2 (en) * | 2007-06-22 | 2015-04-07 | Google Inc. | Machine translation for query expansion |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
FR2932942B1 (fr) * | 2008-06-23 | 2011-03-18 | Alcatel Lucent | Procede de recuperation d'une information depuis un terminal telephonique via un serveur de communication et serveur de communication associe. |
US8301437B2 (en) | 2008-07-24 | 2012-10-30 | Yahoo! Inc. | Tokenization platform |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20100153366A1 (en) * | 2008-12-15 | 2010-06-17 | Motorola, Inc. | Assigning an indexing weight to a search term |
US20100250335A1 (en) * | 2009-03-31 | 2010-09-30 | Yahoo! Inc | System and method using text features for click prediction of sponsored search advertisements |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
EP2534585A4 (en) * | 2010-02-12 | 2018-01-24 | Google LLC | Compound splitting |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US20110264437A1 (en) * | 2010-04-26 | 2011-10-27 | Honeywell International Inc. | System and method for translating an english language message into another language |
US20110295897A1 (en) * | 2010-06-01 | 2011-12-01 | Microsoft Corporation | Query correction probability based on query-correction pairs |
US8612205B2 (en) * | 2010-06-14 | 2013-12-17 | Xerox Corporation | Word alignment method and system for improved vocabulary coverage in statistical machine translation |
KR101682207B1 (ko) | 2010-08-23 | 2016-12-12 | 에스케이플래닛 주식회사 | 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법 |
US9547626B2 (en) | 2011-01-29 | 2017-01-17 | Sdl Plc | Systems, methods, and media for managing ambient adaptability of web applications and web services |
US10657540B2 (en) | 2011-01-29 | 2020-05-19 | Sdl Netherlands B.V. | Systems, methods, and media for web content management |
US10580015B2 (en) | 2011-02-25 | 2020-03-03 | Sdl Netherlands B.V. | Systems, methods, and media for executing and optimizing online marketing initiatives |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9858343B2 (en) | 2011-03-31 | 2018-01-02 | Microsoft Technology Licensing Llc | Personalization of queries, conversations, and searches |
US9454962B2 (en) | 2011-05-12 | 2016-09-27 | Microsoft Technology Licensing, Llc | Sentence simplification for spoken language understanding |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8838434B1 (en) * | 2011-07-29 | 2014-09-16 | Nuance Communications, Inc. | Bootstrap call router to other languages using selected N-best translations |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
US9009148B2 (en) | 2011-12-19 | 2015-04-14 | Microsoft Technology Licensing, Llc | Clickthrough-based latent semantic model |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9773270B2 (en) | 2012-05-11 | 2017-09-26 | Fredhopper B.V. | Method and system for recommending products based on a ranking cocktail |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US11386186B2 (en) | 2012-09-14 | 2022-07-12 | Sdl Netherlands B.V. | External content library connector systems and methods |
US10452740B2 (en) | 2012-09-14 | 2019-10-22 | Sdl Netherlands B.V. | External content libraries |
US11308528B2 (en) | 2012-09-14 | 2022-04-19 | Sdl Netherlands B.V. | Blueprinting of multimedia assets |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
US9104733B2 (en) * | 2012-11-29 | 2015-08-11 | Microsoft Technology Licensing, Llc | Web search ranking |
US9183197B2 (en) | 2012-12-14 | 2015-11-10 | Microsoft Technology Licensing, Llc | Language processing resources for automated mobile language translation |
CN103092831B (zh) * | 2013-01-25 | 2015-08-19 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
EP2954514B1 (en) | 2013-02-07 | 2021-03-31 | Apple Inc. | Voice trigger for a digital assistant |
US20140350931A1 (en) * | 2013-05-24 | 2014-11-27 | Microsoft Corporation | Language model trained using predicted queries from statistical machine translation |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) * | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9760559B2 (en) * | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
RU2639684C2 (ru) * | 2014-08-29 | 2017-12-21 | Общество С Ограниченной Ответственностью "Яндекс" | Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US9817808B2 (en) * | 2014-09-29 | 2017-11-14 | International Business Machines Corporation | Translation using related term pairs |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
WO2016054552A1 (en) * | 2014-10-04 | 2016-04-07 | Proz.Com | Knowledgebase with work products of service providers and processing thereof |
WO2016065327A1 (en) * | 2014-10-24 | 2016-04-28 | Google Inc. | Neural machine translation systems with rare word processing |
US10452786B2 (en) * | 2014-12-29 | 2019-10-22 | Paypal, Inc. | Use of statistical flow data for machine translations between different languages |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10545958B2 (en) | 2015-05-18 | 2020-01-28 | Microsoft Technology Licensing, Llc | Language scaling platform for natural language processing systems |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
CN106484681B (zh) | 2015-08-25 | 2019-07-09 | 阿里巴巴集团控股有限公司 | 一种生成候选译文的方法、装置及电子设备 |
CN106484682B (zh) | 2015-08-25 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 基于统计的机器翻译方法、装置及电子设备 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9830384B2 (en) | 2015-10-29 | 2017-11-28 | International Business Machines Corporation | Foreign organization name matching |
US10614167B2 (en) | 2015-10-30 | 2020-04-07 | Sdl Plc | Translation review workflow systems and methods |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
KR102195627B1 (ko) | 2015-11-17 | 2020-12-28 | 삼성전자주식회사 | 통역 모델 생성 장치 및 방법과, 자동 통역 장치 및 방법 |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
KR102565274B1 (ko) | 2016-07-07 | 2023-08-09 | 삼성전자주식회사 | 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치 |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN107885716B (zh) | 2016-09-29 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 文本识别方法及装置 |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
CN108304412B (zh) * | 2017-01-13 | 2022-09-30 | 北京搜狗科技发展有限公司 | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US10803256B2 (en) | 2017-12-29 | 2020-10-13 | Paypal, Inc. | Systems and methods for translation management |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10747962B1 (en) | 2018-03-12 | 2020-08-18 | Amazon Technologies, Inc. | Artificial intelligence system using phrase tables to evaluate and improve neural network based machine translation |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
CN112602098A (zh) | 2018-05-08 | 2021-04-02 | 谷歌有限责任公司 | 对比序列到序列数据选择器 |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
CN111597800B (zh) * | 2019-02-19 | 2023-12-12 | 百度在线网络技术(北京)有限公司 | 同义句的获取方法及装置、设备及存储介质 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11410667B2 (en) | 2019-06-28 | 2022-08-09 | Ford Global Technologies, Llc | Hierarchical encoder for speech conversion system |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
JP7332486B2 (ja) * | 2020-01-08 | 2023-08-23 | 株式会社東芝 | 記号列変換装置および記号列変換方法 |
CN111680527B (zh) * | 2020-06-09 | 2023-09-19 | 语联网(武汉)信息技术有限公司 | 基于专属机翻引擎训练的人机共译系统与方法 |
US11829720B2 (en) | 2020-09-01 | 2023-11-28 | Apple Inc. | Analysis and validation of language models |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1720524A (zh) * | 2002-10-29 | 2006-01-11 | 埃里·阿博 | 知识系统方法和装置 |
CN1770107A (zh) * | 2004-11-04 | 2006-05-10 | 微软公司 | 提取小树转换对 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991710A (en) * | 1997-05-20 | 1999-11-23 | International Business Machines Corporation | Statistical translation system with features based on phrases or groups of words |
JPH11143877A (ja) * | 1997-10-22 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム |
US20060143007A1 (en) * | 2000-07-24 | 2006-06-29 | Koh V E | User interaction with voice information services |
US6999932B1 (en) * | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
AUPR082400A0 (en) * | 2000-10-17 | 2000-11-09 | Telstra R & D Management Pty Ltd | An information retrieval system |
US6885985B2 (en) | 2000-12-18 | 2005-04-26 | Xerox Corporation | Terminology translation for unaligned comparable corpora using category based translation probabilities |
US6934683B2 (en) * | 2001-01-31 | 2005-08-23 | Microsoft Corporation | Disambiguation language model |
US7027987B1 (en) * | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
US6721728B2 (en) * | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
US7295965B2 (en) * | 2001-06-29 | 2007-11-13 | Honeywell International Inc. | Method and apparatus for determining a measure of similarity between natural language sentences |
US6985861B2 (en) * | 2001-12-12 | 2006-01-10 | Hewlett-Packard Development Company, L.P. | Systems and methods for combining subword recognition and whole word recognition of a spoken input |
US7177814B2 (en) * | 2002-02-07 | 2007-02-13 | Sap Aktiengesellschaft | Dynamic grammar for voice-enabled applications |
US7293015B2 (en) * | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
WO2005033909A2 (en) * | 2003-10-08 | 2005-04-14 | Any Language Communications Inc. | Relationship analysis system and method for semantic disambiguation of natural language |
US7593843B2 (en) * | 2004-03-30 | 2009-09-22 | Microsoft Corporation | Statistical language model for logical form using transfer mappings |
US20060036438A1 (en) * | 2004-07-13 | 2006-02-16 | Microsoft Corporation | Efficient multimodal method to provide input to a computing device |
US20080077570A1 (en) * | 2004-10-25 | 2008-03-27 | Infovell, Inc. | Full Text Query and Search Systems and Method of Use |
JP2006268375A (ja) * | 2005-03-23 | 2006-10-05 | Fuji Xerox Co Ltd | 翻訳メモリシステム |
US7672931B2 (en) * | 2005-06-30 | 2010-03-02 | Microsoft Corporation | Searching for content using voice search queries |
US20070061335A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Multimodal search query processing |
JP4058071B2 (ja) * | 2005-11-22 | 2008-03-05 | 株式会社東芝 | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム |
US7813926B2 (en) * | 2006-03-16 | 2010-10-12 | Microsoft Corporation | Training system for a speech recognition application |
US8943080B2 (en) * | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US7949514B2 (en) * | 2007-04-20 | 2011-05-24 | Xerox Corporation | Method for building parallel corpora |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US9002869B2 (en) * | 2007-06-22 | 2015-04-07 | Google Inc. | Machine translation for query expansion |
-
2008
- 2008-03-28 US US12/058,328 patent/US8615388B2/en active Active
-
2009
- 2009-02-27 WO PCT/US2009/035389 patent/WO2009120449A1/en active Application Filing
- 2009-02-27 KR KR1020107021217A patent/KR101543992B1/ko active IP Right Grant
- 2009-02-27 EP EP09725780.2A patent/EP2269148B1/en active Active
- 2009-02-27 CN CN200980112180.XA patent/CN101981566B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1720524A (zh) * | 2002-10-29 | 2006-01-11 | 埃里·阿博 | 知识系统方法和装置 |
CN1770107A (zh) * | 2004-11-04 | 2006-05-10 | 微软公司 | 提取小树转换对 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704456A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 识别控制方法以及识别控制装置 |
CN107704456B (zh) * | 2016-08-09 | 2023-08-29 | 松下知识产权经营株式会社 | 识别控制方法以及识别控制装置 |
CN112204653A (zh) * | 2019-03-29 | 2021-01-08 | 谷歌有限责任公司 | 通过机器学习的直接的语音到语音翻译 |
CN112204653B (zh) * | 2019-03-29 | 2024-04-02 | 谷歌有限责任公司 | 通过机器学习的直接的语音到语音翻译 |
CN110147558A (zh) * | 2019-05-28 | 2019-08-20 | 北京金山数字娱乐科技有限公司 | 一种翻译语料处理的方法和装置 |
CN110147558B (zh) * | 2019-05-28 | 2023-07-25 | 北京金山数字娱乐科技有限公司 | 一种翻译语料处理的方法和装置 |
CN110852324A (zh) * | 2019-08-23 | 2020-02-28 | 上海撬动网络科技有限公司 | 一种基于深度神经网络集装箱箱号检测方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20100135757A (ko) | 2010-12-27 |
EP2269148B1 (en) | 2018-09-05 |
WO2009120449A1 (en) | 2009-10-01 |
US20090248422A1 (en) | 2009-10-01 |
CN101981566B (zh) | 2015-04-15 |
KR101543992B1 (ko) | 2015-08-13 |
US8615388B2 (en) | 2013-12-24 |
EP2269148A4 (en) | 2011-06-29 |
EP2269148A1 (en) | 2011-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101981566B (zh) | 语言内统计机器翻译 | |
US10346540B2 (en) | Self-learning statistical natural language processing for automatic production of virtual personal assistants | |
US9330661B2 (en) | Accuracy improvement of spoken queries transcription using co-occurrence information | |
US8713037B2 (en) | Translation system adapted for query translation via a reranking framework | |
EP3355301B1 (en) | Cross-lingual initialization of language models | |
CN111710333B (zh) | 用于生成语音转录的方法和系统 | |
WO2018157789A1 (zh) | 一种语音识别的方法、计算机、存储介质以及电子装置 | |
US8165877B2 (en) | Confidence measure generation for speech related searching | |
US8560300B2 (en) | Error correction using fact repositories | |
JP5822432B2 (ja) | 機械翻訳の方法およびシステム | |
US9405823B2 (en) | Spoken document retrieval using multiple speech transcription indices | |
US20060282255A1 (en) | Collocation translation from monolingual and available bilingual corpora | |
CN111666764B (zh) | 一种基于XLNet的自动摘要方法与装置 | |
Jeong et al. | Semantic-oriented error correction for spoken query processing | |
Chen et al. | A discriminative HMM/N-gram-based retrieval approach for Mandarin spoken documents | |
Manishina | Data-driven natural language generation using statistical machine translation and discriminative learning | |
Wang et al. | Voice search | |
Saadany et al. | Automatic Linking of Judgements to UK Supreme Court Hearings | |
Chien et al. | A spoken‐access approach for chinese text and speech information retrieval | |
Kolkhorst | Strategies for out-of-vocabulary words in spoken term detection | |
CN116186201A (zh) | 基于语音识别的政务事项搜索方法及装置、介质、设备 | |
Moyal et al. | Phonetic Search | |
Barth | Phoneme-based Video Indexing Using Phonetic Disparity Search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150730 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150730 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |