CN101019121A - 对存储在数据库中的文档编制索引和进行检索的方法和系统 - Google Patents

对存储在数据库中的文档编制索引和进行检索的方法和系统 Download PDF

Info

Publication number
CN101019121A
CN101019121A CNA2006800007729A CN200680000772A CN101019121A CN 101019121 A CN101019121 A CN 101019121A CN A2006800007729 A CNA2006800007729 A CN A2006800007729A CN 200680000772 A CN200680000772 A CN 200680000772A CN 101019121 A CN101019121 A CN 101019121A
Authority
CN
China
Prior art keywords
vector
information
document
intermediate representation
interview
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800007729A
Other languages
English (en)
Inventor
彼得·P.·沃尔夫
约瑟夫·K.·沃尔费尔
比克沙·拉玛克里施南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN101019121A publication Critical patent/CN101019121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Abstract

提供了一种为存储在数据库中的文档编制索引和检索存储在数据库中的文档的方法。从每一个文档中提取文档特征矢量,然后,根据特征矢量给文档编制索引。将口头查询转换为代表口头查询中的项的可能连续组合的可能性的中间表示形式。根据所述中间表示形式生成查询确定性矢量。获取其他信息。将其他信息与查询确定性矢量组合。然后,将所述查询矢量以及所述其他信息与每一个文档特征矢量进行比较,以检索文档的分等级的结果集。

Description

对存储在数据库中的文档编制索引 和进行检索的方法和系统
技术领域
一般而言,本发明涉及给文档编制索引和从数据库中检索文档,以及多媒体内容,具体来说,涉及使用口头查询从数据库中检索。
背景技术
借助于因特网,可以在全球范围内访问大量的存储了可以公开地访问的多媒体内容和文档的数据库。许多内容是以音频和视频记录的形式存在的。通常,使用在台式机系统上运行的浏览器和搜索引擎,通过让用户指定文本查询或跟随链接,检索存储的文档。键入的查询通常包括关键字或短语,输出也是文本或图像。
诸如蜂窝电话和个人数字助理(PDA)之类的便携式通信设备也可以被用来访问因特网。然而,这样的设备具有有限的文本输入和输出功能。例如,蜂窝电话的小键盘不特别适合键入输入查询,许多PDA根本没有字符键。这些设备的显示器的大小也比较有限,难以阅读。这种设备更加适合语音输入和输出,特别是在文档包括诸如语音或音乐之类的音频信号的情况下。因此,有时使用口头查询。
现有技术的对于口头查询的文档检索系统通常使用语音识别引擎,将口头查询转换为查询的文本抄本形式。然后,查询被当做文本,可以使用信息检索过程来检索匹配该查询的相关的文档。
然而,该方法丢弃了可以用来改善检索系统的性能的有价值的信息。最严重的是,丢弃了整个音频频谱信号(口头查询),所剩余的只是原始文本内容,常常被曲解。
当通过语音指定文档或查询时,必须提供新技术,以优化系统的性能。在使用文本查询来检索文档的常规信息检索系统中使用的技术对口头查询和口头文档执行得较差,因为语音识别引擎的文本输出常常包含错误。口头查询常常包含可以以许多不同的方式解释的多义现象。经过转换的文本甚至可能包含在口头查询的上下文内完全不一致的单词,并包括对任何听者来说显而易见的错误。语音识别引擎的简单文本输出丢弃了许多有价值的信息,如可能已经说了什么其他的单词,或者,查询听起来像什么。音频信号通常比较丰富,并包含许多特征,如音量和音高的变化,比较难以区别诸如重音或着重点之类的特征。所有这些信息都丢失。
因此,需要改善使用口头查询的信息检索系统。此外,还需要在搜索可能匹配口头查询的文档时保持口头查询的确定性信息。具体来说,如果在搜索多媒体数据库时说了什么或没有说什么的概率是已知的,将改善文档检索。
发明内容
提供了一种给存储在数据库中的文档编制索引和检索存储在数据库中的文档的系统和方法。文档被定义为具有关联的文本的任何项目组,例如,艺术家、专辑,以及歌曲的标题。为每一个待编制索引的文档提取完全的文档特征矢量。可选地,将文档特征矢量投射到低维文档特征矢量。不论是哪一种情况,都根据完全或者低维文档特征矢量给文档编制索引。
语音识别引擎将口头查询转换为中间表示形式。中间表示形式保留了音频信号的某些特征。中间表示形式可以是单词网格;单词的组成部分的网格、语音网格,或单词、单词的组成部分或音素的n-最佳列表。单词的组成部分可以是音节或其他单词段。笼统地,单词、单词的组成部分、音节以及音素这里被定义为“项”。
在任何情况下,中间表示形式都表示口头查询中的项的可能连续组合。应该注意,中间表示形式与常规的经转换的文本字符串不同,后者表示语音识别引擎在将口头查询解释为单一文本字符串时已经尽了最大努力。已知,到文本的直接转换很可能出错。
中间表示形式被转换为查询确定性矢量,该矢量可以可选地被投射到低维查询确定性矢量。将查询矢量与每一个文档特征矢量进行比较,以检索匹配的结果文档集。可以对结果文档集进行分级。
此外,也可以使用其他信息来产生结果文档集并进行分级,例如,使用用户偏爱或位置。此外,可以使用诸如AND、OR以及NOT之类的布尔运算符,将多个口头查询合并到单一查询中。如此,可以近似为形式“X和Y,或Z,但不是Q”的逻辑查询。
附图说明
图1是根据本发明的使用口头查询的信息检索系统的方框图;
图2是使用位置作为其他信息产生一组结果文档的检索系统的方框图;
图3是使用多个逻辑查询作为其他信息产生一组结果文档的检索系统的方框图;以及
图4是使用偏好作为其他信息产生一组结果文档的检索系统的方框图。
具体实施方式
本发明提供了用于使用口头查询从多媒体数据库检索文档的系统和方法。本发明的概念是保持在口头查询中所说的内容的确定性信息,并在搜索数据库中的匹配文档时使用此信息。确定性信息表示项是什么的概率以及它们出现的顺序。确定性信息也可以使用音频信号的其他频谱特征,如音量和音高的变化,以判断口头查询中的某些项是否比其它的项更加重要。类似地,也可以根据保留了被索引的文档中的项的确定性的模型,对数据库中存储的文档进行索引。
根据本发明的系统和方法判断和比较从语音或文本生成的特征矢量。比较特征矢量提供了用于在给定特定口头查询的情况下判断文档的相关性的度量。给定了记录的语音或文本的查询的情况下,使用度量来检索记录的语音和文本的相关的文档。
对文档编制索引
本发明提供了下列对文档编制索引的实施例。第一个实施例使用完全的维文档特征矢量来编制文档索引和检索文档。第二个实施例使用低维文档特征矢量来编制文档索引和检索文档。
图1显示了根据本发明的文档索引和检索系统100。对系统的输入是文档101。为每一个文档提取110文档特征矢量102。文档特征矢量102是文档中的所有单词的加权列表。文档特征矢量也可以包括如下面定义和详细描述的“项”。每一个项的权重等于其在文档中出现的频率。比较频繁地出现的项可以被视为更加重要。
每一个文档特征矢量被可选地投射120到较低的维,以产生低维(LD)文档特征矢量103。投影可以使用奇异值分解(SVD)以从常规矢量空间表示形式转换为低维投影。SVD技术已为大家所熟知。或者,可以使用潜在的语义分析(LSA)投影。LSA类似于SVD,只是它基于项频率的统计属性。
其他低维投影表示形式也是可以的。与所有这些技术通用的是,每个文档都可以通过与在该文档中出现的项关联的值的低维矢量来表示。与项关联的值是该项对文档来说的估计的相对重要性的度量。也可以应用过滤器,以忽视常见的项,如冠词,例如,“the”和连接符。可以作为一个单独的列表维护待过滤和忽视的项,该列表也许可以由用户进行编辑。
然后,使用文档特征矢量,完全或者低维的,对数据库140中的文档编制索引130。
解释口头查询
本发明提供了用于从口头查询判断查询确定性矢量的下列各项。第一个实施例使用完全维查询确定性特征矢量。第二个实施例使用低维查询确定性特征矢量。
按如下方式处理口头查询105以搜索180数据库140。向语音识别引擎150提供口头查询。然而,不是如在现有技术中那样将口头查询直接转换为文本,根据本发明的系统生成中间表示形式106。中间表示形式106保留了音频语音信号的某些特征,并不是如在现有技术中那样简单地向文本字符串转换。
中间表示形式可以呈现单词、单词的组成部分、音节、单词段或音素。笼统地,单词、单词的组成部分、单词段、音节,以及音素这里被定义为“项”。例如,日语口语短语“jamanasi ken no kijosatogendai bizjucukan”转换为项“ja ma na si ke n no ki jo sa to ge n da ibi zju cu ka n”。将口头查询转换为项的优点是,基于项的语音识别器需要的词汇量比大词汇量单词识别器需要的小得多。因此,基于项的识别器可以比大词汇量单词识别器小得多和快得多。
项可以作为网格或n-最佳列表来组织。
网格可以以两种方式表示中间结果:1)节点代表项,连接项的有向边代表以关联的确定性说出的项的可能顺序,2)边代表项,而连接边的节点代表以关联的确定性说出的项的可能顺序。一般而言,确定性信息包括统计学的可能性或概率。
n-最佳列表代表中间结果,作为每一个抄本的具有关联的确定性的抄本系列和抄本中的单个单词。
一般而言,网格和n-最佳列表是等效的。网格可以被转换为n-最佳列表,并且n-最佳列表也可以被转换为网格,而不会造成信息损失。
如此,中间表示形式保留有关与口头查询中的多义性关联的确定性信息。这与语音识别的常规用法不同,常规用法利用单一的可能错误的文本字符串。即,中间表示形式106表示具有关联的概率分数的可能已经说出的项的可能连续组合。
典型的采用现有技术的语音识别引擎的输出通常是对应于口头查询的最大努力解释的字符串文本。由于语音识别引擎常常产生错误,因此,并非假设的抄本中的所有的单词都将始终是正确的。这可能会产生不包括对于检索十分重要的单词的抄本。另一方面,文本可能包含伪造的单词,或被转换得完全超出上下文之外的产生错误的检索的单词。
为了补偿这些错误,本发明将口头查询表示为确定性矢量。此矢量的每一个元素都表示可能已经说出的项,其值表示项被实际说出的项的确定性或概率,以及项被说出的顺序。
有多种确定170查询确定性矢量107的方式。通过将穿过网格中的节点与的所有路径的分数与网格中的所有路径的总分数进行比较,可以确定网格中的每个节点的概率。这会产生可能说出的具有关联的概率的所有项的列表。
另一个实施例从n-最佳列表确定查询确定性矢量。根据n-最佳结果中的每一个抄本选择和关联的置信度值来计算查询矢量值。
分类器可以考虑网格中的节点的各种属性,包括频率分数,如上面所产生的,并可以产生与节点关联的置信度。分类器方法包括高斯分类法、基于增强(boosting)的分类,以及基于规则的基于网格的属性的启发式。示例包括网格中的各个点处的网格密度。如上所述,概率也可以考虑音频信号的其他特征来判断在语音中是否强调了某些项。也可以使用上下文信息。例如,似乎在上下文之外的识别的项可以被给予较低的确定性分数。
中间表示形式中的任何项的最后的确定性值是中间表示形式106中的可能的项的所有实例的上述方法产生的置信度或确定性的组合。
查询确定性矢量的每个元素与文档或查询中的对应的项的实例的数量的估计值成正比。此确定性矢量是文档101的文档特征矢量空间表示102的模拟,并可以可选地接受施加于文档特征矢量102的相同的投影(SVD,LSA等等),以产生低维查询确定性矢量。在任何情况下,使用查询确定性矢量,来对数据库140编制索引,以产生满足口头查询105的结果文档集109。
检索文档
给定了口头查询,从数据库中检索相关的文档109是简单的。步骤是:使用语音识别器将口头查询映射到中间表示形式;确定利用关联的权重说出的可能的项的集;从具有关联的权重的可能的项的集生成确定性矢量,以及将查询确定性矢量与每一个映射的文档特征矢量进行比较,以获得适当分数。然后,可以按照适当分数的等级顺序,将结果文档集109中的文档呈现给用户。可以丢弃分数小于预先确定的阈值的文档。
组合口头查询与其他信息
在许多应用程序中,系统100可以访问超出了口头查询的音频以外的补充信息。此信息可以用来改善结果文档集109。此信息可以是一维的,例如,位置;多维的,例如,用户偏爱;或多查询,例如,由逻辑运算符组合起来的查询。
组合口头查询与位置
为项目所特有的位置是单维段的补充信息的示例。例如,用户可以搜索导航数据库,以查找位于用户的当前位置附近的兴趣点(POI)。可以从GPS信息或其他导航系统获取位置,如目前在汽车中经常使用的那样。用户也可以说出位置,要么是地理位置,要么是地址形式,例如,“at mile 300 Route 66 West”或“123 Main Street。”
在此情况下,系统100将所需要的POI的口头描述与数据库中的每一个POI的位置进行比较。然后,根据用户和兴趣点之间的距离,对结果文档集109进行等级排序。
如图2所示,如上文所描述的,口头查询201被语音识别引擎210转换为中间表示形式211。从中间表示形式生成220查询确定性矢量221。确定240用户位置241和存储在数据库中的兴趣点(POI)的位置242之间的距离243。然后,比较230查询确定性矢量221、文档特征矢量222,以及距离243,以产生分等级的结果文档集231。
在逻辑上组合多个口头查询
如图3所示,多个口头查询201可以被转换为多个中间表示形式,以及对应的查询确定性矢量。多个口头查询通过表示布尔运算符的项(如,“and”,“or”,以及“not”)链接起来。然后,根据逻辑运算符,在逻辑上将多个查询矢量与文档特征矢量进行比较,以产生分等级的结果文档集。
组合口头查询与偏好
如图4所示,用户可以说出被转换为中间表示形式的偏好401。从中间表示形式生成420偏好矢量421。然后,将文档、查询,以及偏好矢量进行比较430,以产生分等级的结果文档集。
给偏好提供权重。例如,一个非常强的偏好可以得到比适度的偏好更高的权重。偏好也可以呈现不喜欢的形式,这将被给予负的权重。在此情况下,作为比较430的一部分,将查询确定性矢量乘以偏好矢量。乘法可以是按元素进行的。
应该理解,也可以组合其他信息的各种形式。例如,最后向数据库查询文档的结果集可以指定位置、布尔运算符,以及偏好。
虽然通过优选实施例的示例描述了本发明,但是,应该理解,可以在本发明的精神和范围内作出其他修改。因此,所附的权利要求的目标涵盖所有这样的变化和修改,并在本发明的真正的精神和范围内。

Claims (13)

1.一种计算机实现的用于对存储在数据库中的文档编制索引以及进行检索的方法,包括下列步骤:
从多个文档中的每一个文档中提取文档特征矢量;
根据关联的文档特征矢量给多个文档中的每一个文档编制索引;
将口头查询转换为代表所述口头查询中的项的可能连续组合的中间表示形式;
根据所述中间表示形式生成查询确定性矢量;
获取其他信息;
将所述其他信息与所述查询确定性矢量组合;以及
将所述查询矢量以及所述其他信息与每一个文档特征矢量进行比较,以检索文档的分等级的结果集。
2.根据权利要求1所述的方法,进一步包括:
将所述文档特征矢量以及所述查询确定性矢量投射到低维。
3.根据权利要求1所述的方法,其中,所述中间表示形式是项的网格。
4.根据权利要求1所述的方法,其中,所述项是单词。
5.根据权利要求1所述的方法,其中,所述项是单词的组成部分。
6.根据权利要求1所述的方法,其中,所述中间表示形式是项的n最佳列表。
7.根据权利要求1所述的方法,其中,所述项是音素。
8.根据权利要求1所述的方法,其中,所述文档描述了兴趣点,每一个兴趣点都具有位置,并进一步包括:
确定生成所述口头查询的用户的位置;
确定所述用户的位置与匹配所述口头查询的每一个兴趣点之间的距离,以产生其他信息;以及
根据所述距离给所述结果文档集分等级。
9.根据权利要求1所述的方法,进一步包括:
将多个口头查询转换为多个中间表示形式,所述多个口头查询由逻辑运算符链接起来;
根据所述多个查询确定性矢量生成多个查询确定性矢量,以产生所述其他信息;以及
根据逻辑运算符,将所述多个查询矢量以及所述其他信息与每一个文档特征矢量进行比较,以检索文档的分等级的结果集。
10.根据权利要求1所述的方法,进一步包括:
将口头偏好转换为对应的中间表示形式;
从对应的中间表示形式生成偏好矢量,以产生其他信息;以及
根据所述偏好矢量给所述结果文档集分等级。
11.根据权利要求10所述的方法,其中,按权重对偏好矢量分配权重,并进一步包括:
将所述查询矢量乘以所述偏好矢量。
12.根据权利要求11所述的方法,其中,权重可以是正的和负的,并进一步包括:
将所述查询矢量以及所述偏好矢量与每一个文档特征矢量进行比较,以检索文档的分等级的结果集。
13.一种给文档编制索引以及检索文档的系统,包括:
多个文档,每一个文档都具有关联的文档特征矢量;
根据关联的文档特征矢量给多个文档中的每一个文档编制索引的数据库;
将口头查询转换为代表所述口头查询中的项的可能连续组合的中间表示形式的语音识别引擎;
用于根据所述中间表示形式生成查询确定性矢量的装置;
用于获取其他信息的装置;
用于将所述其他信息与所述查询确定性矢量组合的装置;以及
比较器,被配置为将所述查询矢量以及所述其他信息与每一个文档特征矢量进行比较,以检索文档的分等级的结果集。
CNA2006800007729A 2005-02-25 2006-02-06 对存储在数据库中的文档编制索引和进行检索的方法和系统 Pending CN101019121A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/067,165 2005-02-25
US11/067,165 US7542966B2 (en) 2002-04-25 2005-02-25 Method and system for retrieving documents with spoken queries

Publications (1)

Publication Number Publication Date
CN101019121A true CN101019121A (zh) 2007-08-15

Family

ID=36471964

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800007729A Pending CN101019121A (zh) 2005-02-25 2006-02-06 对存储在数据库中的文档编制索引和进行检索的方法和系统

Country Status (5)

Country Link
US (1) US7542966B2 (zh)
EP (1) EP1803072A1 (zh)
JP (1) JP2008532099A (zh)
CN (1) CN101019121A (zh)
WO (1) WO2006090600A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723449A (zh) * 2013-11-06 2016-06-29 系统翻译国际有限公司 基于对录取的语音数据的核心语提取的言语内容分析系统和利用该系统的索引方法及言语内容分析方法
CN111737393A (zh) * 2020-07-01 2020-10-02 自然资源部四川基础地理信息中心(自然资源部四川测绘资料档案馆) 一种web环境下矢量数据自适管理方法及系统

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
WO2005010866A1 (en) * 2003-07-23 2005-02-03 Nexidia Inc. Spoken word spotting queries
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060104515A1 (en) * 2004-07-19 2006-05-18 King Martin T Automatic modification of WEB pages
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20070043608A1 (en) * 2005-08-22 2007-02-22 Recordant, Inc. Recorded customer interactions and training system, method and computer program product
JP2009540398A (ja) 2006-06-02 2009-11-19 テルコーディア テクノロジーズ インコーポレイテッド 音声ドキュメントに関する概念ベースのメディア間インデックス化および取り出し
US7499858B2 (en) * 2006-08-18 2009-03-03 Talkhouse Llc Methods of information retrieval
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US8214210B1 (en) * 2006-09-19 2012-07-03 Oracle America, Inc. Lattice-based querying
US20080130699A1 (en) * 2006-12-05 2008-06-05 Motorola, Inc. Content selection using speech recognition
WO2008106649A1 (en) * 2007-03-01 2008-09-04 Recordant, Inc. Calibration of word spots system, method, and computer program product
JP5159772B2 (ja) * 2007-05-17 2013-03-13 株式会社創知 文書検索装置及び文書検索方法
US8700008B2 (en) 2008-06-27 2014-04-15 Microsoft Corporation Providing data service options in push-to-talk using voice recognition
JP5308786B2 (ja) * 2008-11-20 2013-10-09 Kddi株式会社 文書データ検索装置
US20100153112A1 (en) * 2008-12-16 2010-06-17 Motorola, Inc. Progressively refining a speech-based search
EP2382563A1 (en) * 2008-12-31 2011-11-02 Thomson Reuters Global Resources System and method to retrieve relevant information
DE202010018601U1 (de) 2009-02-18 2018-04-30 Google LLC (n.d.Ges.d. Staates Delaware) Automatisches Erfassen von Informationen, wie etwa Erfassen von Informationen unter Verwendung einer dokumentenerkennenden Vorrichtung
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US20110060588A1 (en) * 2009-09-10 2011-03-10 Weinberg Garrett L Method and System for Automatic Speech Recognition with Multiple Contexts
US8788267B2 (en) 2009-09-10 2014-07-22 Mitsubishi Electric Research Laboratories, Inc. Multi-purpose contextual control
CN102023995B (zh) 2009-09-22 2013-01-30 株式会社理光 语音检索设备和语音检索方法
US20110071826A1 (en) * 2009-09-23 2011-03-24 Motorola, Inc. Method and apparatus for ordering results of a query
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9594851B1 (en) * 2012-02-07 2017-03-14 Google Inc. Determining query suggestions
US20140184803A1 (en) * 2012-12-31 2014-07-03 Microsoft Corporation Secure and Private Tracking Across Multiple Cameras
US9245523B2 (en) * 2013-07-25 2016-01-26 Nice-Systems Ltd Method and apparatus for expansion of search queries on large vocabulary continuous speech recognition transcripts
US10102482B2 (en) * 2015-08-07 2018-10-16 Google Llc Factorized models
JP6461773B2 (ja) * 2015-11-30 2019-01-30 日本電信電話株式会社 ベクトル量子化器生成方法、ベクトル量子化方法、装置、及びプログラム
US10296586B2 (en) * 2016-12-23 2019-05-21 Soundhound, Inc. Predicting human behavior by machine learning of natural language interpretations
US20200159801A1 (en) * 2017-06-01 2020-05-21 Interactive Solutions Inc. Display Device
US10915707B2 (en) * 2017-10-20 2021-02-09 MachineVantage, Inc. Word replaceability through word vectors

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153394A (ja) * 1997-07-29 1999-02-26 Just Syst Corp 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
JP2000259645A (ja) * 1999-03-05 2000-09-22 Fuji Xerox Co Ltd 音声処理装置及び音声データ検索装置
US6882970B1 (en) * 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US20030069940A1 (en) 2001-10-10 2003-04-10 Sathya Kavacheri Method and system for implementing location aware information access and retrieval in a wireless portal server
ES2391261T3 (es) 2001-11-21 2012-11-22 Werner Voegeli Método y aparato para recuperar información importante
JP2003256466A (ja) * 2002-03-04 2003-09-12 Denso Corp 適応的情報検索システム
US6847966B1 (en) * 2002-04-24 2005-01-25 Engenium Corporation Method and system for optimally searching a document database using a representative semantic space
US20030204399A1 (en) * 2002-04-25 2003-10-30 Wolf Peter P. Key word and key phrase based speech recognizer for information retrieval systems
US6877001B2 (en) 2002-04-25 2005-04-05 Mitsubishi Electric Research Laboratories, Inc. Method and system for retrieving documents with spoken queries

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723449A (zh) * 2013-11-06 2016-06-29 系统翻译国际有限公司 基于对录取的语音数据的核心语提取的言语内容分析系统和利用该系统的索引方法及言语内容分析方法
US10304441B2 (en) 2013-11-06 2019-05-28 Systran International Co., Ltd. System for grasping keyword extraction based speech content on recorded voice data, indexing method using the system, and method for grasping speech content
CN111737393A (zh) * 2020-07-01 2020-10-02 自然资源部四川基础地理信息中心(自然资源部四川测绘资料档案馆) 一种web环境下矢量数据自适管理方法及系统
CN111737393B (zh) * 2020-07-01 2023-10-27 自然资源部四川基础地理信息中心(自然资源部四川测绘资料档案馆) 一种web环境下矢量数据自适管理方法及系统

Also Published As

Publication number Publication date
WO2006090600A1 (en) 2006-08-31
JP2008532099A (ja) 2008-08-14
US7542966B2 (en) 2009-06-02
EP1803072A1 (en) 2007-07-04
US20050149516A1 (en) 2005-07-07

Similar Documents

Publication Publication Date Title
CN101019121A (zh) 对存储在数据库中的文档编制索引和进行检索的方法和系统
US9218412B2 (en) Searching a database of listings
US7272558B1 (en) Speech recognition training method for audio and video file indexing on a search engine
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
US8117026B2 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
US8165877B2 (en) Confidence measure generation for speech related searching
US9727639B2 (en) Name search using a ranking function
KR101255405B1 (ko) 텍스트 메타데이터를 갖는 음성문서의 인덱싱 및 검색방법, 컴퓨터 판독가능 매체
US6877001B2 (en) Method and system for retrieving documents with spoken queries
CN102549652B (zh) 信息检索装置
CN102023995B (zh) 语音检索设备和语音检索方法
US20050060304A1 (en) Navigational learning in a structured transaction processing system
KR101945749B1 (ko) 데이터베이스 검색방법, 네비게이션 장치 및 인덱스 구조 생성 방법
US20070136280A1 (en) Factoid-based searching
US20030204399A1 (en) Key word and key phrase based speech recognizer for information retrieval systems
WO2003010754A1 (fr) Systeme de recherche a entree vocale
KR20090065130A (ko) 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템
CN101937450B (zh) 在由粒子表示的信息检索数据库中进行条目检索的方法
US7580942B2 (en) Indexing and ranking processes for directory assistance services
Lee et al. Let's buy books: Finding ebooks using voice search
US20060265388A1 (en) Information retrieval system and method for distinguishing misrecognized queries and unavailable documents
CN107704461B (zh) 一种基于数据分析的智能路况信息检索方法
CN114064861A (zh) 一种查询语句的生成方法和装置
CN117609325A (zh) 一种前端拼音库模糊筛选系统、方法和装置
Gouvêa et al. Word particles applied to information retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20070815