CN1363069A - 信息管理、检索和显示系统以及相关方法 - Google Patents

信息管理、检索和显示系统以及相关方法 Download PDF

Info

Publication number
CN1363069A
CN1363069A CN00809232A CN00809232A CN1363069A CN 1363069 A CN1363069 A CN 1363069A CN 00809232 A CN00809232 A CN 00809232A CN 00809232 A CN00809232 A CN 00809232A CN 1363069 A CN1363069 A CN 1363069A
Authority
CN
China
Prior art keywords
search
finite element
data
information resources
key words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN00809232A
Other languages
English (en)
Inventor
乔治·梅纳德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EvREsearch Ltd
Original Assignee
EvREsearch Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23223852&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1363069(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by EvREsearch Ltd filed Critical EvREsearch Ltd
Publication of CN1363069A publication Critical patent/CN1363069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/956Hierarchical
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Abstract

本系统搜索信息资源,如一个或多个文档(18),或信息流,并以基于用户选择的显示条件或层次结构(32)的格式显示搜索结果。显示层次结构将使用户能够有效地获得感兴趣的内容。本系统执行一种检索信息的方法,该方法包括下列步骤:(a)将信息资源分为有限元素;(b)将分类标记分配到每个元素;(c)为各个元素生成可搜索的数据库记录(23),其中每个记录至少包含元素内的一个字符串;(d)提供搜索字符串;(e)搜索数据库,以查找包含搜索字符串的记录;(f)根据(至少部分地)分配到搜索所返回的元素的分类标记中的数据,按层次结构排列结果;以及(g)以层次结构显示结果。

Description

信息管理、检索和显示系统以及相关方法
技术领域
本发明是搜索信息资源并从中检索信息的计算机化系统和方法,更具体来说,本发明是信息管理、检索和显示系统,用于搜索信息资源,并基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。
背景技术
许多常规的搜索引擎或搜索工具(如InfoseekTM、AltaVistaTM、HotbotTM)的一个固有缺点是,搜索的结果通常按照正在搜索的每个文档(Web页)中的搜索字或短语的匹配数量来组织。这种类型的搜索结果显示要求最终用户一个一个地浏览匹配项,最终才能访问到他/她要查找的文档。此类常规搜索引擎的另一个缺点是,搜索的结果不考虑一个单词可能有多种不同意思的情况,以及在许多不同的上下文中使用的情况。例如,如果最终用户要查找有关卡通老鼠的信息,因为搜索查询将包含单词“mouse”,匹配列表将包括有关电子光标控制设备的文档、提供有关老鼠的生物信息的文档、提供有关老鼠的宠物信息的文档。因此,最终用户可能必须浏览许多此类匹配项,最终才能(如果有的话)找到涉及卡通老鼠的匹配项。
因此,需要有一个这样的搜索引擎或搜索工具,以便使最终用户以这样的方式来组织搜索结果,以使最终用户有效而快速地获得感兴趣的内容。
发明内容
本发明是信息管理、检索和显示系统,用于搜索信息资源,如文档(例如,条约)、许多单个文档(例如驻留在因特网上的Web页)、信息流(例如,DNA代码、源代码、卫星数据传输信息等),并基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。这样的显示层次结构将使最终用户有效而快速地从搜索结果中获得感兴趣的内容。信息资源的类型或格式并不重要。
本发明包括四个主要模块:中断模块、索引模块、搜索模块和非中断模块。中断模块是一个专家系统,它根据定义其运行的一组专家规则来运行。中断模块分析信息资源,以将信息资源分为有限元素(如段、节、子节、小段等)。中断模块还为每一个有限元素创建分类标记,其中分配到每个有限元素的分类标记都基于对每个有限元素的内容的分析(由一组专家系统规则来定义)。分类标记可以包括标准分类,如,“Dewey十进制类型”号码。分类标记还可以包括组织属性(如关于有限元素的类型或相对于信息资源的其余部分的位置)、日期戳、分类词等。优选情况下,将分类标记插入到有限元素中。
索引模块分析由中断模块标识/创建/处理的有限元素,并创建可搜索的数据库,该数据库有针对中断模块标识的每个有限元素的数据库记录。可搜索的数据库是一种反向索引,其中每个记录都包括对应的有限元素的地址或位置(反过来又包括分类标记),有限元素中包含的字符串(如单词、短语等)以及它们在有限元素内出现的频率(即,它们的权重)。
在本发明的用户不能控制正在搜索的信息(即,因特网上的Web页)的应用场合,每个数据库记录还可能包括分类标记,因为分类标记无法由中断模块插入到有限元素中。因此,对于Web搜索应用场合,可能根本就不需要利用中断模块和非中断模块,因为对于本发明,每个Web页或链接都可能被认为是一个有限元素。
一旦创建反向索引,就可以对反向索引进行搜索。最终用户可以提供关键字符串(如关键字、短语或符号段)作为搜索查询,用户还可以选择或定义显示层次结构或条件。所选择的显示条件将指示搜索模块如何处理搜索结果的数据。具体来说,所选择的显示条件将定义,搜索结果是否完全根据分类标记内包含的信息按某种顺序或结构来显示(以研究为中心),搜索结果是否完全取决于关键字符串在有限元素中出现的频率按某种顺序来显示(常规),或者搜索结果是否根据两种情况的组合按某种顺序或结构来显示(以文档为中心)。
搜索模块访问搜索查询,并搜索反向索引,以查找与特定的搜索条件或搜索查询匹配的数据库记录。然后通过将满足搜索条件的每个有限元素的分类标记中的信息应用到所选择的显示层次结构,以可折叠的/可展开的(树形)结构显示搜索结果。例如,如果所选择的层次结构是以文档为中心的层次结构,显示层次结构的第一层次可以是,例如,创建有限元素的年份,显示层次结构的第二层次可以是,例如,有限元素在文档中出现的顺序,显示层次结构的第三层次可以,例如,基于搜索字在每个有限元素中出现的频率。搜索模块的运行,与中断模块和索引模块一样,基于一组专家规则。因此,如果搜索结果不令人满意,则修改中断模块、索引模块和/或搜索模块中的专家规则,然后再次执行该过程。
一旦最终用户选择了搜索结果显示中的一个有限元素,那么非中断模块就允许最终用户查看所选择的有限元素所属的信息资源的连续部分。非中断模块将所选择的有限元素与其他相关的有限元素汇编在一起,以重新构建信息资源的连续部分。非中断模块参考所选择的有限元素的分类标记,获得有关有限元素相对于整个信息资源的位置的信息,然后用从属于该部分的所有有限元素来构建信息资源的一部分。例如,如果所选择的有限元素是文档的一个段落,那么可以配置非中断模块,以重新构建该段落所属的文档的章节。与本发明的其他模块一样,非中断模块的运行受一组专家规则的控制,如果结果不令人满意,可以修改这些规则。
可以想象,由熟悉正在搜索的文档或信息的专家来创建和精炼规则集。例如,如果本发明的系统将要与《联邦管理法典》的第37卷关联,那么非常熟悉该卷的个人(或几个人)将最适合制定和微调这些规则集。对这些规则集的微调将涉及个人使用规则集连续地对该卷执行示例搜索,以及连续地修改规则集以获得所需要的内容和格式。一旦对规则集微调完毕,可以将本发明的搜索模块与该卷一起打包,并作为可搜索的卷来销售或分发。同样,搜索模块也可以在Web站点上运行,以便用户可以访问Web站点,并对该卷执行搜索。由于“专家”已经对规则集进行定义和微调,用户将拥有完全可操作的搜索引擎,该引擎可以根据专家掌握的卷的知识来执行搜索和显示结果。
正如上文所提及的,可以想象,本发明的实施例可用于搜索驻留在因特网上的单个Web页,并基于用户所选择的显示条件或层次结构,采用可折叠的/可展开的格式来显示搜索结果。在这样的实施例中,采用上文所描述的形式的中断模块可能并不需要,因为每个Web页可能已经被认为是“有限元素”,且搜索引擎将无法修改Web页。相应地,在这样的应用场合,索引模块将分析每个Web页(有限元素),以创建具有每个Web页的记录的可搜索数据库。可搜索数据库中的每个记录将包括Web页的Web地址,包含在Web页中的非共用词以及它们的频率(权重),分类标记,如上文所述,这种分类标记包括基于对Web页的内容的分析的数据。索引模块还将检查每个Web页,以确定Web页的创建者是否在Web页中嵌入了分类标记,如果找到这样的嵌入分类标记,那么索引模块只需将这种预先定义的分类标记插入数据库记录中,而不需要重新创建。因此,随着本发明在因特网上越来越广泛地应用,Web页的创建者可能希望为他们的Web页创建他们自己的分类标记,而不是让搜索引擎为他们创建。有了这一功能,Web页设计人员就可以影响搜索结果,以便获得对Web站点的更准确描述。当然,这样的功能也可以由Web设计人员以虚假的方式使用,在这种情况下,当搜索者在查找完全不同类型的信息时,分类标记将使Web页列在搜索结果中。由于认识到这一潜在的问题,索引模块将包括一个选项,它将把Web页的实际内容与嵌入的分类标记进行比较,如果存在显著的差异,它就会创建新的分类标记,以插入到数据库记录中。同样,还可以对索引模块进行配置,使其根据嵌入的分类标记的指示或者通过检查Web页内容本身,过滤掉具有不需要的或令人讨厌的内容的Web站点。
在本发明的另一个实施例中,可以配置动态专家规则集,以在全局范围内接受和索引各种各样的静态和动态信息(如新闻馈送、数据传输等),在这种情况下,根据分类组织方案(如Dewey十进制系统),最终用户将能够从分层次搜索结果显示中有效而快速地获得他/她所需要的任何种类的信息。
因此,在本发明的一个方面,从信息资源中检索信息的方法包括下面的步骤:(a)将信息资源分为众多有限元素;(b)向每个有限元素分配分类标记,其中分类标记包括关于有限元素的内容的数据;(c)为各个有限元素产生可搜索数据库记录,其中每个可搜索数据库记录都至少包括有限元素内所包含的一个字符串,其中字符串可以是单词、短语、符号、符号组、数据段等等;(d)提供搜索字符串;(e)搜索可搜索的数据库,以查找包含搜索字符串的可搜索数据库记录;(f)根据(至少部分地)分配到在搜索步骤中查找到的有限元素的分类标记中的数据,以层次结构排列搜索步骤的结果;(g)以层次结构显示搜索步骤的结果。
信息资源可以是单个文档、众多文档或数据流,标识有限元素的步骤可以包括标识文档内的节或子节或数据流的步骤或只需标识文档本身。将信息资源分为众多有限元素的步骤在优选的情况下由专家系统根据规则集来执行,向每个有限元素分配分类标记的步骤在优选的情况下由专家系统根据另一个规则集来执行。如果在上述步骤(g)中获得的结果不令人满意,那么可以由最终用户修改一个或两个规则,然后再重新执行一遍步骤(a)到(g)。
每个数据库记录在优选的情况下包括对应的有限元素的地址或指向该有限元素的指针,还进一步优选地包括对应的有限元素内所包含的所有非共用字符串(例如,单词或短语)以及这些字符串所出现的频率。
在本发明的另一个方面,从信息资源中检索信息的方法包括下列步骤:定义第一个规则集,用于将信息资源分为众多有限元素;利用第一个规则集,将信息资源分为众多有限元素;定义第二个规则集,用于为其中一个有限元素创建分类标记,利用第二个规则集,为各个有限元素创建分类标记;产生可搜索数据库,包括每个有限元素的可搜索数据库记录;搜索可搜索数据库,以查找相关的数据库记录;将在搜索中查找到的相关的数据库记录与对应的相关有限元素关联;选择用于显示关于相关有限元素的标识短语的层次结构;根据(至少部分地)每个有限元素的分类标记,按层次结构排列相关的有限元素;根据排序步骤中的结果,显示关于相关有限元素的标识短语。
在本发明的另一个方面,提供数据存储设备(如CD ROM),该设备包括:分为众多有限元素的信息资源,其中每个有限元素都包括分类标记以及分配的数据库记录,其中分类标记包括关于有限元素的内容的数据,而数据库记录至少包括有限元素内包含的一个字符串,还包括软件指令,这些指令经过编程,以至少检索和显示该信息资源的一部分。可以对软件指令进行配置,使它们执行下列步骤:提供搜索字符串,搜索数据库记录,以查找包含搜索字符串的相关数据库记录,根据分配到与相关的数据库记录对应的有限元素的分类标记中的信息,以层次结构排列搜索步骤的结果,为与层次结构中的相关数据库记录对应的有限元素显示标识短语。
附图说明
图1是本发明的第一个实施例的操作的流程图表示;
图2A和2B是图1中所说明的实施例的操作的流程图表示;
图3是本发明的第二个实施例的操作的流程图表示,驻留在数据存储设备(如CD ROM)中
图4是本发明的第三个实施例的操作的流程图表示;
图5A和5B是图4中所说明的实施例的流程图表示。
详细说明
本发明是信息管理、检索和显示系统,用于搜索信息资源,如文档(例如条约)、许多单个文档(例如,驻留在因特网上的Web页),或信息流(例如DNA代码、源代码、卫星数据传输信息等),并基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。这样的显示层次结构将使最终用户有效而快速地从搜索结果中获得感兴趣的内容。
如图1所示,在本发明的第一个实施例中,信息管理、检索和显示系统包括四个主要模块:中断模块10、索引模块12、搜索模块14和非中断模块16。这些处理模块中的每个模块在优选的情况下都是专家引擎,它们根据一组专家规则来运行,这些规则定义单个模块的运行。正如在下文中所详细描述的,针对这些模块的专家规则在优选的情况下由熟悉正在搜索的文档18的人(多人)来制定;对专家规则的微调是一个反复的过程,在这个过程中,如果对文档的搜索证明是不令人满意的,专家就会对上述一个或多个模块的规则进行修改。
中断模块10分析信息资源,如一组文档18,以将文档组分为“有限元素”20a-20z。每个有限元素都是文档中的用户定义的信息“篮”,可以对这些信息“篮”分别进行索引和搜索。有限元素通常不是单个单词、短语或符号,而是信息资源的节或部分,可以由中断模块来标识和隔离。有限元素的简单例子是文档的单个段落。有限元素的其他例子将包括文档的子章节、文档的单个页、文档的其他类型的可标识节。在一些实例中,有限元素可以是整个文档本身。中断模块还负责分析每个有限元素20a-20z的内容,为各个有限元素创建分类标记22a-22z,这些分类标记将要插入到有限元素中。分类标记22a-22z可以包括基于内容分析的标准分类,例如“Dewey十进制”类型号码,或一些其他分类引用号码。分类标记还可以包括组织属性,如关于有限元素的类型或有限元素在文档内的位置、日期戳、概括有限元素的内容的分类单词或短语等。正如下文将要详细描述的,每个分类标记的内容将向搜索模块12提供信息,以便帮助搜索模块创建搜索结果的分层次显示。
索引模块分析由中断模块创建的每个有限元素,并创建可搜索的数据库23,该数据库包括中断模块创建的每个有限元素的数据库记录24a-24z。可搜索的数据库23是一种反向索引,其中每个记录24a-24z包括对应的有限元素的地址或位置,有限元素内所包含的所有单词(优选的情况下排除共用词,如“and”、“in”、“the”...)以及它们在有限元素内出现的频率(即它们的权重)。
在该过程中的某一时刻,用户(该用户可能是最终用户,也可能是制定规则集的专家)将输入搜索查询26和可选层次结构选择28。搜索查询可以是现有技术中那些普通技术人员可用的任何常规搜索查询,也可以包括搜索字或短语和/或将单词连接起来的运算符。层次结构选择通知搜索模块有关用户希望看到的显示结果所采用的显示格式的类型。具体来讲,层次结构选择将通知搜索模块,搜索结果是否完全根据分类标记内包含的信息按某种顺序或结构来显示(以研究为中心),搜索结果是否完全取决于关键字或短语在有限元素中出现的频率按某种顺序来显示(常规),或者搜索结果是否根据两种情况的组合按某种顺序或结构来显示(以文档为中心)。
搜索模块将利用搜索查询,来搜索数据库记录24a-24z,以便查找与搜索查询中的单词或短语匹配的数据库记录30。然后,取决于所选择的层次结构28,基于有限元素20(这些有限元素与匹配搜索查询的记录30相关联)中所包括的分类标记22中的信息,搜索模块将按顺序或以可折叠的/可展开的树形结构显示搜索结果32。例如,显示层次结构的第一个层次可能根据有限元素所在的文档的章节来排列顺序。有关有限元素所在的章节的信息将驻留在与有限元素关联的分类标记内。显示结果的第二个层次可能根据搜索字或短语在每个有限元素内出现的权重或频率,来排列每个章节的有限元素。因此,在搜索结果屏幕中,最终用户将选择他或她希望查看的相关的有限元素所在的章节,然后,显示屏幕展开,以显示与搜索查询匹配的该章节中的有限元素。包含在该章节内的这些有限元素将根据搜索查询或单词的权重来排列顺序。从那里,用户将作出选择34,向非中断模块16指出用户希望查看哪一个有限元素。
现有技术中的那些普通技术人员应该认识到,排序方案和任何给定的层次结构中的层次的不同的组合几乎是无限的。排序方案和层次的其他例子可以基于有限元素的主题、有限元素的作者或提供者、有限元素的时间/日期、有限元素相对于信息资源的位置等。层次结构只包括一个排序层次的情况,也在本发明的范围内。
尽管搜索模块以可折叠的/可展开的树形结构来显示搜索结果是优选的,但以可替换的层次结构来显示搜索结果也在本发明的范围内。可替换的层次结构的一个例子是,使用层叠或平铺显示来呈现层次结构的各个层次。当然,如果只有一个排序层次,显示结构就不必是可折叠的/可展开的。
还可以对搜索模块进行配置,使其识别出搜索查询中的字符串可能有其他渗透,它们可以由搜索引擎用来提供与数据库记录的匹配项。例如,如果搜索查询包括以第一种语言表示的单词,当查找与数据库记录的匹配项时,搜索模块提供以其他语言表示的单词,这种情况也在本发明的范围内。同样,搜索模块提供单词的其他已知的词形或时态,这种情况也在本发明的范围内,搜索模块提供具有相似的或相同意思的其他搜索字,这种情况也在本发明的范围内。
非中断模块16访问所选择的有限元素34的分类标记,以确定文档18的其他有限元素36,这些有限元素将要组合在一起以便形成单个连续显示38。例如,如果所选择的有限元素34是文档的段落,那么非中断模块16将参看其余的有限元素的分类标记,以确定与所选择的有限元素出现在相同页中的其他有限元素36,以便显示整个页38,而不是单个段落。同样,非中断模块可以将连续的章、节或一个文档或多个文档的其他连续的可标识的部分的相关的有限元素组合在一起。简而言之,非中断模块用于在上下文中与信息资源的其余部分一起显示所选择的有限元素。
尽管利用非中断模块来重新构建信息资源的连续部分是优选的,但配置非中断模块的专家规则集,以使用所选择的有限元素和原始信息资源中的其他有限元素构建新的信息资源,这种情况也在本发明的范围内。例如,可以配置非中断模块,以将匹配搜索查询的所有有限元素汇编为新的信息资源,并使用这些有限元素的分类标记,规定汇编有限元素时所采用的顺序。在另一个例子中,可以配置非中断模块,以检查所选择的有限元素的分类标记,从而基于创建有限元素时的日期、或有限元素的作者/所有者、或有限元素的内容,来确定与所选择的有限元素相关的其他有限元素,然后非中断模块将构建新的信息资源,同时汇编所有相关的有限元素。
图2A和2B是上文所描述的实施例的信息管理、检索和显示系统的操作的流程图表示。如功能块40所示,第一个步骤是访问正在检查的信息资源。如功能块42中所说明的,下一个步骤是选择适当的专家规则集,将其应用于对信息资源的搜索。所选择的特定的规则集将取决于在步骤40中访问的信息资源的类型。例如,用于搜索和分析《南极条约》的一组专家规则将与用于搜索和分析《联邦管理法典》的第37卷的一组规则不同。如功能块44所示,下一个步骤是根据第一组专家系统规则,将信息资源分为众多有限元素。正如上文所讨论的,此步骤涉及将信息资源分为可标识的信息段,如段落、子节、页、章、子章等等。下面的表1提供了将《南极条约》分为众多有限元素的示例规则集。
表1:自动将文档分为段或元素的“规则集”的完整示例1
文档划分层次 特定文档划分 模式匹配规则
第一层次 南极条约、约定、协议及其附件 由位于页中间的大号粗体字体来识别
第二层次 建议、措施等 由罗马数字来识别
第三层次 第一层次或第二层次中的文档内的条款 由带有冒号的页中间的中号字体来识别
分组层次 南极条约咨询会议 按它们的罗马数字组合文档
附加层次 将文档的签署的日期附加到第一层次、第二层次或分组层次
1基于《南极条约手册》中的公有土地文档,该手册自20世纪60年代以来由美国国务院仅以硬拷贝形式发行,而现在已经转换为可搜索的数据库。2源代码使用JAVA语言描述,但很容易用PERL语言或任何其他编程语言编写。请参见附录A,了解源代码段的示例
如上面的表格所示,采用示例规则集,以将《南极条约》分为众多的层次,其中条约的第一层次(该层次涉及《南极条约、约定、协议及其附件》)由搜索引擎通过标识页中间的大号粗体来识别。第二个层次(它们是包含在条约内的建议和措施)由搜索引擎通过标识罗马数字来识别。利用第三个层次来将第一层次和第二层次分为较小的有限元素。此第三层次的有限元素由搜索引擎通过标识带有冒号的页中间的中号字体来识别。根据对本表以及相关的模式匹配规则的分析,该表中的其余层次对现有技术中的那些普通技术人员是显而易见的。
相应地,上面的规则集的目的是为匹配模式创建一个自动工具,匹配模式区分任何类型的信息资源内的层次结构、段或元素。根据用户定义的针对信息资源内的需要索引和搜索的段或元素的要求,来制定规则集。在包括已经区分的段或元素(如在单独的栏或块中)的信息资源中,规则集将大大地简化,这对于现有技术中的那些普通技术人员是显而易见的。优选的情况下,规则集由非常熟悉信息资源的专家来设计,利用反馈循环反复地进行,关于这一点,将在下文中详细描述。
如功能块46所示,下一个步骤是,根据第二组专家系统规则,基于对有限元素的位置和/或内容分析,为各个有限元素创建分类标记。下面的表2提供了为从《南极条约》中提取的有限元素定义分类标记的规则集的示例。
表2:自动附加到根据用户定义的“规则集”创建的有限元素的分类标记示例(请参见表1)1
文档划分层次 特定文档划分
第一层次 南极条约、约定、协议及其附件
第二层次 建议、措施等
第三层次 第一层次或第二层次中的文档内的条款
分组层次 南极条约咨询会议
附加层次
1基于《南极条约手册》中的公有土地文档,该手册自20世纪60年代以来由美国国务院仅以硬拷贝形式发行,而现在已经转换为可搜索的数据库。2源代码使用JAVA语言描述,但很容易用PERL语言或任何其他编程语言编写。请参见附录A,了解源代码段的示例。
如表2所示,分类标记将包括一种表示法,指示有限元素在《南极条约》的各种标识的层次内的位置。例如,分类标记将包括指示在第一层次有限元素是否包含在《南极条约、约定、协议及其附件》内的信息。在第二层次,分类标记将指出有限元素是否包含在《建议、措施》中。如该表的最底部所示,每个有限元素的分类标记还将包括内容基表示法,指出创建特定的节或有限元素的年份。当然,分类标记中所包括的位置和/或内容基表示法的类型和变体几乎是无限的。例如,可以配置规则集,以分析有限元素的内容,以便提供分类词或短语,这些分类词或短语向用户提供有关有限元素的内容的提示。同样,不是利用单词或短语,规则集可以分析有限元素的内容或位置,以提供有限元素的分类引用号码,如Dewey十进制类型号码。
如功能步骤48所示,下一个步骤是将在上面的步骤46中创建的分类标记插入到在步骤44中创建的有限元素中。如功能块50所示,下一个步骤是,为各个有限元素产生可搜索的数据库记录。每个数据库记录都优选地包含有限元素内所包含的非共用字符串(例如单词、短语、符号)以及它们的频率(即权重)。此外,每个数据库记录将包括对应的有限元素的地址、位置或指向它的链接。如功能块52所示,下一个步骤是,输入搜索字符串,如单词、短语或符号,并选择显示层次结构。如功能块54所示,下一个步骤是,搜索在功能块50中创建的数据库记录,以查找搜索字符串和数据库记录的非共用字符串之间的匹配。此搜索步骤将标识具有与搜索字符串匹配的非共用字符串的相关数据库记录。如功能块56所示,将对在搜索步骤54中查找到的相关数据库记录进行排序,方法是,将相关的数据库记录的关联的有限元素的每个分类标记中的信息应用到所选择的显示层次结构,和/或将相关的数据库记录中的匹配搜索字符串的权重应用到所选择的显示层次结构。
例如,《南极条约》的显示层次结构的第一层次可能是创建有限元素的年份;第二层次可能根据《南极条约》的条款的顺序进行排序;显示层次结构的第三层次可能根据数据库记录内包含的匹配字符串的权重进行排序。
如功能块58所示,下一个步骤是,在显示屏幕上以可折叠的/可展开的层次结构显示搜索结果。如功能块60所示,用户将确定搜索结果是否令人满意,如果不令人满意,过程将进入到功能块62,此处用户将修改一个或多个规则集,并取决于修改了哪些规则集,返回到功能块44或功能块52。
如果在功能块60中搜索结果令人满意,过程将进入功能块64,此处用户将从搜索结果显示中选择其中一个有限元素。然后在功能块66中,所选择的有限元素的分类标记将用来标识其他有限元素,这些有限元素将与所选择的有限元素组合在一起,以创建要显示的信息资源的连续部分。最后,在功能块68中,信息资源的连续部分将显示在显示屏中或打印出来。
可以想象,熟悉信息资源的专家将基于他或她对信息资源的了解来制定规则集。此后,一旦规则集完全制定出来,上面所描述的流程图的反馈部分将不再需要。
此外,一旦规则集完全制定出来,可以将搜索模块、非中断模块和制定完全的规则集合并到数据存储设备(如CD ROM、磁盘驱动器、软盘等等)中,还包括预先分为众多有限元素的信息资源(其中每个有限元素包括以前创建的对应的分类标记),还包括预先创建的众多有限元素的可搜索数据库。因此,此类存储设备将提供可搜索的文档,该文档包括信息资源的全部内容,以及已经由专家使用其信息资源的知识进行微调的搜索引擎,这样,CD ROM(或其他类型的存储设备)的最终用户将能够利用专家的知识和经验来搜索所包含的信息资源。
如图3所示,提供了驻留在数据存储设备(如CD ROM)中的本发明的实施例的流程图表示。此实施例相当于上文图2A和2B所描述的实施例,只不过不再需要制定规则集。如功能块52'所示,第一个步骤是最终用户输入搜索字符串,并选择显示层次结构。在功能块54'中,下一个步骤是搜索模块搜索包含在CD ROM或从CD ROM中下载的数据库记录,以将搜索字符串与可搜索数据库记录中包含的非共用字符串匹配。如功能块56'所示,下一个步骤是,搜索模块对搜索结果进行排序,方法是,向如上文所讨论的所选择的显示层次结构应用匹配有限元素(它们包含在CD ROM或从CD ROM中下载)的分类标记中的信息和/或应用匹配字符串的权重。如功能块58'所示,下一个步骤是优选地以可折叠的/可展开的层次结构显示搜索结果。如功能块60'所示,最终用户在查看搜索结果时将确定结果是否令人满意。如果不令人满意,过程将返回到功能块52',在此最终用户将输入新搜索字符串和/或将选择新的显示层次结构。如果步骤58'的显示结果令人满意,过程将进入功能块64',在此最终用户将从搜索结果显示中选择一个有限元素。进入功能块66'后,非中断模块将重新构建信息资源的部分,该部分包括所选择的有限元素,其方法是,访问所选择的有限元素和CD ROM中的其他周围的或相关的有限元素,以创建包含该有限元素的信息资源的连续部分。
在本发明的另一个实施例中,可以特别配置信息管理、检索和显示系统,以搜索驻留在因特网上的许多单个Web页,基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。在这样的实施例中,可能不需要上文所描述的形式的中断模块,因为每个Web页可能已经被认为是“有限元素”,且搜索引擎将无法修改Web页。因此,对于这样的实施例,搜索引擎也将无法把分类标记插入到有限元素中。因此,在此实施例中,可以将分类标记与有限元素分开存储或直接合并到数据库记录中。此外,可以想象,Web页的创建者可能希望为他们的Web页创建他们自己的分类标记,而不是让搜索引擎为他们创建。有了这一功能,Web页设计人员就可以影响搜索结果,以便获得对他或她的Web站点的更准确描述。当然,这样的功能也可以由Web设计人员以虚假的方式使用,在这种情况下,当搜索者在查找完全不同类型的信息时,分类标记将使Web页列在搜索结果中。由于认识到这一潜在的问题,索引模块将包括一个选项,它将把Web页的实际内容与Web页设计人员插入的嵌入式分类标记进行比较,如果两者之间存在显著的差异,它就会创建新的分类标记,以插入到数据库记录中。同样,还可以对搜索引擎进行配置,以包括一个可选的过滤器,该过滤器将根据嵌入的分类标记的指示或者通过检查Web页内容本身,过滤掉具有令人讨厌的内容的Web站点。
如图4所示,在本发明的实施例中,信息管理、检索和显示系统包括两个主要模块,索引模块70和搜索模块72。这些处理模块中的每个模块优选情况下都是专家引擎,它们根据一组专家规则来运行,这些规则定义单个模块的运行。索引模块70将定期利用常规的Web爬行遍历或Web搜索技术(如“蜘蛛”技术,该技术用来检查因特网上提供的每个Web页,或尽可能多地检查Web页)爬行遍历Web页74的卷。如图4所示,一些Web页可能包括预先定义的、所包括的嵌入分类标记76。如上文所讨论的,这样的嵌入标记76将由Web页设计人员插入到Web页中,这样图4的搜索引擎将利用此预先定义的嵌入分类标记,而不是单独创建分类标记。在此实施例中定义分类标记的专家规则集的规则示例是,标识在访问Web站点时在初始屏幕上出现的最突出的单词或短语。
索引模块70还将创建可搜索的数据库78,包括上面所访问的每个Web页的数据库记录80a-80z。此可搜索的数据库78是一种反向索引,或者每个记录80a-80z包括指向对应的Web页的链接,包含在Web页内的所有单词(最好排除共用单词)以及它们在Web页内出现的频率,以及上文所描述的特定的Web页内所包括的索引模块所创建的分类标记或分类标记的副本。可以想象,索引模块将不断地反复访问Web页74并更新可搜索的数据库78,因为Web页的内容也不断地更新或更改。
当用户希望使用搜索引擎进行搜索时,用户将输入搜索查询82,并选择可选的层次结构选择84。搜索查询可以是现有技术中那些普通技术人员可用的任何常规搜索查询,它可能包括搜索字或短语和/或将单词连接起来的运算符。层次结构选择通知搜索模块有关用户希望看到的显示结果所采用的显示格式的类型。具体来讲,层次结构选择将通知搜索模块,搜索结果是否完全根据分类标记内包含的信息按某种顺序或结构来显示(以研究为中心),搜索结果是否完全取决于关键字或短语在有限元素中出现的频率按某种顺序来显示(常规),或者搜索结果是否根据两种情况的组合按某种顺序或结构来显示(以文档为中心)。
搜索模块72将利用搜索查询82,来搜索数据库记录80a-80z,以便查找与搜索查询中的单词或短语匹配的数据库记录86。然后,取决于所选择的层次结构84,基于与搜索查询匹配的数据库记录87内所包括的分类标记89中的信息,搜索模块将按顺序或以可折叠的/可展开的树形结构显示搜索结果88。从显示屏幕88中,用户将对指向他或她希望查看的Web页的链接进行选择90,然后搜索模块将在显示屏幕上显示Web页92。
图5A和5B提供上面的图4所描述的实施例的操作的流程图表示。如功能块94所示,第一个步骤是访问因特网上的Web页。在功能块96中,下一个步骤是确定所访问的Web页是否包括嵌入分类标记。如果Web页包括嵌入分类标记,过程将进入功能块98,在此该过程将确定嵌入的分类标记是否与Web页的内容相一致。如果Web页不包括嵌入分类标记或者如果分类标记与Web页的内容不一致,那么过程将进入功能块100,在此将为Web页创建分类标记。如果在步骤98中嵌入分类标记与Web页的内容相一致,或者在步骤100中为Web页创建分类标记,那么过程将进入功能块102,在此将为Web页产生可搜索的数据库记录。此可搜索的数据库记录将包括Web页内包含的非共用词或短语以及它们的频率(即权重),指向Web页的链接,嵌入在Web页内的或在上面的步骤100中创建的分类标记。然后,过程将进入功能块104,以确定是否要访问下一个Web页。如果如此,过程将返回到功能块94。如果可搜索数据库是完整的,那么过程将进入功能块106,在此用户将在所选择的显示层次结构中输入搜索字或短语。
进入功能块108后,搜索引擎将搜索数据库记录,以查找搜索字或短语和数据库记录内包含的非共用词或短语之间的匹配。进入功能块110后,搜索引擎将对搜索结果进行排序,方法是,通过将匹配数据库记录的分类标记中的信息应用到所选择的显示层次结构,和/或将每个匹配数据库记录中的搜索字或短语的权重应用到所选择的显示层次结构。进入功能块112后,下一步将涉及在显示屏幕上显示搜索结果。在功能块114中,如果搜索结果令人满意,用户将选择显示屏幕上的Web页链接,搜索引擎将显示所选择的关联的Web页。如果搜索结果不令人满意,过程将进入功能块118,在此用户将输入新的搜索字或短语和/或选择新的显示层次结构,该过程将返回到功能块108,以便可以执行另一个搜索。
在本实施例中,创建分类标记、数据库记录的专家规则集可以由专家利用上面的过程的反复的变体针对因特网的有限的部分(类似于上面的图2A和2B中所描述的部分)来进行定义。一旦精炼了规则集,则可以将规则集应用到整个因特网。上面所描述的搜索引擎可以在Web站点上运行或者包含在存储设备(例如CD ROM)中,其上的内容可以下载到可以访问因特网的计算机中。
下面的附录提供了示例代码段,用于将《南极条约》分为众多有限元素,以及用于为有限元素创建分类标记。
                          附录A
Table 1:
    1)$line=~m/<FONT FACE=\″Helvetica.Arial″SIZE=\d>((\d)\.(\d\d|\d)?\?(\d\d|\d)?\.?(d\d|\d)?)([a-zA-z\-\_\s]+)

    2)$line=~m/<P ALIGN=\″CENTER\″>(([IXVLDCM]+)\-([^<]+?))<VP>/

    3)$line=~m/<P

    ALIGN=\″CENTER\″>(Extract(s)?\s+from\s+Report\s+of\s+([IXVLDCM]+)(th|st)\s+ATCM[^<]*)/i

    4)Simple variable substitutionàààA Hashtable is generated using the code:

    #####################################################################################################################

           #      SUB:gen_hashes

           #

         #Purpose:To generate a tables based on a set pattern from an

         #     files related to the Antarctic Treaty Project.

  #####################################################################################################################

         sub gen_hashes

        {

                 my $FileList=@_[0];

                 print″FileList:$FileList<br>\n″;

          print″Generating Year-Roman Numeral and Year-Major Document Name Hashes.\n\n″;

          print″Processing″;

                 while($InputFN=glob(″$FileList″))

                         {

                         open(InFile,″<$InputFN″)||die(″Cannot open $InputFN\n$!″):

                         print″.″;

                 while(defined($line=<InFile>))

                                  {

                                  chomp($line);

                    #Remove unwanted characters from the line

                 $line=rem_all($line);

                 #   print $line;

                    # Begin Matching
				
				<dp n="d19"/>
                # Attempt to grab the last for digits of a line.if they are on the line

                if($line=~m/^(\w+\w+\w+\w+|\w+\w+\w+).?(\w+|\w+\w+|\w+\w+\w+).??(\d|\d\d)(
\w+)?-(\d|\d\d)(\w+)?\w+(\d\d\d\d)/)

                      {    

                        # Debugging Code

                                       #print″$1 $2 $3 $4 $5 $6 $7 $8 $9 $10\n″;

                                       $MajorDoc=$1;

                          $year=$7;

                if(″$year″ne″″)

                                {

                                if(defined($NextLine=<InFile>))

                                         {

                                      # Remove unwanted characters from the line

                                         $NextLine=rem_all($NextLine);

                                 # Match the Roman Numerals at the beginning of the

                                 # next line

                                 if($NextLine=~m/^([IVXLCDM]+)/)

                                         {

                            $RomanNumeral=$1;

                                        SYearTrans{$RomanNumeral}=$year;

                                                              $DocTrans{$year}=$MajorDoc;

                                                              }

                                                        }

                                                   }

                         }                                            

                    }

                    close InFile;

                  }

                  print″\n″;

           }

           Then,when the Dewey tag is written out,the ATCM is placed in the appropriate position.whether it be the
first,second,or third level using the Year from the currently matched pattern to obtain the correct ATCM from the
hashtable(Doc Trans table specifically)as generated above
5)Simple variable substitutionàààA Hashtable is generated using the code:
				
				<dp n="d20"/>
  ###########################################################################################

         #       SUB:gen hashes

         #

         # Purpose:To generate a tables based on a set pattern from an

         #      files related to the Antarctic Treaty Project

  ###########################################################################################

         sub gen_hashes

         {

                 my $FileList=@_[0];

                 print″FileList:$FileList<br>\n″;

          print″Generating Year-Roman Numeral and Year-Major Document Name Hashes.\n\n″;

          print″Processing″;

                 while($InputFN=glob(″$FileList″))

                         {

                         open(InFile,″<$InputFN″)|| die(″Cannot open $InputFN\n$!″);

                         print″.″;

                 while(defined($line=<InFile>))

                                  {

                                  chomp($line);

                  # Remove unwanted characters from the line

                $line=rem_all($line);

                #  print$line;

                  # Begin Matching

                # Attempt to grab the last for digits of a line,if they are on the line

                if($line=~m/^(\w+\w+\w+\w+|\w+\w+\w+),?(\w+|\w+\w+|\w+\w+\w+),??(\d|\d\d)(
\w+)?-(\d|\d\d)(\w+)?\w+(\d\d\d\d)/)

                      {

                         # Debugging Code

                                        #print″$1 $2 $3 $4 $5 $6 $7 $8 $9 $10\n″;

                                        $MajorDoc=$1;

                           $year=$7;

                 if(″$year″ne″″)

                                  {
				
				<dp n="d21"/>
                              if(defined($NextLine=<InFile>))

                                       }

                                   # Remove unwanted characters from the line

                                      SNextLine=rem_all($NextLine);

                              # Match the Roman Numerals at the beginning of the

                              # next line

                              if($NextLine=~m/^([IVXLCDM]+)/)

                                      {

                         $RomanNumeral=$1;

                                     $YearTrans {$RomanNumeral}=$year;

                                                            $DocTrans{$year}=$MajorDoc;

                                                            }

                                                       }

                                                  }

                     }

                }

                close InFile;

              }

              print″\n″;

       }

       Then,when the Dewey tag is written out,the Year is placed in the appropriate position,whether it be the
first,second,or third level using the Roman Numeral from the currently matched pattern to obtain the correct Year
from the hashtable(YearTrans table specifically)as generated above
Table:2      ‘
1)<meta name=″Dewey″content=″Seventeenth Antarctic Consultative
Meeting%%====%%%%====%%%%====%%%%====%%Article XII″>
2)<meta name=″Dewey″content=″CONSERVATION OF ANTARCTIC MARINE LIVING
RESOURCES%%====%%Convention on the Conservation of
Antarctic%%====%%%%====%%%%====%%1981 Article VI Relationship to existing conventions relating to
the conservation of whales and seals″>
3)<meta name=″Dewey″content=″Resolutions and Measures adopted at the XIXth Antarctic Treaty Consultative
				
				<dp n="d22"/>
Meeting%%====%%Annex C%%====%%Resolutions%%====%%%%====%%Resolution 8″>
4)<meta name=″Dewey″content=″Seventeenth Antarctic Consultative
Meeting%%====%%%%====%%%%====%%%%====%%Article XII″>
5)<meta name=″Dewey″content=″1980%%====%%Convention on the Conservation of
Antarctic%%====%%%%====%%%%====%%1980 Article
尽管这里所描述的系统和方法构成了本发明的优选实施例,但要理解,本发明不局限于这些准确的形式,也可以在不超过本发明的范围的情况下作出更改。

Claims (67)

1.检索信息资源上的信息的方法,包括下列步骤:
(a)将信息资源分为众多有限元素;
(b)将分类标记分配到每个有限元素,分类标记包括有关有限元素的内容的数据;
(c)为各个有限元素生成可搜索的数据库记录,每个可搜索的数据库记录至少包含有限元素内的一个字符串;
(d)提供搜索字符串;
(e)搜索可搜索的数据库,以查找包含搜索字符串的可搜索的数据库记录,从而提供搜索结果;
(f)根据分配到有限元素(它们与在搜索步骤中查找到的可搜索的数据库记录相对应)的分类标记中的信息,按层次结构排列搜索步骤的结果;
(g)以层次结构显示搜索步骤的结果。
2.根据权利要求1的方法,其特征在于,信息资源是单个文档,将信息资源分为众多有限元素的步骤包括标识单个文档中的众多节的步骤,其中每个有限元素都是众多节中的其中一节。
3.根据权利要求1的方法,其特征在于,信息资源是多个文档,将信息资源分为众多有限元素的步骤包括标识众多文档的步骤,其中每个有限元素都是众多文档中的其中一个文档。
4.根据权利要求1的方法,其特征在于,信息资源是多个文档,将信息资源分为众多有限元素的步骤包括标识众多文档和标识众多文档内的节的步骤,其中每个有限元素都是标识的节。
5.根据权利要求4的方法,其特征在于,标识的节是众多文档中的整个文档。
6.根据权利要求1的方法,其特征在于,信息资源是数据流,将信息资源分为众多有限元素的步骤包括标识数据流内的段的步骤。
7.根据权利要求1的方法,其特征在于,将信息资源分为众多有限元素的步骤由专家系统根据规则集来执行。
8.权利要求7的方法,进一步包括下列步骤:
如果在显示步骤(g)中最终用户查看到不令人满意的结果,则对规则集进行修改,然后
使用修改后的规则集重复步骤(a)到(g)。
9.根据权利要求1的方法,其特征在于,将分类标记分配到各个有限元素的步骤由专家系统根据规则集来执行。
10.权利要求9的方法,进一步包括下列步骤:
如果在显示步骤(g)中最终用户查看到不令人满意的结果,则对规则集进行修改,然后
使用修改后的规则集重复步骤(a)到(g)。
11.根据权利要求1的方法,其特征在于,分类标记包括关于有限元素相对于信息资源的组织属性的数据。
12.根据权利要求1的方法,其特征在于,分类标记包括关于有限元素的位置的数据。
13.根据权利要求1的方法,其特征在于,分类标记包括关于有限元素的内容的分类短语。
14.根据权利要求1的方法,其特征在于,分类标记包括关于有限元素的内容的分类号码。
15.根据权利要求14的方法,其特征在于,分类号码是基于Dewey十进制的号码。
16.根据权利要求1的方法,其特征在于,将信息资源分为众多有限元素的步骤包括标识和区分信息资源内的标题与子标题的步骤。
17.根据权利要求1的方法,其特征在于,每个数据库记录进一步包括对应的有限元素的地址或指向它的链接。
18.根据权利要求1的方法,其特征在于,数据库记录包括有限元素内包含的非共用字符串。
19.根据权利要求18的方法,其特征在于:
信息资源至少是一个文档;数据库记录包括有限元素内包含的非共用字;并且提供搜索字符串的步骤涉及至少分配一个搜索字的步骤。
20.根据权利要求19的方法,其特征在于,每个数据库记录进一步包括关于对应的有限元素内包含的非共用单词的频率的单词频率数据。
21.根据权利要求20的方法,其特征在于,层次结构是可折叠的/可展开的层次结构,至少有两个层次,排序步骤(f)涉及根据第一层对搜索步骤的结果进行排序,然后根据下一个层次对搜索步骤的结果进一步进行排序。
22.根据权利要求21的方法,其特征在于,层次结构的至少一个层次的排序基础是,分配到有限元素的分类标记中包括的数据,有限元素与在搜索步骤(e)中查找到的数据库记录相关联。
23.根据权利要求22的方法,其特征在于,层次结构中的两个层次中的另一个层次根据在搜索步骤(e)中查找到的数据库记录的单词频率数据来进行排序。
24.根据权利要求1的方法,其特征在于,层次结构是可折叠的/可展开的层次结构,至少有两个层次,排列步骤(f)涉及根据第一个层次对搜索步骤的结果进行排序,然后进一步根据下一个层次对搜索步骤的结果进行排序的步骤。
25.根据权利要求24的方法,其特征在于,层次结构中的至少一个层次的排序基础是,分配到有限元素的分类标记中包括的数据,有限元素与在搜索步骤(e)中查找到的数据库记录相关联。
26.根据权利要求1的方法,其特征在于:
信息资源包括文档;
将信息资源分为众多有限元素的步骤包括标识文档中的众多节的步骤,每个有限元素都是众多节中的其中一节,分类标记包括关于有限元素相对于文档中的其他有限元素的位置的信息;以及
根据分配到有限元素(它们与在搜索步骤中查找到的可搜索的数据库记录相对应)的分类标记中的信息,按层次结构排列搜索步骤的结果的步骤,包括按照有限元素在文档中出现的顺序来排列有限元素的步骤。
27.根据权利要求1的方法,其特征在于,显示步骤包括在计算机屏幕上显示有限元素名称的步骤,有限元素与在搜索步骤中查找到的可搜索的数据库记录对应,该方法进一步包括下列步骤:
选择其中一个显示名称;
访问与所选择的名称对应的有限元素;
在被访问的有限元素的周围重新构建信息资源的连续部分。
28.根据权利要求27的方法,其特征在于,重新构建步骤包括下列步骤:
检查分配到被访问的有限元素的分类标记,以查找被访问的有限元素相对于信息资源的位置的数据;
基于与被访问的有限元素的位置对应的数据,确定要重新构建的信息资源的连续部分;
检索属于信息资源的连续部分的其他有限元素。
29.根据权利要求28的方法,其特征在于,检索步骤涉及检查分配到其他有限元素的分类标记的步骤,以确定其他有限元素是否属于信息资源的连续部分。
30.根据权利要求29的方法,其特征在于,重新构建步骤进一步包括,基于被访问的和检索到的有限元素的每个分类标记中包含的排序和位置数据,将被访问有限元素和检索到的有限元素汇编在一起的步骤。
31.根据权利要求27的方法,其特征在于,重新构建步骤由专家系统根据规则集来执行。
32.权利要求31的方法进一步包括下列步骤:
在最终用户查看重新构建的信息资源的连续部分之后,修改规则集;
使用修改后的规则集,至少重复一次重新构建步骤。
33.根据权利要求1的方法,其特征在于,显示步骤包括在计算机屏幕上显示有限元素名称的步骤,有限元素与在搜索步骤中查找到的可搜索的数据库记录对应,该方法进一步包括下列步骤:
选择其中一个显示名称;
访问与所选择的名称对应的有限元素;
使用被访问的有限元素和其他相关的有限元素,构建新的信息资源供查看。
34.根据权利要求33的方法,其特征在于,其他相关的有限元素基于被访问的有限元素的分类标记内包含的信息来确定。
35.根据权利要求33的方法,其特征在于,其他相关的有限元素是与在搜索步骤中查找到的数据库记录对应的有限元素。
36.根据权利要求35的方法,其特征在于,构建新信息资源的步骤包括,根据其他相关有限元素和被访问的有限元素内包含的信息,对其他相关有限元素和被访问的有限元素进行排序的步骤。
37.根据权利要求1的方法,其特征在于,步骤(b)包括将每个分类标记插入到相应的其中一个有限元素中的步骤。
38.根据权利要求1的方法,其特征在于,步骤(c)包括将各个分类标记插入到与相应的其中一个有限元素对应的数据库记录中的步骤。
39.根据权利要求1的方法,其特征在于,提供步骤(d)包括下列步骤:
提供初始搜索字符串;以及
至少创建一个其他搜索字符串,该字符串具有与初始搜索字符串极其相似的意思或效果。
40.根据权利要求39的方法,其特征在于,初始搜索字符串是第一种语言的单词,至少有一个其他搜索字符串是第二种语言的单词。
41.根据权利要求39的方法,其特征在于,初始搜索字符串是具有第一个意思的单词,至少一个其他搜索字符串是具有与第一个意思相似的第二个意思的另一个单词。
42.根据权利要求39的方法,其特征在于,至少一个其他搜索字符串基于初始搜索字符串的已知渗透。
43.从信息资源中检索信息的方法包括下列步骤:
将信息资源分为众多有限元素;
为各个有限元素创建分类标记;
为各个有限元素生成可搜索的数据库,该数据库包括可搜索的数据库记录;
搜索可搜索的数据库,以查找相关的数据库记录;
将相关的数据库记录与对应的相关有限元素关联;
选择层次结构,用于显示关于相关有限元素的标识短语;
根据(至少部分地)为各个有限元素创建的分类标记,在层次结构中对相关有限元素进行排序;
根据排序步骤中的结果,显示关于相关有限元素的标识短语。
44.根据权利要求43的方法,其特征在于,信息资源是文档,可选层次结构包括基于有限元素在文档中出现的顺序的层次结构。
45.根据权利要求43的方法,其特征在于,可选的层次结构包括基于分类系统的层次结构。
46.根据权利要求45的方法,其特征在于,分类系统是Dewey十进制系统。
47.根据权利要求43的方法,其特征在于,可选的层次结构包括可折叠的/可展开的层次结构,至少具有两个层次。
48.根据权利要求47的方法,其特征在于,可选的层次结构的两个层次结构中的至少一个层次基于为各个有限元素创建的分类标记进行排序。
49.根据权利要求48的方法,其特征在于:
每个可搜索的数据库记录包括关于某字符串出现在对应的有限元素中的频率的字符串频率数据;以及
可选的层次结构的两个层次结构中的另一个层次基于相关的有限元素的字符串频率数据进行排序。
50.根据权利要求43的方法,其特征在于,分类标记至少包括下列信息组中的一个信息项,该信息组包括关于有限元素的内容的内容数据、关于有限元素相对于信息资源的位置的位置数据、关于有限元素在信息资源的组织框架内的布局的组织数据、作者数据、所有者数据和时间数据。
51.从出现在因特网上的众多Web页中检索Web页以及查看Web页的方法包括下列步骤:
(a)向各个Web页分配分类标记,分类标记包括关于Web页的内容的数据;
(b)为各个Web页产生可搜索的数据库记录,每个可搜索的数据库记录至少包括包含在Web页内的一个单词或短语,并包括分配到Web页的分类标记;
(c)提供搜索字或短语;
(d)搜索可搜索的数据库,以查找包含搜索字或短语的可搜索的数据库记录;
(e)根据(至少部分地)在搜索步骤中查找到的可搜索的数据库记录中包括的分类标记中的信息,在层次结构中排列搜索步骤的结果;以及
(f)在层次结构中显示搜索步骤的结果。
52.权利要求51的方法进一步包括下列步骤:
检查各个Web页,以获得包含在Web页内的嵌入分类标记;以及
对查找Web页中的嵌入分类标记作出反应,将分类标记的副本插入到为Web页生成的数据库记录内。
53.权利要求52的方法进一步包括下列步骤:
对查找Web页中的嵌入分类标记作出反应,检查Web页的内容,并将包含在分类标记内的内容数据与Web页的内容相比较。
54.权利要求53的方法进一步包括下列步骤:
对确定包含在分类标记内的内容数据与Web页的内容不匹配作出反应,为Web页生成新的分类标记,并将新的分类标记插入到为Web页生成的数据库记录内。
55.搜索和检索部分信息资源的方法包括下列步骤:
(a)将信息资源分为众多有限元素,各个有限元素都是信息资源的可定义的节,每个可定义的节都包括众多单词;
(b)为各个有限元素生成可搜索的数据库记录,各可搜索的数据库记录都至少包括有限元素内包含的一个单词或短语;
(c)提供搜索字或短语;
(d)搜索可搜索的数据库,以查找包含搜索字或短语的可搜索的数据库记录,从而至少产生一个相关的数据库记录;以及
(e)显示相关的数据库记录的标识符。
56.根据权利要求55的方法,其特征在于,信息资源是单个文档,将信息资源分为众多有限元素的步骤包括标识单个文档中的众多节的步骤,其中每个有限元素都是众多节中的其中一节。
57.根据权利要求55的方法,其特征在于,信息资源是多个文档,将信息资源分为众多有限元素的步骤包括标识众多文档的步骤,其中每个有限元素都是众多文档中的其中一个文档。
58.根据权利要求55的方法,其特征在于,信息资源是多个文档,将信息资源分为众多有限元素的步骤包括标识众多文档和标识众多文档内的节的步骤,其中每个有限元素都是标识的节。
59.根据权利要求55的方法,其特征在于,标识的节是众多文档中的整个文档。
60.根据权利要求55的方法,其特征在于,信息资源是动态信息流,将信息资源分为众多有限元素的步骤包括标识动态信息流内的中断的步骤。
61.根据权利要求55的方法,其特征在于,将信息资源分为众多有限元素的步骤由专家系统根据规则集来执行。
62.权利要求61的方法进一步包括下列步骤:
如果在显示步骤(e)中最终用户查看到不令人满意的结果,则对规则集进行修改,然后
使用修改后的规则集重复步骤(a)到(e)。
63.根据权利要求55的方法,其特征在于,将信息资源分为众多有限元素的步骤包括标识和区分信息资源内的标题与子标题的步骤。
64.根据权利要求55的方法,其特征在于,显示步骤包括在计算机屏幕上显示有限元素名称的步骤,有限元素与在搜索步骤中查找到的可搜索的数据库记录对应,该方法进一步包括下列步骤:
选择其中一个显示名称;
访问与所选择的名称对应的有限元素;
在被访问的有限元素的周围重新构建信息资源的连续部分。
65.根据权利要求64的方法,其特征在于,重新构建步骤由专家系统根据规则集来执行。
66.权利要求65的方法进一步包括下列步骤:
在最终用户查看重新构建的信息资源的连续部分之后,修改规则集;
使用修改后的规则集,至少重复一次重新构建步骤。
67.数据存储设备,包括:
分为众多有限元素的信息资源,每个有限元素包括分类标记和分配的数据库记录,分类标记至少包括下列信息组中的一个信息项,该信息组包括关于有限元素的内容的内容数据、关于有限元素相对于信息资源的位置的位置数据、关于有限元素在信息资源的组织框架内的布局的组织数据、作者数据、所有者数据和时间数据;以及
软件指令,这些指令经过编程,以至少检索和显示该信息资源的一部分,可以对软件指令进行配置,使它们执行下列步骤:
提供搜索查询,
搜索数据库记录,以查找匹配搜索查询的相关数据库记录;
根据(至少部分地)分配到与相关的数据库记录对应的有限元素的
分类标记中的信息,以层次结构排列搜索步骤的结果;以及
为与层次结构中的相关数据库记录对应的有限元素显示标识短语。
CN00809232A 1999-05-20 2000-05-17 信息管理、检索和显示系统以及相关方法 Pending CN1363069A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/315,316 US6175830B1 (en) 1999-05-20 1999-05-20 Information management, retrieval and display system and associated method
US09/315,316 1999-05-20

Publications (1)

Publication Number Publication Date
CN1363069A true CN1363069A (zh) 2002-08-07

Family

ID=23223852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN00809232A Pending CN1363069A (zh) 1999-05-20 2000-05-17 信息管理、检索和显示系统以及相关方法

Country Status (11)

Country Link
US (3) US6175830B1 (zh)
EP (1) EP1210675B1 (zh)
JP (2) JP3883810B2 (zh)
CN (1) CN1363069A (zh)
AU (1) AU770087B2 (zh)
CA (1) CA2371362C (zh)
DK (1) DK1210675T3 (zh)
ES (1) ES2555428T3 (zh)
MX (1) MXPA01011691A (zh)
NZ (1) NZ515007A (zh)
WO (1) WO2000072196A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405366C (zh) * 2003-04-29 2008-07-23 国际商业机器公司 用于为一组搜索结果生成精细化类别的系统和方法
CN100444168C (zh) * 2004-06-25 2008-12-17 英国电讯有限公司 数据仓库装置、用于构造其的方法及从中检索数据的方法
CN100444164C (zh) * 2004-08-06 2008-12-17 佳能株式会社 信息处理装置、文档检索方法
CN100449541C (zh) * 2004-02-27 2009-01-07 株式会社理光 文档组分析设备、文档组分析方法及文档组分析系统
CN101882152A (zh) * 2010-06-13 2010-11-10 博采林电子科技(深圳)有限公司 一种便携式学习机及其资源检索方法
CN101884024A (zh) * 2007-09-20 2010-11-10 起元技术有限责任公司 在基于图的计算中管理数据流
CN101133388B (zh) * 2005-01-25 2011-07-06 谷歌公司 基于多索引的信息检索系统
CN101529372B (zh) * 2006-09-08 2011-07-27 谷歌公司 计算机实现的确定关于企业的信息的方法和计算机系统
CN103425730A (zh) * 2012-05-15 2013-12-04 国际商业机器公司 用于生成与电子文档关联的值的方法与系统
CN105005562A (zh) * 2014-04-15 2015-10-28 索意互动(北京)信息技术有限公司 检索结果的显示处理方法及装置
CN108491324A (zh) * 2018-03-12 2018-09-04 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置

Families Citing this family (230)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US6154757A (en) * 1997-01-29 2000-11-28 Krause; Philip R. Electronic text reading environment enhancement method and apparatus
US7177835B1 (en) * 1997-08-28 2007-02-13 Walker Digital, Llc Method and device for generating a single-use financial account number
US6163771A (en) * 1997-08-28 2000-12-19 Walker Digital, Llc Method and device for generating a single-use financial account number
JP4214598B2 (ja) * 1998-04-02 2009-01-28 ソニー株式会社 文書処理方法および装置ならびに記録媒体
US6427165B1 (en) * 1998-11-18 2002-07-30 Gateway, Inc. Method and apparatus for information retrieval from a network using parameter value sampling
US7493553B1 (en) * 1998-12-29 2009-02-17 Intel Corporation Structured web advertising
US20060190805A1 (en) * 1999-01-14 2006-08-24 Bo-In Lin Graphic-aided and audio-commanded document management and display systems
US6324526B1 (en) 1999-01-15 2001-11-27 D'agostino John System and method for performing secure credit card purchases
US6175830B1 (en) 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
AU5451800A (en) 1999-05-28 2000-12-18 Sehda, Inc. Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces
US20020032564A1 (en) * 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US7058517B1 (en) 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
DE00941722T1 (de) * 1999-06-25 2004-04-15 Genaissance Pharmaceuticals Inc., New Haven Verfahren für erhaltung und anwendung von haplotype daten
US7346605B1 (en) * 1999-07-22 2008-03-18 Markmonitor, Inc. Method and system for searching and monitoring internet trademark usage
US7013300B1 (en) * 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
US7219073B1 (en) * 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US6556997B1 (en) * 1999-10-07 2003-04-29 Comverse Ltd. Information retrieval system
US6523009B1 (en) * 1999-11-06 2003-02-18 Bobbi L. Wilkins Individualized patient electronic medical records system
US6650344B1 (en) * 1999-11-29 2003-11-18 International Business Machines Corporation Method and system for displaying computer documents
US7562294B1 (en) * 1999-12-30 2009-07-14 Infoprint Solutions Company Llc Formatting computer generated documents for output
US7676384B2 (en) * 2000-01-18 2010-03-09 Medigenesis, Inc. System and method for the automated presentation of system data to, and interaction with, a computer maintained database
US6606659B1 (en) * 2000-01-28 2003-08-12 Websense, Inc. System and method for controlling access to internet sites
US6819339B1 (en) * 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US6785670B1 (en) * 2000-03-16 2004-08-31 International Business Machines Corporation Automatically initiating an internet-based search from within a displayed document
WO2001071572A2 (en) 2000-03-22 2001-09-27 Sidestep, Inc. Method and apparatus for dynamic information connection engine
US6963875B2 (en) 2000-03-23 2005-11-08 General Atomics Persistent archives
US7428554B1 (en) 2000-05-23 2008-09-23 Ocimum Biosolutions, Inc. System and method for determining matching patterns within gene expression data
US6931326B1 (en) 2000-06-26 2005-08-16 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
KR100805210B1 (ko) * 2000-07-19 2008-02-21 마쯔시다덴기산교 가부시키가이샤 전극이 있는 기판 및 그 제조방법
US7225180B2 (en) 2000-08-08 2007-05-29 Aol Llc Filtering search results
US7359951B2 (en) * 2000-08-08 2008-04-15 Aol Llc, A Delaware Limited Liability Company Displaying search results
US7047229B2 (en) 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
US7007008B2 (en) * 2000-08-08 2006-02-28 America Online, Inc. Category searching
EP1182581B1 (en) * 2000-08-18 2005-01-26 Exalead Searching tool and process for unified search using categories and keywords
US7647339B2 (en) * 2000-10-04 2010-01-12 Gonzalez Emmanuel C Method for digitally labeling websites
US8122236B2 (en) 2001-10-24 2012-02-21 Aol Inc. Method of disseminating advertisements using an embedded media player page
CN1471669A (zh) 2000-10-24 2004-01-28 汤姆森许可公司 利用嵌入媒体播放器页面传播广告的方法
WO2002035323A2 (en) * 2000-10-26 2002-05-02 Charles Petruzzi Device, system and method for a rotating search engine
FR2816157A1 (fr) * 2000-10-31 2002-05-03 Thomson Multimedia Sa Procede de traitement de donnees video distinees a etre visualisees sur ecran et dispositif mettant en oeuvre le procede
US6735583B1 (en) * 2000-11-01 2004-05-11 Getty Images, Inc. Method and system for classifying and locating media content
AU2002220172A1 (en) * 2000-11-15 2002-05-27 David M. Holbrook Apparatus and method for organizing and/or presenting data
US7925967B2 (en) 2000-11-21 2011-04-12 Aol Inc. Metadata quality improvement
US20040030681A1 (en) * 2000-11-21 2004-02-12 Shannon Paul Thurmond System and process for network site fragmented search
US20040030683A1 (en) * 2000-11-21 2004-02-12 Evans Philip Clark System and process for mediated crawling
US7174453B2 (en) 2000-12-29 2007-02-06 America Online, Inc. Message screening system
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
US20020143557A1 (en) * 2001-03-14 2002-10-03 Gregory Vassmer Computer program product for assisting a user to select among information units of a plurality of structured information units concerning bearings and seals
JP2002269114A (ja) * 2001-03-14 2002-09-20 Kousaku Ookubo 知識データベース及び知識データベースの構築方法
US8117313B2 (en) * 2001-03-19 2012-02-14 International Business Machines Corporation System and method for adaptive formatting of image information for efficient delivery and presentation
US20020133605A1 (en) * 2001-03-19 2002-09-19 Alok Khanna Generation and use of rules for reading of data for online account aggregation
NZ592340A (en) 2001-03-27 2012-12-21 Elenore S Bogoch A method for making a virus vaccine compising Replikin peptides
US7894999B2 (en) 2001-03-27 2011-02-22 Samuel Bogoch Systems and methods for identifying Replikin Scaffolds and uses of said Replikin Scaffolds
US7774144B2 (en) * 2001-10-26 2010-08-10 Samuel Bogoch System and method for identifying complex patterns of amino acids
US7189800B2 (en) * 2001-03-27 2007-03-13 Samuel Bogoch Replikin peptides in rapid replication of glioma cells and in influenza epidemics
US7442761B2 (en) * 2003-06-06 2008-10-28 Samuel Bogoch Replikin peptides and uses thereof
US7420028B2 (en) * 2001-03-27 2008-09-02 Samuel Bogoch Replikins and methods of identifying replikin-containing sequences
US20020178186A1 (en) * 2001-04-11 2002-11-28 Parry John Chad Remote URL munging business method
US7099871B2 (en) * 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US6934702B2 (en) * 2001-05-04 2005-08-23 Sun Microsystems, Inc. Method and system of routing messages in a distributed search network
US7171415B2 (en) * 2001-05-04 2007-01-30 Sun Microsystems, Inc. Distributed information discovery through searching selected registered information providers
US7013303B2 (en) * 2001-05-04 2006-03-14 Sun Microsystems, Inc. System and method for multiple data sources to plug into a standardized interface for distributed deep search
US6950821B2 (en) * 2001-05-04 2005-09-27 Sun Microsystems, Inc. System and method for resolving distributed network search queries to information providers
US6961723B2 (en) * 2001-05-04 2005-11-01 Sun Microsystems, Inc. System and method for determining relevancy of query responses in a distributed network search mechanism
US6725217B2 (en) 2001-06-20 2004-04-20 International Business Machines Corporation Method and system for knowledge repository exploration and visualization
CA2454740C (en) * 2001-07-23 2012-04-17 Evresearch, Ltd. Storage medium encoded with a server program and method using same
US7146409B1 (en) * 2001-07-24 2006-12-05 Brightplanet Corporation System and method for efficient control and capture of dynamic database content
US7130861B2 (en) 2001-08-16 2006-10-31 Sentius International Corporation Automated creation and delivery of database content
US6931408B2 (en) 2001-08-17 2005-08-16 E.C. Outlook, Inc. Method of storing, maintaining and distributing computer intelligible electronic data
DE10200704A1 (de) * 2001-08-24 2003-03-20 Jong Won Park Elektronisches Wörterbuchsystem mit Baumstruktur und dessen Ausgabe
US7529685B2 (en) * 2001-08-28 2009-05-05 Md Datacor, Inc. System, method, and apparatus for storing, retrieving, and integrating clinical, diagnostic, genomic, and therapeutic data
JP2003122738A (ja) * 2001-10-10 2003-04-25 Seiko Epson Corp ディジタルコンテンツ作成システム及びディジタルコンテンツ作成プログラム、並びにディジタルコンテンツ作成方法
US8028001B2 (en) * 2001-10-30 2011-09-27 Goldman Sachs & Co. Systems and methods for facilitating access to documents via a set of content selection tags
US6970870B2 (en) * 2001-10-30 2005-11-29 Goldman, Sachs & Co. Systems and methods for facilitating access to documents via associated tags
US7191185B2 (en) * 2001-10-30 2007-03-13 Goldman Sachs & Co. Systems and methods for facilitating access to documents via an entitlement rule
JP4088749B2 (ja) * 2001-11-09 2008-05-21 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US20040064500A1 (en) * 2001-11-20 2004-04-01 Kolar Jennifer Lynn System and method for unified extraction of media objects
US8346733B2 (en) 2006-12-22 2013-01-01 Commvault Systems, Inc. Systems and methods of media management, such as management of media to and from a media storage library
US7603518B2 (en) 2005-12-19 2009-10-13 Commvault Systems, Inc. System and method for improved media identification in a storage device
KR100849272B1 (ko) * 2001-11-23 2008-07-29 주식회사 엘지이아이 마크업 문서 자동 요약 방법
US7194464B2 (en) 2001-12-07 2007-03-20 Websense, Inc. System and method for adapting an internet filter
US20030120559A1 (en) * 2001-12-21 2003-06-26 Don Joel C. System and method of distributing public relations and marketing content
US20040267458A1 (en) * 2001-12-21 2004-12-30 Judson Richard S. Methods for obtaining and using haplotype data
GB0201942D0 (en) * 2002-01-29 2002-03-13 Rolls Royce Plc Databases
US20040015785A1 (en) * 2002-02-22 2004-01-22 Bo-In Lin Automatic link generation for linking to relevant data records circumstantial to document processes
US7949648B2 (en) * 2002-02-26 2011-05-24 Soren Alain Mortensen Compiling and accessing subject-specific information from a computer network
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US20040153360A1 (en) * 2002-03-28 2004-08-05 Schumann Douglas F. System and method of message selection and target audience optimization
US6763354B2 (en) * 2002-05-10 2004-07-13 Agentarts, Inc. Mining emergent weighted association rules utilizing backlinking reinforcement analysis
US7080059B1 (en) * 2002-05-13 2006-07-18 Quasm Corporation Search and presentation engine
US20040044659A1 (en) * 2002-05-14 2004-03-04 Douglass Russell Judd Apparatus and method for searching and retrieving structured, semi-structured and unstructured content
US20040128138A1 (en) * 2002-06-28 2004-07-01 Andrews Donna B. Universal type-in line
US7266553B1 (en) * 2002-07-01 2007-09-04 Microsoft Corporation Content data indexing
US7668885B2 (en) * 2002-09-25 2010-02-23 MindAgent, LLC System for timely delivery of personalized aggregations of, including currently-generated, knowledge
US20040117354A1 (en) * 2002-12-16 2004-06-17 Azzaro Steven Hector Process for tagging and measuring quality
US7640336B1 (en) 2002-12-30 2009-12-29 Aol Llc Supervising user interaction with online services
US20040167897A1 (en) * 2003-02-25 2004-08-26 International Business Machines Corporation Data mining accelerator for efficient data searching
GB0304782D0 (en) * 2003-03-03 2003-04-09 Percy Richard System and method using alphanumeric codes for the identification, description, classification and encoding of information
US7548858B2 (en) 2003-03-05 2009-06-16 Microsoft Corporation System and method for selective audible rendering of data to a user based on user input
AU2003229699A1 (en) * 2003-03-06 2004-09-28 Sap Aktiengesellschaft A method and a computer system for data assignment
WO2004090789A2 (en) 2003-04-03 2004-10-21 Commvault Systems, Inc. System and method for extended media retention
MXPA05010591A (es) 2003-04-03 2005-11-23 Commvault Systems Inc Sistema y metodo para desempenar dinamicamente operaciones de almacenamiento en una red de computadora.
US7043463B2 (en) 2003-04-04 2006-05-09 Icosystem Corporation Methods and systems for interactive evolutionary computing (IEC)
US20040220903A1 (en) * 2003-04-30 2004-11-04 Emarkmonitor Inc. Method and system to correlate trademark data to internet domain name data
US20040236724A1 (en) * 2003-05-19 2004-11-25 Shu-Yao Chien Searching element-based document descriptions in a database
US8494781B2 (en) * 2003-06-06 2013-07-23 Samuel Bogoch Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds
EP1649346A2 (en) 2003-08-01 2006-04-26 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US8869061B1 (en) 2003-08-29 2014-10-21 Microsoft Corporation User interface for searching an electronic document
US7756750B2 (en) 2003-09-02 2010-07-13 Vinimaya, Inc. Method and system for providing online procurement between a buyer and suppliers over a network
US7590936B1 (en) * 2003-09-30 2009-09-15 Microsoft Corporation Method for extracting information associated with a search term
CN1296860C (zh) * 2003-10-27 2007-01-24 无敌科技股份有限公司 数字数据特征化管理系统及其方法
WO2005041060A1 (en) * 2003-10-27 2005-05-06 Sap Ag Systems and methods for searching and displaying search hits in hierarchies
US7548968B1 (en) 2003-12-10 2009-06-16 Markmonitor Inc. Policing internet domains
US7814089B1 (en) 2003-12-17 2010-10-12 Topix Llc System and method for presenting categorized content on a site using programmatic and manual selection of content items
US8271495B1 (en) * 2003-12-17 2012-09-18 Topix Llc System and method for automating categorization and aggregation of content from network sites
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US20050149510A1 (en) * 2004-01-07 2005-07-07 Uri Shafrir Concept mining and concept discovery-semantic search tool for large digital databases
US7831581B1 (en) 2004-03-01 2010-11-09 Radix Holdings, Llc Enhanced search
US8595146B1 (en) 2004-03-15 2013-11-26 Aol Inc. Social networking permissions
JP4041080B2 (ja) * 2004-03-23 2008-01-30 東芝ソリューション株式会社 データ検索装置及びデータ検索プログラム
US20050234929A1 (en) * 2004-03-31 2005-10-20 Ionescu Mihai F Methods and systems for interfacing applications with a search engine
US7941439B1 (en) * 2004-03-31 2011-05-10 Google Inc. Methods and systems for information capture
US7680888B1 (en) 2004-03-31 2010-03-16 Google Inc. Methods and systems for processing instant messenger messages
US7725508B2 (en) * 2004-03-31 2010-05-25 Google Inc. Methods and systems for information capture and retrieval
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
US7581227B1 (en) 2004-03-31 2009-08-25 Google Inc. Systems and methods of synchronizing indexes
US7333976B1 (en) 2004-03-31 2008-02-19 Google Inc. Methods and systems for processing contact information
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US8275839B2 (en) * 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
US7412708B1 (en) * 2004-03-31 2008-08-12 Google Inc. Methods and systems for capturing information
US9254315B2 (en) 2004-04-28 2016-02-09 Samuel Bogoch Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds
US20050283502A1 (en) * 2004-06-18 2005-12-22 Ami Heitner Methods and systems for reconciling data
US7870091B2 (en) * 2004-06-18 2011-01-11 Sap Ag Methods and systems for receiving data, selecting a condition table, selecting a ruleset based on the condition table, and determining and applying rules to data
US7672845B2 (en) * 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US9047388B2 (en) * 2004-07-01 2015-06-02 Mindjet Llc System, method, and software application for displaying data from a web service in a visual map
US7293017B2 (en) * 2004-07-01 2007-11-06 Microsoft Corporation Presentation-level content filtering for a search result
US7707220B2 (en) 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
WO2006026579A2 (en) * 2004-08-27 2006-03-09 Peng Tao A personal online information management system
US7454434B1 (en) * 2004-10-04 2008-11-18 American Express Travel Related Services Company, Inc. System and method for stepped loading of web page content
US20060080610A1 (en) * 2004-10-12 2006-04-13 Kaminsky David L Methods, systems and computer program products for outline views in computer displayable presentations
CA2587055A1 (en) 2004-11-05 2006-05-18 Commvault Systems, Inc. Method and system of pooling storage devices
US20060106870A1 (en) * 2004-11-16 2006-05-18 International Business Machines Corporation Data compression using a nested hierarchy of fixed phrase length dictionaries
US7792811B2 (en) * 2005-02-16 2010-09-07 Transaxtions Llc Intelligent search with guiding info
US7734644B2 (en) * 2005-05-06 2010-06-08 Seaton Gras System and method for hierarchical information retrieval from a coded collection of relational data
US8429167B2 (en) * 2005-08-08 2013-04-23 Google Inc. User-context-based search engine
US8027876B2 (en) * 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
WO2007035848A2 (en) 2005-09-21 2007-03-29 Icosystem Corporation System and method for aiding product design and quantifying acceptance
JP4241704B2 (ja) * 2005-09-30 2009-03-18 ブラザー工業株式会社 情報管理装置、及び、プログラム
JP4241705B2 (ja) * 2005-09-30 2009-03-18 ブラザー工業株式会社 情報管理装置、及び、プログラム
US7930647B2 (en) * 2005-12-11 2011-04-19 Topix Llc System and method for selecting pictures for presentation with text content
US9262446B1 (en) 2005-12-29 2016-02-16 Google Inc. Dynamically ranking entries in a personal data book
US20070214119A1 (en) * 2006-03-07 2007-09-13 Microsoft Corporation Searching within a Site of a Search Result
WO2007106826A2 (en) 2006-03-13 2007-09-20 Markmonitor Inc. Domain name ownership validation
US8725729B2 (en) * 2006-04-03 2014-05-13 Steven G. Lisa System, methods and applications for embedded internet searching and result display
US7827125B1 (en) 2006-06-01 2010-11-02 Trovix, Inc. Learning based on feedback for contextual personalized information retrieval
US20080015113A1 (en) * 2006-06-29 2008-01-17 Applera Corporation Method for storage of gene expression results
WO2008000090A1 (en) * 2006-06-30 2008-01-03 University Of Guelph Dna barcode sequence classification
US8020206B2 (en) 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US8615800B2 (en) 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US9633356B2 (en) 2006-07-20 2017-04-25 Aol Inc. Targeted advertising for playlists based upon search queries
US7539783B2 (en) 2006-09-22 2009-05-26 Commvault Systems, Inc. Systems and methods of media management, such as management of media to and from a media storage library, including removable media
WO2008140557A2 (en) * 2006-10-24 2008-11-20 Samuel Bogoch A method of predicting influenza outbreaks
US7979388B2 (en) * 2006-11-17 2011-07-12 Microsoft Corporation Deriving hierarchical organization from a set of tagged digital objects
US9654495B2 (en) 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US9405732B1 (en) 2006-12-06 2016-08-02 Topix Llc System and method for displaying quotations
US7831566B2 (en) * 2006-12-22 2010-11-09 Commvault Systems, Inc. Systems and methods of hierarchical storage management, such as global management of storage operations
US7908260B1 (en) 2006-12-29 2011-03-15 BrightPlanet Corporation II, Inc. Source editing, internationalization, advanced configuration wizard, and summary page selection for information automation systems
WO2008143717A2 (en) * 2007-01-18 2008-11-27 Samuel Bogoch Methods of determining lethality of pathogens and malignancies involving replikin peak genes
US8190602B1 (en) * 2007-01-30 2012-05-29 Adobe Systems Incorporated Searching a database of selected and associated resources
US7792816B2 (en) 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
US7693813B1 (en) 2007-03-30 2010-04-06 Google Inc. Index server architecture using tiered and sharded phrase posting lists
US8166021B1 (en) 2007-03-30 2012-04-24 Google Inc. Query phrasification
JP2010527051A (ja) * 2007-03-30 2010-08-05 グーグル・インコーポレーテッド モバイル装置のための文書処理
US8166045B1 (en) 2007-03-30 2012-04-24 Google Inc. Phrase extraction using subphrase scoring
US8396909B1 (en) * 2007-04-12 2013-03-12 United Services Automobile Association (Usaa) Electronic file management hierarchical structure
US8375072B1 (en) * 2007-04-12 2013-02-12 United Services Automobile Association (Usaa) Electronic file management hierarchical structure
US8041709B2 (en) * 2007-05-25 2011-10-18 Microsoft Corporation Domain collapsing of search results
JP4983401B2 (ja) * 2007-05-25 2012-07-25 富士ゼロックス株式会社 情報処理装置及び制御プログラム
EP2594578A1 (en) * 2007-05-30 2013-05-22 Samuel Bogoch Replikin peptides directed against pathogenic infections of invertebrates in aquaculture
AU2008259833B2 (en) * 2007-06-01 2012-11-08 Getty Images, Inc. Method and system for searching for digital assets
US9760839B1 (en) 2007-07-25 2017-09-12 United Services Automobile Association (Usaa) Electronic recording statement management
US8706976B2 (en) 2007-08-30 2014-04-22 Commvault Systems, Inc. Parallel access virtual tape library and drives
US8140969B2 (en) * 2007-12-03 2012-03-20 International Business Machines Corporation Displaying synchronously documents to a user
US8024285B2 (en) * 2007-12-27 2011-09-20 Microsoft Corporation Determining quality of tier assignments
US20090269367A1 (en) * 2008-04-23 2009-10-29 Samuel Bogoch Methods and compounds for mitigating pathogenic outbreaks using replikin count cycles
US8364659B2 (en) * 2008-05-14 2013-01-29 Enpulz, L.L.C. Network server employing client favorites information and profiling
AU2009267107A1 (en) 2008-06-30 2010-01-07 Websense, Inc. System and method for dynamic and real-time categorization of webpages
US20100144589A1 (en) * 2008-08-08 2010-06-10 Samuel Bogoch Methods of predicting cancer lethality using replikin counts
US20100057685A1 (en) * 2008-09-02 2010-03-04 Qimonda Ag Information storage and retrieval system
US20100070466A1 (en) 2008-09-15 2010-03-18 Anand Prahlad Data transfer techniques within data storage devices, such as network attached storage performing data migration
US9396455B2 (en) 2008-11-10 2016-07-19 Mindjet Llc System, method, and software application for enabling a user to view and interact with a visual map in an external application
CN102122296B (zh) * 2008-12-05 2012-09-12 北京大学 检索结果聚类方法及装置
US8805861B2 (en) * 2008-12-09 2014-08-12 Google Inc. Methods and systems to train models to extract and integrate information from data sources
US20100169234A1 (en) * 2009-01-01 2010-07-01 Wizbill Ltd Method for Capturing the Essence of Product and Service Offers of Service Providers
US9233148B2 (en) 2009-01-09 2016-01-12 Samuel Bogoch Replikin-based compounds for prevention and treatment of influenza and methods of differentiating infectivity and lethality in influenza
US9607324B1 (en) 2009-01-23 2017-03-28 Zakta, LLC Topical trust network
US10191982B1 (en) 2009-01-23 2019-01-29 Zakata, LLC Topical search portal
US10007729B1 (en) 2009-01-23 2018-06-26 Zakta, LLC Collaboratively finding, organizing and/or accessing information
US8214390B2 (en) * 2009-06-03 2012-07-03 Yahoo! Inc. Binary interest vector for better audience targeting
US8291313B1 (en) * 2009-08-26 2012-10-16 Adobe Systems Incorporated Generation of a container hierarchy from a document design
CN102045305B (zh) * 2009-10-20 2015-06-10 中兴通讯股份有限公司 一种多媒体资源传播的监测追踪方法和系统
US20110269119A1 (en) 2009-10-30 2011-11-03 Synthetic Genomics, Inc. Encoding text into nucleic acid sequences
US9208259B2 (en) * 2009-12-02 2015-12-08 International Business Machines Corporation Using symbols to search local and remote data stores
US8452765B2 (en) * 2010-04-23 2013-05-28 Eye Level Holdings, Llc System and method of controlling interactive communication services by responding to user query with relevant information from content specific database
US9721035B2 (en) 2010-06-30 2017-08-01 Leaf Group Ltd. Systems and methods for recommended content platform
US9244779B2 (en) 2010-09-30 2016-01-26 Commvault Systems, Inc. Data recovery operations, such as recovery from modified network data management protocol data
US9734245B2 (en) * 2010-11-18 2017-08-15 Leaf Group Ltd. System and method for automated responses to information needs on websites
US10068266B2 (en) 2010-12-02 2018-09-04 Vinimaya Inc. Methods and systems to maintain, check, report, and audit contract and historical pricing in electronic procurement
WO2012151661A1 (en) * 2011-03-23 2012-11-15 Chung Edmon W O System and method for aggregating contextual content
US20120265692A1 (en) * 2011-04-14 2012-10-18 Gerald Gerber System and method for project estimates
WO2012169379A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
US9436726B2 (en) 2011-06-23 2016-09-06 BCM International Regulatory Analytics LLC System, method and computer program product for a behavioral database providing quantitative analysis of cross border policy process and related search capabilities
WO2013148096A1 (en) 2012-03-30 2013-10-03 Commvault Systems, Inc. Informaton management of mobile device data
US9311412B2 (en) * 2012-07-16 2016-04-12 International Business Machines Corporation Automatically notifying a computer user of internet content
US8892576B2 (en) * 2012-10-26 2014-11-18 International Business Machines Corporation Ordering and presenting a set of data tuples
CN102999601A (zh) * 2012-11-20 2013-03-27 广东欧珀移动通信有限公司 一种文件排序的方法及多媒体终端
US9069799B2 (en) 2012-12-27 2015-06-30 Commvault Systems, Inc. Restoration of centralized data storage manager, such as data storage manager in a hierarchical data storage system
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
KR101611388B1 (ko) * 2015-02-04 2016-04-11 네이버 주식회사 태그를 활용한 검색 서비스 제공 방법 및 시스템
US9928144B2 (en) 2015-03-30 2018-03-27 Commvault Systems, Inc. Storage management of data using an open-archive architecture, including streamlined access to primary data originally stored on network-attached storage and archived to secondary storage
CN105005559A (zh) * 2015-08-18 2015-10-28 东南大学 一种基于主题特征的文档分类方法
US10101913B2 (en) 2015-09-02 2018-10-16 Commvault Systems, Inc. Migrating data to disk without interrupting running backup operations
US10643178B1 (en) 2017-06-16 2020-05-05 Coupa Software Incorporated Asynchronous real-time procurement system
US10742735B2 (en) 2017-12-12 2020-08-11 Commvault Systems, Inc. Enhanced network attached storage (NAS) services interfacing to cloud storage
CN109558468B (zh) * 2018-12-13 2022-04-01 北京百度网讯科技有限公司 资源的处理方法、装置、设备和存储介质
US11593223B1 (en) 2021-09-02 2023-02-28 Commvault Systems, Inc. Using resource pool administrative entities in a data storage management system to provide shared infrastructure to tenants

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2048039A1 (en) 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5537586A (en) * 1992-04-30 1996-07-16 Individual, Inc. Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures
US5404510A (en) 1992-05-21 1995-04-04 Oracle Corporation Database index design based upon request importance and the reuse and modification of similar existing indexes
JP3573471B2 (ja) * 1993-04-19 2004-10-06 株式会社日立製作所 全文デ−タベ−ス検索方法
US5546529A (en) 1994-07-28 1996-08-13 Xerox Corporation Method and apparatus for visualization of database search results
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5838319A (en) * 1994-12-13 1998-11-17 Microsoft Corporation System provided child window control for displaying items in a hierarchical fashion
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5855015A (en) 1995-03-20 1998-12-29 Interval Research Corporation System and method for retrieval of hyperlinked information resources
US5675710A (en) 1995-06-07 1997-10-07 Lucent Technologies, Inc. Method and apparatus for training a text classifier
US5748975A (en) * 1995-07-06 1998-05-05 Sun Microsystems, Inc. System and method for textual editing of structurally-represented computer programs with on-the-fly typographical display
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5948058A (en) * 1995-10-30 1999-09-07 Nec Corporation Method and apparatus for cataloging and displaying e-mail using a classification rule preparing means and providing cataloging a piece of e-mail into multiple categories or classification types based on e-mail object information
US5870735A (en) 1996-05-01 1999-02-09 International Business Machines Corporation Method and system for generating a decision-tree classifier in parallel in a multi-processor system
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US5778157A (en) 1996-06-17 1998-07-07 Yy Software Corporation System and method for expert system analysis using quiescent and parallel reasoning and set structured knowledge representation
US5864863A (en) 1996-08-09 1999-01-26 Digital Equipment Corporation Method for parsing, indexing and searching world-wide-web pages
US5790121A (en) 1996-09-06 1998-08-04 Sklar; Peter Clustering user interface
AU4495597A (en) * 1996-09-23 1998-04-14 Lowrie Mcintosh Defining a uniform subject classification system incorporating document management/records retention functions
US5870559A (en) 1996-10-15 1999-02-09 Mercury Interactive Software system and associated methods for facilitating the analysis and management of web sites
US6154757A (en) * 1997-01-29 2000-11-28 Krause; Philip R. Electronic text reading environment enhancement method and apparatus
US5852819A (en) * 1997-01-30 1998-12-22 Beller; Stephen E. Flexible, modular electronic element patterning method and apparatus for compiling, processing, transmitting, and reporting data and information
JPH10228486A (ja) * 1997-02-14 1998-08-25 Nec Corp 分散ドキュメント分類システム及びプログラムを記録した機械読み取り可能な記録媒体
AUPO525497A0 (en) * 1997-02-21 1997-03-20 Mills, Dudley John Network-based classified information systems
US5960383A (en) * 1997-02-25 1999-09-28 Digital Equipment Corporation Extraction of key sections from texts using automatic indexing techniques
US5890147A (en) 1997-03-07 1999-03-30 Microsoft Corporation Scope testing of documents in a search engine using document to folder mapping
US5895470A (en) 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
US5924090A (en) 1997-05-01 1999-07-13 Northern Light Technology Llc Method and apparatus for searching a database of records
US5999925A (en) * 1997-07-25 1999-12-07 Claritech Corporation Information retrieval based on use of sub-documents
US6006223A (en) * 1997-08-12 1999-12-21 International Business Machines Corporation Mapping words, phrases using sequential-pattern to find user specific trends in a text database
US6278991B1 (en) * 1997-08-22 2001-08-21 Sap Aktiengesellschaft Browser for hierarchical structures
US6122643A (en) * 1997-08-25 2000-09-19 Synopsys, Inc. Method and system for electronic article submission
US5848410A (en) 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
US6112181A (en) * 1997-11-06 2000-08-29 Intertrust Technologies Corporation Systems and methods for matching, selecting, narrowcasting, and/or classifying based on rights management and/or other information
US5953718A (en) * 1997-11-12 1999-09-14 Oracle Corporation Research mode for a knowledge base search and retrieval system
US6223145B1 (en) * 1997-11-26 2001-04-24 Zerox Corporation Interactive interface for specifying searches
US6236400B1 (en) * 1998-04-02 2001-05-22 Sun Microsystems, Inc. Method and apparatus for controlling the display of hierarchical information
US6405238B1 (en) * 1998-07-31 2002-06-11 Hewlett-Packard Co. Quick navigation upon demand to main areas of web site
US6334131B2 (en) * 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6356898B2 (en) * 1998-08-31 2002-03-12 International Business Machines Corporation Method and system for summarizing topics of documents browsed by a user
US6418429B1 (en) * 1998-10-21 2002-07-09 Apple Computer, Inc. Portable browsing interface for information retrieval
US6175830B1 (en) 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405366C (zh) * 2003-04-29 2008-07-23 国际商业机器公司 用于为一组搜索结果生成精细化类别的系统和方法
CN100449541C (zh) * 2004-02-27 2009-01-07 株式会社理光 文档组分析设备、文档组分析方法及文档组分析系统
CN100444168C (zh) * 2004-06-25 2008-12-17 英国电讯有限公司 数据仓库装置、用于构造其的方法及从中检索数据的方法
CN100444164C (zh) * 2004-08-06 2008-12-17 佳能株式会社 信息处理装置、文档检索方法
CN101133388B (zh) * 2005-01-25 2011-07-06 谷歌公司 基于多索引的信息检索系统
CN101529372B (zh) * 2006-09-08 2011-07-27 谷歌公司 计算机实现的确定关于企业的信息的方法和计算机系统
CN101884024A (zh) * 2007-09-20 2010-11-10 起元技术有限责任公司 在基于图的计算中管理数据流
CN101884024B (zh) * 2007-09-20 2016-03-30 起元技术有限责任公司 在基于图的计算中管理数据流
CN101882152A (zh) * 2010-06-13 2010-11-10 博采林电子科技(深圳)有限公司 一种便携式学习机及其资源检索方法
CN103425730A (zh) * 2012-05-15 2013-12-04 国际商业机器公司 用于生成与电子文档关联的值的方法与系统
CN105005562A (zh) * 2014-04-15 2015-10-28 索意互动(北京)信息技术有限公司 检索结果的显示处理方法及装置
CN105005562B (zh) * 2014-04-15 2018-09-21 索意互动(北京)信息技术有限公司 检索结果的显示处理方法及装置
CN108491324A (zh) * 2018-03-12 2018-09-04 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置
CN108491324B (zh) * 2018-03-12 2022-03-22 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置

Also Published As

Publication number Publication date
JP2003500747A (ja) 2003-01-07
ES2555428T3 (es) 2015-12-30
JP3883810B2 (ja) 2007-02-21
US6175830B1 (en) 2001-01-16
AU770087B2 (en) 2004-02-12
EP1210675B1 (en) 2015-09-30
JP2005202974A (ja) 2005-07-28
CA2371362C (en) 2011-07-12
DK1210675T3 (en) 2016-01-11
WO2000072196A1 (en) 2000-11-30
US6484166B1 (en) 2002-11-19
NZ515007A (en) 2004-03-26
AU5271800A (en) 2000-12-12
USRE42167E1 (en) 2011-02-22
EP1210675A1 (en) 2002-06-05
CA2371362A1 (en) 2000-11-30
EP1210675A4 (en) 2005-03-23
MXPA01011691A (es) 2003-09-10

Similar Documents

Publication Publication Date Title
CN1363069A (zh) 信息管理、检索和显示系统以及相关方法
Lee et al. Viziometrics: Analyzing visual information in the scientific literature
Chen et al. Content-based image retrieval by clustering
JP4335335B2 (ja) ドキュメント画像のソート方法
JP3942290B2 (ja) ドキュメント画像のクライアント・ワークステーションへの送信方法
EP2041672B1 (en) Methods and apparatus for reusing data access and presentation elements
JP5025488B2 (ja) ドメイン特定のデータ・エンティティ・マッピング方法及びシステム
US9547287B1 (en) System and method for analyzing library of legal analysis charts
JPH11224345A (ja) ドキュメント画像の一部の識別方法
US20100268703A1 (en) Method of search strategy visualization and interaction
US20050071367A1 (en) System and method for displaying patent analysis information
WO2013134200A1 (en) Digital resource set integration methods, interface and outputs
Rus et al. Customizing information capture and access
Barrio et al. Sampling strategies for information extraction over the deep web
US20020132258A1 (en) Knowledge database and method for constructing knowledge database
Telles et al. Normalized compression distance for visual analysis of document collections
JP2007164633A (ja) コンテンツ検索方法及び装置及びプログラム
JP2005141476A (ja) 文書管理装置、プログラムおよび記録媒体
Zhang et al. Concept analysis as a formal method for menu design
Rus et al. Information retrieval, information structure, and information agents
JP2006501545A (ja) オブジェクト分類のための顕著な特徴を自動的に判定する方法および装置
Zekri et al. Visual-CBIR: Platform for Storage and Effective Manipulation of a Database Images.
Meng et al. IPKB: a digital library for invertebrate paleontology
Clavaud et al. Controlling the production of EAD encoded documents, extracting metadata and publishing them on the web: methods and tools, France
JP2000305948A (ja) 文書群分類装置および文書群分類方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication