CN1169195A - 存取信息的方法和/或系统 - Google Patents

存取信息的方法和/或系统 Download PDF

Info

Publication number
CN1169195A
CN1169195A CN96191566A CN96191566A CN1169195A CN 1169195 A CN1169195 A CN 1169195A CN 96191566 A CN96191566 A CN 96191566A CN 96191566 A CN96191566 A CN 96191566A CN 1169195 A CN1169195 A CN 1169195A
Authority
CN
China
Prior art keywords
user
information
keyword set
keyword
agency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN96191566A
Other languages
English (en)
Inventor
尼古拉斯·约翰·戴维斯
理查德·威克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of CN1169195A publication Critical patent/CN1169195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure

Abstract

一个对存于一个分布式信息数据库中的信息进行存取的系统,提供了一个智能软件代理(105)的共用体。每个代理(105)都可以被建成一个用于诸如Internet上的World Wide Web(43)这样的分布式信息系统的著名浏览器扩充。代理(105)被与浏览器(400)有效地结合起来,从而能用浏览器(400)来提取用来存贮在一个智能页存贮器中一页。可以对信息系统来的文本进行提取和附加上用户任选的信息后再存贮。基于代理的存取系统使用关键词集来对用户感兴趣的信息定位,再结合上用户的档案,这样,一个用户所存的页就可以被通告给另一个其档案显示出潜在兴趣的用户。关键词集合可以通过使用一个存储库来扩充。

Description

存取信息的方法和/或系统
本发明是关于通过通信系统来存取信息的方法和/或系统。
Internet上的World Web是一个著名的基于许多被连在一起的单独的通信网的通信系统。它提供了一个丰富的来自许多不同提供者的信息的来源,但因为没有中央监控,所以其丰富也就产生了如何存取特定的信息的问题。
1982,科学、组织和技术的信息量每五年翻一番。到1986年为每2.2年增长一倍,而到了1992年,则是每1.6年增长一倍。随着Internet和其它网络的扩充,这个增长速度会持续上升。这些网络生存能力的关键将会是其管理信息的能力和当用户需要信息时,提供给他们所需信息的能力。
按照本发明的一个实施例,它提供了一个存取以分布方式存放且可通过通信网络存取的信息的系统,它包括许多软件代理(agent),以便用户能通过一个代理使用网络来存取信息。在系统中给每个代理都提供了一个智能页存贮器,用来存贮可通过网络存取的各条信息的摘要以及相关的数据,还为每个代理提供了许多用于存贮关键词集合的关键词存贮器,由于预先为每条信息都在智能页存贮器中建了一个项目,这样代理就可以通过把第一或第二关键词集合或两者全部加到上述项目上来识别用户所需的信息。
在一个有用的结构中,关键词的第一和第二集合可与各自不同的用户相联系。
然后,就可以为不同的用户,通过不同的环境来触发上述代理,以便把关键词集合运用到页存贮器中的信息页上,或为页存贮器添加新的信息页。例如,一个代理可以在某第一用户提出存贮请求期间,运用第一关键词集合。然而,代理有可能运用一个或更多附加的关键词集合以便向该项目的一个或更多其他用户进行通告。
尽管在本存取系统中可能会有多个智能页存贮器或有多个智能页存贮器能为本存取系统所用,但最好是一个代理组共享一个智能页存贮器。这种共享提供了一种使一个代理能监视页存贮器中新项目的方法,以便向潜在地感兴趣的用户通告。
本发明的实施例提供了一种智能软件代理的分布式系统,可以为用户或用户团体执行有关信息的任务,如通过Internet的World WideWeb(W3)来执行信息任务。即软件代理是用来对在W3上发现的信息进行存贮、检索、概括及通告给其它代理的。
向W3这样的网络系统是为人熟悉的,并且是按照如客户/服务器型这样的已知的体系结构建起来的,所以其详细情况就不在这里说了。
在发明不是要为检索如W3这样的系统提供另一种工具,这类工具已有很多了。这些工具频繁地随着Web的覆盖度和检索引擎的完善度的增加而增加。相反,本发明的实施例是关于以下问题的:已经在W3上发现了有用的信息,如何对它进行存贮,使之易于检索,并且如何能识别和通知那些可能对该信息感兴趣的用户?
软件代理提供了一种著名的处理分布式的而不是集中式的基于计算机的系统的方法。每个代理通常都包括以自动方式为一个实体(人或机器)执行一项或多项任务的功能,以及支持该项或该些任务的位置极据,或存取这些数据的手段。在本说明书中,在发明的实施例中的用于存贮和检索信息的代理被简称为“Jasper代理”它是由以下词的首字母组成的:“Joint Accessto Stored Pages with Easy Retrieval(易于检索地对所存贮的页进行联合存取)”。
当从W3上可获得的信息的量很大时,最好是能避免把信息从其原始位置拷贝到一个本地服务器上。的确,有人会说这种方法与Web的整体精神相违背。所以,Jasper代理不是拷贝信息,而是只存贮相关的“元信息”(Meta-information)。正如下面将会看到的,可以认为这个元信息的级别要高于信息本身,它是关于信息的,而不是实际的信息本身。例如,它可以包括关键词、一个摘要、文件标题、广泛资源定位器(URL)和存取的日期和时间。然后,当一个检索请求发生时,这个元信息可以被用来提供一个指向实际信息或指向“索引打开”的指针。
大部分已知的W3客户(Mosaic,Netscape等)都提供某些存贮用户感兴趣的页的方法。通常,这是通过允许用户创建一个与特定的URL相联系(可能是分级的)名称菜单来实现的。这个菜单设备故然很有用,但当要涉及很大量的W3页时,它就显得不方便了。基本上这种方法所提供的代表还不丰富,不足以允许获取所有关于所存贮的信息的有可能需要的东西:用户只能提供一个命名页的字符串。除了诸如存取页的时间这样的有用的元信息被丢失的事实之外,一个单独的词组(名字)可能不足以在所有上下文中精确地检索一个页。
作为一个简单的例子,考虑关于在药理学数据的信息检索中使用基于知识的系统(KBS)的信息:在不同的上下文中,所感兴趣的可能是KBS,信息检索或药理学三者中的任何内容。除非仔细选择一个名字,使之能提到所有三个方面,否则信息就可能在它的有用的上下文中的一个或多个中被错过。这个问题与UNIX(或其它)文件系统中查找包含所需信息的文件的问题相类似,Jones,W.P.在其所写的论文《关于人类记忆模型的使用:记忆扩张器的个人文件系统》中对后者进行了描述。这篇文章登在Int J.Man.Machine Studies,25,191-228,1986中。然而在大多数文件系统中,至少有按创建日期来分类文件的设备。
本发明的实施例中所采用的解决这个问题的方法是允许用户通过一个丰富得多的元信息的集合去存取信息。下面就解释Jasper代理是如何实现这个目的的,及结果元信息是如何被利用的。
现在参照着附图,只用举例的方法来说明一个按照本发明的一个实施例的信息存取系统,其中:
图1所示的是一个结合着一个Jasper代理系统的信息存取系统。
图2所示的是一个以图解方式显示的由上述存取系统所提供的存贮过程。
图3所的是在图1的存贮过程中使用的一个智能页存贮器的结构。
图4以图解的方式显示了由上述存取系统提供的检索过程;
图5所示的是图2中存贮过程的流程图。
图6、7和8所示的是使用Jasper存取系统的三个信息检索过程的流程图;以及
图9所的是一个用分群技术生成的关键词网络,用于向一个Jasper系统扩展和/或添加用户档案。
参照图1,按照本发明的一个实施例的一个信息存取系统可被建成为一个已知的信息检索体系结构,如一个与Internet相连的客户一服务器型体系结构。
更详细一些,一个顾客,如一个国际公司,可能有多个配备了个人计算机或工作站405的用户。这些可能被通过在顾客的客户上下文中的一个WorldWide Web(www)浏览器400连和顾客的WWW文件服务器410上。做为浏览器400的一个有效的扩展,Jasper代理105可能实际上被装在WWW文件服务器410上。
顾客的WWW文件服务器410被以已知的方式和Internet上,例如通过顾客自己的网络415和一个路由器420。这样服务提供者的文件服务器425就可以通过Internet,再通过路由器被访问了。
一个文本摘要生成工具120和两个数据存贮器也装在顾客的文件服务器410上,或能被它访问,二个存贮器中,一个保存用户的档案(即档案存贮器430),另一个(即智能页存贮器100)主要是为一个文件集合保存元信息。
在一个基于Jasper代理的系统中,代理105自身可以被建成为一个诸如Netscape这样的已知的浏览器的扩展。代理105被与浏览器400有效地结合起来,并可以从浏览器400中提取W3页,该浏览器可能由Netscape或者是Masaic等提供。
正如前而所描述的,在客户——服务器体系结构中,文本摘要生成器和用户档案都是做为装有Jasper代理的顾客文件服务器410的文件。然而,Jasper代理105可以交替地出现在顾客的客户上下文中。
Jasper代理是一个软件的代理,通常可被描述为一个软件实体,它结合有为一个用户执行一个或数个任务的功能以及本地数据,或对本地数据进行访问,以便支持上述一个或多个任务。下面对上述在一个Jasper代理系统中相关的任务进行描述,它们中的一个或多个可以由一个Jasper代理来实现。本地数据通常包括从智能页存贮器100和档案存贮器430来的数据。由Jasper代理提供的功能通常包括运用一个文本到摘要生成工具并存贮结果,访问或读取以及更新至少一个用户档案装置,把一个关键词集与另一个关键词或元信息集相比较的装置,以及向用户发出警告的装置。
在优选实施例中,为了选择一个要比较的关键词集,还为Jasper代理提供了监视用户输入的装置。
在另一个优选实施例中,给Jasper代理提供了运用一种涉及到第一和第二关键词集,以便生成一个二者间相似性测度的算法的装置,按照上述相似性测度,或者第一或者第二关键词集可能预先被Jasper代理所更新,或是对第一或第二关键词集与某第三关键词集相比较的结果进行修改,或对元信息进行上述相同的操作。
本发明的实施例可能会被按照不同的软件系统来建立。例如,应用面向目标技术可能是很方便的。然而,在下面描述的实施例中,服务器将是基于Unix的,并且能运行Con Text及一种W3浏览器,上述Con Text是一个由Oracle公司提供的著名的自然语言处理系统。尽管客户潜在地有可能是任何可以支持一个W3浏览器机器,但本系统通常是“C”来实现的。
在下节中,讨论Jasper代理提供给用户的用于管理信息的设备。这些设备可分为两类:存贮和检索。存贮
图2和5所示的是当Jasper代理105往一个智能页存贮器(IPS)100中存贮信息时所进行的操作。首先,用户110发现了一个很感兴趣的W3页,要用Jasper系统存贮到一个与自己相联系的IPS100中(步骤501)。用户110随后就通过自己的被选的W3客户115(Mosaic和Netscape版本在当前所有的平台上都可以使用)上的菜单选项来向Jasper代理105发出一个“存贮”请求,该Jasper代理装在顾客的WWW元件服务器410上(步骤502)。随后,Jasper代理105请用户110提供一个相关的注释,这个注释也要被存起来(步骤503)。通常,这可能就是用户对该页感兴趣的原因,并且这对于其他用户决定要看从IPS100检索来的页中的哪一页是很有用的。(下面将进一步讨论信息共享)。
Jasper代理105接着又通过W3上的W3客户115从所涉及的页中提取源文本(步骤504)。源文本是以一种“Hypertext”格式提供的,Jasper代理105先把Hyper Text Markup Language(HTML)标记去掉(步骤505)。Jasper代理105随后把文本发给一个象“Con Text”120这样的文本摘要生成器(步骤506)。
Con Text120首先对一个文件进行语法分析以确定每个句子的语法结构(步骤507)。ConTent语法分析器的功能很强,能够处理英语句子中出现的大范围的语法现象。句子级的语汪分析完成之后,Context120就进入“概念处理”阶段(步骤508)。所提供的工具有:
信息提取:对一个文件内容的主索行进行计算,以便对文本中的概念、事实及定义进行索引。
内容缩减:能够得到数个等级的摘要,其范围从一张文件主要标题的列表互一个全文的摘要。
论述跟踪:通过对一个文件的论述的跟踪,Context可以提取该文件中所有与某个特定概念有特殊关系的部分。
在一个客户-服务器体系结构中Context120被Jasper代理105使用:经过对文件进行语法分析后,服务器就生成独立于应用的、经标记的版本(步骤509)。从Jasper代理105来的使用一个应用编程界面(API)的呼叫随后就可解释这个标记了。通过使用这些API呼叫,就可从源文本中得到元信息(步骤510);Jasper代理105首先提取一个页的文本摘要。摘要的尺寸由传给Context120的参数来控制,而Jasper代理105确保能得到100-150个单词的摘要。通过对Context使用另一个呼叫,Jasper代理105可以得出一个来自源文本的关键词集合。然后,用户就随时都有机会通过HTML表125添加更多的关键词(步骤511)。通过这种方式,与某用户有特殊关系的关键词就可以被提供了,而Jasper代理105所提供的关键词集合则可能与一个更广泛的用户团体有很大的关系。
在本过程结束时,Jasper代理105已经生成了以下关于所感兴趣的W3的元信息:·  Context所提供的通用关键词;·  用户指定的关键词,·  用户的注释;·  一个页内容的摘要;·  文件标题;·  通用资源位置(URL);和·  存贮的日期与时间。
参照附图3,Jasper代理105随后把这个页的元信息添加给IPS100的文件130(步骤512)。在IPS100中,(两种类型的)关键词随后就被用来在包含其它页的元信息的文件上进行索引。检索
使用Jasper代理105从IPS100检索信息共有三种模式。一种是一个标准关键词检索设备,而其它两种则涉及到在一个代理团体和代理的用户间共享信息。每一种模式都将在下面各节中描述。
当把一个Jasper代理105装在某用户的机器上时,该用户就会提供一份个人档案:一个描述用户所感兴趣的通过W3可得到的信息的关键词集合。这份档案由该代理105保存或至少是维护着,以便决定哪页可能是用户感兴趣的。关键词检索
如图4、6、7和8中所示,对于直接关键词检索,用户通过一个由Jasper代理105提供的HTML表300给Jasper代理105提供一个关键词集合(步骤601)。该Jasper代理105随后使用一种简单的关键词匹配和求分算法来对10个保存在IPS100中的与之最紧密匹配的页进行检索(步骤602)。由用户在页被存贮时提供的(而不是那些由Context自动提取的)关键词在匹配过程中被给予额外的加权值。用户可以预先指定一个检索门限,分数在该门限以下的页就不用显示了。代理105随后动态地建立一张HTML表305,其中有一张被分级的连线的列表,列表中包含与被检索的页的连线及其摘要(步骤603)。任何由最初的用户所做的注释及每个被检索的页的分值也都被包括在该表中。这个页然后就被从其W3客户上提供给上述用户(步骤604)。“新的是什么”设备
任何用户都可以向Jasper代理问“新的是什么?”(步骤701)。代理105随后就查询IPS100并检索最新存人的页(步骤702)。然后它再用一种简单的关键词匹配和求分算法来决定这些页中哪个与用户的档案最匹配(步骤703)。然后送给该用户一个HTML页,它显示被分级连线的列表,该列表中有与近来所存贮的与该用户的档案最匹配的页和与IPS中最近存贮的页的连线,还有上述各页中提供的注释(步骤704)。这样用户就既可以看到最近存贮的页,也可以看到可能最令他感兴趣的页,用户也就可以对近来存贮的页进行更广泛的选择(步骤705)。
用户可以通过一个允许他往档案中添加关键词或从档案中删除关键词的HTML表来随时更新他的Jasper代理105所保存的档案。通过这种方式,用户可以有效地选择不同的要在其中工作的“上下文”。上下文是由一个关键词(这些关键词可以是那些构成档案的,或是那些在一个检索查询中指定的关键词)集合来定义的,并可以认为它是某顾客在某特定时刻感兴趣的那种类型的信息。
在计算机的文件系统的上下文中,把人类记忆模型运用到形成信息文件上这种想法是由Jones在其前面所引的论文中提出来的。正如他在通常的文件形成系统的上下文中所提出的,在文件系统中的子目录与由Jasper代理105所检索的页集合之间具有一种相似性。该页的集合可被认为是一个由它在其中被检索的上下文所定义的动态构成的子目录。在以下两种意义上,这是一种高度灵活的子目录的定义:第一,依靠上下文,在本检索中出现的页自然也可在其它检索中出现;第二,对于子目录没有明确的界限:页处于子目录中的范围的程度大还是小依靠它们对当前上下文的匹配程度。由此,在本方法中,划分页上的信息的方法的数量只受信息自身的分散程度和丰富程度限制。与其它感兴趣的代理的通信
参照图8,当一个页被Jasper代理105存到IPS100中时(步骤801),该代理105就在它的“本地团体”中检查其它代理的用户的档案(步骤802)。这个本地团体可以是任何预确定的团体。如果该页与某用户的档案相匹配,其分值高于某个确定的门限值(步骤803),则Jasper代理105就自动生成一个报文,如一个“email”(电子邮件)报文,并将该报文送给相关的用户(步骤804),通知他发现了所需的页。
email的头的格式可能如下例所示:
JASPER KW:(关键词)
这样就使用户可以阅读报文的主体前认出它是由Jasper系统来的。最好再带一个关键词列表,这样用户就可以估计出本条报文所携带的信息的相对重要程度了。报文头中的关键词因用户不同而变化,它们决定于从与用户的档案中的关键词相匹配的页来的关键词,所以报文针每个用户的兴趣有很大的个人化倾向。报文的主体给出进一步的信息,诸如页的标题和URL,该URL存贮着页及由存贮者提供的关于该页的注释。
上而所描述的Jasper代理105和系统为一个极其有用的存取在一个如W3这样的分布式管理系统中的相关信息的方法提供了基础。对不离开本发明的范围的一个系统进行修改和扩充是有可能的。例如,在一个相对简单的水平上,就可以使用经改进的检索技术。作为例子,向量空间或概率模型就有可能被使用,正如GSalton在《文本自动处理》一书中所描述的一样,该书由美国马萨诸塞州的Addison-Wesley in Reading于1989年出版。
另外,通过提供对元信息而不是关键词的索引,可以使索引变得更加通用。例如,额外的元信息可能是存贮一个(Jasper可以从URL提取的)页的日期及页的原始位置。这些额外索引使用户可以(通过一个HTML表)来构成如下形式命令:
“Show me all pages Istored in 1994 from Cambridge University about arti-ficial intelligence and information retrieval”
(给我从剑桥大学提取并显示出所有我于1994年存入的关于人工智能和信息检索的页。)
在另一个做为替换的版本中,Jasper代理可能使用一个存贮库来利用关键词的同义词。这样就减少了必须精确输入与存贮一个页时所使用的关键词相同的关键词这一做法的重要性。确实,有可能在其它几个领域中对存贮库的使用进行利用,这些领域包括代理105为其用户保存的个人档案。自适应代理
Jasper代理105使用用户档案来决定信息是否与其用户有关这功能已很强大了,但仍有能提高之处。当用户想改变上下文时(可能是从一个任务转到另一个任务,或者是从工作转为休息),该用户的档案都得通过增加和/或删除关键词来重新指定。一种更好的方法是当用户的兴趣改变超时时由代理改变用户的档案。上下文的这种改变可能以两种方式发生:例如可以有一个短期的上下文由工作到休息的转换。代理可以从一张为用户保存的当前上下事的列表中识别上述上下文并转到该上下文中。例如,当用户访问一个不同信息类型的新页时,就可以触发这种转换。代理所保存的上下文也可能会有基于用户的兴趣的发展的较长期的改变。这些变化可以由代理从对用户的观察中得出。例如,可被用在自适应代理中的已知技术包括遗传算法,它从反馈和基于记忆的推理中进行学习。这些技术公布在由ShethB和MaesP、所写的,题为“为个人化的信息过滤发展代理”的MIT内部报告中,这个报告已于1993年公开。远端和本地信息的综合
Jasper系统的另一个可能的变化将会是把用户自己的计算机文件形成系统与IPS100综合起来,这样W3上和本地机器上发现的信息对处于顶层的用户来讲是相同的。然后就可以用与Jasper代理105访问W3页同样的方式来访问文件,使用户不受面向名字的文件形成系统的限制并且对所有种类的本地和运端信息都提供了一种内容可寻址的界面。Jasper系统的分群
Jasper IPS100和相关的文件基本上可被称为一个集合;它是一个通过关键词索引的文件集。它与“传统”集合的不同处在于其中的文件的位置通常远离索引的位置;索引(即IPS100)实际上指向一个指定文件在Internet上的位置的URL。此外,不同的附加的元信息条被加到Jasper系统中的文件上,诸如存贮页的用户,该页是何时被存贮的,用户可能已提供的任何注释等等。
Jasper系统与大多数文件集合相区别的一个重要方面是每个已被某用户输入到IPS100中的文件都被他有意识地标记为将来有可能对他和他的同事有用的信息条。这连同被保存的元信息使得JasperIPS100成为一个非常丰富的信息源。
我们也对把已知的信息检索(IR)技术运用到JasperIPS100上是否有利进行了检查。具体地说,我们已对能否使用分群进行调查。文件分群
通过使用已知的IR技术,可以用Jasper的词汇文件矩阵来为在JasperIPS100中被标识的文件计算一个相似性矩阵。这个相似性矩阵给出了存贮器中被标识了的文件的相似性的测度。对每一对文件计算Dice系数,对于两个文件Di和Dj;有
2*[Di∩Dj]/[Di]+[Dj]
其中[X]表示X中的词的数目,X∩Y是在X和Y中共同出现的词的数目。这个系数产生一个0到1之间的数。一个为零的系数意味着两个文件中没有共同的词,而分数为1则意味着每个文件中的词的集合相同。相似性矩阵,即Sim代表存贮器中每一对文件的相似性,所以,对每对文件i和j有:
Sim(i,j)=2*[Di∩Dj]/[Di]+[Dj]
这个矩阵可被用来用Griffiths,A.等在其《自动文件分类的分级凝聚分群法》一文中所描述的分级凝聚分群过程,自动创建相关文件的群,该文刊登在Journal of Documentatim,40:3,September,1984,pp175~205。在这样一个过程中,最初把每一个文件放入一个只由它自己组成的群中,然后把两个最相似的群合并成一个较大的群,再计算它与其它每个群的相似性。这个合并过程一直持续到只剩下一个水平最高的文件群为止。
计算群之间的相似性的方法(不同于单独的文件)可以不同。对于一个Jasper存贮器,则可使用“完全链接分群”。在完全链接分群中,分别属于两个群的最不相似的两个文件间的相似性就被当做这两个群间的相似性。
通过运用VRML(虚真实模型语言(Virtual RealityModelling Language))可以用Jasper存贮器的结果群结构创建一个Jasper系统上三维(3D)的前端。(VRML是一种已知的用于三维图画空间或通过全球Internet联网的虚拟世界或在World Wide Web内超级联接的虚拟世界的语言。)关键词的分群
关于一个特定的JASPER文件集所存在的关键词(词)也可以用与上面所描述的文件分群技术完全相类似的方法进行分群:可以为存在Jasper存贮器中的关键词建一个相似性矩阵,该矩阵给出一种存贮器中关键词间“相似性”的一种测度。对于每一对文件要计算其Dice系数。对于两个关键词,其Dice系数由下式给出:
2*[Ki∩Kj]/[Ki]+[Kj]
其中[X]是其中有X出现的文件数,X∩Y则是其中同时出现X、Y的文件数。
然而,一且一个Jasper存贮器的相似性矩阵被计算出来,就没必要对关键词象文件那样进行分群了。相反有可能用下述两种方式对矩阵本身进行利用。
第一种方式是“档案增强”。这里,可以通过使用那些与用户档案中的关键词最相似的关键词来增强该用户档案。例如,如果以下单词virtual,reality和Internet是某用户的档案的一部分,而VRML不是,则一个增强的档案可能把VRML加入到最初的档案中(假设VRML经分群后与virtual,reality和Internet接近)。在这种方式中,包含VRML但不包含virtual,reality和Internet的文件就可能被检索,相反若用未增强的档案,它们就不被检索。
图9显示了一个已根据某当前Jasper存贮器中提取的关键词相似性矩阵建立的关键词网络900的例子。算法是直接的:给定一个最初的起始关键词,从相似性矩阵中找出4个与它最相似的词。把这4个词与最初的词相连,然后对这4个词的每一个重复上述过程。重复的次数可能为若干次(图9中是三次)。两个词间的双向连接9-01表明两个词彼此都出现在对方4个最相似的关键词中。人们自然可以为了对涉及两个词间被细化相似性的信息而给每个连接加上特定的相似性系极。
第二个方法是“前摄搜寻”。Jasper使用构成一个用户的档案的关键词来前摄搜寻与它们的兴趣有关的多个WWW页,然后提供一个用户可能感兴趣的页的列表,用户却不需进行一个精确的搜寻。这些前摄搜寻可由一个Jasper系统以某个给定的间隔来完成,例如每星期一次。这里分群是很有用的,因为一个档案可能反映不只一种兴趣。例如,考虑如下用户档案:Internet,WWW,html,football,Manchester,united,linguistics,parsing,pragmatics。很明显,上述档案中代表三种兴趣,单独对每种兴趣搜寻似乎会产生比只为给定的用户输入全部档案作为一个查询所产生的结果好得多的结果。对从文件集来的关键词进行分群可以使查询生成过程自动化,从而为用户的Jasper代理进行前摄搜寻打下基础。
当Jasper得到搜寻结果时,这些结果可以被用通常的方法提取摘要并与用户档案匹配以便给出一个划分了优先级的新URL以及本地保存的摘要的列表。
可以用其它文本摘要生成器来代替Con Text。例如,NetSumm就是一种获得摘要的工具,它被英国电信公司放到了Internet上,在http://www.labs.bt.com/innovate/informat/nutsumm/index.htm可得到。
尽管这里所描述的本发明的实施例是关于通过Internet进行信息定位的,但人们也会发现当对其它系统上的信息进行定位时,本发明的实施例也是很有用的,诸如在对用户的内部系统上的Hypertext格式的文件进行定位时就是如此。
做为本说明书中所介绍的本系统的创造性的方面的更进一步,下面所说的也应当被看作是对本系统新颖而先进的特性的表述。
一种对信息输入到一个数据存贮器进行监视的方法,这个输入请求可以是许多用户中的任何人提出的,为了能向某第一用户警告某第二用户的输入,警告准则要至少是部分地由上述第一用户来决定,这个方法包括:
I)为每个用户存贮一份用户档案,档案中至少要包括一个关键词集和一个用户标识符;
II)对一个由某第二用户提出的要把信息输入到数据存贮器的请求进行检测;
III)对请求进行处理,以生成信息输入;
IV)把该信息输入与一个来自第一用户的档案的关键词集进行比较;
V)比较结果为正时,向第一用户发出一个警告报文。
上述方法还包括监视由不同用户提出的信息输入的请求及在检测到由某特定的用户提出的信息输入请求发生重大变化时,在一个不同的用户提出一个信息输人请求的情况下,把步骤IV)所使用的关键词集换成该特定用户档案中的关键词集。
上述方法中,每个信息输入都包括至少一个与各个文件相联系的关键词的集合,并且上述方法还包含为上述关键词集合至少两个生成相似性矩阵的步骤。及利用上述相似性矩阵扩展步骤IV)中用户档案中的关键词集的规模,以便为相联系的用户增加正结果的数量。
上述方法还包括以下步骤:对某用户文件中的关键词集合使用一种分群算法以便把该关键词集分成多个子关键词集,并用至少一个子关键词集来代替步骤IV)中的完全关键词集。

Claims (12)

1.一种信息存取系统,用于对以分布方式存贮且可利用通信网络存取的信息进行存取,本存取系统包括至少一个用于利用网络来存取信息的软件代理,这个代理带有数据存贮器或能对数据存贮器进行访问,以便能保存与能通过网络进行存取的信息相联系的元信息,并保存至少一个关键词,上述代理是可触发的,当数据存贮器中的元信息被输入时,该代理就被触发,对上述至少一个关键词集与该元信息进行比较,并当比较结果为正时送出一个警靠报文。
2.按照权利要求1的系统,其中上述至少一个关键词集与某特定的用户相联系,且系统包含向该用户发出警告报文的装置。
3.按照上述一项权利要求的系统,为了使多个用户能使用本系统,这些用户中每一个都要有至少一个与之相联系的关键词集后,其中有响应用户提出的往数据存贮器中输入元信息的请求的装置,上述至少一个关键词集合是与未提出请求的用户相联系的,这样系统对某第一用户输入元信息作出响应,同时,当与某第二用户的关键词集出现正匹配时还向该第二用户发出一条警告报文。
4.按照上述任一项权利要求的系统,其中的代理具有一个上述关键词集中关键词的同义词的存贮库,以便增加与关键词集合正匹配的数量。
5.按照上述任一项权利要求的系统,其中的代理带有监视某个用户的输入的装置,以检测那些输入是否发生变化,且当检测到变化时,就修改或替换与该用户相联系的关键词集合。
6.按照上述权利要求和1~4中任一项的系统,其中系统具有改变与某用户相联系的关键词集以便对该用户提出的请求进行响应的装置。
7.按照上述任一项权利要求的系统,其中具有存贮至少一种数据分群算法,并对一个或更多的关键词集运用上述算法的装置,以便在与元信息进行此较前对一个或多个关键词集进行修改。
8.按照上述任一项权利要求的系统,包括多个代理,这些代理被分配给本系统的各自不同的用户。
9.一种对将信息输入到数据贮器进行监视的方法,输入请求可以由许多用户中的任何人提出,本方法的目的是要向某第一用户提出警告,告知他某第二用户提出了一个输入请求,警告所根据的准则至少是部分地要由上述第一用户决定,本方法包括:
I)为每个用户保存一份用户档案,档案中包括至少一个关键词集和一个用户标识符;
II)检测由某第二用户提出的将信息输入到数据存贮器的请求;
III)对请求进行处理,生成信息输入。
IV)把该信息输入与上述第一用户的档案中的一个关键词相比较;
V)比较出现正结果时,给该第一用户送出一个警告报文。
10.按照权利要求9的方法,还包括对由各个用户提出的信息输入请求进行监视及当检测到由某特定用户提出的信息输入请求有重大变化时,在另一个不同的用户提出信息输入请求的情况下,为该特定用户改变步骤IV)中所用的关键词集。
11.按照权利要求9和10中任一项的方法,其中每个信息输入都包括至少一个与各个文件相联系的关键词集,并且该方法中还包括以下步骤:为至少两个上述关键词集生成一个相似性矩阵,并使用该相似性矩阵来扩展步骤IV)中用户档案中关键词的规模以便为有关用户增加正结果的数量。
12.按照权利要求9或10中任一项的方法还包括以下步骤:把一种分群算法运用于某用户档案的关键词集以便把该关键词集分为子关键词集,并用子关键词集中至少一个代替步骤IV)中的完整关键词集。
CN96191566A 1995-01-23 1996-01-23 存取信息的方法和/或系统 Pending CN1169195A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP95300420 1995-01-23
EP95300420.7 1995-01-23

Publications (1)

Publication Number Publication Date
CN1169195A true CN1169195A (zh) 1997-12-31

Family

ID=8221064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96191566A Pending CN1169195A (zh) 1995-01-23 1996-01-23 存取信息的方法和/或系统

Country Status (14)

Country Link
US (1) US6289337B1 (zh)
EP (2) EP0953920A3 (zh)
JP (1) JPH10513587A (zh)
KR (1) KR19980701598A (zh)
CN (1) CN1169195A (zh)
AU (1) AU707050B2 (zh)
BR (1) BR9606931A (zh)
CA (1) CA2210581C (zh)
DE (1) DE69606021T2 (zh)
FI (1) FI973080A (zh)
HK (1) HK1004832A1 (zh)
NO (1) NO973372L (zh)
NZ (1) NZ298861A (zh)
WO (1) WO1996023265A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104321768A (zh) * 2012-03-19 2015-01-28 法国埃布尔公司 用于执行应用程序以通过浏览电信网络查阅可访问的内容和服务的方法和系统

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049777A (en) * 1995-06-30 2000-04-11 Microsoft Corporation Computer-implemented collaborative filtering based method for recommending an item to a user
US6041311A (en) * 1995-06-30 2000-03-21 Microsoft Corporation Method and apparatus for item recommendation using automated collaborative filtering
US6092049A (en) * 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US6112186A (en) * 1995-06-30 2000-08-29 Microsoft Corporation Distributed system for facilitating exchange of user information and opinion using automated collaborative filtering
US7035914B1 (en) 1996-01-26 2006-04-25 Simpleair Holdings, Inc. System and method for transmission of data
US6076109A (en) 1996-04-10 2000-06-13 Lextron, Systems, Inc. Simplified-file hyper text protocol
CA2184518A1 (en) * 1996-08-30 1998-03-01 Jim Reed Real time structured summary search engine
GB2317302A (en) * 1996-09-12 1998-03-18 Sharp Kk A distributed information system
US6370563B2 (en) * 1996-09-30 2002-04-09 Fujitsu Limited Chat system terminal device therefor display method of chat system and recording medium
EP0848337A1 (en) * 1996-12-12 1998-06-17 SONY DEUTSCHLAND GmbH Server with automatic document assembly
JP3579204B2 (ja) * 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
US6480600B1 (en) 1997-02-10 2002-11-12 Genesys Telecommunications Laboratories, Inc. Call and data correspondence in a call-in center employing virtual restructuring for computer telephony integrated functionality
US7031442B1 (en) 1997-02-10 2006-04-18 Genesys Telecommunications Laboratories, Inc. Methods and apparatus for personal routing in computer-simulated telephony
US6104802A (en) 1997-02-10 2000-08-15 Genesys Telecommunications Laboratories, Inc. In-band signaling for routing
DE19809231A1 (de) * 1997-03-04 1998-09-17 Talkway Inc System für verbesserte Diskussionstechnologien
AU6555798A (en) * 1997-03-14 1998-09-29 Firefly Network, Inc. Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
JPH10283240A (ja) * 1997-04-09 1998-10-23 Canon Electron Inc 情報ファイル装置、情報ファイルの記録方法、および、情報ファイルの記録手順を記憶した記憶媒体
US5966711A (en) * 1997-04-15 1999-10-12 Alpha Gene, Inc. Autonomous intelligent agents for the annotation of genomic databases
SE510438C2 (sv) * 1997-07-02 1999-05-25 Telia Ab Metod och system för att samla in och distribuera information över Internet
JPH1125125A (ja) * 1997-07-08 1999-01-29 Canon Inc ネットワーク情報探索装置、ネットワーク情報探索方法および記憶媒体
WO1999005621A1 (en) * 1997-07-22 1999-02-04 Microsoft Corporation System for processing textual inputs using natural language processing techniques
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
AU742831B2 (en) * 1997-09-04 2002-01-10 British Telecommunications Public Limited Company Methods and/or systems for selecting data sets
US6711611B2 (en) 1998-09-11 2004-03-23 Genesis Telecommunications Laboratories, Inc. Method and apparatus for data-linking a mobile knowledge worker to home communication-center infrastructure
US6985943B2 (en) 1998-09-11 2006-01-10 Genesys Telecommunications Laboratories, Inc. Method and apparatus for extended management of state and interaction of a remote knowledge worker from a contact center
NZ503682A (en) * 1997-10-21 2001-09-28 British Telecomm Information management system with data storage and retrieval, and control to input data set to data retrieval tool
USRE46528E1 (en) 1997-11-14 2017-08-29 Genesys Telecommunications Laboratories, Inc. Implementation of call-center outbound dialing capability at a telephony network level
SE511584C2 (sv) * 1998-01-15 1999-10-25 Ericsson Telefon Ab L M Informationsdirigering
IL123129A (en) 1998-01-30 2010-12-30 Aviv Refuah Www addressing
IL125432A (en) 1998-01-30 2010-11-30 Easynet Access Inc Personalized internet interaction
US6078924A (en) * 1998-01-30 2000-06-20 Aeneid Corporation Method and apparatus for performing data collection, interpretation and analysis, in an information platform
US7907598B2 (en) 1998-02-17 2011-03-15 Genesys Telecommunication Laboratories, Inc. Method for implementing and executing communication center routing strategies represented in extensible markup language
US6332154B2 (en) 1998-09-11 2001-12-18 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing media-independent self-help modules within a multimedia communication-center customer interface
US6535492B2 (en) * 1999-12-01 2003-03-18 Genesys Telecommunications Laboratories, Inc. Method and apparatus for assigning agent-led chat sessions hosted by a communication center to available agents based on message load and agent skill-set
SE512106C2 (sv) * 1998-03-10 2000-01-24 Telia Ab Förbättring av, eller med avseende på, telekommunikationstransmissionssystem
SE512107C2 (sv) * 1998-03-10 2000-01-24 Telia Ab Förbättring av, eller med avseende på, telekommunikationstransmissionssystem
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
DE19811352C2 (de) * 1998-03-16 2000-01-13 Siemens Ag System und Verfahren zur Suche auf untereinander vernetzten Rechnern mit Informationsbeständen mittels Softwareagenten
JP4081175B2 (ja) * 1998-03-19 2008-04-23 富士通株式会社 検索処理装置および記憶媒体
US6658453B1 (en) * 1998-05-28 2003-12-02 America Online, Incorporated Server agent system
EP0967545A1 (en) * 1998-06-23 1999-12-29 BRITISH TELECOMMUNICATIONS public limited company A system and method for the co-ordination and control of information supply using a distributed multi-agent platform
US6694357B1 (en) * 1998-07-02 2004-02-17 Copernican Technologies, Inc. Accessing, viewing and manipulation of references to non-modifiable data objects
US6886044B1 (en) 1998-07-08 2005-04-26 British Telecommunications Public Limited Company Method and system having requirements matching servers for processing user messages
EP0971298A1 (en) * 1998-07-08 2000-01-12 BRITISH TELECOMMUNICATIONS public limited company Requirements matching
US6484155B1 (en) * 1998-07-21 2002-11-19 Sentar, Inc. Knowledge management system for performing dynamic distributed problem solving
WO2000008539A1 (en) * 1998-08-03 2000-02-17 Fish Robert D Self-evolving database and method of using same
US6266668B1 (en) * 1998-08-04 2001-07-24 Dryken Technologies, Inc. System and method for dynamic data-mining and on-line communication of customized information
USRE46153E1 (en) 1998-09-11 2016-09-20 Genesys Telecommunications Laboratories, Inc. Method and apparatus enabling voice-based management of state and interaction of a remote knowledge worker in a contact center environment
AU6244099A (en) * 1998-09-11 2000-04-03 Gene Logic, Inc. Genomic knowledge discovery
US6115709A (en) 1998-09-18 2000-09-05 Tacit Knowledge Systems, Inc. Method and system for constructing a knowledge profile of a user having unrestricted and restricted access portions according to respective levels of confidence of content of the portions
US8380875B1 (en) 1998-09-18 2013-02-19 Oracle International Corporation Method and system for addressing a communication document for transmission over a network based on the content thereof
AU5822899A (en) 1998-09-18 2000-04-10 Tacit Knowledge Systems Method and apparatus for querying a user knowledge profile
US6154783A (en) * 1998-09-18 2000-11-28 Tacit Knowledge Systems Method and apparatus for addressing an electronic document for transmission over a network
US6598046B1 (en) * 1998-09-29 2003-07-22 Qwest Communications International Inc. System and method for retrieving documents responsive to a given user's role and scenario
US6768996B1 (en) * 1998-10-08 2004-07-27 Hewlett-Packard Development Company, L.P. System and method for retrieving an abstracted portion of a file without regard to the operating system of the current host computer
US8121891B2 (en) 1998-11-12 2012-02-21 Accenture Global Services Gmbh Personalized product report
US7076504B1 (en) 1998-11-19 2006-07-11 Accenture Llp Sharing a centralized profile
US7062707B1 (en) * 1998-12-08 2006-06-13 Inceptor, Inc. System and method of providing multiple items of index information for a single data object
FR2787902B1 (fr) * 1998-12-23 2004-07-30 France Telecom Modele et procede d'implementation d'un agent rationnel dialoguant, serveur et systeme multi-agent pour la mise en oeuvre
WO2000050972A2 (en) * 1999-02-26 2000-08-31 Webivore Knowledge Systems, Llc Network meta-information collection tool
US6449632B1 (en) * 1999-04-01 2002-09-10 Bar Ilan University Nds Limited Apparatus and method for agent-based feedback collection in a data broadcasting network
US6304864B1 (en) 1999-04-20 2001-10-16 Textwise Llc System for retrieving multimedia information from the internet using multiple evolving intelligent agents
KR19990068686A (ko) * 1999-06-11 1999-09-06 이판정 리얼네임에의한웹사이트접속및정보제공방법
US6480858B1 (en) * 1999-06-30 2002-11-12 Microsoft Corporation Method and apparatus for finding nearest logical record in a hash table
KR100359233B1 (ko) * 1999-07-15 2002-11-01 학교법인 한국정보통신학원 웹 정보 추출 방법 및 시스템
US7013300B1 (en) * 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
US7219073B1 (en) 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US6513036B2 (en) * 1999-08-13 2003-01-28 Mindpass A/S Method and apparatus for searching and presenting search result from one or more information sources based on context representations selected from the group of other users
EP1081606A3 (de) * 1999-08-31 2001-05-02 comMouse AG Verfahren und Displaymaus zur Navigation innerhalb eines Netzwerkes von Rechnern
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
AU1171001A (en) * 1999-10-26 2001-05-14 Patrick Constant A reversed computer system based on access by content instead of access by address and its fully optimized implementation
US7929978B2 (en) 1999-12-01 2011-04-19 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing enhanced communication capability for mobile devices on a virtual private network
NL1013997C2 (nl) * 1999-12-30 2001-07-03 Cons Health Entrepreneurs Bv Werkwijze voor het verzamelen en leveren van informatie.
GB2358717A (en) * 2000-01-25 2001-08-01 Gordon Ross Methods for enhanced information exchange and transactions within multi-device environments
US7720833B1 (en) 2000-02-02 2010-05-18 Ebay Inc. Method and system for automatically updating search results on an online auction site
CA2402918A1 (en) 2000-03-31 2001-10-11 Kapow Aps Method of retrieving attributes from at least two data sources
AU2001257084A1 (en) * 2000-04-18 2001-10-30 Hewlett-Packard Company Activity report generation
FI111879B (fi) * 2000-05-08 2003-09-30 Sonera Oyj Käyttäjäprofiilin hallinta tietoliikenneverkossa
EP1158419A1 (en) * 2000-05-15 2001-11-28 Gabriele Huss Method and apparatus for observing user orientated information from data networks
CA2311857A1 (en) 2000-05-16 2001-11-16 Wilson Grad Conn System and method to facilitate sharing of information
DE10024368A1 (de) * 2000-05-17 2001-11-22 Michael Fahrmair Treffen einer Vorauswahl an Informationsangeboten
GB2362972A (en) * 2000-06-02 2001-12-05 Res Summary Com An internet based searchable database for up to date financial executive summaries with links to full documents
KR100378642B1 (ko) * 2000-07-06 2003-03-31 김시환 정보 검색 시스템과 그 방법
AU2001276920A1 (en) * 2000-07-17 2002-01-30 Blue Ripple, Inc. Content distribution
US7054900B1 (en) * 2000-08-18 2006-05-30 Netzero, Inc. Automatic, profile-free web page recommendation
KR20020017622A (ko) * 2000-08-31 2002-03-07 김종민 인터넷 환경에서의 접속자 커뮤니티 서비스 시스템 및 그제공 방법
AUPR033800A0 (en) * 2000-09-25 2000-10-19 Telstra R & D Management Pty Ltd A document categorisation system
FR2814829B1 (fr) * 2000-09-29 2003-08-15 Vivendi Net Procede et systeme d'optimisation de consultations d'ensembles de donnees par une pluralite de clients
DE10053738A1 (de) * 2000-10-30 2002-05-02 Starzone Gmbh Verfahren zur Verknüpfung von unterschiedlichen Zielgruppen sowie ein geeignetes System hierfür
US6910045B2 (en) 2000-11-01 2005-06-21 Collegenet, Inc. Automatic data transmission in response to content of electronic forms satisfying criteria
CA2428404C (en) * 2000-11-20 2012-02-07 Ian Barry Crabtree Information provider
JP2002163546A (ja) * 2000-11-27 2002-06-07 Matsushita Electric Ind Co Ltd 情報配信システム及び情報配信方法
US20020161757A1 (en) * 2001-03-16 2002-10-31 Jeffrey Mock Simultaneous searching across multiple data sets
US7200556B2 (en) * 2001-05-22 2007-04-03 Siemens Communications, Inc. Methods and apparatus for accessing and processing multimedia messages stored in a unified multimedia mailbox
US7260607B2 (en) * 2001-08-02 2007-08-21 Siemens Communications, Inc. Methods and apparatus for performing media/device sensitive processing of messages stored in unified multimedia and plain text mailboxes
US20030028603A1 (en) * 2001-08-02 2003-02-06 Siemens Information And Communication Networks, Inc. Methods and apparatus for automatically summarizing messages stored in a unified multimedia mailboxes
AUPR710801A0 (en) * 2001-08-17 2001-09-06 Gunrock Knowledge Concepts Pty Ltd Knowledge management system
US8046343B2 (en) * 2001-09-29 2011-10-25 Siebel Systems, Inc. Computing system and method for automatic completion of pick field
AU2006203729B2 (en) * 2001-11-26 2008-07-31 Fujitsu Limited Information analyzing method and apparatus
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US7333966B2 (en) 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
DE10208959B4 (de) * 2002-02-28 2006-10-12 Equero Future Net Technologies Ag Verfahren und Vorrichtung zur Erfassung und Auswertung von in einem Rechnernetzwerk abgelegten Informationen
US20040024756A1 (en) * 2002-08-05 2004-02-05 John Terrell Rickard Search engine for non-textual data
US9805373B1 (en) 2002-11-19 2017-10-31 Oracle International Corporation Expertise services platform
JP2006512693A (ja) 2002-12-30 2006-04-13 トムソン コーポレイション 法律事務所用の知識管理システム
US8055669B1 (en) * 2003-03-03 2011-11-08 Google Inc. Search queries improved based on query semantic information
US7925984B2 (en) * 2003-03-31 2011-04-12 International Business Machines Corporation Remote configuration of intelligent software agents
US8392553B2 (en) 2003-04-29 2013-03-05 University Of Strathclyde Remote monitoring by tracking, storing, and analyzing user interactions with an operating system of a data processing device
US20040230564A1 (en) * 2003-05-16 2004-11-18 Horatiu Simon Filtering algorithm for information retrieval systems
US8010484B2 (en) * 2003-06-16 2011-08-30 Sap Aktiengesellschaft Generating data subscriptions based on application data
US7966260B2 (en) * 2003-06-16 2011-06-21 Sap Aktiengesellschaft Generating data subscriptions based on application data
US7009369B2 (en) * 2003-07-14 2006-03-07 Texas Instruments Incorporated Advanced monitoring algorithm for regulated power systems with single output flag
US7647327B2 (en) 2003-09-24 2010-01-12 Hewlett-Packard Development Company, L.P. Method and system for implementing storage strategies of a file autonomously of a user
WO2005055090A1 (en) * 2003-12-01 2005-06-16 Metanav Corporation Dynamic keyword processing system and method for user oriented internet navigation
JP4200933B2 (ja) * 2004-04-27 2008-12-24 コニカミノルタホールディングス株式会社 情報検索装置
US7716219B2 (en) * 2004-07-08 2010-05-11 Yahoo ! Inc. Database search system and method of determining a value of a keyword in a search
JP4524640B2 (ja) * 2005-03-31 2010-08-18 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8027876B2 (en) * 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US8429167B2 (en) 2005-08-08 2013-04-23 Google Inc. User-context-based search engine
US9008075B2 (en) 2005-12-22 2015-04-14 Genesys Telecommunications Laboratories, Inc. System and methods for improving interaction routing performance
US20070238789A1 (en) * 2006-03-31 2007-10-11 Chin-Ming Chang Prednisolone acetate compositions
US7735010B2 (en) 2006-04-05 2010-06-08 Lexisnexis, A Division Of Reed Elsevier Inc. Citation network viewer and method
WO2008107895A2 (en) 2007-03-08 2008-09-12 Technion Research And Development Foundation Ltd Method for delivering query responses
WO2009036796A1 (de) * 2007-09-12 2009-03-26 Admar Informatik Marti Verfahren zur erstellung eines profils eines benutzers eines datenverarbeitungssystems
US8577930B2 (en) 2008-08-20 2013-11-05 Yahoo! Inc. Measuring topical coherence of keyword sets
CN102725739A (zh) * 2009-05-18 2012-10-10 西山修平 虚拟单一存储装置上的元信息共享型分布式数据库系统
US9235563B2 (en) * 2009-07-02 2016-01-12 Battelle Memorial Institute Systems and processes for identifying features and determining feature associations in groups of documents
US8543381B2 (en) 2010-01-25 2013-09-24 Holovisions LLC Morphing text by splicing end-compatible segments
US9183308B1 (en) * 2010-05-28 2015-11-10 Sri International Method and apparatus for searching the internet
US8832655B2 (en) 2011-09-29 2014-09-09 Accenture Global Services Limited Systems and methods for finding project-related information by clustering applications into related concept categories
EP2973045A4 (en) 2013-03-15 2017-03-08 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
US10699062B2 (en) * 2017-08-01 2020-06-30 Samsung Electronics Co., Ltd. Apparatus and method for providing summarized information using an artificial intelligence model

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
US5408655A (en) 1989-02-27 1995-04-18 Apple Computer, Inc. User interface system and method for traversing a database
US5790116A (en) 1989-06-30 1998-08-04 Massachusetts Institute Of Technology Object-oriented computer user interface
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
US5448727A (en) * 1991-04-30 1995-09-05 Hewlett-Packard Company Domain based partitioning and reclustering of relations in object-oriented relational database management systems
JP2804403B2 (ja) * 1991-05-16 1998-09-24 インターナショナル・ビジネス・マシーンズ・コーポレイション 質問回答システム
US5428778A (en) 1992-02-13 1995-06-27 Office Express Pty. Ltd. Selective dissemination of information
US5446891A (en) 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US5537586A (en) * 1992-04-30 1996-07-16 Individual, Inc. Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures
DE69432503T2 (de) 1993-10-08 2003-12-24 Ibm Informationsarchivierungssystem mit objektabhängiger Funktionalität
JP2682811B2 (ja) * 1994-03-22 1997-11-26 インターナショナル・ビジネス・マシーンズ・コーポレイション データ記憶管理システム及び方法
US5619615A (en) 1994-07-22 1997-04-08 Bay Networks, Inc. Method and apparatus for identifying an agent running on a device in a computer network
US5623652A (en) 1994-07-25 1997-04-22 Apple Computer, Inc. Method and apparatus for searching for information in a network and for controlling the display of searchable information on display devices in the network
US5680530A (en) * 1994-09-19 1997-10-21 Lucent Technologies Inc. Graphical environment for interactively specifying a target system
US5717923A (en) 1994-11-03 1998-02-10 Intel Corporation Method and apparatus for dynamically customizing electronic information to individual end users
US5694594A (en) 1994-11-14 1997-12-02 Chang; Daniel System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5530852A (en) 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
DE69531599T2 (de) 1994-12-20 2004-06-24 Sun Microsystems, Inc., Mountain View Verfahren und Gerät zum Auffinden und Beschaffen personalisierter Informationen
JPH08297669A (ja) 1994-12-27 1996-11-12 Internatl Business Mach Corp <Ibm> 複合ドキュメント内の複数のパートを自動的にリンクするシステムおよび方法
US5649186A (en) 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
US5745938A (en) 1996-08-30 1998-05-05 Westvaco Corporation Rescue board

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104321768A (zh) * 2012-03-19 2015-01-28 法国埃布尔公司 用于执行应用程序以通过浏览电信网络查阅可访问的内容和服务的方法和系统

Also Published As

Publication number Publication date
MX9705582A (es) 1997-11-29
EP0807291B1 (en) 2000-01-05
JPH10513587A (ja) 1998-12-22
FI973080A0 (fi) 1997-07-22
CA2210581C (en) 2002-03-26
BR9606931A (pt) 1997-11-11
NO973372D0 (no) 1997-07-22
AU707050B2 (en) 1999-07-01
NO973372L (no) 1997-09-22
AU4454996A (en) 1996-08-14
EP0953920A3 (en) 2005-06-29
DE69606021T2 (de) 2000-08-03
NZ298861A (en) 1999-01-28
US6289337B1 (en) 2001-09-11
HK1004832A1 (en) 1998-12-11
KR19980701598A (ko) 1998-05-15
WO1996023265A1 (en) 1996-08-01
EP0953920A2 (en) 1999-11-03
DE69606021D1 (de) 2000-02-10
FI973080A (fi) 1997-07-22
EP0807291A1 (en) 1997-11-19
CA2210581A1 (en) 1996-08-01

Similar Documents

Publication Publication Date Title
CN1169195A (zh) 存取信息的方法和/或系统
Li et al. Pfp: parallel fp-growth for query recommendation
JP4274689B2 (ja) データ組を選ぶための方法とシステム
JP4739455B2 (ja) 文書管理方法
US8463824B2 (en) Ecosystem method of aggregation and search and related techniques
US20060122994A1 (en) Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies
NZ503682A (en) Information management system with data storage and retrieval, and control to input data set to data retrieval tool
Delen et al. A holistic framework for knowledge discovery and management
CN101393565A (zh) 基于本体的面向虚拟博物馆的搜索方法
Staab et al. AI for the web-ontology-based community web portals
Gilchrist Corporate taxonomies: report on a survey of current practice
Sheth et al. Semantic content management for enterprises and the web
JPH11161670A (ja) 情報フィルタリング方法、装置及びシステム
French et al. Personalized information environments: an architecture for customizable access to distributed digital libraries
Hwang et al. A prototype WWW literature recommendation system for digital libraries
Ferragina et al. The anatomy of a hierarchical clustering engine for Web-page, news and book snippets
Rocha Talkmine and the adaptive recommendation project
Chen et al. Research for web usage mining model
Aggarwal et al. Improving the efficiency of weighted page content rank algorithm using clustering method
Verma et al. Multi agent architecture for search engine
Wable Information Retrieval in Business
Kumar et al. Web data mining using xML and agent framework
Espinasse et al. AGATHE: an Agent and Ontology based System for Restricted-Domain Information Gathering on the Web.
Sabri New Approach Exploring Unclear Weighted Association Rules Using Weighted Support and Trust Framework by using Data Mining
Di Stefano et al. SHARK, a multi-agent system to support document sharing and promote collaboration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication