CN1606008A - 在万维网上进行搜索的系统和方法 - Google Patents

在万维网上进行搜索的系统和方法 Download PDF

Info

Publication number
CN1606008A
CN1606008A CNA2004100589953A CN200410058995A CN1606008A CN 1606008 A CN1606008 A CN 1606008A CN A2004100589953 A CNA2004100589953 A CN A2004100589953A CN 200410058995 A CN200410058995 A CN 200410058995A CN 1606008 A CN1606008 A CN 1606008A
Authority
CN
China
Prior art keywords
search
territory
user
hits
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100589953A
Other languages
English (en)
Other versions
CN1332342C (zh
Inventor
蒂莫西·A·迪茨
瓦利德·M·科布罗斯利
纳迪姆·马利克
阿维吉特·萨哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1606008A publication Critical patent/CN1606008A/zh
Application granted granted Critical
Publication of CN1332342C publication Critical patent/CN1332342C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Abstract

一种用于减少在万维网上的接收显示站点之一接收的搜索结果中的过量命中数目的实现,包括:用于在所述接收显示站点显示从万维网上的源接收的万维网文档的传统装置,和用于在万维网上进行关键词搜索的装置。存在与该接收显示站点关联的装置,用于显示由所述关键词搜索命中的万维网文档的数目;以及响应于过量的万维网文档命中数目、使用户能显示由所述搜索命中的万维网文档的域的层次级别的装置,每个域具有命中数目的计数;和使用户能交互消除选中的域、由此减少所述搜索中过量命中数目的装置。使请求搜索的用户能以通过用户显示屏上的万维网内容管理器组织的方式分析过量命中的列表,并通过消除该搜索捕获的无关的域或子域而减少过量命中。

Description

在万维网上进行搜索的系统和方法
技术领域
本发明涉及例如环球网(万维网)的计算机管理通信网络,并具体涉及用于简化在万维网上进行的关键词搜索的实现。
背景技术
由数据处理工业与消费者电子工业的趋同而驱动的科技革命已标记了过去的十年。该效果依次驱动了这些年已知可用但相对静止的技术。这些技术中的主要技术是文档、媒体和程序的因特网或万维网相关的分配。电子娱乐和消费者工业与数据处理的趋同指数级加速了广泛延伸通信分配渠道、和万维网或因特网的需求,该需求已作为宽松的学术和政府数据分配设施而平静存在了几乎一代,达到了“临界物质”并开始了现象扩展的时期。随着该扩展,商店和消费者直接访问文档、媒体和计算机程序的所有素材。
另外,多年来已成为因特网或万维网的文件语言的超文本标记语言(HTML)提供万维网上的页面和其他文件与多个相关数据源之间的直接链接,所述相关数据源首先为文本和图像,例如JPEG和MPEG,然后演化为媒体,即“超媒体”。万维网文档也可包括applets(一种Java程序)和其他编程例程。(这里使用的术语万维网文档意味着包括所有这样的数据文档)。这也进一步激发了因特网或万维网的使用。
所有万维网用户遇到的主要问题是用户由于指示错误而花费的浪费的时间量,例如用户在尝试到达正确的万维网站点或万维网文档时经常经过的“死胡同”。很明显,所有企业和组织感兴趣的是使用该万维网使得它们的消费者和客户能尽可能敏捷和快速地到达他们在万维网上预期的目的地。
该时间浪费的主要根源在该万维网页面(万维网的基本文档页面)本身。在万维网页面的情况下,我们不具有相对小组的专业设计者计算出人性因素的情形。而且,在万维网的时代,任何人和每个人都能设计网页。页面被开发者频繁设计而无需可用性技巧。结果,以折衷方式频繁设立和设计网页。经常通过具有网页的通用贸易或公共输入的宽松的企业、专业人员、社会和教育的配置来建立网页。
部分由于网页或文档创建中的分歧,所以经常发生的情况是这些万维网文档中使用的术语和单词可在不同工业、商业、技术和艺术中具有不同的含义。结果,当在搜索引擎上进行传统关键词搜索时,它们进行到万维网上的数据库或源域、甚至是与请求用户意欲搜索的主题实质无关的域中的数据源路径。因为许多工业、商业和技术中的术语相似性,所以提交两个或三个单词组合的任何搜索接收具有好几万术语的搜索结果不是不经常发生的。例如,如果用户希望在电影胶片的储藏中搜索胶片涂层腐烂,则他很可能从电影工业和果树栽培、牙科和液体管腐蚀中得到超过130000个命中(hit)。
过去降低过多命中数目的手段包括增加搜索声明中的关键词数目,其具有使搜索太具有限制性的风险。而且,可由用户提供单词的排除列表。这同样可能太具有限制性。而且,必须利用关键词组合在每一随后搜索中重复该排除列表。
发明内容
本发明提供了一种允许请求搜索的用户以通过用户显示屏上的万维网内容管理器组织的方式分析过量命中的列表、并通过消除该搜索捕获的无关的域或子域而减少过量命中的方法、系统和程序。
因此,本发明包括一种用于减少在万维网上的接收显示站点之一接收的搜索结果中过量的命中数据的实现,其包括:用于在所述接收显示站点显示从万维网上的源接收的万维网文档的传统装置,和用于在万维网上进行关键词搜索的装置。存在与该接收显示站点关联的装置,用于显示由所述关键词搜索命中的万维网文档的数目;以及响应于过量的万维网文档命中数目、使用户能显示由所述搜索命中的万维网文档的域的层次级别的装置,每个域具有命中数目的计数;并且还存在使用户能交互消除选中的域、由此减少所述搜索中过量的命中数目的装置。还存在一种实现,在上述消除选中域后,用于再次进行初始关键词搜索。
还能使该搜索用户显示几个域级别的层次,其中每个域级别中具有每个域的命中数目的计数。这些装置也使用户能交互消除每个域级别中的选中域。还包括与所述接收显示站点关联地存储搜索上下文的装置,所述搜索上下文包括所述消除的选中域,由此可从随后的搜索中消除所述选中域。然后,可用所存储的搜索上下文在万维网上进行随后搜索,但是其关键词不同于原始万维网搜索中的关键词。
而且,最好存在与接收显示站点关联的万维网浏览器,并包括:用于在所述接收显示站点显示从所述源接收的万维网文档的所述装置;用于在万维网上进行关键词搜索的所述装置;与所述接收显示站点关联的所述装置,用于显示由所述关键词搜索命中的万维网文档的数目;响应于过量的万维网文档命中数目、使用户能显示由所述搜索命中的万维网文档的域的层次级别的所述装置,每个域具有命中数目的计数;使用户能交互消除选中域、由此减少所述搜索中过量的命中数目的所述装置;和用于存储包括所述消除的选中域的搜索上下文、由此可从随后搜索中消除所述选中域的所述装置。为了最好的结果,该系统应该包括用于将所述接收显示站点连接到万维网的万维网服务器;并且用于存储包括所述消除的选中域的搜索上下文的所述装置可操作地与所述万维网服务器关联。
附图说明
通过结合所附说明书参考以下附图,本发明将得到更好理解,并且其许多目的和优点对本领域普通技术人员而言将变得更清楚,其中:
图1是数据处理系统的方框图,该数据处理系统包括中央处理单元和通过通信适配器的网络连接,该通信适配器能用作接收网站的显示计算机以及万维网服务器;
图2是示出了实现本发明的元件的万维网部分的概括示意图,其允许请求搜索的用户以通过用户显示屏上的万维网内容管理器组织的方式来分析过多命中的列表,并通过消除无关的域而减少过多命中;
图3是示出了在包括命中总数的搜索中发现的万维网文档的初始部分列表的显示屏的图表图示;
图4是示出了在表示每一域或子域中的命中数目的搜索结果中的域和路径的分层树的显示屏的图表图示;
图5是在用户从搜索上下文中选择性消除了几个域之后的图4的显示屏;
图6是描述了用于当发生过多数目命中时而从搜索上下文中消除域的、根据本发明的程序元素的建立的示意流程图;和
图7是图6中建立的程序的示例性运行的流程图。
具体实施方式
参考图1,示出典型数据处理终端,可用作在实现本发明中使用的基本计算机控制万维网接收终端,用于显示和检查搜索结果,并当万维网文档命中数目过多且必须减少时,减少搜索的万维网域的搜索上下文。该系统也可用于万维网上使用的传统服务器,例如万维网访问服务器、源数据库服务器。该系统可用作由根据本发明的服务提供商使用的万维网服务器,以相对于搜索的域来修改搜索的上下文,并存储在随后的关键词搜索中有用的修改的搜索上下文,这将在下面更详细地描述。中央处理单元(CPU)10,例如PC微处理器或工作站之一,例如从国际商业机器公司(IBM)可获得的RISCSystem(系统)/6000TM系列、或Dell(戴尔)PC微处理器,由系统总线12提供并互连到各种其他组件。操作系统41在CPU 10上运行,提供控制并用于协调图1的各组件的作用。操作系统41可以是可商业获得的操作系统之一,例如IBM的AIX 6000TM操作系统或微软的WindowsXPTM或Windows2000TM、以及UNIX和其他IBM AIX操作系统。由该系统控制的应用程序40被移入和移出主存存储器随机存取存储器(RAM)14。这些程序包括下面将对其操作进行描述的本发明的程序,其中图1的系统用作在减少搜索范围或上下文中、根据本发明由服务提供商使用的万维网服务器。只读存储器(ROM)16通过总线12连接到CPU 10,并包括控制该基本计算机功能的基本输入/输出系统(BIOS)。RAM 14、I/O适配器18和通信适配器34也互连到系统总线12。I/O适配器18可为与盘存储设备20通信的小型计算机系统接口(SCSI)适配器。通信适配器34将总线12与外部因特网或万维网互连。I/O设备也通过用户接口适配器22和显示适配器36连接到系统总线12。键盘24和鼠标26全部通过用户接口适配器22互连到总线12。通过这样的输入设备,用户可与本发明的程序交互式相关。显示适配器36包括作为存储设备的帧缓冲器39,能在显示屏38上保持每一像素的呈现。图像可存储在帧缓冲器39中,用于通过例如数模转换器(未示出)等各种组件在监视器38上显示。通过利用前述I/O设备,用户能通过键盘24或鼠标26向系统输入信息,并通过显示器38从该系统接收输出信息。
在讨论特定实施例的细节之前,从更全面的角度理解可与本发明相关的各种元件和方法是有帮助的。既然本发明的主要方面在于在网络上传输的文档,例如网页和其中的媒体内容,则理解网络及其工作原理是有利的。我们不会更详细描述本发明应用的网络。还已经参考了本发明到全球网,例如因特网或万维网的适用性。关于因特网节点、对象和链路的细节,请参考文章Mastering the Internet(掌握因特网),G.H.Cady et al.,published by SybexInc.(由西贝公司出版),Alameda,CA,1996。
因特网或万维网为计算机技术和操作系统的不同种类混合的全球网络。更高级别对象通过各种网络服务器计算机链接到该层次中的较低级别对象。这些网络服务器是网络分配的关键,例如网页和相关文件的分配。关于这一点,术语“文档”用于描述通过万维网或其他网络传输的数据,并意欲包括具有可显示的文本、图形、其他图像和音频的网页。该可显示的信息可为静止、活动或动画,例如动画GIF图像。
传统上用HTML语言实现万维网文档,其在以下文本中有详细描述,即Just Java,van der Linden,1997,SunSoft Press,具体在第七章、第249-268页—关于网页的处理;并在以上引用的 Mastering the Internet,尤其在637-642页,关于网页形成中的HTML。另外,本描述的许多方面将引用万维网浏览器。在上述 Mastering the Internet文本的291-313页中可发现浏览器的通用和全面的描述。在文本 Internet:The Complete Reference,Millennium Edition(因 特网:完整的参照,千年版),Young et al.,1999,Osborne/McGraw-Hill:Chapter19(第19章),pp.419-454(页),on the Netscape Navigator(关于网景浏览器);Chapter 20(第20章),pp.455-494(页),on the Microsoft Internet Explorer(关于微软因特网浏览器);and Chapter 21(第21章),pp.495-512(页),covering Lynx,Opera and other browsers(涵盖了Lynx、Opera和其它浏览器)中可发现更详细的浏览器描述。
在本发明的描述中,搜索引擎将用于定位和预访问在接收显示站点存储的先前访问的万维网文档。如在上述 Internet:The Complete Reference, Millennium Edition文本,pp.395 and 522-535(页)中讨论的一样,搜索引擎利用关键词和短语来在万维网上查询期望的主题。在执行其搜索时,该搜索引擎浏览数据库以将关键词主题与引擎语法相匹配。该搜索引擎然后向用户呈现确定为与所请求的查询最接近的网页列表。一些重要搜索引擎为:Alta Vista,Infoseek,Lycos,Magellan,Webcrawler and Yahoo。
图2示出了其中连接在搜索或浏览期间用于网页接收的计算机控制显示终端57的万维网的一部分的概括图。可由图1中建立的计算机系统实现计算机显示终端57,并且连接58(图2)为图1所示的网络连接。为了本实施例的目的,计算机57用作将访问万维网文档,例如显示的页面56的接收万维网显示站点。关于通过网络服务器从本地显示站点至万维网之间的典型连接,可参考上述 Mastering the Internet,pp.136-147(页);任一个连接可用于实现使用本发明的系统。图2的系统实施例具有主机拨号连接。该主机拨号连接已通过链接61到万维网60的网络访问服务器53而使用了30多年。该万维网服务器53也可具有关于图1所述的计算机结构,可由万维网服务提供商维持到客户机的显示终端57。在上述文本 Internet:The Complete Reference, Millennium Edition的第14-18页中一般描述了这样的万维网或因特网服务提供商(ISPs)。由客户机接收终端57经由调制解调器54、电话线55和调制解调器52通过普通拨号电话链接58而访问该万维网服务器53。任何包括无线连接的传统数字或模拟链接都是可用的。先前描述的传统上通过万维网访问服务器联系的搜索引擎67搜索万维网并将选择的万维网文档发回到接收显示站点57,该一般可在该站点上实时显示这些文档。如同下面将更详细描述的一样,将由与该站点关联的万维网浏览器程序59来执行接收显示站点57关于万维网的许多功能。
通过合适的万维网数据库访问服务器65从该万维网数据库源64访问该万维网文档。可通过万维网服务器66访问例如源61和62的其他数据库源。
现在,参考图3到5,我们将提供图示例子,说明当关键词搜索提供过多数目命中时,如何使用本发明来降低万维网搜索上下文以消除次要或不感兴趣的域。图3中的网页列表70为在宣布搜索结果的接收显示站点传统上呈现给用户的万维网文档的显示列表的图示。在所示图示例子中,对电影胶片保存感兴趣的用户用关键词“涂层”、“胶片”和“腐烂”73的组合来搜索万维网。不幸的是,该搜索导致关于该术语组合的138000个命中,74。很明显,这远多于用户能处理的数目。根据本发明,他需要很好理解该搜索覆盖的万维网数据库的域和子域,使得他可通过消除一些域而减少该搜索上下文。利用他的光标或指针,他点击按钮71“搜索树”,并呈现图4的显示屏,表示示出所有域的搜索树或层次:包括在该搜索中的76、77、78和79,以及它们各自的子域80。对于每一域和子域,示出了万维网文档或页面命中的数目。在接收用户的显示站点上的图4所示的域树可在服务该显示站点的万维网服务器53上进行组织。这种表现的动态组织可利用万维网内容管理器程序来完成,例如Interwoven Inc(公司)。分配的那些或用于动态万维网内容管理的IBMContent Manager Express(内容管理器速递)服务器程序。当然上述各种搜索程序跟踪它们的命中的源域,并且可用呈现图4所示的命中树的稍后描述的程序来建立该内容管理器程序。对话框81提示用户检查该树并从搜索上下文中消除域。
因此,图5中,对电影胶片保存感兴趣的用户已检查了该域树并用他的光标83点击,以消除阴影线所示的“牙齿(www.tooth)”76、“安装管子(www.pipefitting)”77和“水果(www.fruit)”78各个域,使得修改的搜索上下文仅包括“电影(www.movies)”79域。尽管图5中没有图示,但可能单独消除一个或多个子域。在这点上,子域传统上标注在URL http路径定义中的域之后的部分,例如该路径定义中的任何数据库源级别是定义本发明的子域的等同。一旦选择了如图所示将消除的域,则用户可点击按钮82,以保存该搜索上下文用于进一步搜索。这样保存的上下文可连同该万维网服务器一起保存,或作为请求该搜索的接收显示站点。
图6是示出了根据本发明用于减少在接收显示万维网站点接收的搜索结果中过多数目的命中的处理的发展的流程图。图6的处理中的大多数编程功能已参考图3到5大体描述过。步骤90中,在万维网上的接收显示站点提供万维网浏览器,用于以传统方式访问网页并在显示站点装载它们。传统上,通过ISP提供的万维网服务器来获得这些网页。该万维网浏览器具有从通过万维网可用的一个或多个搜索引擎请求搜索的能力。步骤91中,在请求搜索的显示站点提供传统的能力,以顺序列出在该搜索中发现的所有万维网文档,并提供这些命中的总数。如图4和5所示,在步骤92,如果用户发现该命中总数超出用户能处理的数目,则通过先前描述的、最好在万维网服务器上维护的万维网内容管理器程序,使得用户能够显示该搜索中发现的万维网文档的域的层次和来自每一域的命中数目。在步骤93,准备提示用户从步骤92中的显示层次中交互选择用户想从该搜索上下文中消除的那些域。在步骤94,也使得用户能够保存在步骤93创建的搜索上下文,用于进一步的万维网搜索。在步骤95,也使得用户能够利用在步骤93创建的搜索上下文而再进行初始搜索。另外,在步骤96,接收站点的用户可请求可以使用不同关键词的所有随后的万维网搜索仍使用在步骤93创建的相同搜索上下文。最后,在以上步骤的执行中,接收显示站点的万维网浏览器准备与万维网服务器交互。
现在将参考图7的流程图来描述结合图3到5描述并在图6中建立的处理的运行。让我们假设我们正参加通过浏览器的万维网浏览会话。该流程图代表将图示本发明的操作的例程中的一些步骤。在步骤101,由万维网上的接收显示站点通过其万维网浏览器和该接收站点的万维网服务器来请求初始搜索。在步骤101,列出搜索结果,并如图3所示,合计了命中的数目。在步骤103,确定该命中数目是否过量。如果没有,则在步骤108,所列出的万维网文档照例被全部浏览和显示。如果是,确定该命中数目过量,则在步骤104显示域层次,如图4所示。在步骤105,提示用户选择性消除一些域,在步骤106,将得到的搜索上下文保存为新搜索上下文。在步骤107,然后重复该初始搜索,但利用该新搜索上下文,并且当再次确定过量的命中数目时,该处理返回到步骤103。
在步骤108之后,方便地确定该会话是否结束。如果是,退出该会话。如果否,则确定是否将进行新搜索。如果否,则该处理返回到步骤109。在步骤111,如果判断为是,则进行新搜索,然后进一步确定是否在从先前消除域得出的新上下文中进行搜索。如果否,则该处理通过分枝“A”返回到初始步骤101。如果是,则在步骤112,使用该新修改的搜索上下文但利用新的或不同的关键词来进行搜索。一旦完成该搜索,该处理返回步骤103,其中观看包括命中数目的搜索结果。
尽管已示出和描述了某些优选实施例,但应理解在不脱离所附权利要求的范围和意图的情况下可在其中进行许多改变和修改。

Claims (20)

1.一种用于减少在接收显示站点之一接收的搜索结果中的过量命中数目的系统,用于用户通过多个数据处理器控制的交互式接收显示站点访问的环球网(万维网)通信网络中,所述接收显示站点用于显示可从该万维网上的数据库源访问的所接收的万维网文档,所述系统包括:
用于在所述接收显示站点显示从所述源接收的万维网文档的装置;
用于在该万维网上进行关键词搜索的装置;
与所述接收显示站点关联、用于显示由所述关键词搜索命中的万维网文档的数目的装置;
响应于过量的万维网文档命中数目、用于使用户能显示所述搜索命中的万维网文档的域的层次级别的装置,每个域具有命中数目的计数;和
使用户能交互消除选中的域、由此减少所述搜索中过量的命中数目的装置。
2.根据权利要求1的万维网通信网络,还包括用于在消除选中域后、再次进行具有所述过量的命中数目的所述关键词搜索的装置。
3.根据权利要求2的万维网通信网络,其特征在于:
所述使用户能显示所述搜索命中的万维网文档的域的层次级别的装置能够显示几个域级别的层次,其中每个域级别中的每个域具有命中数目的计数;和
所述使用户能交互消除选中域的装置使用户能消除每个域级别中的选中域。
4.根据权利要求1的万维网通信网络,还包括与所述接收显示站点关联地存储搜索上下文的装置,所述搜索上下文包括所述消除的选中域,由此可从随后的搜索中消除所述选中域。
5.根据权利要求4的万维网通信网络,还包括用所述存储的搜索上下文在万维网上进行随后搜索的装置,但是其关键词不同于原始万维网搜索中的关键词。
6.根据权利要求4的万维网通信网络,还包括与接收显示站点关联的万维网浏览器,并包括:
用于在所述接收显示站点显示从所述源接收的万维网文档的所述装置;
用于在该万维网上进行关键词搜索的所述装置;
与所述接收显示站点关联的所述装置,用于显示由所述关键词搜索命中的万维网文档的数目;
响应于过量的万维网文档命中数目、用于使用户能显示所述搜索命中的万维网文档的域的层次级别的所述装置,每个域具有命中数目的计数;
使用户能交互消除选中域、由此减少所述搜索中的过量的命中数目的所述装置;和
用于存储包括所述消除的选中域的搜索上下文、由此可从随后搜索中消除所述选中域的所述装置。
7.根据权利要求4的万维网通信网络,还包括万维网服务器,用于将所述接收显示站点连接到万维网;并且用于存储包括所述消除的选中域的搜索上下文的所述装置可操作地与所述万维网服务器关联。
8.一种用于减少在接收显示站点之一接收的搜索结果中的过量命中数目的方法,用于用户通过多个数据处理器控制的交互式接收显示站点访问的万维网通信网络中,所述接收显示站点用于显示可从该万维网上的数据库源访问的所接收的万维网文档,所述方法包括:
在所述接收显示站点显示从所述源接收的万维网文档;
在该万维网上进行关键词搜索;
在所述接收显示站点显示由所述关键词搜索命中的万维网文档的数目;
响应于过量的万维网文档命中数目,使用户能显示所述搜索命中的万维网文档的域的层次级别,每个域具有命中数目的计数;和
使用户能交互消除选中的域,由此减少所述搜索中过量的命中数目。
9.根据权利要求8的方法,还包括在消除选中的域后,再次进行具有所述过量的命中数目的所述关键词搜索的步骤。
10.根据权利要求9的方法,其中:
使用户能显示所述搜索命中的万维网文档的域的层次级别的所述步骤能够显示几个域级别的层次,其中每个域级别中的每个域具有命中数目的计数;和
使用户能交互消除选中域的所述步骤使用户能消除每个域级别中的选中域。
11.根据权利要求8的方法,还包括与所述接收显示站点关联地存储搜索上下文的步骤,所述搜索上下文包括所述消除的选中域,由此可从随后的搜索中消除所述选中域。
12.根据权利要求11的方法,还包括用所述存储的搜索上下文在万维网上进行随后搜索的步骤,但是其关键词不同于原始万维网搜索中的关键词。
13.根据权利要求11的方法,还包括在所述接收显示站点上的万维网浏览处理,该处理包括所述步骤:
在所述接收显示站点显示从所述源接收的万维网文档;
在该万维网上进行关键词搜索;
在所述接收显示站点显示由所述关键词搜索命中的万维网文档的数目;
使用户能显示由所述搜索命中的万维网文档的域的层次级别,每个域具有命中数目的计数;
使用户能交互消除选中域,由此减少所述搜索中过量的命中数目;和
存储包括所述消除的选中域的搜索上下文,由此可从随后搜索中消除所述选中域。
14.根据权利要求11的方法,还包括存储搜索上下文的步骤,所述搜索上下文包括与万维网服务器关联的所述消除的选中域,所述万维网服务器用于将该接收显示站点连接到万维网。
15.一种具有在计算机可读介质上记录的代码的计算机程序,用于在用户通过多个数据处理器控制的交互式接收显示站点访问的万维网通信网络中,减少在接收显示站点之一接收的搜索结果中过量的命中数目,所述接收显示站点用于显示可从万维网上的数据库源访问的所接收的万维网文档,所述计算机程序包括:
用于在所述接收显示站点显示从所述源接收的万维网文档的装置;
用于在万维网上进行关键词搜索的装置;
与所述接收显示站点关联的装置,用于显示由所述关键词搜索命中的万维网文档的数目;
响应于过量的万维网文档命中数目、使用户能显示由所述搜索命中的万维网文档的域的层次级别的装置,每个域具有命中数目的计数;和
使用户能交互消除选中的域、由此减少所述搜索中过量命中数目的装置。
16.根据权利要求15的计算机程序,还包括在消除选中域后再次进行具有所述过量命中数目的所述关键词搜索的装置。
17.根据权利要求16的计算机程序,其中:
使用户能显示由所述搜索命中的万维网文档的域的层次级别的所述装置能够显示几个域级别的层次,其中每个域级别中具有每个域的命中数目的计数;和
使用户能交互消除选中域的所述装置使用户能消除每个域级别中的选中域。
18.根据权利要求15的计算机程序,还包括与所述接收显示站点关联地存储搜索上下文的装置,所述搜索上下文包括所述消除的选中域,由此可从随后的搜索中消除所述选中域。
19.根据权利要求18的计算机程序,还包括用所述存储的搜索上下文在万维网上进行随后搜索的装置,但是其关键词不同于原始万维网搜索中的关键词。
20.根据权利要求18的计算机程序,还包括接收显示站点的万维网浏览器程序,并包括:
用于在所述接收显示站点显示从所述源接收的万维网文档的所述装置;
用于在万维网上进行关键词搜索的所述装置;
与所述接收显示站点关联的所述装置,用于显示由所述关键词搜索命中的万维网文档的数目;
响应于过量的万维网文档命中数目、使用户能显示由所述搜索命中的万维网文档的域的层次级别的所述装置,每个域具有命中数目的计数;
使用户能交互消除选中的域、由此减少所述搜索中过量的命中数目的所述装置;和
用于存储包括所述消除的选中域的搜索上下文、由此可从随后搜索中消除所述选中域的所述装置。
CNB2004100589953A 2003-10-09 2004-07-29 在万维网上进行搜索的系统和方法 Expired - Fee Related CN1332342C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/682.397 2003-10-09
US10/682,397 US7447688B2 (en) 2003-10-09 2003-10-09 System for conducting searches on the world wide web enabling the search requester to modify the domain context of a search responsive to an excessive number of hits on combinations of keywords

Publications (2)

Publication Number Publication Date
CN1606008A true CN1606008A (zh) 2005-04-13
CN1332342C CN1332342C (zh) 2007-08-15

Family

ID=34422514

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100589953A Expired - Fee Related CN1332342C (zh) 2003-10-09 2004-07-29 在万维网上进行搜索的系统和方法

Country Status (2)

Country Link
US (2) US7447688B2 (zh)
CN (1) CN1332342C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206669B (zh) * 2006-12-19 2010-07-21 国际商业机器公司 为用户提供平台无关内容服务的系统和方法
CN107066465A (zh) * 2010-04-22 2017-08-18 微软技术许可有限责任公司 信息呈现系统
US10628504B2 (en) 2010-07-30 2020-04-21 Microsoft Technology Licensing, Llc System of providing suggestions based on accessible and contextual information

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8078977B2 (en) * 2004-06-29 2011-12-13 Blake Bookstaff Method and system for intelligent processing of electronic information
US9047388B2 (en) * 2004-07-01 2015-06-02 Mindjet Llc System, method, and software application for displaying data from a web service in a visual map
US8412698B1 (en) * 2005-04-07 2013-04-02 Yahoo! Inc. Customizable filters for personalized search
JP4341656B2 (ja) 2006-09-26 2009-10-07 ソニー株式会社 コンテンツ管理装置、ウェブサーバ、ネットワークシステム、コンテンツ管理方法、コンテンツ情報管理方法およびプログラム
US20090287645A1 (en) * 2008-05-15 2009-11-19 Yahoo! Inc. Search results with most clicked next objects
US9396455B2 (en) 2008-11-10 2016-07-19 Mindjet Llc System, method, and software application for enabling a user to view and interact with a visual map in an external application
US8352460B2 (en) 2010-03-29 2013-01-08 International Business Machines Corporation Multiple candidate selection in an entity resolution system
US8918393B2 (en) 2010-09-29 2014-12-23 International Business Machines Corporation Identifying a set of candidate entities for an identity record
US9519714B2 (en) * 2010-12-22 2016-12-13 Microsoft Technology Licensing, Llc Presenting list previews among search results
US9916301B2 (en) * 2012-12-21 2018-03-13 Microsoft Technology Licensing, Llc Named entity variations for multimodal understanding systems

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809499A (en) * 1995-10-20 1998-09-15 Pattern Discovery Software Systems, Ltd. Computational method for discovering patterns in data sets
CA2257314C (en) * 1996-06-17 2002-04-30 British Telecommunications Public Limited Company Network based access system
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
US6732086B2 (en) * 1999-09-07 2004-05-04 International Business Machines Corporation Method for listing search results when performing a search in a network
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
AU4712601A (en) * 1999-12-08 2001-07-03 Amazon.Com, Inc. System and method for locating and displaying web-based product offerings
US6801906B1 (en) * 2000-01-11 2004-10-05 International Business Machines Corporation Method and apparatus for finding information on the internet
AU5862601A (en) * 2000-05-24 2001-12-03 Espotting (Uk) Limited Searching apparatus and a method of searching
WO2001093096A2 (en) * 2000-05-30 2001-12-06 Koki Uchiyama Distributed monitoring system providing knowledge services
US6636848B1 (en) * 2000-05-31 2003-10-21 International Business Machines Corporation Information search using knowledge agents
US7062488B1 (en) * 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
US20030014659A1 (en) * 2001-07-16 2003-01-16 Koninklijke Philips Electronics N.V. Personalized filter for Web browsing

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206669B (zh) * 2006-12-19 2010-07-21 国际商业机器公司 为用户提供平台无关内容服务的系统和方法
CN107066465A (zh) * 2010-04-22 2017-08-18 微软技术许可有限责任公司 信息呈现系统
CN107066465B (zh) * 2010-04-22 2021-01-26 微软技术许可有限责任公司 信息呈现系统
US10628504B2 (en) 2010-07-30 2020-04-21 Microsoft Technology Licensing, Llc System of providing suggestions based on accessible and contextual information

Also Published As

Publication number Publication date
US20080294635A1 (en) 2008-11-27
US7447688B2 (en) 2008-11-04
US7933886B2 (en) 2011-04-26
US20050080767A1 (en) 2005-04-14
CN1332342C (zh) 2007-08-15

Similar Documents

Publication Publication Date Title
US7899818B2 (en) Method and system for providing focused search results by excluding categories
US6182065B1 (en) Method and system for weighting the search results of a database search engine
EP0718783B1 (en) A computer implemented method and system for information retrieval
US6640218B1 (en) Estimating the usefulness of an item in a collection of information
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
US6519631B1 (en) Web-based information retrieval
US9213961B2 (en) Systems and methods for generating social index scores for key term analysis and comparisons
US7219139B2 (en) System and method for using continuous messaging units in a network architecture
US7933886B2 (en) System for conducting searches on the world wide web enabling the search requester to modify the domain context of a search responsive to an excessive number of hits on combinations of keywords
US20050097088A1 (en) Techniques for analyzing the performance of websites
US20080282186A1 (en) Keyword generation system and method for online activity
US7107264B2 (en) Content bridge for associating host content and guest content wherein guest content is determined by search
US20030231196A1 (en) Implementation for determining user interest in the portions of lengthy received web documents by dynamically tracking and visually indicating the cumulative time spent by user in the portions of received web document
US20080027798A1 (en) Serving advertisements based on keywords related to a webpage determined using external metadata
EP0718784A1 (en) Personalized information retrieval
US20090024467A1 (en) Serving Advertisements with a Webpage Based on a Referrer Address of the Webpage
US20150081441A1 (en) Dynamic Determination of Number of Served Media Content
WO2005057359A2 (en) Transparent search engine
EP2628097A1 (en) Systems and methods for using a behavior history of a user to augment content of a webpage
WO2004036457A2 (en) Separating hyperlinks from a sequence of hypertext documents
WO2006036781A2 (en) Search engine using user intent
CN102779136A (zh) 一种信息搜索的方法和装置
US20110093456A1 (en) Method and system for displaying information
US20110184940A1 (en) System and method for detecting changes in the relevance of past search results
US7975238B2 (en) Identifying previously bookmarked hyperlinks in a received Web page in a World Wide Web network browser system for searching

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070815