CN102405470B - 用于复合搜索的系统和方法 - Google Patents

用于复合搜索的系统和方法 Download PDF

Info

Publication number
CN102405470B
CN102405470B CN200980108757.XA CN200980108757A CN102405470B CN 102405470 B CN102405470 B CN 102405470B CN 200980108757 A CN200980108757 A CN 200980108757A CN 102405470 B CN102405470 B CN 102405470B
Authority
CN
China
Prior art keywords
search
page
network
standard
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980108757.XA
Other languages
English (en)
Other versions
CN102405470A (zh
Inventor
B·加尔文
A·麦科德
D·R·伯伊斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OL Security LLC
Original Assignee
Michelli Capital LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Michelli Capital LLC filed Critical Michelli Capital LLC
Publication of CN102405470A publication Critical patent/CN102405470A/zh
Application granted granted Critical
Publication of CN102405470B publication Critical patent/CN102405470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种搜索系统,包括:网络连接的服务器、耦合至第一服务器的数据库以及驻留在该数据库上并在第一服务器上执行的软件。服务通过软件向用户呈现交互界面,通过与用户的迭代交互来确定搜索目的,开发用于该搜索的搜索标准,向通过网络可访问的一个或多个标准搜索引擎录入标准,以及代表用户收集搜索结果。

Description

用于复合搜索的系统和方法
技术领域
本发明涉及信息技术的广阔领域,并且尤其涉及向在传统实体零售机构中购物的客户提供信息,该信息涉及出售的产品和服务。
背景技术
由于信息以不断增长的步伐激增,信息技术中需求的最大领域之一处于查找所需信息的方式的领域中,如上简要描述的,在一个重要方面中,这是由使用户能够诸如在因特网网络中的web页面中查找信息的搜索引擎和相关联的系统所服务的领域。在本发明的实施方式中,特别关注搜索系统和所述引擎。
大部分搜索引擎的目标是使用户容易地查找和/或访问万维网(WWW)上的相关数据成为可能。相关性总是最重要的,并且可能最好由查找信息的人来判断。
大部分已知的搜索引擎的关键子系统是用于爬行Web并收集信息的系统,本领域中称为Web爬行器。在没有定期爬行Web以更新可用信息的情况下,搜索引擎将快速地过时并无关。而且,需要Web爬行子系统是有效的并且在相对大的范围上操作。理想地,此类搜索引擎应当在不打扰所爬行的Web本身或站点(页面)的情况下操作。在本领域中寻求很多革新,包括用于在通知搜索引擎企业相关改变中,针对包括来自于内容所有者的请求介入的更新来检查页面的方法、用于高速缓存数据并且将爬行处理并行化的方法等。通常,Web爬行的结果是可以跨越多于100亿Web页面的Web内容数据库,其所有或部分内容可以由搜索引擎收集并存档。
以本领域中公知的各种方式来分析由爬行器子系统收集的页面,从而创建页面标识符的索引和到页面的链接。此类搜索索引用作与书的索引极为相似的目的;针对作为搜索标准录入的任何一个或多个项,返回具有到那些页面的链接的页面列表。更概括地说,Web搜索索引的目标是在用户录入诸如“引人注目的革新”的搜索查询时返回页面列表。通常,返回的页面是其中简单呈现了该项的页面,但是可能的优选是,还返回可能不包含搜索项但与录入该搜索项的人的需求相关的页面。例如,响应于表达为“引人注目的革新”的搜索查询,搜索引擎可能返回到怀特兄弟飞机革新的历史的链接,即使该历史可能不包括该特定项。相关性是重要的。Web爬行器是在搜索中达到目的的手段。从爬行器生成的信息中构建索引是搜索系统的核心元素。
然而,除非用户可以将其用于搜索Web,否则索引将毫无用处,因此需要用户界面。在此类界面中,通常根据本领域公知为浏览器的应用操作,用户录入搜索查询并通常按下回车。该查询经由因特网网络被发送至主管搜索服务的企业,其中的多个主要企业是众所周知的。搜索引擎继而使用当前索引(索引可以在时间上随Web爬行行进而改变)制作与搜索查询相匹配的Web页面列表。而且,关键挑战在于:提供在列表的顶部或附近显示对于该特定用户而言最相关的结果。
已知的相关性需要已经成为开发页面排名算法中非常重要的动机。页面排名算法(或节点排名算法)是排名子系统,其确定显示搜索结果的顺序。该功能的关键性在于进行搜索的人将查看列在顶部的页面、而不是向下挖掘被埋没的信息,尤其是如果清楚地了解存在排名系统,其意味着在顶部附近呈现更相关的页面。此外,如果很多用户认为相关性确定是可信的,则仅查看高排名的搜索结果的倾向将更加明显,这对相关性分数的影响非常大。
在提交本申请时本领域中最有效的页面排名算法之一是GoogleTM公司的PageRank算法。PageRank算法的有效性在当前技术中至少部分地涉及结构化图和矩阵计算。结构化图是页面之间链接的“图形”形式的表示,在“图论”领域中是公知的。众所周知,尽管存在添加和变化,但是PageRank系统基本上通过赋予经索引的页面一分数来工作,其中该分数是通过将从其他页面指向待排名页面的链接数量相加、以及基于针对链接页面计算的类似分数对该分数进行加权而计算的。即,如果存在链接到待排名页面的五个页面,但是没有其他页面链接到这五个页面,则该页面的PageRank将大大低于具有五个入链接(in-link)的页面的PageRank,其中五个入链接中的每个都来自于高排名的链接页面(继而这些页面是高排名的,因为很多页面链接到它们,以此类推)。清楚的是,针对页面排名的计算涉及相对复杂的数学,因为一个页面的分数由链接页面的分数确定,而链接页面的分数依次由它们的链接页面的分数确定,而这些链接页面的分数又由它们的链接页面的分数确定,以此类推至至少某一预定深度。
根据该描述,需要图的原因变得清楚:在当前技术中,为了执行基于链接的计算需要理解连接Web页面的链接结构。
简而言之,可以将WWW可视化为庞大的点阵(点或节点),每个点表示因特网网络中连接的Web页面。为了及时地表示任何一点处几乎所有的已有页面将需要大约1010个点。每个页面必然是代码的集合,代码通常是HTML格式(或其已知扩展之一,诸如DHTML、层叠式样表等),其定义了页面内容,该页面内容通过通常使用web浏览器的用户计算机由页面呈现,该页面内容可以包括文本、图形、可听音乐和语音、视频等。Web中几乎任何页面的另一组件是用于向不同页面发起传送的至少一个链接,或最近在某些情况中,是出于某些目的向用户的计算机发起代码和数据的传送的链接而不需要转移到不同的页面。
图1是一页一点示图的图示或上面引入的WWW的非常简单的视图。仅示出了了五个页面表示性点,但是对本目的足以,这些页面是页面101到105。可以认为本目的的链接是web页面显示中的公知导航元素,针对该元素,光标在鼠标移过时变为手形,并且对其的点击将声明地址(诸如统一资源定位符URL),该地址将用户带到另一Web页面。显示中链接区域可以是图标、文本乃至动画。
在图1中,链接示出为箭头。注意,页面105具有到页面101至页面104中所有页面的链接,而没有回到页面105的链接。链接101到104的每个具有到另一页面的一个链接。考虑以下内容将是有帮助的,尽管链接就是链接,但是从页面本身来看,存在不同的链接形式。从页面的观点看,链接可以是出链接(out-link,即向另一页面传出的链接)或从另一页面到当前页面(instant page)的入链接。例如,考虑具有两个入链接且每个入链接分别来自于页面102和105、一个到页面104的出链接的页面103。还考虑可以示出不是所有链接都去往或来自这五个页面,因为示出了页面非常有限的子集。例如,页面105可以具有来自于未示出页面的多个入链接。出于陈述现有技术页面排名系统的目的,最重要的通常是入链接。
在当前技术中,根据发明人已知的所有信息,如上所述,PageRank算法和所有其他搜索排名系统都基于万维网的静态链接结构。然而,利用示出的链接示出的随机页面图对于本目的不是好的数学模型。为了更好的计算效率,在图2中示出了更好的模型(图)。发明人将该图称为结构化Web图(SWG)。还应该理解,开始,SWG可以仅示出WWW结构的子集,WWW的大小和结构持续变化。在此SWG概念中,WWW(或子集)中的每个Web页面仍旧是一个点,但是没有在随机空间而是以行列示出了页面。因此,在图2的SWG中,存在每个由页面关联标识的五行和每个由相同页面关联标识的五列。通过使用与图1相同的五个页面,得到六乘六矩阵,这考虑了五个页面和具有到矩阵的原点的需要。如果必须针对所有Web页面定义矩阵,则将大小将是1010行和1010列。
在图2中,利用用于与每行每列相关联的页面的标识符来示出行和列。在机器可操纵的有效的数学定义中,将仅以数据惯例定义行和列;可能从不显示矩阵。
如图2所示的矩阵产生了矩阵中呈现的每个页面与呈现的每个其他页面的行列交点。这是其用途的基础。还存在每个页面与本身的交点,这对于本目的无用,并且这些交点在图2中以X标记。
现在作为SWG用途的示例考虑以下图示,这在本领域中是公知的。页面104的行与页面102的列的交点(在图2中标记为元素201)提供了表示页面104和102之间特定关系的机会,这可以以多个方式示出,其中一个方式是仅在交点处放置值。在该情况中,通常值表示是否存在从102到104的入链接。因为不存在,所以值为零。
应该认识到,在交点处,基于从由列表示的页面到由行表示的页面的链接的存在、利用值标记交点的惯例是任意的;可以容易地选择以下惯例,在该惯例中,元素201将表示从页面104到页面102的链接,并且因此仍旧设置为零(因为从102到页面104的路径是间接的;在图1中不存在从102到104的链接)。在现有技术的大部分搜索引擎中,使用的SWG的主要功能是以计算上有用的方式捕获页面之间的多个链接关系。入链接是最有用的,因为它们表示web页面设计者对从他们正在设计的页面到其他web页面链接的选择。应该理解,大量所链接到的页面很可能更加重要,然而,具有很多出链接的页面可以或可以不是相关的(这些页面的设计者自由地添加更多的出链接,因为他们控制他们自身页面的内容,他们将能够容易地抬高他们页面的相关性分数)。web爬行器可以通过爬行每个web页面并且注意从该页面到其他页面的链接来收藏该信息;在图2的元素201的情况中,当爬行器到达页面104时,其将注意到没有到页面102的链接,并且因此在元素201中标记零,如图2所示。
爬行图1提供页面104被从页面103链接(具有入链接)而不是从页面102被链接的信息。因此,201处的值为零,但是页面104的行和页面103的列的交点处的值为1。通过相同的处理,爬行图1,确定所有其他交点处的值,并这些值已经在图2中指出。
在该特定示例中,值是一或零,其对于计算机仿真和操作可能是方便的。当然,可以指派其他值,并且在现实世界中,可以通过多个其他考虑而不仅仅是是否存在从次要页面到主要页面的链接,而对值进行加权。例如,本领域中普通的是,归一化结构化Web图的值从而结构化Web图中的所有值之和等于1,这使得每个值等于这样的概率,即随机的web冲浪者可能进行从一个页面到下一个页面的特定迁移(并且,继续该惯例,列的值之和表示在长会话之后,随机的web冲浪者将发现自己处于列所表示的页面上的概率)。
可以采取很多形式(可能是原始形式)的页面排名算法可能仅考虑SWG一次以对页面进行排名。每个交点处的值可以是一或零,但是存在针对另一页面的、在每个交点处的主要页面为1的概率。对于页面104,跨该行的交点处的值之和为二。因此,可以赋予页面104的排名值为二,因为两个页面(103和105)链接到页面104中。页面105的排名值将是页面105的行的和或零,因为没有页面链入页面105。在图2中,除了105之外的每行之和为二,因此105之外的页面可以具有相等的排名,或在算法中可以存在决胜方式(tie-breaker)。在现实世界的情况中,存在更多要考虑的交点,并且可以将一个页面视为被从数十或数百其他页面链接。
在更复杂的情况中,页面排名算法可以首先考虑页面的行之和,并且继而查看正交点处每个次级页面的入链接;即,对以下问题的答案:多少个页面链接到直接链接到被排名的页面的每个页面,这可以扩展为多少个(以及哪些)链接到每个页面,其中每个页面链接到当前页面。现在,用于排名的值变得更加现实和颗粒状,但是仍旧限于设计链接到Web页面中的结构化链接。该方法是公知的、由GoogleTM首开先河的PageRank算法的基础;驱动该步骤的启发是链接表现的可信性,并且给定可信性的相关入链接密度提供该可信性的重要性的良好指示。因此,至少指示标称相关性。
总之,本领域中的搜索引擎包括几个关键元素,诸如用于发现并收集关于Web页面信息的Web爬行器、包括由爬行器获得的信息的Web页面索引、至少部分地基于浏览者录入的搜索查询来确定向查看者呈现索引中的哪个页面的搜索功能、也基于由爬行器获取的信息的结构化Web图已经使用结构化Web图和在图中指派的值以赋予每个页面唯一的PageRank分数,从而对显示的页面返回进行排序的PageRank算法。授予Lawrence Page的美国专利6,285,999描述了并要求此类PageRank系统。通过在本申请中引用而将美国专利6,285,999合并于此。
记住伴随搜索技术的很多困难,其中的很多困难在上面进行了描述,应该清楚,由从联网的集合中寻找信息的个人提供正确和便利的搜索标准是非常困难的,并且返回针对相关性进行排名的信息对于传统搜索系统(诸如由MozillaTM、GoogleTM和YahooTM提供的那些)也是巨大的挑战。通过考虑所有这些困难,发明人相信,很明显,需要的是将在处理更传统搜索服务中为个人提供大大增强的所述能力的中间系统和方法。
发明内容
在当前情况下,本发明人确定在传统搜索系统和实践中存在严重问题,因此,本发明人已经开发了用于产生好得多的结果的独特复合系统。在一个实施方式中,提供一种搜索服务,包括:网络连接的服务器、耦合至第一服务器的数据库、以及驻留在该数据库上并在第一服务器上执行的软件。服务通过软件向用户呈现交互界面,通过与用户的迭代交互来确定搜索目的、开发用于该搜索的搜索标准、向通过网络可访问的一个或多个标准搜索引擎录入标准、以及代表用户收集搜索结果。
在本发明的另一方面中,提供了一种用于搜索的方法,包括以下步骤:(a)通过在网络连接的服务器上执行交互式搜索服务向用户呈现交互式界面,其中网络连接的服务器执行来自于所耦合数据库的软件;(b)服务通过与用户的迭代交互来确定搜索目的;(c)开发搜索标准;(d)向连接至网络的一个或多个标准搜索引擎录入开发的标准;以及(e)代表用户收集搜索结果。
附图说明
图1是因特网网络中页面节点的简单图示。
图2是结构化Web图的图示。
图3是示出了本发明实施方式中复合搜索系统的图示。
图4是示出了本发明实施方式中处理的处理流程图。
具体实施方式
在本发明的另一方面中,为从联网的集合(比如WWW)寻找信息的个人提供用于增强搜索能力的方法和系统。
图3是示出了涉及本发明实施方式中总体搜索系统的架构的图示。移动设备301表示各种类型的移动设备,诸如很多蜂窝电话、AppleTM iPhoneTM、BlackberryTM设备、其他个人数字助理以及具有访问比如公知的因特网网络的广域网络(WAN)303的能力的其他设备,并且从其而来的搜索可能是通过商业可获得的搜索系统发起的。在该说明书中,在对实施方式的描述中使用因特网网络,但是不必是仅在本发明实施方式中可用的网络。如本领域普通的,设备301是支持无线的,并且经由诸如站302的基站进行无线通信。在本领域的某些情况中,以分级方式配置站,并且存在可以从移动设备传输信号以及向移动设备传输信号的各种架构。示出的简图旨在表示所有此类架构。
膝上型计算机314示出为业通过基站102使用本领域中称为空中卡的事物进行无线连接,这实现了通过蜂窝电话网络的因特网活动。膝上型计算机可能还经由WiFi网络(诸如由StarbucksTM等提供的那些)进行连接。膝上型计算机可能还通过调制解调器直接连接,诸如经由DSL通过陆线电话系统进行直接连接。
示出的台式计算机315经由陆线通过因特网服务提供商316进行连接。台式计算机也可能以其他方式进行连接。
图示示出了移动设备301、膝上型计算机314和台式计算机315全部都以一个方式或另一方式连接至线304(这意味着表示因特网网络中所有互连),该图示是为了表示计算设备可能连接至因特网和其他广域网网络的所有方式。
本发明实施方式中执行来自于相关联数据库309的软件306的因特网连接的服务器305在本发明实施方式中提供两个(或更多)阶段搜索过程中的第一阶段。执行来自于相关联数据库310的软件308的因特网连接的服务器307和执行来自于数据库313的软件312的因特网连接的服务器311表示商业可获得的已经公众可获得的搜索服务,诸如MozillaTM、GoogleTM和YahooTM。在本发明的各种实施方式中,连接至提供独特搜索服务的服务器305的人员操作设备301、314或315,如下面详细描述。
图4是示出了由操作设备301、314或315之一的人员实现的、用于从因特网网络获取信息的搜索过程的流程图。在第一步骤401,用户连接至执行软件306的服务器305提供的本发明的服务的web页面。通常该服务将向在优选实施方式中将是服务的客户端的用户呈现“欢迎”页面。因此,该服务将具有存储在数据库309中的针对客户端的简档,并且将识别该客户端以及通过名称(或别名)对该客户端进行寻址。
服务的目的在于为客户端提供实质上更加丰富和更详细的服务,从而解决标准搜索服务的很多问题。上述问题之一是搜索标准的性质问题,并且对于大部分人而言,难以立即想到有用的词语或短语以录入到标准搜索引擎中作为搜索标准。通常,在标准搜索引擎中,存在用户可以录入词语、短语或词语和短语与逻辑运算符的组合的单个录入窗口。
在本发明的实施方式中,引导用户以向服务描述所需信息的性质,该描述比传统搜索服务更详细且结合上下文,如图4的步骤402所指示的。在一个实施方式中,利用具体问题提示用户以引出并提炼用户的意图。界面通常是个文本录入窗口,但是在某些实施方式中可以支持语音,并且可以存在待回答的多个选择问题。在该阶段中,服务确定待执行的搜索的准确性质。
作为用于确定并提炼搜索性质的服务处理的一个实例,用户可以首先录入以下段落(步骤403),可能如下:“我想要关于AbrahamLincoln的信息,并且尤其是Lincoln遇刺以及刺客之后如何的细节。”此类录入绝不符合针对标准的标准搜索引擎。在用户录入之后,服务将分析、标准化并概括输入,在某些情况中,以一个或多个步骤向用户提供反馈。服务可能向用户发布:“我们确定主要关注是Abraham Lincoln”,是/否。“次要关注是他的遇刺”,是/否。“你希望知道谁是刺客”,是/否。是/否组合是交互式的,并且提示用户为每个级别进行选择。在该情况中,用户将选择是、是、否。然后,服务为最后的部分进行更加确定的努力,并且返回“你希望了解刺客的进一步历史”,是/否。用户可能对此感动满意并指示“是”。
现在,在步骤404,服务使用确定的搜索性质连同标准搜索服务和它们如何工作的知识、还有关于用户的其他知识来开发将向一个或多个搜索标准服务录入的特定搜索标准。服务例如可以确定搜索是简单的事项,并且仅需在GoogleTM上的简单搜索,而且将针对GoogleTM假定搜索标准。仅使用一个标准搜索引擎是可能的,但是通常情况是将进行不止一个搜索。服务器例如可以假定三个搜索标准集合。
在步骤405,服务打开三个GoogleTM搜索,每个标准集合被确定对于所确定搜索性质而言是最佳的,这使得发起三个搜索,从而导致在步骤406向服务返回三个结果的“页面排名”的集合。在步骤407,服务处理结果。该处理可以仅是向服务返回的页面的选择和重新排名,这可以基于客户端事务历史和其他标准,诸如所返回页面的标题中的关键字,在大部分情况中,将列表截取至可管理的页面数量。在更鲁棒的实施方式中,将选择页面的内容并通过服务“提升”以成为针对客户端的综合报告的一部分。在该实施方式中,在步骤408,客户端可以得到排名的或重新排名的页面标题(当然是交互式的,如在标准搜索引擎中),但是还可以得到由上下文分析和概括技术准备的综合报告,其有望对准确地提供客户端所要求的事物:“遇刺的情况和之后发生了什么”大有帮助。
作为针对用户/客户端的其他服务,服务可以为每个客户端提供数据库309的特定部分,其中可以记录客户端的搜索历史,并且在未来可以由客户端对此进行搜索。服务将定期向客户端提供按时间顺序的提纲和交互式的搜索界面,在该界面中,客户端可以搜索他/她自己的过去搜索,并且服务可以以不同的方式识别并呈现来自不同搜索的和其中的数据。
在本发明的某些实施方式中,服务使用若干标准搜索引擎,并且可以在与客户端的交互式处理中开发针对每个搜索的搜索标准范围、可以与客户端交互式地收窄并提炼搜索,直到客户端满意。因此,在某些实施方式中,服务是这样一种服务:其在客户端和标准搜索引擎之间执行,帮助客户端尽量做到最好并且最彻底地搜索客户端实际希望找到的事物,该服务还为了搜索开发与客户端进行交互,因此客户端可以进一步提炼搜索的引导。在某些实施方式中,服务还分析、标准化并概括返回页面中的信息,并且在很多实施方式中基于原搜索的性质准备综合搜索报告。例如,针对如上所述的、想要关于Abraham Lincoln的信息的人,本发明的独特服务可以在规范化和标准化报告中概括出所发现的所有信息,而不像如商业传统搜索设施那样仅仅返回排名页面的web链接。在一个实施方式中,本发明的独特服务还可以提供找到信息的位置的映射;即,概要和从中获取概要信息的页面、以及页面中找到信息的位置的指示。
在移动设备301的情况中,总体交互式搜索中涉及的另一条信息将是移动设备的位置,在很多情况中其由集成在该移动设备中的全球定位系统(GPS)确定。在确定搜索性质以及可能为客户端返回和存储何种材料的步骤中,该信息可能是有价值的。
本领域的技术人员将清楚,上述实施方式和示例不是本发明的仅有实施方式,还可以在不脱离本发明的精神和范围的情况下进行很多改变和修改。因此,本发明仅由以下的权利要求书限制。

Claims (24)

1.一种网络连接的服务器中的用于复合搜索的设备,所述设备包括:
用于向连接至网络的计算设备提供交互界面的装置;
用于通过接收初始搜索查询的迭代的交互确定搜索的目的以便基于所述迭代交互而开发用于所述搜索的搜索标准的装置,所述用于确定的装置包括:用于呈现说明关于所述初始搜索查询的第一说明问题、以及接收对于所述第一说明问题的第一回答的装置,用于在接收所述第一回答之后、呈现第二说明问题并且接收对于所述第二说明问题的第二回答的装置;
用于向通过所述网络可访问的一个或多个标准搜索引擎录入所述搜索标准的装置;以及
用于收集所述搜索的结果的装置。
2.根据权利要求1所述的设备,还包括:用于处理所述搜索的结果以生成经处理的结果、并且向所述计算设备发送所述经处理的结果用于呈现的装置。
3.根据权利要求1所述的设备,还包括:用于开发与所述搜索的目的相关的多个标准的装置,用于向所述一个或多个标准搜索引擎录入不同条目中的所述多个标准以执行多个搜索的装置,以及用于聚合来自于所述多个搜索的多个搜索结果的装置。
4.根据权利要求1所述的设备,还包括:用于通过选择由所述一个或多个标准搜索引擎返回的页面子集来处理所述搜索的结果的装置。
5.根据权利要求1所述的设备,还包括:用于通过对由所述一个或多个标准搜索引擎排名的返回页面进行重新排名来处理所述搜索的结果的装置。
6.根据权利要求5所述的设备,还包括:用于至少部分地使用简档中的一个或多个搜索历史或信息来对所述搜索的结果进行重新排名的装置。
7.根据权利要求1所述的设备,还包括:用于通过从一个或多个返回的页面中选择内容部分、以及准备包括所选部分的报告以发送至所述计算设备来处理所述搜索的结果的装置。
8.根据权利要求1所述的设备,还包括:
用于在耦合至所述网络连接的服务器的数据库中存储所述搜索的结果的装置,所述搜索的结果被标识为与用于执行所述搜索的所述计算设备相关联。
9.根据权利要求8所述的设备,还包括:用于通过允许所述计算设备搜索并获取存储的搜索结果来提供对所述存储的搜索结果的交互式访问的装置。
10.一种用于复合搜索的方法,包括:
通过在网络连接的服务器上执行软件,经由对于连接至网络的计算设备的交互界面,来进行界面连接,所述软件驻留在耦合至所述网络连接的服务器的数据库上;
通过迭代交互确定针对从所述计算设备接收的搜索请求的目的,包括接收查询项,以及包括使得所述交互界面呈现关于所述查询项的第一提炼问题,以及包括经由所述交互界面接收对于所述第一提炼问题的第一回答,在接收所述第一回答之后,使得所述交互界面呈现第二提炼问题,以及包括经由所述交互界面接收对于所述第二提炼问题的第二回答;
基于所述搜索请求的目的开发搜索标准;
向连接至所述网络的一个或多个标准搜索引擎提交包括所述搜索标准的搜索;以及
收集由所述一个或多个标准搜索引擎返回的搜索结果。
11.根据权利要求10所述的方法,其中所述界面连接包括:通过执行在耦合至所述网络连接的服务器的数据库中保持的软件,来对连接至所述网络的所述计算设备进行交互式界面连接。
12.根据权利要求10所述的方法,还包括:
处理由所述一个或多个标准搜索引擎返回的所述搜索结果以形成经处理的结果;以及
使得所述交互界面呈现所述经处理的结果。
13.根据权利要求10所述的方法,还包括:
开发与所述搜索请求的目的相关的多个标准;
向所述一个或多个标准搜索引擎录入不同条目中的所述多个标准以执行多个搜索;
接收来自所述一个或者多个标准搜索引擎的所述多个搜索的多个结果;以及
聚合所述多个搜索的多个结果以形成聚合的结果。
14.根据权利要求12所述的方法,其中所述处理包括:选择由所述一个或多个标准搜索引擎返回的所述搜索结果的子集。
15.根据权利要求12所述的方法,其中所述处理包括:对所述搜索结果进行重新排名。
16.根据权利要求15所述的方法,其中至少部分地使用简档中的一个或多个搜索历史或信息来实现所述重新排名。
17.根据权利要求12所述的方法,其中所述处理包括:
从一个或多个所述搜索结果中选择内容部分;以及
准备包括所述部分的报告。
18.根据权利要求10所述的方法,还包括:
在数据库中存储所述搜索结果;以及
将所述数据库中的所述搜索结果标识为与所述计算设备相关联。
19.根据权利要求18所述的方法,还包括:通过允许所述计算设备搜索并获取所述搜索结果,来提供对所述搜索结果的交互式访问。
20.一种用于复合搜索的方法,包括:
经由网络连接至服务器;
显示由所述服务器提供的交互界面;
获取输入,所述输入包括通过迭代交互来描述搜索的性质的至少一个搜索项,所述输入至少请求并接收关于所述至少一个搜索项的至少一个第一说明,以及在接收所述至少一个第一说明之后,至少请求和接收至少一个第二说明;
向所述服务器发送所述输入,以便确定所述搜索的目的,基于所述搜索的所述目的开发搜索标准,向一个或多个标准搜索引擎录入所述标准,以及收集所述搜索的结果;以及
从所述服务器接收所述搜索的所述结果。
21.根据权利要求20所述的方法,还包括:对数据库中存储的、之前返回的搜索结果进行搜索。
22.一种用于复合搜索的设备,包括:
用于呈现由搜索服务提供的交互界面的装置,所述搜索服务由网络耦合的服务器提供,其中所述交互界面包括:
用于迭代收集与搜索的描述相关的输入以提炼所述搜索的目的的装置,所述搜索服务将所述搜索的所述目的用于确定搜索标准,所述搜索标准用于从一个或者多个标准搜索引擎产生搜索结果;
用于请求和接收对于所述输入的至少一个第一说明以及向所述搜索服务发送所述第一说明的装置,以及
用于在接收所述第一说明之后、请求和接收至少一个第二说明以及向所述搜索服务发送所述第二说明的装置。
23.根据权利要求22所述的设备,其中所述用于呈现的装置包括用于呈现由所述搜索服务提供的过去搜索的界面的装置,其中所述过去搜索的界面包括用于交互地访问连接至所述网络耦合的服务器的数据库的过去搜索的结果的装置。
24.一种用于复合搜索的系统,包括:
用于确定由网络连接的客户端设备发起的搜索目的的装置;所述用于确定的装置包括:用于接收关于来自所述网络连接的客户端的搜索的至少一个查询项的装置,用于从所述网络连接的客户端请求提炼关于所述搜索的信息的至少一个第一提炼项的装置,以及用于从所述网络连接的客户端接收提炼信息的至少一个第一提炼项的装置,以及用于从所述网络连接的客户端请求提炼关于所述搜索的信息的至少一个第二提炼项的装置,以及用于从所述网络连接的客户端接收提炼信息的至少一个第二提炼项的装置;
用于基于所述搜索目的从至少一个标准搜索引擎获得搜索结果的装置;以及
用于在向所述网络连接的客户端设备返回所述搜索结果之前处理所述搜索结果的装置。
CN200980108757.XA 2008-03-14 2009-03-12 用于复合搜索的系统和方法 Active CN102405470B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/048,637 US7930287B2 (en) 2008-03-14 2008-03-14 Systems and methods for compound searching
US12/048,637 2008-03-14
PCT/US2009/036923 WO2009114672A2 (en) 2008-03-14 2009-03-12 Systems and methods for compound searching

Publications (2)

Publication Number Publication Date
CN102405470A CN102405470A (zh) 2012-04-04
CN102405470B true CN102405470B (zh) 2015-06-03

Family

ID=41064133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980108757.XA Active CN102405470B (zh) 2008-03-14 2009-03-12 用于复合搜索的系统和方法

Country Status (5)

Country Link
US (2) US7930287B2 (zh)
EP (1) EP2263175A4 (zh)
JP (1) JP5318125B2 (zh)
CN (1) CN102405470B (zh)
WO (1) WO2009114672A2 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930287B2 (en) * 2008-03-14 2011-04-19 Michelli Capital Limited Liability Company Systems and methods for compound searching
US9251157B2 (en) * 2009-10-12 2016-02-02 Oracle International Corporation Enterprise node rank engine
US9659265B2 (en) 2009-10-12 2017-05-23 Oracle International Corporation Methods and systems for collecting and analyzing enterprise activities
JP5806451B2 (ja) 2010-07-21 2015-11-10 キヤノン株式会社 画像形成装置
KR20130035486A (ko) * 2011-09-30 2013-04-09 삼성전자주식회사 사용자 행위를 고려한 검색 장치 및 방법
CN103294777A (zh) * 2013-05-13 2013-09-11 沈文策 一种问题解答方法及系统
CN103533399A (zh) * 2013-09-30 2014-01-22 深圳创维-Rgb电子有限公司 一种视频信息显示方法和装置
US9454621B2 (en) * 2013-12-31 2016-09-27 Google Inc. Surfacing navigational search results
US10019523B2 (en) * 2014-11-21 2018-07-10 Ebay Inc. Diversifying search results
US10530714B2 (en) 2016-02-29 2020-01-07 Oracle International Corporation Conditional automatic social posts
US10503805B2 (en) * 2016-12-19 2019-12-10 Oracle International Corporation Generating feedback for a target content item based on published content items
US11003996B2 (en) * 2017-05-24 2021-05-11 Facebook, Inc. Determining navigation patterns associated with a social networking system to provide content associated with a destination page on a starting page
US11762934B2 (en) 2021-05-11 2023-09-19 Oracle International Corporation Target web and social media messaging based on event signals

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075239A (zh) * 2006-08-23 2007-11-21 腾讯科技(深圳)有限公司 一种复合搜索方法和系统

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128139A (ja) * 1987-11-12 1989-05-19 Fujitsu Ltd 手続き的知識の処理方式
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7725525B2 (en) * 2000-05-09 2010-05-25 James Duncan Work Method and apparatus for internet-based human network brokering
JP3964630B2 (ja) * 2001-03-07 2007-08-22 日本電信電話株式会社 情報検索装置と情報検索プログラムおよび該プログラムを記録した記録媒体
US6947930B2 (en) 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
EP1646956A1 (en) * 2003-07-23 2006-04-19 University College Dublin, National University of Ireland Dublin Information retrieval
US20050177555A1 (en) * 2004-02-11 2005-08-11 Alpert Sherman R. System and method for providing information on a set of search returned documents
US20050278317A1 (en) * 2004-05-14 2005-12-15 William Gross Personalized search engine
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US9092523B2 (en) * 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
US8694530B2 (en) * 2006-01-03 2014-04-08 Textdigger, Inc. Search system with query refinement and search method
JP2007188352A (ja) * 2006-01-13 2007-07-26 National Institute Of Information & Communication Technology ページリランキング装置、ページリランキングプログラム
KR100717387B1 (ko) * 2006-01-26 2007-05-11 삼성전자주식회사 유사곡 검색 방법 및 그 장치
US20070192179A1 (en) * 2006-02-15 2007-08-16 Van Luchene Andrew S Survey-Based Qualification of Keyword Searches
US8266131B2 (en) * 2006-07-25 2012-09-11 Pankaj Jain Method and a system for searching information using information device
US20080141126A1 (en) * 2006-11-17 2008-06-12 Vincent Lee Johnson Method and system to aid in viewing digital content
US7555478B2 (en) * 2006-12-05 2009-06-30 Yahoo! Inc. Search results presented as visually illustrative concepts
US8244750B2 (en) * 2007-03-23 2012-08-14 Microsoft Corporation Related search queries for a webpage and their applications
US20090106233A1 (en) * 2007-08-24 2009-04-23 Veenstra John W Query engine interpreter and prioritization engine
US20090119254A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results
US20090138439A1 (en) * 2007-11-27 2009-05-28 Helio, Llc. Systems and methods for location based Internet search
US8145630B1 (en) * 2007-12-28 2012-03-27 Google Inc. Session-based dynamic search snippets
US7930287B2 (en) * 2008-03-14 2011-04-19 Michelli Capital Limited Liability Company Systems and methods for compound searching

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075239A (zh) * 2006-08-23 2007-11-21 腾讯科技(深圳)有限公司 一种复合搜索方法和系统

Also Published As

Publication number Publication date
WO2009114672A2 (en) 2009-09-17
JP5318125B2 (ja) 2013-10-16
EP2263175A2 (en) 2010-12-22
US7930287B2 (en) 2011-04-19
CN102405470A (zh) 2012-04-04
WO2009114672A3 (en) 2011-08-18
US20110167052A1 (en) 2011-07-07
US20090234835A1 (en) 2009-09-17
JP2011526008A (ja) 2011-09-29
EP2263175A4 (en) 2013-01-16

Similar Documents

Publication Publication Date Title
CN102405470B (zh) 用于复合搜索的系统和方法
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US10430425B2 (en) Generating suggested queries based on social graph information
US20080313137A1 (en) Behavioral WEB Graph
CN101218582B (zh) 搜索和浏览url和url历史的方法
US9411890B2 (en) Graph-based search queries using web content metadata
US20110282861A1 (en) Extracting higher-order knowledge from structured data
CN102073725B (zh) 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
CN101283353A (zh) 通过分析标签找到相关文档的系统和方法
CN110941698B (zh) 一种基于bert下卷积神经网络的服务发现方法
KR20100094021A (ko) 이동통신 단말기와 아이피 기반 정보 단말기를 이용한 맞춤, 지능형 심볼, 아이콘 인터넷 정보 검색시스템
CN102687138A (zh) 搜索建议聚类和呈现
MX2011006234A (es) Provision de historial reciente con resultados de busqueda.
KR20080062369A (ko) 지유아이 검색 서비스 제공 방법 및 시스템
US20120101979A1 (en) Systems and methods for extracting information from structured documents
US20180232410A1 (en) Refining structured data indexes
CN103365932A (zh) 一种网页搜索方法和装置
US20030233617A1 (en) Server and web page information providing method
WO2013067444A2 (en) Triggering social pages
CN103718179A (zh) 信息处理装置、信息处理方法、信息处理程序以及记录有信息处理程序的记录介质
JP2003141163A (ja) 情報蓄積・検索装置及び方法、情報蓄積・検索プログラムならびにそのプログラムを記録した記録媒体
JP6783133B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9898544B2 (en) Guided web navigation tool
Modi et al. A Comparative Study of Various Page Ranking Algorithms
US20110137931A1 (en) Search Strategy Capture and Retrieval Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant