详细描述
此处用细节来描述本发明的主题以满足法定要求。然而,描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其它当前或未来技术按照其它方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的顺序时,该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定顺序。
如先前所指示的,执行对网页的搜索的基本形式由于其来源而在本质上保持不变。具体地,搜索引擎从用户处接收作为搜索输入的包括一个或多个搜索项的搜索查询并提供指示与该搜索查询相关的多个网页的搜索结果。本发明的实施例提供了该基本搜索形式的逆,并且由此在此被称为“逆向搜索”。搜索引擎从用户处接收作为搜索输入的网页标识符(例如,URL)并提供对该网页的相关搜索查询,而非接收搜索查询并提供网页结果。虽然并非必需,但是如果搜索使用相关搜索查询来执行,则相关搜索查询理论上会指示作为搜索结果的网页(例如,假设该网页由搜索引擎来索引)。
在本发明的其他实施例中,可使用逆向搜索形式来细化和提高提供基本搜索形式的搜索引擎的核心相关性。在一个实施例中,可使用对网页的相关搜索查询来为搜索引擎确定要索引哪些网页。在另一实施例中,可使用相关搜索查询来对作为对于查询的搜索结果的网页进行排序,由此提高了搜索相关性。
在本发明的还有的实施例中,对网页的相关搜索查询可以被扩展到特定商业应用。例如,可以将对网页的相关搜索查询放置在网页上。当用户从网页中选择相关搜索查询时,对于所选相关搜索查询的搜索结果与广告一起呈现。在某些实施例中,由这种广告产生的任何广告收入可由搜索引擎来与网页所有者分享。这种方法不仅增加了搜索引擎的通信量,而且还帮助网页所有者向访问者提供丰富的体验并且为搜索引擎和网页所有者双方产生收入。
因此,一方面,本发明的实施例涉及用于提供对网页的一个或多个相关搜索查询的计算机实现的方法。该方法包括经由被配置成接收对搜索引擎的输入的输入框来从最终用户接收作为搜索输入的网页标识符。该方法也包括确定对网页的一个或多个相关搜索查询。该方法还包括传送相关搜索查询中的至少一部分以便呈现给最终用户。
在另一实施例中,本发明的一方面涉及用于确定是否在搜索引擎索引中索引网页的计算机实现的方法。该方法包括识别对网页的一个或多个相关搜索查询。方该法还包括基于相关搜索查询来确定是否在搜索引擎索引中索引网页。该方法还包括如果确定应该索引该网页,则在该搜索引擎索引中索引网页。
本发明的又一实施例涉及用于对作为对于搜索查询的搜索结果的多个网页进行排序的计算机实现的方法。该方法包括确定对网页的至少一部分的一个或多个相关搜索查询。该方法还包括至少部分地基于相关搜索查询来对网页进行排序。
在简要描述了本发明的概览之后,以下描述其中可实现本发明的各方面的示例性操作环境,以便为本发明各方面提供通用上下文。最初具体参考图1,示出用于实现本发明的实施例的示例性操作环境,并将其大致指定为计算设备100。计算设备100只是合适的计算环境的一个示例,并且不旨在对本发明的使用范围或功能提出任何限制。也不应该将计算设备100解释为对所示出的任一组件或其组合有任何依赖性或要求。
本发明可以在计算机代码或机器可使用指令的一般上下文中描述,机器可使用指令包括由计算机或诸如个人数据助理或其它手持式设备等其它机器执行的诸如程序模块等的计算机可执行指令。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施,这些系统配置包括手持式设备、消费电子产品、通用计算机、更专用计算设备等等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实施。
参考图1,计算设备100包括直接或间接耦合以下设备的总线110:存储器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口118、输入/输出组件120、和说明性电源122。总线110可以是一条或多条总线(诸如地址总线、数据总线、或其组合)。尽管为了清楚起见用线条示出了图1的各框,但是在实际上,各组件的轮廓并不是那样清楚,并且按比喻的说法,线条更精确地将是灰色的和模糊的。例如,可以将诸如显示设备等呈现组件认为是I/O组件。同样,处理器具有存储器。可以认识到,这是本领域的特性,并且重申,图1的图示只是例示可结合本发明的一个或多个实施例来使用的示例性计算设备。在诸如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。
计算设备100通常包括各种计算机可读介质。作为示例而非限制,计算机可读介质可以包括随机存取存储器(RAM);只读存储器(ROM);电可擦除可编程只读存储器(EEPROM);闪存或其它存储器技术;CDROM、数字多功能盘(DVD)或其它光或全息介质;磁带盒、磁带、磁盘存储或其它磁存储设备;载波或可用于对所需信息进行编码并且可由计算设备100访问的任何其它介质。
存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从诸如存储器112或I/O组件120等各种实体读取数据的一个或多个处理器。呈现组件116向用户或其它设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等等。
I/O端口118允许计算设备100逻辑上耦合至包括I/O组件120的其它设备,其中某些设备可以是内置的。说明性组件包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、无线设备等等。
现在转向图2,提供了示出其中可采用本发明的各实施例的示例性系统200的框图。应该理解,此处所描述的该排列和其它排列仅是作为示例来阐述的。可以使用其它排列和元素(例如,机器、接口、功能、顺序和功能组等)作为对此处所示的排列和元素的补充或替换,并且某些元件可以被一起省略。此外,此处所描述的许多元素都是功能实体,这些功能实体可被实现为离散的和分布式组件,或者结合其它组件并且用任何合适的组合并在任何合适的位置实现。此处所描述的各种功能在由一个和多个实体执行时可以由硬件、固件和/和软件来实现。例如,各种功能可以由执行存储在存储器中的指令的处理器来执行。
除了未示出的组件之外,系统200可以包括搜索引擎202、源设备204和用户设备206。搜索引擎202、源设备204和用户设备206中的每一个都可以是任一种类型的计算设备,诸如例如,参考图1描述的计算设备100。各组件可以经由网络208彼此通信,网络208可以包括但不限于,一个和多个局域网(LAN)和/或广域网(WAN)。这些联网环境常见于办公室、企业范围计算机网络、内联网以及因特网。应该理解,在本发明的范围内可以在系统200内采用任何数量的内容共享服务器、广告服务器、用户设备和网络。另外,未示出的其它组件也可以被包括在系统200内。
诸如源设备204等源设备可以维护各种网页。例如,源设备204可以是维护多个网页的web服务器。搜索引擎202可以通过与这些源设备通信来访问网页信息。例如,搜索引擎202可以周期性地爬寻源设备204以访问网页信息和/或索引信息。
通过访问和/或来自各个源设备的网页信息,搜索引擎202可以向诸如用户设备206等用户设备提供搜索能力。具体地,用户可采用web浏览器210或用户设备206上的其它机制来与搜索引擎202通信。例如,用户可以向搜索引擎202发出搜索查询并接收搜索结果。如先前所示,在传统搜索形式中,搜索查询可以包括一个或多个搜索项,而搜索引擎202尝试提供与这些搜索项相关的网页搜索结果。在本发明的各实施例中,搜索引擎202被配置成提供逆向搜索能力。具体地,用户可以发出包括诸如URL等网页标识符的对特定网页搜索查询,并且搜索引擎202返回包括与该网页相关联的一个或多个相关搜索查询的搜索结果。相关搜索查询可以经由用户设备206以超链接的形式呈现给用户,从而允许用户与相关搜索查询交互。由此,用户可以选择相关搜索查询以使得搜索引擎202使用相关搜索查询来执行搜索并将网页结果提供给用户设备206。
现在参考图3,将更详细地描述根据本发明一实施例的示例性搜索引擎300。除了未示出的组件之外,搜索引擎300可以包括用户界面组件302、相关搜索查询组件304以及数据存储306。每一个组件都可以包括程序、例程、应用程序或能够执行此处所讨论的动作的其它机器可执行代码。本领域的技术人员将会认识到,图3所示的组件仅仅是出于说明的目而提供的,可以根据本发明的各个实施例来提供其它安排。
一般地,搜索引擎300可以经由用户界面组件302来从诸如图2的用户设备206等用户设备接收包括网页标识符的搜索查询。用户界面组件302可以进行通信以便从用户设备接收网页标识符,并且将该网页标识符传递给相关搜索查询组件304以便确定对与该网页标识符相关联的网页的相关搜索查询。用户界面组件302可以进行通信以便从相关搜索查询组件304接收包括相关搜索查询的搜索结果并将该搜索结果返回给用户设备。
相关搜索查询组件304被配置成确定对与由用户提供给搜索引擎300的网页标识符对应的网页的相关搜索查询。相关搜索查询组件304可以例如通过爬寻目标网页或参考诸如数据存储306中的索引或高速缓存、存储关于目标网页的信息来收集关于目标网页的信息。如下文中更详细描述的,通过使用与目标网页相关联的信息,相关搜索查询组件304可以按本发明的范围内的多种不同的方式来确定相关搜索查询。作为示例而非限制,相关搜索查询可以通过从目标网页的内容中提取关键词并基于所提取的关键词来确定相关搜索查询来确定。在其它实施例中,可使用诸如例如在查询日志中找到的历史搜索信息来确定对目标网页的相关搜索查询。在其他实施例中,在确定对目标网页的相关搜索查询后,搜索引擎300可以索引相关搜索查询信息或将其高速缓存在数据存储306中。因此,当用户请求对该特定网页的后续逆向搜索时,可以通过参考存储在数据存储306中的、将例如目标网页的网页标识符映射到相关搜索查询的信息来确定相关搜索查询。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
现在转向图4,提供了示出根据本发明的一实施例的用于执行逆向搜索的示例性总体方法的流程图。最初,如框402所示,在搜索引擎处接收诸如URL等网页标识符。如本领域的技术人员将会认识到的,可以在搜索引擎处以多种不同的方式接收网页标识符。作为示例而非限制,用户可以采用web浏览器导航到搜索引擎网页并将网页标识符输入到该网页上的输入框中。另外,用户可以在由位于例如web浏览器、用户的计算设备的桌面或其它位置中的搜索引擎工具栏提供的输入框中输入网页标识符。本领域的技术人员将会认识到,也可以采用用于允许最终用户将网页标识符作为对搜索引擎的搜索输入来提供的各种其他方法。
在接收到网页标识符后,搜索引擎确定对与该标识符相关联的网页的相关搜索查询,如框404所示。如上所示,对网页的相关搜索查询可以按本发明的范围内的多种不同的方式来确定。作为示例而非限制,相关搜索查询可以通过从网页的内容中提取关键词并基于所提取的关键词来确定相关搜索查询来确定。在其它实施例中,可使用诸如在查询日志中找到的历史搜索信息来确定对网页的相关搜索查询。在另外的实施例中,相关搜索查询可以通过参考将网页标识符映射到相关搜索查询的索引来确定。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
如框406所示,传送相关搜索查询的至少一部分以便呈现给最终用户。尽管并非必需,但是通常提供列出对网页的相关搜索查询作为搜索结果的搜索结果用户界面(类似于由搜索引擎以基本搜索形式提供的搜索结果用户界面)。相关搜索查询可以基于针对这些相关搜索查询确定的排名来在列表中排序。排名可以基于例如相关搜索查询与网页的相关性以及相关搜索查询的受欢迎程度(例如,基于历史搜索信息)。在某些实施例中,可仅传送排名最高的相关搜索查询以便呈现给用户,而在其它实施例中可以提供针对网页确定的所有相关搜索查询。
列表中所包括的每一个相关搜索结果都可包括允许用户选择相关搜索查询的超链接。因此,当用户选择相关搜索查询时,使用所选相关搜索查询来执行搜索并提供搜索结果。对于所选相关搜索查询的搜索结果可以在例如原始搜索结果用户界面中与相关搜索查询一起呈现(例如,邻近所选相关搜索查询)或可以经由单独的搜索结果用户界面来呈现。
在本发明的各实施例中,可以结合相关搜索查询来提供其它搜索相关信息和其他类型的搜索结果。例如,可以提供相关人员、相关地点、相关网页或与所搜索的网页相关的其它内容。在某些实施例中,可以使用一个或多个相关搜索查询来执行搜索,并且可以结合相关搜索查询来提供搜索结果。例如,可以为前五位的相关搜索查询提供前五位的搜索结果。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
作为说明,图5示出了可以例如经由搜索引擎网页来提供的搜索输入框502。搜索输入框502允许用户出于搜索目的来键入输入。如本领域中已知且如图5所示,搜索引擎可以提供各种搜索能力,包括广泛的web搜索和各种垂直搜索。因此,结合搜索输入框502提供多个搜索选择504-514。搜索选择504-514包括广泛的web搜索504、多个垂直搜索(即,图像垂直搜索506、新闻垂直搜索508、地图垂直搜索510以及分类垂直搜索512)以及相关查询搜索514。通过在搜索输入框502中输入搜索查询并选择搜索选择504-514中的一个,用户可以使得搜索引擎使用所输入的搜索查询来执行所选类型的搜索。
在所示示例中,用户已在搜索输入框502中输入URL“www.michaeljordanfanclub.com”。在输入该URL后,用户可以选择相关查询搜索514以使得搜索引擎执行逆向搜索并提供对与所输入的URL相关联的网页的相关搜索查询搜索。或者,可以采用用于向搜索引擎指示用户希望执行逆向搜索的其它方法。例如,用户可以在搜索输入框502中输入“Related:”,之后是URL以便向搜索引擎指示用户希望执行逆向搜索。在某些实施例中,搜索引擎可以例如仅基于搜索输入框502中的URL输入来推断用户希望执行逆向搜索,而非要求用户明确地指示想要执行逆向搜索。
通过使用在搜索输入框502中输入的URL,搜索引擎执行逆向搜索并提供图中所示的搜索结果用户界面600。搜索结果用户界面600包括对与“www.michaeljordanfanclub.com”相关联的网页的相关搜索查询602的列表。如上所示,相关搜索查询可以用超链接形式来呈现,该超链接允许用户例如通过选择相关搜索查询并使得针对所选相关搜索查询来执行网络搜索来与搜索结果交互。
图7-9提供了根据本发明的各个实施例的用于确定对网页的相关搜索查询的多种方法。应该理解,参考图7-9讨论的方法仅是出于说明的目的而提供的,而不应该被视为限制性的。因此,本领域的技术人员将会认识到,可组合所描述的方法并且可在本发明的范围内采用用于确定对网页的相关搜索查询的其它方法。
最初参考图7,提供了示出根据本发明的一实施例的用于通过从网页的内容中提取关键词来确定对网页的相关搜索查询的示例性方法700的流程图。最初,如框702所示,接收作为搜索输入的对应于网页的网页标识符。基于该网页标识符,爬寻网页内容,如框704所示。
如框706所示,词从网页的内容中提取关键词。本领域的技术人员将会认识到,在本发明的范围内可以采用各种关键词提取方法。信息提取是信息检索研究中的流行话题。例如,在web搜索的上下文中,可以从关于网页的多个信息片段中提取关键词,这些信息片段包括:指向当前网页的网页锚文本;网页标题;以及网页的正文(包括传出锚文本、突出显示的单词等)。通过使用这些各种信息片段,可以构建用于预测网页的哪些单词是关键词的机器学习模型。作为示例而非限制,简单的关键词提取方法可以包括将网页的内容中的单词标准化成其相应的词根的词干提取(stemming)功能。此外,可以提供用于标识和过滤出无用词(即对网页内容不重要的词)的无用词过滤。此外,可以提供用于移除出现频率比特定预定义阀值小的单词的低使用率单词移除。此外,可使用项频率/逆文档频率(TF/IDF)技术来计算网页内容中所包括的单词和/或短语的TF/IDF值。随后可使用该值来相对于彼此地为单词/短语打分,从而使得具有最高分的单词/短语可以被标识为关键词和/或在选择关于关键词的相关搜索查询时被给予更大的权重。
如框708所示,基于所提取的关键词来确定相关搜索查询。基于所提取的关键词来确定相关搜索查询可以按本发明的范围内的各种不同的方式来执行。作为示例而非限制,相关搜索查询可以通过将所提取的关键词与历史搜索信息(例如,查询日志中的可用信息)进行比较来确定。例如,历史搜索信息可以包括关于由搜索引擎执行的过去搜索(即,使用基本搜索形式)的信息,包括由用户提交的搜索查询。通过分析这一信息,可以标识单词序列的模式。因此,给定从网页内容中提取的关键词,可以标识高精度地匹配所提取的关键词的多个模式。这些模式可以作为相关搜索查询来提供。
在确定对网页的相关搜索查询后,传送这些相关搜索查询的至少一部分以便呈现给最终用户,如框710所示。
接着转向图8,提供了示出根据本发明的一实施例的用于使用历史搜索信息来确定对网页的相关搜索查询的示例性方法800的流程图。最初,如框802所示,例如经由搜索输入框来从最终用户接收对应于网页的网页标识符。
在框804,访问包括历史搜索信息的数据存储。数据存储可以是例如,由服务器(例如,搜索引擎服务器)存储的查询日志或搜索引擎高速缓存,或存储在最终用户的计算设备上的web浏览器高速缓存。历史搜索信息可以包括关于由搜索引擎执行的过去搜索(即,基本搜索形式)的信息,包括例如,搜索引擎接收到的过去的搜索查询、对于搜索查询的搜索结果以及用户与搜索结果的交互(例如,点进或其它选项选择)。
如框806所示,使用历史搜索信息来确定对网页的相关搜索查询。在某些实施例中,可以通过标识其搜索结果包括网页的过去的搜索查询来从历史查询信息中确定对网页的相关搜索查询。在其他实施例中,通过标识不仅包括作为搜索结果的网页而且用户从对于其的搜索结果中选择该网页的过去的搜索查询来确定对网页的相关搜索查询。因为可根据经验来将用户最频繁选择访问的结果假设为作为该信息的消费者的用户将其判断为与他们的查询最相关的结果,所以后一种方法可以提供对网页的更好的相关搜索查询。
在确定对网页的相关搜索查询之后,传送相关搜索查询的至少一部分以便呈现给最终用户,如框810所示。
在某些实施例中,可以针对各个网页索引或高速缓存相关搜索查询。例如,为了方便基本搜索形式(即,提供对于搜索查询的网页搜索结果),搜索引擎将爬寻网页并索引关于该网页的信息。类似地,搜索引擎可以爬寻网页和/或分析历史搜索信息以便标识对网页的相关搜索查询并索引信息以便于逆向搜索。另外地或另选地,在某些实施例中,搜索引擎可以被配置成在为最终用户执行逆向搜索后高速缓存对网页的相关搜索查询。在任一种情况下,将网页映射到相关搜索查询的索引会可用于方便逆向搜索。例如,参考图9,提供了示出根据本发明的一实施例的用于通过采用索引来提供对网页的相关搜索查询的示例性方法900的流程图。如框902所示,接收网页的网页标识符。在框904,访问将网页映射到相关搜索查询的索引。在访问该索引后,确定是否已经为网页索引相关搜索查询,如框906所示。如果已经从网页索引相关搜索查询,则在框908处从索引中标识相关搜索查询。另外,传送相关搜索查询以便呈现给最终用户,如框910所示。
如果在框906确定没有为网页索引相关搜索查询,则在框912处确定对网页的相关搜索查询。相关搜索查询可以例如通过采用上述方法中的一种来确定。然后索引对网页的相关搜索查询,如框914所示。因此,相关搜索查询可容易地在索引中用于后续搜索。在框910,还传送相关搜索查询以便呈现给最终用户。
在本发明的其他实施例中,可使用相关搜索查询和所提取的关键词来改进搜索引擎的基本搜索形式。具体地,相关搜索查询和所提取的关键词可用于改进确定要索引哪些网页的选择过程并可用于改进对搜索的网页的排序。
关于用于索引的网页选择,选择的关键目标在于确定要索引哪些网页以及要避免哪些网页。因为实际考虑事项指示搜索引擎可能受到其最大索引数量的限制且爬寻网络上所产生的每一个网页是不切实际的,所以搜索引擎通常必须聪明地地选择要索引哪些网页。当前,在确定是否索引网页时使用多个特征,诸如例如,网页的内链接、网页接收的点击以及锚文本的质量。本发明的实施例提供了用于确定是否索引网页的其他度量。具体地,网页是否应由搜索引擎来索引还可以至少部分地基于对该网页的相关搜索查询来确定。
参考图10,提供了示出根据本发明的一实施例的用于确定是否索引网页的示例性方法1000的流程图。最初,如框1002所示,例如在搜索引擎蜘蛛应用程序爬寻web时标识网页。在框1004,例如使用上述用于确定对网页的相关搜索查询的方法中的一种来确定对所标识的网页的相关搜索查询。
如框1006所示,至少部分地基于对网页的相关搜索查询来确定是否索引网页。在某些实施例中,索引确定可以基于对网页的相关搜索查询的总量。例如,因为网页应答大量搜索查询可以指示该网页是许多用户想要查看的网页。在其他实施例中,索引确定可以基于相关搜索查询的受欢迎程度。搜索查询的受欢迎程序可以例如通过参考历史查询信息并确定搜索查询相对于其他搜索查询的使用频率来确定。具有较高使用频率的搜索查询可以被视作是更受欢迎的,从而使得应该索引应答这些受欢迎的查询的网页。应该理解,在索引选择过程中也可以考虑其他性质的相关搜索查询和关键词。例如,可以考虑相关搜索查询和关键词的货币化或“垃圾(spammy)”程度(例如,相关搜索查询和关键词可导致付费较高的上下文广告的程度)。
如果在框1006处基于对网页的相关搜索查询来确定应索引网页,则索引网页,如框1008所示。或者,如果在框1006处确定不应索引网页,则搜索引擎可以丢弃与网页相关联的数据,如框1010所示。
在构建其索引时,搜索引擎将其索引分成可被称为“小”或“大”的索引。小索引被完全加载到存储器中,而大索引被保存在硬盘上。通常对于搜索引擎采用该方法,因为虽然存储器较快,但相比于硬盘也较昂贵。因此,通常将较受欢迎的网页包括在存储器内的小索引中以便允许较快的搜索结果。然而,因为存储器是昂贵的,所以将所有经索引的信息都包括在存储器中是不可行的。
采用大和小索引的搜索引擎所面临的一个问题是确定在小索引中索引哪些网页以及在大索引中索引哪些网页。本发明的某些实施例可以方便该判定。具体地,可以在确定是否在小索引或大索引中索引网页时应用在使用相关搜索查询和所提取的关键词来确定是否索引网页时应用的相同的考虑事项。
采用小和大索引的搜索引擎所面临的另一个问题是决定对于给定搜索查找哪一个索引的问题,因为在硬盘比存储器慢得多的情况下对于每一个搜索查询都查找大索引是不合乎需要的。本发明的某些实施例可以帮助该判定。具体地,可以创建关键词/相关搜索查询表,其将关键词和相关搜索查询映射到网页并标识网页是位于小索引中还是位于大索引中。当搜索引擎接收到搜索查询时,可在该表中查找该查询以确定是否有足够数量的结果位于小索引中或者搜索引擎是否需要返回来自大索引的结果。
相关搜索查询和所提取的关键词也可用于通过提高搜索结果与用户搜索查询的相关性来细化搜索引擎。在针对用户查询搜索来对网页进行排序时,但是搜索引擎传统上尝试将查询项与出现在诸如锚文本、标题、正文和URL串等网页的若干部分中的单词进行匹配。手动或使用机器学习技术来调节用于匹配不同部分的不同权重。在本发明的实施例中,这些技术可以通过允许搜索引擎向来自用户搜索查询和所提取的关键词的项与相关搜索查询之间的匹配分配比项与其他单词的匹配更高的权重来改进。例如,可使用相关搜索查询和所提取的关键词来应用反馈回路和其他机制以使得自学习网络调整其权重和其他处理,以便为最终用户生成更准确且质量更高的搜索结果。
在某些实施里中,还可使用历史逆向搜索信息来改进网页排序。在搜索引擎为用户执行逆向搜索时,该搜索引擎可以追踪关于用户与作为搜索结果提供的对网页的相关搜索查询的交互(例如,点进)的信息。用户高频率地选择对网页的特定相关搜索查询可以被视为该网页应该被认为是与所选相关搜索查询高度相关的经验证据。因此,可以给予对于匹配如历史逆向搜索信息所证明地具有高频率的用户选择的相关搜索查询的搜索查询的网页较高的加权。
因此,如在图11的示例性方法1100所示,当对用户搜索查询执行web搜索时,可在用于向最终用户提供更相关的搜索结果的排序过程中使用对网页的相关搜索查询和所提取的关键词。如图11的框1102所示,从网页中提取关键词并确定对网页的相关搜索查询,如上文中所描述的。如框1104所示,使用所提取的关键词和相关搜索查询来细化搜索引擎。例如,所提取的关键词、相关搜索查询和历史逆向搜索信息可由搜速引擎索引和/或用于调整加权或其他过程或算法。如框1106所示,搜索引擎从最终用户接收搜索查询。由此,当在框1108处针对搜索查询标识搜索结果并对其进行排序时,该标识和排序至少部分地基于所提取的关键词和相关搜索查询信息。然后传送经排序的搜索结果以便呈现给最终用户,如框1110所示。
本发明的还有的实施例涉及将对网页的相关搜索查询扩展到特定商业应用。当前,允许网页所有者将上下文广告放置在他们的网页上的各种上下文广告程序是可用的。然而,用户通常将这些上下文广告视为分散注意力的。根据本发明的各实施例,作为对在网页上呈现上下文广告的替换(或补充),在网页上呈现对该网页的相关搜索查询。当访问网页的用户选择相关搜索查询时,向用户提供搜索结果用户界面,其包括对于所选相关搜索查询的搜索结果和与搜索结果相关联的上下文广告。在某些实施例中,从这种上下文广告中产生的收入可以与网页所有者分享。这种方法不仅增加了搜索引擎的流量,而且还帮助网页所有者向访问者提供丰富的体验并且为搜索引擎和网页所有者双方产生收入。
转向图12,提供了示出根据本发明的一实施例的用于在网页上提供相关搜索查询并使用相关搜索查询来产生广告收入的示例性方法1200的流程图。最初,如框1202所示,标识目标网页。在框1204,确定对目标网页的相关搜索查询(例如,使用上述用于确定相关搜索查询的方法)。在目标网页上包括相关搜索查询,如框1206所示。当用户访问目标网页时,结合该网页的内容来呈现相关搜索查询,如框1208所示。相关搜索查询以允许用户选择相关搜索查询的超链接的形式呈现。用户可认出相关搜索查询并希望选择相关搜索查询中的一个以找出相关网页。因此,如框1210所示,接收用户对相关搜索查询的选择。基于该用户选择,呈现与所选相关搜索查询相关联的搜索结果,如框1212所示。通常,在搜索结果用户界面中提供搜索结果。基于搜索结果的多个上下文广告结合搜索结果来呈现。
当经由与搜索结果一起呈现的广告来产生广告收入时,可将一部分广告收入与网页所有者分享,如框1214所示。如本领域内已知的,广告收入可以基于可由搜索引擎和/或广告客户采用的各种补偿模型来产生。例如,广告客户可以按照按投放付费、按点击付费、按动作付费、按购买付费或其他补偿模型来提供补偿。为了方便搜索引擎跟踪广告收入并将其归因于网页所有者,目标网页上所包括的相关搜索查询的超链接可以包括与网页所有者相关联的标识符。在某些实施例中,广告收入可以按基于会话的方式归因于网页所有者。例如,通常当用户从目标网页中选择特定相关搜索查询时,呈现具有搜索结果以及用于接收后续搜索的输入框的搜索结果用户界面。由此,用户可以发出新的搜索查询并造成在后续搜索结果页面处产生广告收入。因此,在某些实施例中,可将由用户在该会话期间产生的所有广告收入的一部分分配给网页所有者。
作为对广告分享实施例的说明,图13提供了示出与在上文中参考图5和6描述的上述示例中使用的URL“www.michaeljordanfanpage.com”相关联的假想网页1300的一部分的屏幕显示。如图13所示,网页1300包括标题1302、内容1304和相关查询区域1306。相关查询区域1306提供对网页1300的相关搜索查询的列表。当用户选择相关查询区域1306中的相关搜索查询中的一个时,检索对于所选相关搜索查询的搜索结果并将其呈现给用户。在某些实施例中,可以在网页1300上(例如,在相关查询区域1306中)呈现搜索结果。在其他实施例中,向用户呈现搜索结果用户界面,诸如图14所示的搜索结果用户界面1400。如图14所示,用户界面1400包括搜索结果区域1402,其列出对于所选相关搜索查询的搜索结果(未示出)。另外,用户界面1400包括广告区域1404,其呈现基于所选相关搜索查询和/或搜索结果来选择的各种上下文广告(未示出)。如上所示,当经由广告产生广告收入时,广告收入的一部分可由搜索引擎来与网页所有者分享。
如可以理解的,本发明的实施例提供了逆向搜索,其中搜索引擎消费网页标识符并且提供对目标网页的相关搜索查询。本发明其他实施例提供了通过使用所提取的关键词和相关搜索查询来标识要索引的网页并方便针对搜索查询来对网页进行排序的对搜索引擎的细化。还有一些实施例涉及通过将相关搜索查询放置在网页上来产生和分享广告收入。
参考各具体实施例描述了本发明,各具体实施例在所有方面都旨在是说明性的而非限制性的。在不背离本发明范围的情况下各替换实施例对本发明所属领域的普通技术人员将变得显而易见。
从前述内容可知,本发明很好地适用于实现前述的所有目的和目标,并且具有对于该系统和方式是显而易见且固有的其它优点。也可理解特定的特征和子组合是有用的,并且可以加以利用而无需参考其它特征和子组合。这由权利要求书所构想并在其范围之内。