CN101641697A - 对网页的相关搜索查询及其应用 - Google Patents

对网页的相关搜索查询及其应用 Download PDF

Info

Publication number
CN101641697A
CN101641697A CN200880009383A CN200880009383A CN101641697A CN 101641697 A CN101641697 A CN 101641697A CN 200880009383 A CN200880009383 A CN 200880009383A CN 200880009383 A CN200880009383 A CN 200880009383A CN 101641697 A CN101641697 A CN 101641697A
Authority
CN
China
Prior art keywords
webpage
search
search queries
related search
queries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880009383A
Other languages
English (en)
Other versions
CN101641697B (zh
Inventor
K·C·盖德
S·R·奥勒蒂
N·E·克拉斯韦尔
A·帕拉卡什
H·E·威廉姆斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101641697A publication Critical patent/CN101641697A/zh
Application granted granted Critical
Publication of CN101641697B publication Critical patent/CN101641697B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Abstract

此处提供了基本搜索形式的逆。搜索引擎从最终用户接收作为搜索输入的网页标识符,确定对相关联的网页的相关搜索查询并将该相关搜索查询提供给发出该搜索的最终用户,而非接收搜索查询并提供网页结果。对网页的相关搜索查询还可用于通过方便确定要索引的网页并且对作为对于用户查询的搜索结果的网页进行排序来细化执行基本搜索形式的搜索引擎。此外,相关搜索查询可用于广告收入产生和分享。

Description

对网页的相关搜索查询及其应用
背景
因特网上的可用信息和内容的量继续呈指数级增长。给定大量信息,已开发了搜索引擎以便于web搜索。具体地,用户可以通过输入包括用户可能感兴趣的一个或多个项的搜索查询来搜索信息和文档。在从用户处接收到搜索查询之后,搜索引擎基于这些项来标识相关文档和/或网页。由于其效用,web搜索,即找出针对用户发出的搜索查询的相关网页和文档的过程已可论证地成为当今因特网上最受欢迎的服务。然而,进行web搜索,即提供针对用户发出的查询的网页和文档结果的基本形式由于web搜索的来源而保持不变。
简要概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
各实施例涉及基本搜索形式的逆。搜索引擎从最终用户接收作为搜索输入的网页标识符并且确定对相关联的网页的相关搜索查询,而非接收搜索查询并提供网页结果。对特定网页的相关搜索查询可以按根据各实施例的多种不同的方式来确定。可以向发出搜索的最终用户提供相关搜索查询。
在其他实施例中,可使用逆向搜索形式来细化和提高提供基本搜索形式的搜索引擎的核心相关性。一方面,对网页的相关搜索查询可用于为搜索引擎确定要索引哪些网页。另一方面,相关搜索查询可用于对作为对于查询的搜索结果的网页进行排序,由此提高了搜索的相关性。
在还有的实施例中,可将对网页的相关搜索查询扩展到特定商业应用。例如,可以将对网页的相关搜索查询放置在网页上。当用户从网页中选择相关搜索查询时,对于所选相关搜索查询的搜索结果可以与广告一起呈现。在某些实施例中,由这些广告产生的任何广告收入可由搜索引擎来与网页所有者分享。
附图的若干视图的简要描述
以下参考附图详细描述本发明,附图中:
图1是适用于实现本发明的示例性计算环境的框图;
图2是其中可采用本发明的各实施例的示例性系统的框图;
图3是根据本发明的一实施例的示例性搜索引擎的框图;
图4是示出根据本发明的一实施例的用于确定对网页的相关搜索查询的示例性方法的流程图;
图5是示出根据本发明的一实施例的用于搜索引擎的搜索输入框的说明性屏幕显示;
图6是示出根据本发明的一实施例的包括对网页的相关搜索查询的搜索结果用户界面的说明性屏幕显示;
图7是示出根据本发明的一实施例的用于基于所提取的关键词来确定对网页的相关搜索查询的示例性方法的流程图;
图8是示出根据本发明的一实施例的用于使用历史搜索信息来确定对网页的相关搜索查询的示例性方法的流程图;
图9是示出根据本发明的一实施例的用于使用索引的数据来确定对网页的相关搜索查询的示例性方法的流程图;
图10是示出根据本发明的一实施例的用于使用相关搜索查询来确定是否索引网页的示例性方法的流程图;
图11是示出根据本发明的一实施例的用于通过采用所提取的关键词和相关搜索查询来细化搜索引擎和提供相关搜索结果的示例性方法的流程图;
图12是示出根据本发明的一实施例的用于在网页上提供相关搜索查询并使用这些相关搜索查询来产程广告收入的示例性方法的流程图;
图13是示出根据本发明的一实施例的包括对网页的相关搜索查询的网页的说明性屏幕显示;
图14是示出根据本发明的一实施例的响应于用户从包括上下文广告的网页中选择相关搜索查询而呈现的搜索结果用户界面的说明性屏幕显示。
详细描述
此处用细节来描述本发明的主题以满足法定要求。然而,描述本身并非旨在限制本专利的范围。相反,发明人设想所要求保护的主题还可结合其它当前或未来技术按照其它方式来具体化,以包括不同的步骤或类似于本文中所描述的步骤的步骤组合。此外,尽管术语“步骤”和/或“框”可在此处用于指示所采用的方法的不同元素,但除非而且仅当明确描述了各个步骤的顺序时,该术语不应被解释为意味着此处公开的各个步骤之中或之间的任何特定顺序。
如先前所指示的,执行对网页的搜索的基本形式由于其来源而在本质上保持不变。具体地,搜索引擎从用户处接收作为搜索输入的包括一个或多个搜索项的搜索查询并提供指示与该搜索查询相关的多个网页的搜索结果。本发明的实施例提供了该基本搜索形式的逆,并且由此在此被称为“逆向搜索”。搜索引擎从用户处接收作为搜索输入的网页标识符(例如,URL)并提供对该网页的相关搜索查询,而非接收搜索查询并提供网页结果。虽然并非必需,但是如果搜索使用相关搜索查询来执行,则相关搜索查询理论上会指示作为搜索结果的网页(例如,假设该网页由搜索引擎来索引)。
在本发明的其他实施例中,可使用逆向搜索形式来细化和提高提供基本搜索形式的搜索引擎的核心相关性。在一个实施例中,可使用对网页的相关搜索查询来为搜索引擎确定要索引哪些网页。在另一实施例中,可使用相关搜索查询来对作为对于查询的搜索结果的网页进行排序,由此提高了搜索相关性。
在本发明的还有的实施例中,对网页的相关搜索查询可以被扩展到特定商业应用。例如,可以将对网页的相关搜索查询放置在网页上。当用户从网页中选择相关搜索查询时,对于所选相关搜索查询的搜索结果与广告一起呈现。在某些实施例中,由这种广告产生的任何广告收入可由搜索引擎来与网页所有者分享。这种方法不仅增加了搜索引擎的通信量,而且还帮助网页所有者向访问者提供丰富的体验并且为搜索引擎和网页所有者双方产生收入。
因此,一方面,本发明的实施例涉及用于提供对网页的一个或多个相关搜索查询的计算机实现的方法。该方法包括经由被配置成接收对搜索引擎的输入的输入框来从最终用户接收作为搜索输入的网页标识符。该方法也包括确定对网页的一个或多个相关搜索查询。该方法还包括传送相关搜索查询中的至少一部分以便呈现给最终用户。
在另一实施例中,本发明的一方面涉及用于确定是否在搜索引擎索引中索引网页的计算机实现的方法。该方法包括识别对网页的一个或多个相关搜索查询。方该法还包括基于相关搜索查询来确定是否在搜索引擎索引中索引网页。该方法还包括如果确定应该索引该网页,则在该搜索引擎索引中索引网页。
本发明的又一实施例涉及用于对作为对于搜索查询的搜索结果的多个网页进行排序的计算机实现的方法。该方法包括确定对网页的至少一部分的一个或多个相关搜索查询。该方法还包括至少部分地基于相关搜索查询来对网页进行排序。
在简要描述了本发明的概览之后,以下描述其中可实现本发明的各方面的示例性操作环境,以便为本发明各方面提供通用上下文。最初具体参考图1,示出用于实现本发明的实施例的示例性操作环境,并将其大致指定为计算设备100。计算设备100只是合适的计算环境的一个示例,并且不旨在对本发明的使用范围或功能提出任何限制。也不应该将计算设备100解释为对所示出的任一组件或其组合有任何依赖性或要求。
本发明可以在计算机代码或机器可使用指令的一般上下文中描述,机器可使用指令包括由计算机或诸如个人数据助理或其它手持式设备等其它机器执行的诸如程序模块等的计算机可执行指令。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施,这些系统配置包括手持式设备、消费电子产品、通用计算机、更专用计算设备等等。本发明也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实施。
参考图1,计算设备100包括直接或间接耦合以下设备的总线110:存储器112、一个或多个处理器114、一个或多个呈现组件116、输入/输出端口118、输入/输出组件120、和说明性电源122。总线110可以是一条或多条总线(诸如地址总线、数据总线、或其组合)。尽管为了清楚起见用线条示出了图1的各框,但是在实际上,各组件的轮廓并不是那样清楚,并且按比喻的说法,线条更精确地将是灰色的和模糊的。例如,可以将诸如显示设备等呈现组件认为是I/O组件。同样,处理器具有存储器。可以认识到,这是本领域的特性,并且重申,图1的图示只是例示可结合本发明的一个或多个实施例来使用的示例性计算设备。在诸如“工作站”、“服务器”、“膝上型计算机”、“手持式设备”等分类之间没有区别,它们全部都被认为是在图1的范围之内的并且被称为“计算设备”。
计算设备100通常包括各种计算机可读介质。作为示例而非限制,计算机可读介质可以包括随机存取存储器(RAM);只读存储器(ROM);电可擦除可编程只读存储器(EEPROM);闪存或其它存储器技术;CDROM、数字多功能盘(DVD)或其它光或全息介质;磁带盒、磁带、磁盘存储或其它磁存储设备;载波或可用于对所需信息进行编码并且可由计算设备100访问的任何其它介质。
存储器112包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移动的、不可移动的、或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从诸如存储器112或I/O组件120等各种实体读取数据的一个或多个处理器。呈现组件116向用户或其它设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等等。
I/O端口118允许计算设备100逻辑上耦合至包括I/O组件120的其它设备,其中某些设备可以是内置的。说明性组件包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、无线设备等等。
现在转向图2,提供了示出其中可采用本发明的各实施例的示例性系统200的框图。应该理解,此处所描述的该排列和其它排列仅是作为示例来阐述的。可以使用其它排列和元素(例如,机器、接口、功能、顺序和功能组等)作为对此处所示的排列和元素的补充或替换,并且某些元件可以被一起省略。此外,此处所描述的许多元素都是功能实体,这些功能实体可被实现为离散的和分布式组件,或者结合其它组件并且用任何合适的组合并在任何合适的位置实现。此处所描述的各种功能在由一个和多个实体执行时可以由硬件、固件和/和软件来实现。例如,各种功能可以由执行存储在存储器中的指令的处理器来执行。
除了未示出的组件之外,系统200可以包括搜索引擎202、源设备204和用户设备206。搜索引擎202、源设备204和用户设备206中的每一个都可以是任一种类型的计算设备,诸如例如,参考图1描述的计算设备100。各组件可以经由网络208彼此通信,网络208可以包括但不限于,一个和多个局域网(LAN)和/或广域网(WAN)。这些联网环境常见于办公室、企业范围计算机网络、内联网以及因特网。应该理解,在本发明的范围内可以在系统200内采用任何数量的内容共享服务器、广告服务器、用户设备和网络。另外,未示出的其它组件也可以被包括在系统200内。
诸如源设备204等源设备可以维护各种网页。例如,源设备204可以是维护多个网页的web服务器。搜索引擎202可以通过与这些源设备通信来访问网页信息。例如,搜索引擎202可以周期性地爬寻源设备204以访问网页信息和/或索引信息。
通过访问和/或来自各个源设备的网页信息,搜索引擎202可以向诸如用户设备206等用户设备提供搜索能力。具体地,用户可采用web浏览器210或用户设备206上的其它机制来与搜索引擎202通信。例如,用户可以向搜索引擎202发出搜索查询并接收搜索结果。如先前所示,在传统搜索形式中,搜索查询可以包括一个或多个搜索项,而搜索引擎202尝试提供与这些搜索项相关的网页搜索结果。在本发明的各实施例中,搜索引擎202被配置成提供逆向搜索能力。具体地,用户可以发出包括诸如URL等网页标识符的对特定网页搜索查询,并且搜索引擎202返回包括与该网页相关联的一个或多个相关搜索查询的搜索结果。相关搜索查询可以经由用户设备206以超链接的形式呈现给用户,从而允许用户与相关搜索查询交互。由此,用户可以选择相关搜索查询以使得搜索引擎202使用相关搜索查询来执行搜索并将网页结果提供给用户设备206。
现在参考图3,将更详细地描述根据本发明一实施例的示例性搜索引擎300。除了未示出的组件之外,搜索引擎300可以包括用户界面组件302、相关搜索查询组件304以及数据存储306。每一个组件都可以包括程序、例程、应用程序或能够执行此处所讨论的动作的其它机器可执行代码。本领域的技术人员将会认识到,图3所示的组件仅仅是出于说明的目而提供的,可以根据本发明的各个实施例来提供其它安排。
一般地,搜索引擎300可以经由用户界面组件302来从诸如图2的用户设备206等用户设备接收包括网页标识符的搜索查询。用户界面组件302可以进行通信以便从用户设备接收网页标识符,并且将该网页标识符传递给相关搜索查询组件304以便确定对与该网页标识符相关联的网页的相关搜索查询。用户界面组件302可以进行通信以便从相关搜索查询组件304接收包括相关搜索查询的搜索结果并将该搜索结果返回给用户设备。
相关搜索查询组件304被配置成确定对与由用户提供给搜索引擎300的网页标识符对应的网页的相关搜索查询。相关搜索查询组件304可以例如通过爬寻目标网页或参考诸如数据存储306中的索引或高速缓存、存储关于目标网页的信息来收集关于目标网页的信息。如下文中更详细描述的,通过使用与目标网页相关联的信息,相关搜索查询组件304可以按本发明的范围内的多种不同的方式来确定相关搜索查询。作为示例而非限制,相关搜索查询可以通过从目标网页的内容中提取关键词并基于所提取的关键词来确定相关搜索查询来确定。在其它实施例中,可使用诸如例如在查询日志中找到的历史搜索信息来确定对目标网页的相关搜索查询。在其他实施例中,在确定对目标网页的相关搜索查询后,搜索引擎300可以索引相关搜索查询信息或将其高速缓存在数据存储306中。因此,当用户请求对该特定网页的后续逆向搜索时,可以通过参考存储在数据存储306中的、将例如目标网页的网页标识符映射到相关搜索查询的信息来确定相关搜索查询。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
现在转向图4,提供了示出根据本发明的一实施例的用于执行逆向搜索的示例性总体方法的流程图。最初,如框402所示,在搜索引擎处接收诸如URL等网页标识符。如本领域的技术人员将会认识到的,可以在搜索引擎处以多种不同的方式接收网页标识符。作为示例而非限制,用户可以采用web浏览器导航到搜索引擎网页并将网页标识符输入到该网页上的输入框中。另外,用户可以在由位于例如web浏览器、用户的计算设备的桌面或其它位置中的搜索引擎工具栏提供的输入框中输入网页标识符。本领域的技术人员将会认识到,也可以采用用于允许最终用户将网页标识符作为对搜索引擎的搜索输入来提供的各种其他方法。
在接收到网页标识符后,搜索引擎确定对与该标识符相关联的网页的相关搜索查询,如框404所示。如上所示,对网页的相关搜索查询可以按本发明的范围内的多种不同的方式来确定。作为示例而非限制,相关搜索查询可以通过从网页的内容中提取关键词并基于所提取的关键词来确定相关搜索查询来确定。在其它实施例中,可使用诸如在查询日志中找到的历史搜索信息来确定对网页的相关搜索查询。在另外的实施例中,相关搜索查询可以通过参考将网页标识符映射到相关搜索查询的索引来确定。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
如框406所示,传送相关搜索查询的至少一部分以便呈现给最终用户。尽管并非必需,但是通常提供列出对网页的相关搜索查询作为搜索结果的搜索结果用户界面(类似于由搜索引擎以基本搜索形式提供的搜索结果用户界面)。相关搜索查询可以基于针对这些相关搜索查询确定的排名来在列表中排序。排名可以基于例如相关搜索查询与网页的相关性以及相关搜索查询的受欢迎程度(例如,基于历史搜索信息)。在某些实施例中,可仅传送排名最高的相关搜索查询以便呈现给用户,而在其它实施例中可以提供针对网页确定的所有相关搜索查询。
列表中所包括的每一个相关搜索结果都可包括允许用户选择相关搜索查询的超链接。因此,当用户选择相关搜索查询时,使用所选相关搜索查询来执行搜索并提供搜索结果。对于所选相关搜索查询的搜索结果可以在例如原始搜索结果用户界面中与相关搜索查询一起呈现(例如,邻近所选相关搜索查询)或可以经由单独的搜索结果用户界面来呈现。
在本发明的各实施例中,可以结合相关搜索查询来提供其它搜索相关信息和其他类型的搜索结果。例如,可以提供相关人员、相关地点、相关网页或与所搜索的网页相关的其它内容。在某些实施例中,可以使用一个或多个相关搜索查询来执行搜索,并且可以结合相关搜索查询来提供搜索结果。例如,可以为前五位的相关搜索查询提供前五位的搜索结果。任何及所有这样的变型都被构想为落在本发明的各实施例的范围内。
作为说明,图5示出了可以例如经由搜索引擎网页来提供的搜索输入框502。搜索输入框502允许用户出于搜索目的来键入输入。如本领域中已知且如图5所示,搜索引擎可以提供各种搜索能力,包括广泛的web搜索和各种垂直搜索。因此,结合搜索输入框502提供多个搜索选择504-514。搜索选择504-514包括广泛的web搜索504、多个垂直搜索(即,图像垂直搜索506、新闻垂直搜索508、地图垂直搜索510以及分类垂直搜索512)以及相关查询搜索514。通过在搜索输入框502中输入搜索查询并选择搜索选择504-514中的一个,用户可以使得搜索引擎使用所输入的搜索查询来执行所选类型的搜索。
在所示示例中,用户已在搜索输入框502中输入URL“www.michaeljordanfanclub.com”。在输入该URL后,用户可以选择相关查询搜索514以使得搜索引擎执行逆向搜索并提供对与所输入的URL相关联的网页的相关搜索查询搜索。或者,可以采用用于向搜索引擎指示用户希望执行逆向搜索的其它方法。例如,用户可以在搜索输入框502中输入“Related:”,之后是URL以便向搜索引擎指示用户希望执行逆向搜索。在某些实施例中,搜索引擎可以例如仅基于搜索输入框502中的URL输入来推断用户希望执行逆向搜索,而非要求用户明确地指示想要执行逆向搜索。
通过使用在搜索输入框502中输入的URL,搜索引擎执行逆向搜索并提供图中所示的搜索结果用户界面600。搜索结果用户界面600包括对与“www.michaeljordanfanclub.com”相关联的网页的相关搜索查询602的列表。如上所示,相关搜索查询可以用超链接形式来呈现,该超链接允许用户例如通过选择相关搜索查询并使得针对所选相关搜索查询来执行网络搜索来与搜索结果交互。
图7-9提供了根据本发明的各个实施例的用于确定对网页的相关搜索查询的多种方法。应该理解,参考图7-9讨论的方法仅是出于说明的目的而提供的,而不应该被视为限制性的。因此,本领域的技术人员将会认识到,可组合所描述的方法并且可在本发明的范围内采用用于确定对网页的相关搜索查询的其它方法。
最初参考图7,提供了示出根据本发明的一实施例的用于通过从网页的内容中提取关键词来确定对网页的相关搜索查询的示例性方法700的流程图。最初,如框702所示,接收作为搜索输入的对应于网页的网页标识符。基于该网页标识符,爬寻网页内容,如框704所示。
如框706所示,词从网页的内容中提取关键词。本领域的技术人员将会认识到,在本发明的范围内可以采用各种关键词提取方法。信息提取是信息检索研究中的流行话题。例如,在web搜索的上下文中,可以从关于网页的多个信息片段中提取关键词,这些信息片段包括:指向当前网页的网页锚文本;网页标题;以及网页的正文(包括传出锚文本、突出显示的单词等)。通过使用这些各种信息片段,可以构建用于预测网页的哪些单词是关键词的机器学习模型。作为示例而非限制,简单的关键词提取方法可以包括将网页的内容中的单词标准化成其相应的词根的词干提取(stemming)功能。此外,可以提供用于标识和过滤出无用词(即对网页内容不重要的词)的无用词过滤。此外,可以提供用于移除出现频率比特定预定义阀值小的单词的低使用率单词移除。此外,可使用项频率/逆文档频率(TF/IDF)技术来计算网页内容中所包括的单词和/或短语的TF/IDF值。随后可使用该值来相对于彼此地为单词/短语打分,从而使得具有最高分的单词/短语可以被标识为关键词和/或在选择关于关键词的相关搜索查询时被给予更大的权重。
如框708所示,基于所提取的关键词来确定相关搜索查询。基于所提取的关键词来确定相关搜索查询可以按本发明的范围内的各种不同的方式来执行。作为示例而非限制,相关搜索查询可以通过将所提取的关键词与历史搜索信息(例如,查询日志中的可用信息)进行比较来确定。例如,历史搜索信息可以包括关于由搜索引擎执行的过去搜索(即,使用基本搜索形式)的信息,包括由用户提交的搜索查询。通过分析这一信息,可以标识单词序列的模式。因此,给定从网页内容中提取的关键词,可以标识高精度地匹配所提取的关键词的多个模式。这些模式可以作为相关搜索查询来提供。
在确定对网页的相关搜索查询后,传送这些相关搜索查询的至少一部分以便呈现给最终用户,如框710所示。
接着转向图8,提供了示出根据本发明的一实施例的用于使用历史搜索信息来确定对网页的相关搜索查询的示例性方法800的流程图。最初,如框802所示,例如经由搜索输入框来从最终用户接收对应于网页的网页标识符。
在框804,访问包括历史搜索信息的数据存储。数据存储可以是例如,由服务器(例如,搜索引擎服务器)存储的查询日志或搜索引擎高速缓存,或存储在最终用户的计算设备上的web浏览器高速缓存。历史搜索信息可以包括关于由搜索引擎执行的过去搜索(即,基本搜索形式)的信息,包括例如,搜索引擎接收到的过去的搜索查询、对于搜索查询的搜索结果以及用户与搜索结果的交互(例如,点进或其它选项选择)。
如框806所示,使用历史搜索信息来确定对网页的相关搜索查询。在某些实施例中,可以通过标识其搜索结果包括网页的过去的搜索查询来从历史查询信息中确定对网页的相关搜索查询。在其他实施例中,通过标识不仅包括作为搜索结果的网页而且用户从对于其的搜索结果中选择该网页的过去的搜索查询来确定对网页的相关搜索查询。因为可根据经验来将用户最频繁选择访问的结果假设为作为该信息的消费者的用户将其判断为与他们的查询最相关的结果,所以后一种方法可以提供对网页的更好的相关搜索查询。
在确定对网页的相关搜索查询之后,传送相关搜索查询的至少一部分以便呈现给最终用户,如框810所示。
在某些实施例中,可以针对各个网页索引或高速缓存相关搜索查询。例如,为了方便基本搜索形式(即,提供对于搜索查询的网页搜索结果),搜索引擎将爬寻网页并索引关于该网页的信息。类似地,搜索引擎可以爬寻网页和/或分析历史搜索信息以便标识对网页的相关搜索查询并索引信息以便于逆向搜索。另外地或另选地,在某些实施例中,搜索引擎可以被配置成在为最终用户执行逆向搜索后高速缓存对网页的相关搜索查询。在任一种情况下,将网页映射到相关搜索查询的索引会可用于方便逆向搜索。例如,参考图9,提供了示出根据本发明的一实施例的用于通过采用索引来提供对网页的相关搜索查询的示例性方法900的流程图。如框902所示,接收网页的网页标识符。在框904,访问将网页映射到相关搜索查询的索引。在访问该索引后,确定是否已经为网页索引相关搜索查询,如框906所示。如果已经从网页索引相关搜索查询,则在框908处从索引中标识相关搜索查询。另外,传送相关搜索查询以便呈现给最终用户,如框910所示。
如果在框906确定没有为网页索引相关搜索查询,则在框912处确定对网页的相关搜索查询。相关搜索查询可以例如通过采用上述方法中的一种来确定。然后索引对网页的相关搜索查询,如框914所示。因此,相关搜索查询可容易地在索引中用于后续搜索。在框910,还传送相关搜索查询以便呈现给最终用户。
在本发明的其他实施例中,可使用相关搜索查询和所提取的关键词来改进搜索引擎的基本搜索形式。具体地,相关搜索查询和所提取的关键词可用于改进确定要索引哪些网页的选择过程并可用于改进对搜索的网页的排序。
关于用于索引的网页选择,选择的关键目标在于确定要索引哪些网页以及要避免哪些网页。因为实际考虑事项指示搜索引擎可能受到其最大索引数量的限制且爬寻网络上所产生的每一个网页是不切实际的,所以搜索引擎通常必须聪明地地选择要索引哪些网页。当前,在确定是否索引网页时使用多个特征,诸如例如,网页的内链接、网页接收的点击以及锚文本的质量。本发明的实施例提供了用于确定是否索引网页的其他度量。具体地,网页是否应由搜索引擎来索引还可以至少部分地基于对该网页的相关搜索查询来确定。
参考图10,提供了示出根据本发明的一实施例的用于确定是否索引网页的示例性方法1000的流程图。最初,如框1002所示,例如在搜索引擎蜘蛛应用程序爬寻web时标识网页。在框1004,例如使用上述用于确定对网页的相关搜索查询的方法中的一种来确定对所标识的网页的相关搜索查询。
如框1006所示,至少部分地基于对网页的相关搜索查询来确定是否索引网页。在某些实施例中,索引确定可以基于对网页的相关搜索查询的总量。例如,因为网页应答大量搜索查询可以指示该网页是许多用户想要查看的网页。在其他实施例中,索引确定可以基于相关搜索查询的受欢迎程度。搜索查询的受欢迎程序可以例如通过参考历史查询信息并确定搜索查询相对于其他搜索查询的使用频率来确定。具有较高使用频率的搜索查询可以被视作是更受欢迎的,从而使得应该索引应答这些受欢迎的查询的网页。应该理解,在索引选择过程中也可以考虑其他性质的相关搜索查询和关键词。例如,可以考虑相关搜索查询和关键词的货币化或“垃圾(spammy)”程度(例如,相关搜索查询和关键词可导致付费较高的上下文广告的程度)。
如果在框1006处基于对网页的相关搜索查询来确定应索引网页,则索引网页,如框1008所示。或者,如果在框1006处确定不应索引网页,则搜索引擎可以丢弃与网页相关联的数据,如框1010所示。
在构建其索引时,搜索引擎将其索引分成可被称为“小”或“大”的索引。小索引被完全加载到存储器中,而大索引被保存在硬盘上。通常对于搜索引擎采用该方法,因为虽然存储器较快,但相比于硬盘也较昂贵。因此,通常将较受欢迎的网页包括在存储器内的小索引中以便允许较快的搜索结果。然而,因为存储器是昂贵的,所以将所有经索引的信息都包括在存储器中是不可行的。
采用大和小索引的搜索引擎所面临的一个问题是确定在小索引中索引哪些网页以及在大索引中索引哪些网页。本发明的某些实施例可以方便该判定。具体地,可以在确定是否在小索引或大索引中索引网页时应用在使用相关搜索查询和所提取的关键词来确定是否索引网页时应用的相同的考虑事项。
采用小和大索引的搜索引擎所面临的另一个问题是决定对于给定搜索查找哪一个索引的问题,因为在硬盘比存储器慢得多的情况下对于每一个搜索查询都查找大索引是不合乎需要的。本发明的某些实施例可以帮助该判定。具体地,可以创建关键词/相关搜索查询表,其将关键词和相关搜索查询映射到网页并标识网页是位于小索引中还是位于大索引中。当搜索引擎接收到搜索查询时,可在该表中查找该查询以确定是否有足够数量的结果位于小索引中或者搜索引擎是否需要返回来自大索引的结果。
相关搜索查询和所提取的关键词也可用于通过提高搜索结果与用户搜索查询的相关性来细化搜索引擎。在针对用户查询搜索来对网页进行排序时,但是搜索引擎传统上尝试将查询项与出现在诸如锚文本、标题、正文和URL串等网页的若干部分中的单词进行匹配。手动或使用机器学习技术来调节用于匹配不同部分的不同权重。在本发明的实施例中,这些技术可以通过允许搜索引擎向来自用户搜索查询和所提取的关键词的项与相关搜索查询之间的匹配分配比项与其他单词的匹配更高的权重来改进。例如,可使用相关搜索查询和所提取的关键词来应用反馈回路和其他机制以使得自学习网络调整其权重和其他处理,以便为最终用户生成更准确且质量更高的搜索结果。
在某些实施里中,还可使用历史逆向搜索信息来改进网页排序。在搜索引擎为用户执行逆向搜索时,该搜索引擎可以追踪关于用户与作为搜索结果提供的对网页的相关搜索查询的交互(例如,点进)的信息。用户高频率地选择对网页的特定相关搜索查询可以被视为该网页应该被认为是与所选相关搜索查询高度相关的经验证据。因此,可以给予对于匹配如历史逆向搜索信息所证明地具有高频率的用户选择的相关搜索查询的搜索查询的网页较高的加权。
因此,如在图11的示例性方法1100所示,当对用户搜索查询执行web搜索时,可在用于向最终用户提供更相关的搜索结果的排序过程中使用对网页的相关搜索查询和所提取的关键词。如图11的框1102所示,从网页中提取关键词并确定对网页的相关搜索查询,如上文中所描述的。如框1104所示,使用所提取的关键词和相关搜索查询来细化搜索引擎。例如,所提取的关键词、相关搜索查询和历史逆向搜索信息可由搜速引擎索引和/或用于调整加权或其他过程或算法。如框1106所示,搜索引擎从最终用户接收搜索查询。由此,当在框1108处针对搜索查询标识搜索结果并对其进行排序时,该标识和排序至少部分地基于所提取的关键词和相关搜索查询信息。然后传送经排序的搜索结果以便呈现给最终用户,如框1110所示。
本发明的还有的实施例涉及将对网页的相关搜索查询扩展到特定商业应用。当前,允许网页所有者将上下文广告放置在他们的网页上的各种上下文广告程序是可用的。然而,用户通常将这些上下文广告视为分散注意力的。根据本发明的各实施例,作为对在网页上呈现上下文广告的替换(或补充),在网页上呈现对该网页的相关搜索查询。当访问网页的用户选择相关搜索查询时,向用户提供搜索结果用户界面,其包括对于所选相关搜索查询的搜索结果和与搜索结果相关联的上下文广告。在某些实施例中,从这种上下文广告中产生的收入可以与网页所有者分享。这种方法不仅增加了搜索引擎的流量,而且还帮助网页所有者向访问者提供丰富的体验并且为搜索引擎和网页所有者双方产生收入。
转向图12,提供了示出根据本发明的一实施例的用于在网页上提供相关搜索查询并使用相关搜索查询来产生广告收入的示例性方法1200的流程图。最初,如框1202所示,标识目标网页。在框1204,确定对目标网页的相关搜索查询(例如,使用上述用于确定相关搜索查询的方法)。在目标网页上包括相关搜索查询,如框1206所示。当用户访问目标网页时,结合该网页的内容来呈现相关搜索查询,如框1208所示。相关搜索查询以允许用户选择相关搜索查询的超链接的形式呈现。用户可认出相关搜索查询并希望选择相关搜索查询中的一个以找出相关网页。因此,如框1210所示,接收用户对相关搜索查询的选择。基于该用户选择,呈现与所选相关搜索查询相关联的搜索结果,如框1212所示。通常,在搜索结果用户界面中提供搜索结果。基于搜索结果的多个上下文广告结合搜索结果来呈现。
当经由与搜索结果一起呈现的广告来产生广告收入时,可将一部分广告收入与网页所有者分享,如框1214所示。如本领域内已知的,广告收入可以基于可由搜索引擎和/或广告客户采用的各种补偿模型来产生。例如,广告客户可以按照按投放付费、按点击付费、按动作付费、按购买付费或其他补偿模型来提供补偿。为了方便搜索引擎跟踪广告收入并将其归因于网页所有者,目标网页上所包括的相关搜索查询的超链接可以包括与网页所有者相关联的标识符。在某些实施例中,广告收入可以按基于会话的方式归因于网页所有者。例如,通常当用户从目标网页中选择特定相关搜索查询时,呈现具有搜索结果以及用于接收后续搜索的输入框的搜索结果用户界面。由此,用户可以发出新的搜索查询并造成在后续搜索结果页面处产生广告收入。因此,在某些实施例中,可将由用户在该会话期间产生的所有广告收入的一部分分配给网页所有者。
作为对广告分享实施例的说明,图13提供了示出与在上文中参考图5和6描述的上述示例中使用的URL“www.michaeljordanfanpage.com”相关联的假想网页1300的一部分的屏幕显示。如图13所示,网页1300包括标题1302、内容1304和相关查询区域1306。相关查询区域1306提供对网页1300的相关搜索查询的列表。当用户选择相关查询区域1306中的相关搜索查询中的一个时,检索对于所选相关搜索查询的搜索结果并将其呈现给用户。在某些实施例中,可以在网页1300上(例如,在相关查询区域1306中)呈现搜索结果。在其他实施例中,向用户呈现搜索结果用户界面,诸如图14所示的搜索结果用户界面1400。如图14所示,用户界面1400包括搜索结果区域1402,其列出对于所选相关搜索查询的搜索结果(未示出)。另外,用户界面1400包括广告区域1404,其呈现基于所选相关搜索查询和/或搜索结果来选择的各种上下文广告(未示出)。如上所示,当经由广告产生广告收入时,广告收入的一部分可由搜索引擎来与网页所有者分享。
如可以理解的,本发明的实施例提供了逆向搜索,其中搜索引擎消费网页标识符并且提供对目标网页的相关搜索查询。本发明其他实施例提供了通过使用所提取的关键词和相关搜索查询来标识要索引的网页并方便针对搜索查询来对网页进行排序的对搜索引擎的细化。还有一些实施例涉及通过将相关搜索查询放置在网页上来产生和分享广告收入。
参考各具体实施例描述了本发明,各具体实施例在所有方面都旨在是说明性的而非限制性的。在不背离本发明范围的情况下各替换实施例对本发明所属领域的普通技术人员将变得显而易见。
从前述内容可知,本发明很好地适用于实现前述的所有目的和目标,并且具有对于该系统和方式是显而易见且固有的其它优点。也可理解特定的特征和子组合是有用的,并且可以加以利用而无需参考其它特征和子组合。这由权利要求书所构想并在其范围之内。

Claims (20)

1.一种用于提供对网页的一个或多个相关搜索查询的计算机实现的方法,所述方法包括:
经由被配置成接收对搜索引擎的输入的输入框来从最终用户接收作为搜索输入的网页标识符(402);
确定对所述网页的一个或多个相关搜索查询(404);以及
传送所述一个或多个相关搜索查询的至少一部分以便呈现给所述最终用户(406)。
2.如权利要求1所述的计算机实现的方法,其特征在于,所述网页标识符包括统一资源定位符。
3.如权利要求1所述的计算机实现的方法,其特征在于,所述一个或多个相关搜索查询将在执行搜索的情况下指示所述网页作为搜索结果。
4.如权利要求1所述的计算机实现的方法,其特征在于,所述输入框被呈现在在搜索引擎网页和搜索引擎工具栏中的至少一个上。
5.如权利要求1所述的计算机实现的方法,其特征在于,确定对所述网页的一个或多个相关搜索查询包括:
爬寻所述网页的内容;
从所述网页的内容中提取一个或多个关键词;以及
基于所述一个或多个关键词来确定一个或多个相关搜索查询。
6.如权利要求5所述的计算机实现的方法,其特征在于,基于所述一个或多个关键词来确定一个或多个相关搜索查询包括将所述一个或多个关键词与在过去的搜索查询中使用的频繁出现的单词的模式进行比较。
7.如权利要求1所述的计算机实现的方法,其特征在于,确定对所述网页的一个或多个相关搜索查询包括标识先前已经在搜索中使用并导致用户从对于至少一个搜索查询的搜索结果的列表中选择与所述网页相关联的搜索结果的至少一个搜索查询。
8.如权利要求1所述的计算机实现的方法,其特征在于,确定对所述网页的一个或多个相关搜索查询包括访问将相关搜索查询映射到网页标识符的索引并在所述索引中标识映射到与所述网页相关联的网页标识符的一个或多个相关搜索查询。
9.如权利要求1所述的计算机实现的方法,其特征在于,传送所述一个或多个相关搜索查询的至少一部分包括传送包括所述一个或多个相关搜索查询的至少一部分的搜索结果用户界面。
10.如权利要求1所述的计算机实现的方法,其特征在于,所述方法还包括传送对于所述一个或多个相关搜索查询中的至少一个的一个或多个网页结果以便呈现给所述用户。
11.如权利要求1所述的计算机实现的方法,其特征在于,所述方法还包括对所述一个或多个相关搜索查询的至少一部分进行排序。
12.一种用于确定是否在搜索引擎索引中索引网页的计算机实现的方法,所述方法包括:
标识对所述网页的一个或多个相关搜索查询(1004);
基于所述一个或多个相关搜索查询来确定是否在所述搜索引擎索引中索引所述网页(1006);以及
如果确定应该索引所述网页,则在所述搜索引擎索引中索引所述网页(1008)。
13.如权利要求12所述的计算机实现的方法,其特征在于,确定对所述网页的一个或多个相关搜索查询包括:
从所述网页的内容中提取一个或多个关键词;以及
基于所述一个或多个关键词来确定一个或多个相关搜索查询。
14.如权利要求12所述的计算机实现的方法,其特征在于,确定是否索引所述网页还基于从所述网页的内容中提取的一个或多个关键词。
15.如权利要求12所述的计算机实现的方法,其特征在于,基于所述一个或多个相关搜索查询来确定是否在所述搜索引擎索引中索引所述网页包括基于对所述网页的相关搜索查询的总数和所述一个或多个相关搜索查询的受欢迎程度中的至少一个来确定是否索引所述网页。
16.如权利要求15所述的计算机实现的方法,其特征在于,所述相关搜索查询的受欢迎程度基于所述相关搜索查询在过去搜索中的使用频率。
17.一种用于对作为对于搜索查询的搜索结果的多个网页进行排序的计算机实现的方法,所述方法包括:
确定对所述多个网页的至少一部分的一个或多个相关搜索查询(1102);以及
至少部分基于所述一个或多个相关搜索查询来对所述多个网页进行排序(1108)。
18.如权利要求17所述的计算机实现的方法,其特征在于,确定对所述多个网页中至少一个的一个或多个相关搜索查询包括:
从所述至少一个网页的内容中提取一个或多个关键词;以及
基于所述一个或多个关键词来确定对所述至少一个网页的一个或多个相关搜索查询。
19.如权利要求17所述的计算机实现的方法,其特征在于,对所述网页进行排序还基于从每一个网页的内容中提取的一个或多个关键词。
20.如权利要求17所述的计算机实现的方法,其特征在于,至少部分地基于对每一个网页的相关搜索查询来对所述网页进行排序包括以下动作中的至少一个:将权重给予具有匹配对于当前搜索输入的搜索查询的相关搜索查询的网页;以及标识并使用对至少一个网页的至少一个相关搜索查询的点进频率。
CN2008800093831A 2007-03-23 2008-02-07 对网页的相关搜索查询及其应用 Expired - Fee Related CN101641697B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/690,585 2007-03-23
US11/690,585 US8244750B2 (en) 2007-03-23 2007-03-23 Related search queries for a webpage and their applications
PCT/US2008/053271 WO2008118544A1 (en) 2007-03-23 2008-02-07 Related search queries for a webpage and their applications

Publications (2)

Publication Number Publication Date
CN101641697A true CN101641697A (zh) 2010-02-03
CN101641697B CN101641697B (zh) 2013-01-23

Family

ID=39775745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800093831A Expired - Fee Related CN101641697B (zh) 2007-03-23 2008-02-07 对网页的相关搜索查询及其应用

Country Status (5)

Country Link
US (1) US8244750B2 (zh)
EP (1) EP2130142A4 (zh)
CN (1) CN101641697B (zh)
TW (1) TW200842632A (zh)
WO (1) WO2008118544A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193932A (zh) * 2010-03-09 2011-09-21 北京金山软件有限公司 一种确定搜索项的方法和系统
CN102207960A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
CN102541446A (zh) * 2010-12-09 2012-07-04 微软公司 重新规划工具栏输入区域
CN102567441A (zh) * 2010-10-18 2012-07-11 微软公司 提供与用户会话相关的情境提示
CN102647417A (zh) * 2012-03-31 2012-08-22 奇智软件(北京)有限公司 网络访问的实现方法、装置和系统、以及网络系统
CN103279490A (zh) * 2013-04-26 2013-09-04 百度在线网络技术(北京)有限公司 Web页面的标签提取方法及装置
CN103559253A (zh) * 2013-10-31 2014-02-05 北京奇虎科技有限公司 相关垂直资源搜索方法及设备
CN104428769A (zh) * 2012-07-13 2015-03-18 索尼公司 提供文本阅读器的信息
CN105243073A (zh) * 2014-07-11 2016-01-13 北京金山安全软件有限公司 一种书签访问方法、装置及终端
CN105468729A (zh) * 2015-11-23 2016-04-06 深圳大粤网络视界有限公司 一种互联网移动垂直搜索引擎
CN105956116A (zh) * 2010-10-30 2016-09-21 国际商业机器公司 转换搜索引擎查询
CN107357891A (zh) * 2017-07-12 2017-11-17 中云开源数据技术(上海)有限公司 一种主页链接推荐方法
CN108681604A (zh) * 2010-06-29 2018-10-19 微软技术许可有限责任公司 导航到流行的搜索结果
CN110753920A (zh) * 2017-06-16 2020-02-04 T移动美国公司 用于优化和模拟网页排序和流量的系统和方法
US10726083B2 (en) 2010-10-30 2020-07-28 International Business Machines Corporation Search query transformations

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8671114B2 (en) * 2006-11-30 2014-03-11 Red Hat, Inc. Search results weighted by real-time sharing activity
US9183305B2 (en) * 2007-06-19 2015-11-10 Red Hat, Inc. Delegated search of content in accounts linked to social overlay system
US20090063265A1 (en) * 2007-09-04 2009-03-05 Yahoo! Inc. Information network for text ads
US9330180B2 (en) * 2007-10-02 2016-05-03 Microsoft Technology Licensing, Llc Mobile terminal and method of controlling the same
KR101387510B1 (ko) * 2007-10-02 2014-04-21 엘지전자 주식회사 휴대 단말기 및 그 제어 방법
US7814108B2 (en) * 2007-12-21 2010-10-12 Microsoft Corporation Search engine platform
US9117219B2 (en) * 2007-12-31 2015-08-25 Peer 39 Inc. Method and a system for selecting advertising spots
US8412702B2 (en) * 2008-03-12 2013-04-02 Yahoo! Inc. System, method, and/or apparatus for reordering search results
US7930287B2 (en) * 2008-03-14 2011-04-19 Michelli Capital Limited Liability Company Systems and methods for compound searching
US20090234837A1 (en) * 2008-03-14 2009-09-17 Yahoo! Inc. Search query
US20090248669A1 (en) * 2008-04-01 2009-10-01 Nitin Mangesh Shetti Method and system for organizing information
US9135328B2 (en) * 2008-04-30 2015-09-15 Yahoo! Inc. Ranking documents through contextual shortcuts
US8543592B2 (en) * 2008-05-30 2013-09-24 Microsoft Corporation Related URLs for task-oriented query results
US20100125523A1 (en) * 2008-11-18 2010-05-20 Peer 39 Inc. Method and a system for certifying a document for advertisement appropriateness
US9594835B2 (en) * 2008-11-25 2017-03-14 Yahoo! Inc. Lightning search aggregate
US8458171B2 (en) * 2009-01-30 2013-06-04 Google Inc. Identifying query aspects
US8316037B1 (en) 2009-01-30 2012-11-20 Google Inc. Providing remedial search operation based on analysis of user interaction with search results
KR20100095924A (ko) * 2009-02-23 2010-09-01 삼성전자주식회사 동영상의 상황정보를 반영한 광고 키워드 추출 방법 및 장치
US20100262836A1 (en) * 2009-04-13 2010-10-14 Eric Peukert Privacy and confidentiality preserving mapping repository for mapping reuse
WO2010134363A1 (ja) * 2009-05-18 2010-11-25 株式会社東芝 携帯端末
JP4602458B2 (ja) * 2009-05-25 2010-12-22 楽天株式会社 情報処理装置、情報処理方法、および、情報処理プログラム
US20110029384A1 (en) * 2009-07-30 2011-02-03 Yahoo! Inc. System and method for dynamic targeting advertisement based on content-in-view
WO2011035426A1 (en) * 2009-09-25 2011-03-31 Shady Shehata System, method and computer program for searching within a sub-domain by linking to other sub-domains
EP2482247A4 (en) * 2009-10-30 2014-11-19 Rakuten Inc PROGRAM, DEVICE AND METHOD FOR DETERMINING CHARACTERISTIC CONTENT, RECORDING MEDIUM, CONTENT GENERATING DEVICE, AND CONTENT INSERTION DEVICE THEREFOR
US8311792B1 (en) * 2009-12-23 2012-11-13 Intuit Inc. System and method for ranking a posting
US10204163B2 (en) * 2010-04-19 2019-02-12 Microsoft Technology Licensing, Llc Active prediction of diverse search intent based upon user browsing behavior
US20110295680A1 (en) * 2010-05-27 2011-12-01 Google Inc. Single Conversion Advertisements
WO2012052983A1 (en) * 2010-10-20 2012-04-26 Simplygen Ltd. Method for scoring and ranking search engine keywords at a website
US9129009B2 (en) 2010-11-03 2015-09-08 Google Inc. Related links
US8645288B2 (en) * 2010-12-02 2014-02-04 Microsoft Corporation Page selection for indexing
US9589056B2 (en) * 2011-04-05 2017-03-07 Microsoft Technology Licensing Llc User information needs based data selection
US9519726B2 (en) 2011-06-16 2016-12-13 Amit Kumar Surfacing applications based on browsing activity
US8965882B1 (en) 2011-07-13 2015-02-24 Google Inc. Click or skip evaluation of synonym rules
US9613135B2 (en) 2011-09-23 2017-04-04 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation of information objects
US8793252B2 (en) 2011-09-23 2014-07-29 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation using dynamically-derived topics
US9208218B2 (en) * 2011-10-19 2015-12-08 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
US9600587B2 (en) 2011-10-19 2017-03-21 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
US9207754B2 (en) 2011-10-20 2015-12-08 Microsoft Technology Licensing, Llc Enabling immersive, interactive desktop image presentation
US8909627B1 (en) 2011-11-30 2014-12-09 Google Inc. Fake skip evaluation of synonym rules
US8548990B2 (en) 2011-12-30 2013-10-01 Microsoft Corporation Presenting interactive images with search results
US9152698B1 (en) * 2012-01-03 2015-10-06 Google Inc. Substitute term identification based on over-represented terms identification
US8965875B1 (en) 2012-01-03 2015-02-24 Google Inc. Removing substitution rules based on user interactions
US9141672B1 (en) 2012-01-25 2015-09-22 Google Inc. Click or skip evaluation of query term optionalization rule
US8620951B1 (en) 2012-01-28 2013-12-31 Google Inc. Search query results based upon topic
US8959103B1 (en) 2012-05-25 2015-02-17 Google Inc. Click or skip evaluation of reordering rules
US9146966B1 (en) 2012-10-04 2015-09-29 Google Inc. Click or skip evaluation of proximity rules
US20140129973A1 (en) * 2012-11-08 2014-05-08 Microsoft Corporation Interaction model for serving popular queries in search box
US20140156627A1 (en) * 2012-11-30 2014-06-05 Microsoft Corporation Mapping of topic summaries to search results
US8996516B2 (en) 2013-01-02 2015-03-31 Google Inc. Adjacent search results exploration
US10108699B2 (en) * 2013-01-22 2018-10-23 Microsoft Technology Licensing, Llc Adaptive query suggestion
CN104035922A (zh) * 2013-03-04 2014-09-10 阿里巴巴集团控股有限公司 一种在网站内容管理系统中定位网页的方法及装置
RU2592393C2 (ru) 2013-08-30 2016-07-20 Общество С Ограниченной Ответственностью "Яндекс" Система и способ завершения пользовательского запроса и предоставления ответа на запрос
US9569536B2 (en) 2013-12-17 2017-02-14 Microsoft Technology Licensing, Llc Identifying similar applications
RU2595497C2 (ru) * 2014-03-31 2016-08-27 Общество С Ограниченной Ответственностью "Яндекс" Способ отображения веб-ресурса пользователю (варианты) и электронное устройство
US10068013B2 (en) * 2014-06-19 2018-09-04 Samsung Electronics Co., Ltd. Techniques for focused crawling
RU2597476C2 (ru) 2014-06-27 2016-09-10 Общество С Ограниченной Ответственностью "Яндекс" Система и способ выполнения поиска
US20150379141A1 (en) * 2014-06-30 2015-12-31 Mainwire, LLC. Automated search engine optimization
US20160034532A1 (en) * 2014-07-31 2016-02-04 Dmytro Andriyovich Ivchenko Flexible operators for search queries
CN104166728B (zh) * 2014-08-28 2019-01-25 百度在线网络技术(北京)有限公司 通过搜索引擎生成定制化内容的方法、系统及搜索引擎
CN105743937B (zh) 2014-12-08 2021-02-19 创新先进技术有限公司 一种显示访问内容的方法及服务器
US10552493B2 (en) 2015-02-04 2020-02-04 International Business Machines Corporation Gauging credibility of digital content items
US20180157629A1 (en) * 2016-12-01 2018-06-07 Raja Singh Tuli Method for reducing data transfer from a server to a portable device
US20180341716A1 (en) * 2017-05-26 2018-11-29 Microsoft Technology Licensing, Llc Suggested content generation
US11314794B2 (en) 2018-12-14 2022-04-26 Industrial Technology Research Institute System and method for adaptively adjusting related search words

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6513031B1 (en) * 1998-12-23 2003-01-28 Microsoft Corporation System for improving search area selection
US7225182B2 (en) 1999-05-28 2007-05-29 Overture Services, Inc. Recommending search terms using collaborative filtering and web spidering
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
US6704722B2 (en) * 1999-11-17 2004-03-09 Xerox Corporation Systems and methods for performing crawl searches and index searches
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
US6732088B1 (en) * 1999-12-14 2004-05-04 Xerox Corporation Collaborative searching by query induction
US6311194B1 (en) 2000-03-15 2001-10-30 Taalee, Inc. System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
US7225180B2 (en) * 2000-08-08 2007-05-29 Aol Llc Filtering search results
US7047229B2 (en) * 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
US7478089B2 (en) 2003-10-29 2009-01-13 Kontera Technologies, Inc. System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US6990494B2 (en) 2001-07-27 2006-01-24 International Business Machines Corporation Identifying links of interest in a web page
US7007074B2 (en) 2001-09-10 2006-02-28 Yahoo! Inc. Targeted advertisements using time-dependent key search terms
US6708250B2 (en) * 2001-09-28 2004-03-16 Mosaid Technologies Incorporated Circuit and method for performing variable width searches in a content addressable memory
US20050125240A9 (en) * 2002-10-21 2005-06-09 Speiser Leonard R. Product recommendation in a network-based commerce system
US7124125B2 (en) 2002-11-01 2006-10-17 Loudeye Corp. System and method for providing media samples on-line in response to media related searches on the internet
KR20040072983A (ko) 2003-02-12 2004-08-19 허진호 웹 페이지에서의 링크 제공 방법 및 이를 위한 시스템
EP2397954A1 (en) 2003-08-21 2011-12-21 Idilia Inc. System and method for associating queries and documents with contextual advertisements
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7523096B2 (en) * 2003-12-03 2009-04-21 Google Inc. Methods and systems for personalized network searching
CN100495392C (zh) * 2003-12-29 2009-06-03 西安迪戈科技有限责任公司 一种智能搜索方法
WO2005089334A2 (en) * 2004-03-15 2005-09-29 Yahoo! Inc. Inverse search systems and methods
US20060069610A1 (en) 2004-03-19 2006-03-30 Pascal Rossini Browsing device and platform for management and distrubtion in server mode, in particular for the display of advertising links
US7343374B2 (en) * 2004-03-29 2008-03-11 Yahoo! Inc. Computation of page authority weights using personalized bookmarks
US20050262428A1 (en) 2004-05-21 2005-11-24 Little Chad M System and method for contextual correlation of web document content
US20060161520A1 (en) * 2005-01-14 2006-07-20 Microsoft Corporation System and method for generating alternative search terms
US8768766B2 (en) 2005-03-07 2014-07-01 Turn Inc. Enhanced online advertising system
US20060218115A1 (en) 2005-03-24 2006-09-28 Microsoft Corporation Implicit queries for electronic documents
US20060229942A1 (en) 2005-04-11 2006-10-12 Miller Michael R Method and automated system for creating and tracking on-line embedded search event records and generating leads
US7599916B2 (en) * 2005-04-20 2009-10-06 Microsoft Corporation System and method for personalized search
US7577646B2 (en) * 2005-05-02 2009-08-18 Microsoft Corporation Method for finding semantically related search engine queries
US20060253421A1 (en) * 2005-05-06 2006-11-09 Fang Chen Method and product for searching title metadata based on user preferences
US7653627B2 (en) 2005-05-13 2010-01-26 Microsoft Corporation System and method for utilizing the content of an online conversation to select advertising content and/or other relevant information for display
US7844599B2 (en) * 2005-08-24 2010-11-30 Yahoo! Inc. Biasing queries to determine suggested queries
US20070061298A1 (en) * 2005-09-14 2007-03-15 Wilson Jeff K Method and apparatus for adding a search filter for web pages based on page type
US20070074125A1 (en) * 2005-09-26 2007-03-29 Microsoft Corporation Preview information for web-browsing
US20070174255A1 (en) * 2005-12-22 2007-07-26 Entrieva, Inc. Analyzing content to determine context and serving relevant content based on the context
US7725417B2 (en) * 2006-02-09 2010-05-25 Ebay Inc. Method and system to analyze rules based on popular query coverage
US20070271255A1 (en) * 2006-05-17 2007-11-22 Nicky Pappo Reverse search-engine
US8001105B2 (en) 2006-06-09 2011-08-16 Ebay Inc. System and method for keyword extraction and contextual advertisement generation
KR101070053B1 (ko) 2006-06-13 2011-10-04 주식회사 데이타웨이브 시스템 Url을 이용하여 검색 광고를 제공하는 방법 및 그방법을 채용한 시스템
US8694318B2 (en) * 2006-09-19 2014-04-08 At&T Intellectual Property I, L. P. Methods, systems, and products for indexing content
US20080086466A1 (en) * 2006-10-10 2008-04-10 Bay Baker Search method
US20090024718A1 (en) 2007-07-20 2009-01-22 Aris Anagnostopoulos Just-In-Time Contextual Advertising Techniques
US20090089830A1 (en) 2007-10-02 2009-04-02 Blinkx Uk Ltd Various methods and apparatuses for pairing advertisements with video files
US20090164949A1 (en) 2007-12-20 2009-06-25 Kontera Technologies, Inc. Hybrid Contextual Advertising Technique
US8543924B2 (en) 2008-03-06 2013-09-24 Microsoft Corporation Contextual-display advertisement

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193932B (zh) * 2010-03-09 2012-12-19 北京金山软件有限公司 一种确定搜索项的方法和系统
CN102193932A (zh) * 2010-03-09 2011-09-21 北京金山软件有限公司 一种确定搜索项的方法和系统
CN108681604A (zh) * 2010-06-29 2018-10-19 微软技术许可有限责任公司 导航到流行的搜索结果
CN102567441A (zh) * 2010-10-18 2012-07-11 微软公司 提供与用户会话相关的情境提示
CN102567441B (zh) * 2010-10-18 2016-06-29 微软技术许可有限责任公司 提供与用户会话相关的情境提示
US10726083B2 (en) 2010-10-30 2020-07-28 International Business Machines Corporation Search query transformations
CN105956116B (zh) * 2010-10-30 2020-02-28 国际商业机器公司 用于处理将要显示的内容的方法和系统
CN105956116A (zh) * 2010-10-30 2016-09-21 国际商业机器公司 转换搜索引擎查询
US10223456B2 (en) 2010-10-30 2019-03-05 International Business Machines Corporation Boosted slashtags
US11194872B2 (en) 2010-10-30 2021-12-07 International Business Machines Corporation Dynamic inference graph
CN102541446A (zh) * 2010-12-09 2012-07-04 微软公司 重新规划工具栏输入区域
CN102207960B (zh) * 2011-05-25 2013-10-23 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
CN102207960A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
WO2013143405A1 (zh) * 2012-03-31 2013-10-03 北京奇虎科技有限公司 网络访问的实现方法、装置和系统、以及网络系统
CN102647417B (zh) * 2012-03-31 2017-03-29 北京奇虎科技有限公司 网络访问的实现方法、装置和系统、以及网络系统
CN102647417A (zh) * 2012-03-31 2012-08-22 奇智软件(北京)有限公司 网络访问的实现方法、装置和系统、以及网络系统
US10909202B2 (en) 2012-07-13 2021-02-02 Sony Corporation Information providing text reader
CN104428769A (zh) * 2012-07-13 2015-03-18 索尼公司 提供文本阅读器的信息
CN104428769B (zh) * 2012-07-13 2018-04-06 索尼公司 提供文本阅读器的信息
CN103279490A (zh) * 2013-04-26 2013-09-04 百度在线网络技术(北京)有限公司 Web页面的标签提取方法及装置
CN103559253A (zh) * 2013-10-31 2014-02-05 北京奇虎科技有限公司 相关垂直资源搜索方法及设备
CN105243073A (zh) * 2014-07-11 2016-01-13 北京金山安全软件有限公司 一种书签访问方法、装置及终端
CN105468729A (zh) * 2015-11-23 2016-04-06 深圳大粤网络视界有限公司 一种互联网移动垂直搜索引擎
CN110753920A (zh) * 2017-06-16 2020-02-04 T移动美国公司 用于优化和模拟网页排序和流量的系统和方法
CN107357891A (zh) * 2017-07-12 2017-11-17 中云开源数据技术(上海)有限公司 一种主页链接推荐方法

Also Published As

Publication number Publication date
TW200842632A (en) 2008-11-01
EP2130142A4 (en) 2011-03-09
CN101641697B (zh) 2013-01-23
EP2130142A1 (en) 2009-12-09
WO2008118544A1 (en) 2008-10-02
US8244750B2 (en) 2012-08-14
US20080235187A1 (en) 2008-09-25

Similar Documents

Publication Publication Date Title
CN101641697B (zh) 对网页的相关搜索查询及其应用
US20220020056A1 (en) Systems and methods for targeted advertising
US10733250B2 (en) Methods and apparatus for matching relevant content to user intention
Zamani et al. Situational context for ranking in personal search
US10102307B2 (en) Method and system for multi-phase ranking for content personalization
Chen et al. Sheepdog: group and tag recommendation for flickr photos by automatic search-based learning
US8095523B2 (en) Method and apparatus for context-based content recommendation
US7831474B2 (en) System and method for associating an unvalued search term with a valued search term
Wang et al. HAR-SI: A novel hybrid article recommendation approach integrating with social information in scientific social network
CN102999560A (zh) 用社交网络特征提高姓名和其它搜索查询的搜索引擎结果页面的相关性
CN101520784A (zh) 信息发布系统和信息发布方法
CN101652779A (zh) 与搜索查询相关的搜索宏建议
CN104885081A (zh) 搜索系统和相应方法
CN102646108A (zh) 使用主题意识文件评级器的信息检索
Zhou et al. An intelligent video tag recommendation method for improving video popularity in mobile computing environment
CN111475725A (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
Sajeev et al. Effective web personalization system based on time and semantic relatedness
Yao et al. RLPS: A reinforcement learning–based framework for personalized search
Dong et al. Improving sequential recommendation with attribute-augmented graph neural networks
Hsu et al. Efficient and effective prediction of social tags to enhance web search
Huurdeman et al. Using collaborative filtering in social book search
Rajkumar et al. Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine
Daryaie Zanjani et al. Predicting user click behaviour in search engine advertisements
Ling et al. Ontology based service recommendation system for social network
CN104820709A (zh) 一种移动用户数据处理、推送方法及相应的系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150511

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150511

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130123

Termination date: 20200207

CF01 Termination of patent right due to non-payment of annual fee