CN102124462B - 查询识别和关联 - Google Patents
查询识别和关联 Download PDFInfo
- Publication number
- CN102124462B CN102124462B CN200980131937.XA CN200980131937A CN102124462B CN 102124462 B CN102124462 B CN 102124462B CN 200980131937 A CN200980131937 A CN 200980131937A CN 102124462 B CN102124462 B CN 102124462B
- Authority
- CN
- China
- Prior art keywords
- inquiry
- candidate query
- page
- web document
- landing page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Abstract
公开了用于广告的预测性查询识别的装置、系统和方法。从存储在查询日志中的查询识别候选查询。生成多个web文档的相关度分值,每一个相关度分值与相应的web文档相关联以及是候选查询与web文档的相关度的测量。选择具有超过相关度阈值的相关联的相关度分值的web文档。将所选择的web文档与候选查询进行关联。
Description
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求享有于2008年6月23日提交、题为“查询识别和关联”的美国临时专利申请No.61/074,945的权益,通过引用将所述美国临时专利申请合并于此。
技术领域
本文档涉及信息处理。
背景技术
因特网使访问各种各样的web文档,例如视频和/或音频文件、有关特定主题的网页、新闻文章等成为可能。这样的对这些web文档的访问同样使定向广告的机会成为可能。例如,用户特别感兴趣的web文档可以由搜索引擎响应于用户查询来识别。查询可以包括一个或多个搜索词语,以及搜索引擎可以基于查询中的搜索词语识别并且可选地排名web文档,以及(例如,根据排名)向用户展示web文档。该查询还可以是用户感兴趣的信息的类型的指示符。通过将用户查询与查询列表和广告主指定的关键词进行比较,可能的是,向用户提供定向广告。定向广告可以包括指向着陆页的链接,以及对链接的选择可以促使着陆页在web浏览设备上显示。
广告主典型地试图预见用户提交的可能与广告主的提供的产品或服务有关的特定查询。由广告主指定的关键词可以包括与广告主提供的产品或服务有关的关键词。可以将这些关键词与广告主提供的产品或服务广泛匹配,例如关键词“flower(花)”可以与web文档中的“florist(花商)”广泛匹配。然而,这样的广泛匹配可以产生较不期望的结果(例如,较少的转换)。额外地,广告主可以不识别特定相关关键词(被称为“缺失关键词”)。因此,包括缺失关键词的查询可以被认为与广告主的内容较少地相关。因此,对产品的特定查询有时不能导致对链接到与查询高度相关的着陆页的广告的选择。
发明内容
一般地,可以将在本说明书中描述的主题的一个方面具体化在包括下述动作的方法中:从存储在查询日志中的查询识别候选查询;为多个web文档生成相关度分值,每一个相关度分值与相应的web文档相关联以及是候选查询与web文档的相关度的测量;选择具有超过相关度阈值的相关联的相关度分值的web文档;以及将所选择的web文档与候选查询进行关联。本方面的其它实施例包括相应的系统、装置和计算机程序产品。
可以将在本说明书中描述的主题的另一个方面具体化在包括下述动作的方法中:定义查询提取标准,查询提取标准被配置为识别与主题相关度有关的查询;根据提取标准从存储在查询日志中的查询识别候选查询;为第一web文档集生成相关度分值,每一个相关度分值与第一web文档集中的相应web文档相关联以及是候选查询与web文档的相关度的测量;选择具有超过相关度阈值的相关联的相关度分值的web文档;以及从所选择的web文档和候选查询生成查询-页面候选元组(tuple)。本方面的其它实施例包括相应的系统、装置和计算机程序产品。
在附图和下面的描述中阐述了在本说明书中描述的主题的一个或多个实施例的细节。主题的其它特征、方面和优势从描述、附图以及权利要求将变得显而易见。
附图说明
图1是示例在线环境的框图。
图2是图示了示例操作过程的框图。
图3是示出了示例提取过程的框图。
图4是示例候选查询-页面过程的框图。
图5是示例过滤过程的框图。
图6a是图示了查询-页面元组与广告的示例关联的框图。
图6b是图示了查询-页面元组与现有广告的示例关联的框图。
图6c是图示了查询-页面元组与广告的另一个示例关联的框图。
图6d是图示了查询-页面元组与广告的另一个示例关联的框图。
图7是图示了查询-页面元组与查询类别的示例关联的框图。
图8是用于识别查询-页面候选元组的示例过程的流程图。
图9是用于查询提取的示例过程的流程图。
图10是用于过滤查询-页面候选元组的示例过程的流程图。
图11是用于将查询-页面元组与广告组进行关联的示例过程的流程图。
图12是用于将查询与类别进行关联的示例过程的流程图。
图13是示例计算机系统。
在各个附图中相同的参考数字和标记指示相同的元素。
具体实施方式
图1是示例在线环境100的框图。在线环境100可以帮助对例如网页、广告等的web文档的识别和向用户的派发。诸如局域网(LAN)、广域网(WAN)、因特网或以上的组合的计算机网络110连接广告主102、搜索引擎112、发布者106和用户设备108。示例用户设备108包括个人计算机、移动通信设备、电视机顶盒等。在线环境100可以包括成千上万的广告主、发布者和用户设备。
§1.0搜索处理
诸如用户设备108a的用户设备可以向搜索引擎112提交搜索查询109,以及可以响应于搜索查询109向用户设备108a提供搜索结果页111。搜索结果页111可以包括指向发布者106提供的web文档的一个或多个链接。
在一些实施方式中,搜索查询109可以包括一个或多个搜索词语。搜索词语可以是以通过用来检索响应性的搜索结果的搜索引擎112、作为搜索查询的一部分提交的一个或多个关键词的形式。例如,用户设备108a的用户可以搜索在线商店以购买星形蛋糕盘。所提交的搜索查询109可以是“star cake pan”。在该示例中的搜索词语可以是“star”、“cake”和“pan”。
发布者106可以包括通用内容服务器,其接收以搜索查询109的形式的对内容(例如,与文章、讨论话题、音乐、视频、图形有关的web文档、其它web文档收录、信息馈送、产品评论等)的请求,以及响应于搜索查询109检索在搜索结果页111上的指向内容的链接。例如,与新闻内容提供者、零售商、独立博客、社交网络站点、用于出售的产品有关的内容服务器或通过网络110提供内容的任何其它实体可以是发布者。
为了帮助响应于查询而识别内容,搜索引擎112可以对发布者106和广告主102提供的内容进行索引(例如,诸如web索引120的缓存web文档索引)以供稍后搜索以及检索与查询相关的搜索结果118。在澳大利亚布里斯班举行的Seventh International World Wide WebConference(第七届国际万维网会议)(1998)上S.Brin和L.Page的“The Anatomy of a Large-Scale Hypertextual Search Engine(剖析大规模超文本搜索引擎)”和美国专利No.6,285,999中描述了示例性搜索引擎112。搜索结果可以被识别并且根据各种相关度分值被排名,所述相关度分值例如基于缓存和索引的web文档的文本、所识别的文档的特征向量以及其它搜索处理技术的信息检索(“IR”)分值。在一些实施方式中,可以从例如与查询和文档相对应的特征向量的点积、页面排名分值和/或IR分值和页面排名分值的组合等来计算IR分值。
搜索结果118可以包括例如web文档标题、从那些web文档提取的文本的摘录以及指向那些web文档的超文本链接的列表,以及可以被分组成预定数量(例如,10)的搜索结果。搜索结果118还可以由搜索引擎112进行排名,以及作为内容展示在搜索结果页111上。
搜索查询109中的搜索词语控制搜索引擎112通过搜索结果页111提供的搜索结果118。尽管搜索结果118的实际排名基于搜索引擎112所使用的排名算法而变化,但是搜索引擎112可以基于通过搜索查询109提交的搜索词语检索并且排名搜索结果118。例如,“star cake pan”的搜索查询可以基于搜索词语“star”、“cake”和“pan”产生与蛋糕盘的在线零售商有关的搜索结果。
§2.0赞助内容
在一些实施方式中,搜索结果页111可以包括广告116,或可以包括例如JavaScriptTM指令的可执行指令,其可以在用户设备108a处执行来通过网络请求广告116。广告116可以以下述形式:诸如横幅广告的图形广告、纯文本广告、图像广告、音频广告、视频广告、组合任何这样的组件的一个或多个的广告等、或任何其它类型的电子广告文档。广告116还包括嵌入式信息,诸如指向着陆页的链接。
任何web文档可以是着陆页;着陆页是或可以被从另一个web文档、广告或搜索结果链接到的任何web文档。例如,着陆页可以是描述和/或公开出售广告主的产品或服务的web文档。着陆页例如还可以是广告主的主页,例如公司的主页。
广告116可以由广告管理系统104基于提交给搜索引擎112的搜索查询的关键词来选择。在一些实施方式中,广告116与关键词相关联,以及当识别在搜索查询中的特定关键词时,可以选择与那些关键词相关联的广告116以在搜索结果页111上显示。
除基于搜索查询来选择广告外,还可以从拍卖选择广告。在一个实施方式中,广告主102可以对广告主乐意为与广告的每一个交互支付的金额,例如当例如用户点击广告时广告主支付的每点击成本金额,进行选择或出价。每点击成本可以包括最大每点击成本,例如广告主乐意为基于关键词对广告的每一次点击支付的最大金额。所显示的广告的排名可以通过将用于广告的最大每点击成本乘以广告的质量分值来确定,广告的质量分值可以部分地由广告的与查询的关键词的相关度来确定。然后可以按照升序或降序排名将广告放置在其它广告之中。
广告管理系统104可以将广告信息存储在广告数据124中。广告管理系统104还可以将与广告活动有关的信息存储在活动数据126中。活动数据126可以例如指定用于广告的广告预算、将关键词与广告和着陆页进行关联以及指定何时、何地和在何种情况下可以派发特定广告以供展示。
广告主102、发布者106、用户设备108和/或搜索引擎112还可以向广告管理系统104提供使用信息。该使用信息可以包括与已派发的广告116有关的被测量或观察到的用户行为,诸如与广告116有关的转换或选择是否已发生。广告管理系统104执行金融交易,诸如基于使用信息向发布者106记贷并且向广告主102收费。还可以对这样的使用信息进行处理以测量性能度量,诸如点进率(“CTR”)、转换率等。
点进可以例如在用户设备的用户选择或“点击”指向发布者或广告管理系统返回的web文档的链接时发生。CTR是通过例如将点击web文档—例如指向着陆页的链接、广告116或搜索结果118—的用户的数目除以web文档被递送的次数来获取的性能度量。“转换”在用户完成与先前派发的广告116有关的事务时发生。构成转换的内容可以根据情况而有所不同,并且能够以多种方式确定。例如,转换可以在用户点击广告116、被指引到广告主的着陆页并且在离开该着陆页之前在那里完成了购买时发生。还可以使用构成转换的其它行为。
§3.0与广告的查询关联
广告主102将之与广告进行关联的关键词可以基于用户在搜索与做广告的商业提供(commercial offering)有关的信息时可以使用的关键词来选择。商业提供可以是在着陆页上的用于交易的任何机会,例如产品或服务的出售。因此,通过使用广告管理系统104,广告主102能够将他们的用于商业提供的广告116与查询的关键词进行关联。例如,蛋糕盘的零售商可以预见搜索蛋糕盘的用户可能将搜索词语“cake”和“pan”包括在他们的搜索查询中。因此,蛋糕盘的零售商可以将它的广告与关键词“cake”和“pan”进行关联。包括关键词cake和pan的搜索可以导致对蛋糕盘的零售商提供的广告的展示。
然而,精确地或宽泛地对匹配关键词的使用,可能并不总是导致对链接到与用户的兴趣相关的着陆页的广告的识别。因此,替选是处理查询并且将查询作为整体以及可选地它们的独立关键词与广告和/或着陆页进行关联。然而,因为存在用户提交并且存储在查询日志128中的成千上万的搜索查询,所以该过程是相当困难的。
因此,在一些实施方式中,广告管理系统104可以使用查询-页面识别器114,其可以从查询日志128识别被确定与特定着陆页相关的已存储的查询。查询-页面识别器114首先从查询日志128识别候选查询,然后通过使用搜索查询112来识别与候选查询有关的着陆页。在一些实施方式中,搜索引擎112搜索web索引120中的已索引的web文档的真子集,该真子集是商业相关的着陆页。对于每一个查询,由查询-页面识别器114将超过相关度阈值的所识别的着陆页与候选查询进行关联,查询-页面识别器114然后将这些关联存储为查询-页面元组122。
作为示例,查询-页面识别器114可以确定查询“train cake pan(火车蛋糕盘)”可以导致对用于提供“train cake pan”产品的在线商店A的特定着陆页的识别。查询-页面识别器114因此将用于在线商店A的火车蛋糕盘的着陆页与候选查询“train cake pan”进行关联。此后,当用户提交查询“train cake pan”或例如包括词语train、cake和pan的变化组合的任何查询时,链接到所述着陆页的广告可以被识别并且提供在搜索结果页111中。
图2是图示了示例操作过程的框图200。。三个阶段包括提取阶段、候选查询-页面阶段以及过滤阶段。这些阶段仅是说明性的,以及可以使用更多或更少的阶段。
在提取阶段,可以从查询日志128识别候选查询。在候选查询-页面阶段,搜索引擎112可以用于搜索与候选查询有关的着陆页(例如,对web索引120),并且生成候选查询-页面元组。在过滤阶段,可以(例如,由过滤器208)基于各种相关度标准对所识别的候选查询-页面元组进行过滤。可以将未由过滤器208排除的候选查询-页面元组与广告数据212中的广告进行关联、或存储在定义对与广告的关联的建议的建议数据210中、或可以在一些其它数据分析或其它过程中使用未由过滤器208排除的候选查询-页面元组。
在一些实施方式中,为了识别候选查询,查询-页面识别器114从查询日志128识别满足一个或多个提取标准的查询。在一些实施方式中,提取标准用于识别为商业相关的查询,例如商业上相关的查询。在一些实施方式中,查询-页面识别器114不将查询考虑为商业上相关的,除非它在某一时间段期间被提交了至少最少次数,并且在该时间段期间少于最多次数。还可以使用确定查询是否是商业上相关的其它方法。将这些商业上相关的查询识别为候选查询。例如,查询-页面识别器114可以识别查询日志128包括“train cake pan”的查询。如果“traincake pan”的查询被提交超过了提交阈值的最小频率,并且如果它被提交没有超过提交阈值的最大频率,则它可以被认为是商业上相关的。
在上面的示例中的候选查询-页面阶段期间,使用所识别的候选查询来搜索web索引120。在一些实施方式中,使用候选查询来搜索包括包含商业提供的着陆页集的web索引120的真子集。例如,web索引120的真子集可以包括列出用于出售的产品或服务的着陆页子集。例如,出售蛋糕盘并且都具有着陆页的五个不同的在线商店可以是web索引120的真子集的一部分;相反地,政府站点可以使web文档包括在web索引中,但是可以认为来自该政府站点的web文档不是web索引的真子集的一部分。
查询-页面识别器114可以使用搜索引擎112来搜索web索引120的真子集以找到与每一个候选查询有关的着陆页。在一些实施方式中,对于每一个候选查询,搜索引擎112可以将测量候选查询与真子集中的每一个web文档的相关度的相关度分值分配给该web文档。例如,五个在线商店中的两个,在线商店A和在线商店B出售火车蛋糕盘并且每一个具有针对火车蛋糕盘的着陆页,而其它三个在线商店仅仅出售更传统的蛋糕盘。因此,对于查询“train cake pan”,用于在线商店A和在线商店B的包括“train cake pan”的着陆页将具有比用于其它三个在线商店的着陆页更高的相关度分值。
查询-页面识别器114可以基于着陆页的相关度分值从所识别的着陆页集选择候选着陆页。在一些实施方式中,搜索引擎112仅仅选择分配有超过相关度阈值的相关度分值的着陆页。例如,如果在线商店A和在线商店B中的每一个具有高于相关度阈值的相关度分值,则搜索引擎112可以选择用于在线商店A和在线商店B的着陆页来与候选查询“train cake pan”进行关联。如果用于其它三个商店的着陆页的相关度分值低于相关度阈值,则可以不选择用于其它三个商店的着陆页。使所选择的着陆页与候选查询配对,以及在一些实施方式中,可以将所选择的着陆页存储在查询-页面候选元组中。
在过滤阶段,对候选(例如,查询-页面候选元组)进行过滤(例如,以创建查询-页面元组)。查询-页面元组表示满足一个或多个过滤标准的查询-页面候选元组的子集。在一些实施方式中,如果查询-页面候选元组与商业提供不相关,则过滤器208可以移除查询-页面候选元组,例如如由一个或多个统计过程所测量的,导致从整个web索引120识别没有可辨识的意图的页面的查询,和/或对于其意图测量偏离来自整个web索引的所识别的着陆页的意图测量的查询-页面候选元组。在一些实施方式中,建议向量和/或查询意图向量可以用于确定候选元组是否与商业提供相关。
在过滤阶段之后,可以将过滤后的选择(例如,查询-页面元组)与广告进行关联。可以通过将查询与广告进行关联,并且将广告链接到元组的着陆页来将查询-页面元组与广告进行关联。可以将这些关联存储在广告组212中,广告组212在一些实施方式中是关键词、广告和着陆页的关联的集合。例如,可以将候选查询“train cake pan”与链接到用于在线商店A的提供火车蛋糕盘的着陆页的广告进行关联。
在一些实施方式中,在元组和广告之间的关联不是自动的,并且被存储为建议数据210。可以通过例如广告主前端214,例如用于进入广告管理系统104的广告主102的客户端界面,向广告主展示建议数据210。广告主可以使用广告主前端214来接受查询-页面元组与建议的广告的建议关联。
§3.1对候选查询的识别
图3是示出了(例如,与查询-页面识别器114相关联的)示例提取过程的框图300。查询提取器302从查询日志128识别满足一个或多个提取标准308的候选查询集。提取标准308可以包括有关查询的提交频率、查询的时间、查询的类型的标准以及其它标准。
在一些实施方式中,可以选择提交标准指定的频率来识别发生至少最少次数并且发生少于最多次数的查询。可以选择较低阈值来保护用户隐私,以及识别可能在未来再次被提交的查询。例如,每年被提交少于50次的查询可能不是商业上相关的;作为替代,它可能是由一个用户提交的聚焦查询。类似地,可以选择较高阈值以过滤掉被频繁提交的查询,因为这些查询趋于为通用查询(例如,信用卡)或为时事或通俗文化兴趣的查询(例如,名人的名字)。
查询提取器302还可以使用时间标准来分析查询的时间以确定查询是否是商业上相关的。查询不可能在不同时间均具有相同水平的商业相关度。例如,因为人们更可能在万圣节期间搜索化装用服装,所以“pirate eye patch(海盗眼罩)”的查询在万圣节期间可以是商业上相关的。该相同查询在非万圣节时间段可以不是商业上相关的。
查询提取器302还可以使用类型标准来分析查询的类型以确定查询是否是商业上相关的。在一些实施方式中,如果查询不针对商业提供,则它不是商业上相关的。因此,提取标准308可以用于排除为教育的、新闻相关的或不针对商业提供的查询。例如,提取标准308可以将教育网站、新闻站点、当前事件和查询短语(诸如“如何…”查询、“……的历史”查询等)识别为不针对商业提供的查询的类型。
其它提取标准308也可以用于识别候选查询。在一些实施方式中,如果已经存在与查询相关联的广告,则该查询不是商业上相关的。如果查询具有较低的点进率,则查询也可以不是商业上相关的;或者是已经根据提取标准308选择的词干查询的扩展等。
作为示例,在识别候选查询的过程中,查询提取器302可以遇见如表格1中所示的为可能的候选查询的一系列不相关的查询。
查询 | 提交的# |
Mr.Celebrity | 1,000,000 |
red box | 48,000 |
train cake pans | 23,000 |
Battle Tactics | 32,000 |
表格1:可能的候选查询
提取标准308可以指定在一个月内最少提交数为50,以及在该同一个月内最多提交数为50,000。第一查询“Mr.Celebrity”是被提交了多于必要最少次数的非常常见的查询。然而,对于第一查询,提交频率还超过了最多提交数。因此,查询提取器302不将“Mr.Celebrity”识别为候选查询。
其它三个查询“red box”、“train cake pans”以及“Battle Tactics”是被提交在提交频率范围内的查询。因此,这些中的每一个被识别为候选查询。
§3.2对候选查询着陆页和查询-页面候选元组的识别
图4是(例如,与查询-页面识别器114相关联的)示例候选查询-页面过程的框图400。在一些实施方式中,候选查询搜索评估器408可以使用搜索引擎112和真子集标准406和候选查询来识别与候选查询306相关的着陆页。着陆页由候选查询搜索评估器408使用来识别查询-页面候选元组410。
为了识别与候选查询有关的着陆页,搜索引擎112可以使用候选查询306来搜索web索引120的真子集。查询页面识别器114可以使用真子集标准406来识别真子集。在一些实施方式中,真子集标准406从web索引120仅仅识别包括或可能包括商业提供的页面。
在一些实施方式中,真子集标准406通过识别网页的类型来识别带有商业提供的网页。不将诸如新闻页、博客、论坛等的页面包括在真子集中,而将与公司或零售商有关的页面包括在待被搜索的真子集中。这些页面可以由例如域名列表;诸如.biz、.com、.org、.edu的顶级域扩展;或网站来识别和区分。
在一些实施方式中,真子集标准406识别可以指示商业提供的数据。在一些实施方式中,真子集标准406可以包括商业意图的常见用语,例如“购买”、“出售”、“购物车”等。也可以使用用于确定网页是否具有商业提供的其它标准,例如,被链接到带有商业提供的页面的网页可以被视为商业提供,并且将之包括在真子集中。在一些实施方式中,其它考虑(即,除了商业提供)可以用于评估子集。
在一些实施方式中,真子集标准406识别已请求网页被搜索的广告主102的网页。例如,广告主可以提供它的域的站点地图以包括在真子集标准406中。
候选查询搜索评估器408可以促使搜索引擎112对由真子集标准406定义的web索引120的真子集搜索与候选查询306有关的着陆页。在一些实施方式中,搜索引擎112可以将相关度分值分配给关于每一个候选查询的从web索引120的真子集返回的每一个着陆页。例如,候选查询306可以包括查询“train cake pans”。搜索引擎112可以对真子集搜索对候选查询“train cake pans”作出响应的着陆页。对“traincake pans”作出响应的所有着陆页可以被分配表格2中所指示的相关度分值。
着陆页 | 相关度分值 |
www.<Cake Pan Store A(蛋糕盘商店A)>.com | 98 |
www.<Kitchen Products Store B Cake Pans(厨房产品商店B蛋糕盘)>.com | 92 |
www.<Baking Products Store C(烘焙产品商店C)>.com | 87 |
www.<General Products Store D(普通产品商店D)>.com | 72 |
www.<General Products Store E(普通产品商店E)>.com | 63 |
表格2:对“Train Cake Pans”作出响应的着陆页
候选查询搜索评估器408可以基于着陆页的相关度分值来选择从真子集识别的着陆页。在一些实施方式中,候选查询搜索评估器408只选择具有超过相关度阈值的相关度分值的着陆页。例如,如果相关度阈值是85,则对于候选查询“train cake pans”,所列出的商店A、B和C的着陆页—其每一个被分配有高于相关度阈值85的相关度分值—是足够相关的,以至于它们被候选查询搜索评估器408选择。
然后将这些选择的着陆页与查询-页面候选元组410中的相应候选查询进行关联。例如,基于相关度阈值85,表格3列出了关于候选查询“train cake pans”的查询-页面候选元组。
″train cake pans″&Cake Pan Store A |
″train cake pans″&Kitchen Products Store B Cake Pans |
″train cake pans″&Baking Products Store C |
表格3:关于“Train Cake Pans”的查询-页面候选元组
由于商店D和商店E的着陆页没有超过相关度阈值85,所以不将用于那些商店的着陆页包括在带有候选查询“train cake pans”的候选元组中。
在一些实施方式中,搜索引擎112可以被配置为在识别查询-页面候选元组时针对web索引120的真子集执行修改后的搜索。例如,可以在排名过程中省略诸如预测的点进率的查询的估计性能,以及排名可以仅仅取决于候选查询与web文档的内容的相关程度。还可以进行其它搜索算法修改,例如忽略关键词出价;忽略地理因素;等等。
§3.3对查询-页面候选元组进行过滤
图5是(例如,与查询-页面识别器114相关联的)示例过滤过程的框图。在一些实施方式中,过滤器502可以用于从查询-页面候选元组410选择满足一个或多个过滤标准的查询-页面元组。过滤标准例如可以包括主要意图测量、查询-页面意图测量、通用查询列表和/或被选择来排除不会导致商业上可行的广告建议的查询-页面候选元组的其它标准。
在一些实施方式中,过滤器502可以从候选元组410选择可能向广告主展示较好的广告机会的元组。在一些实施方式中,候选元组仅在候选查询的主要意图与候选元组410的选择的着陆页的意图相匹配的情况下才展示可能的广告机会。因此,在不存在候选查询的主要意图的情况下或者在候选查询的主要意图与所选择的着陆页的意图不相匹配的情况下,候选元组410不展示可能的广告机会。
§3.3.1主要意图过滤
在一些实施方式中,候选查询的主要意图可以通过使用候选查询的意图向量来进行测量。意图向量是响应于使用候选查询来搜索整个web索引120而返回的搜索结果的向量表示。在一些实施方式中,例如,意图向量包括来自所识别的着陆页的通常相关联的词语,例如来自10个最高排名的着陆页的词语。
在一些实施方式中,过滤器502可以使用意图向量中的词语来计算意图测量。意图测量识别候选查询是否具有主要意图。在一些实施方式中,对于其着陆页产生具有高意图测量的意图向量的候选查询具有主要意图;相反地,对于其着陆页产生具有低意图测量的意图向量的候选查询没有主要意图。低意图测量指示候选查询可能是通用查询;或可能是为用户的兴趣的拙劣表达的查询。
例如,表格4识别了来自通过使用候选查询“train cake pan”来识别的着陆页的通常相关联的词语。
表格4:“train cake pans”的意图向量
候选查询“train cake pans”的主要意图可以通过分析表格4来确定。因为与候选查询“train cake pans”通常相关联的所有词语暗示候选查询“train cake pans”的主要意图可以被分类为与烘焙盘有关的,所以候选查询“train cake pans”具有高意图测量。由于候选查询“traincake pans”具有高意图测量,所以它可以展示可能的广告机会。
相反地,表格5识别了与候选查询“red box(红框)”通常相关联的词语。
表格5:“red box”的意图向量
由于不存在由与候选查询“red box”相关联的词语所识别的主要意图,所以候选查询“red box”不会有高意图测量。候选查询“red box”的低意图测量指示“red box”是通用词语,以及通常相关联的词语彼此不相关。由于不存在主要意图,所以候选查询“red box”不会展示可能的广告机会。
§3.3.2离题(Off-Topic)过滤
在一些实施方式中,过滤器502还可以使用建议向量来确定候选查询的主要意图是否与建议的着陆页的意图相匹配,或候选查询是否是导致从整个web索引120识别与查询-页面候选元组中的着陆页离题的着陆页的查询。在一些实施方式中,是为候选元组410的一部分的着陆页的向量表示的建议向量可以用于测量为候选元组410的一部分的着陆页的意图。可以将建议向量与基于响应于使用候选查询来搜索整个web索引120而返回的搜索结果的意图向量进行比较。
在一些实施方式中,生成着陆页中的每一个的识别着陆页上—例如,在着陆页的标题、着陆页的URL以及遍及着陆页的短语中—的单词的建议向量。例如,表格6识别了与查询“train cake pans”配对的着陆页的建议向量。
表格6:与“Train Cake Pans”有关的着陆页的建议向量
在表格6中,识别了每一个着陆页的代表性单词。蛋糕盘商店A的代表性单词指示着陆页针对蛋糕盘和烘焙供给。类似地,商店B和商店C着陆页的代表性单词指示着陆页中的每一个针对烘焙产品和厨房供给。因此,着陆页中的每一个的建议向量均针对烘焙产品和厨房工具。
在一些实施方式中,如果候选查询的主要意图与关于该候选查询的着陆页的意图不相同,则广告主不可能想要在该着陆页上做广告。因此,在一些实施方式中,过滤器502将候选查询的建议向量与候选查询的意图向量进行比较以生成相似性测量。意图向量与建议向量的相似性测量识别候选查询在用于搜索整个索引120时的意图与在用于搜索web索引120的真子集时的意图的相似性程度。具有超过相似性阈值的相似性测量的候选元组410被确定是切题的并且被存储在查询-页面元组中,而不具有超过相似性阈值的相似性测量的候选元组410被确定为是离题的并且不被存储在查询-页面元组504中。可以使用其它数据结构。
例如,候选查询“train cake pans”的意图向量将烘焙盘识别为候选查询的主要意图。额外地,来自候选元组410的着陆页的建议向量识别着陆页针对烘焙产品。因此,将“train cake pan”查询-页面候选元组410存储为查询页面元组504。
在一些实施方式中,不将候选查询的意图与元组的着陆页的意图不相匹配的候选元组410存储为查询页面元组504。例如,表格7识别了与候选查询“Battle Tactics(战役战术)”通常相关联的词语。
表格7:“Battle Tactics”的意图向量
候选查询“Battle Tactics”的主要意图可以通过分析表格7来确定。与候选查询通常相关联的所有词语均与对军事战术和战争的研究有关。因此,候选查询“Battle Tactics”具有与对军事战术和战争的研究有关的高意图测量。
表格8识别了与同样是“Battle Tactics”候选元组410的一部分的着陆页—即通过用查询“Battle Tactics”搜索web索引120的真子集来识别的页面—通常相关联的词语。
表格8:与“Battle Tactics”有关的着陆页的建议向量
与查询“train cake pan”候选元组的意图的相似性相比,候选查询“Battle Tactics”的主要意图与基于“Battle Tactics”候选查询-页面元组的建议向量的意图不相匹配。候选查询“Battle Tactics”的建议意图向量将视频游戏识别为候选查询的主要意图。因此,当查询“BattleTactics”被提交给搜索引擎时,所识别的与军事史有关的web文档可能与视频游戏不相关。因此,为了阻止对与所识别的搜索结果离题的广告的派发,不将“Battle Tactics”候选元组410存储为查询-页面元组504。
§3.4将查询-页面元组与广告进行关联
在识别了查询-页面元组504之后,可以将查询-页面元组504与广告进行关联。图6a是图示了查询-页面元组504与存储在广告组212中的广告的示例关联的框图600。在一些实施方式中,广告组212是关键词、广告和着陆页的关联的集合,以及可以例如用于实现以及定义广告活动。典型地,广告组212识别广告主出价的关键词,以及与那些关键词相关联的广告。如果广告主赢得拍卖中的广告位(slot),则与搜索结果一起显示相关联的广告,所述拍卖诸如响应于接收带有广告组212中关键词中的一个或多个的查询而进行的拍卖。在一些实施方式中,查询-页面识别器114可以用于扩增广告组212以将查询和/或关键词和相关联的着陆页包括在广告组212中。
在一些实施方式中,广告组分类器602将来自查询-页面元组504的候选查询的关键词与和广告组212中的广告相关联的关键词进行比较。例如,分类器602可以将候选查询的关键词与和现有广告相关联的关键词进行比较。还可以将候选查询的关键词的同义词与和广告相关联的关键词的同义词进行比较。还可以使用将候选查询与广告进行比较的其它方法。
基于该比较,广告组分类器602识别将查询-页面元组504与广告进行配对的建议的广告分组。可以建议广告与查询-页面元组504的配对用于作为建议606的关联,或者配对可以自动相互关联成广告组212。可以通过广告主前端608向广告主展示建议606。
图6b是图示了查询-页面元组504与广告组212中的现有广告的示例关联的框图625。在该示例中,广告组212包括包含指向着陆页的链接的广告。并且,着陆页已经由查询页面识别器114在查询-页面元组中识别。广告组分类器602可以通过将查询添加到广告组212将与查询-页面元组中的着陆页相关联的查询与广告组212进行关联。在一些实施方式中,查询被添加为关键词字符串,以及广告组212被配置为在接收查询时选择链接到着陆页的广告。因此,下一次查询由用户提交时,广告管理系统104将从广告组选择包括指向着陆页的链接的广告用于拍卖。
作为示例,用于蛋糕盘商店A的着陆页已经与广告组212中的广告相关联。然而,蛋糕盘商店A未对查询“train cake pans”做广告。因此,广告组分类器602将查询“train cake pans”与广告组212中的用于蛋糕盘商店A着陆页的广告相关联。
图6c是图示了查询-页面元组504与广告的示例关联的框图650。在该示例中,来自查询-页面元组的查询已被识别为与广告组212的关键词相关,例如查询可以包括在广告组212中的关键词。因此,可以自动或响应于广告主接受将查询包括在广告组212中的建议,将查询包括在广告组212中。尽管广告组212不包括链接到与查询相关联的着陆页的广告,但是广告组分类器602可以生成将查询-页面元组的候选查询与查询-页面元组的着陆页进行关联的新的广告。可以将新生成的广告包括在广告组中。
作为示例,用于厨房产品商店B蛋糕盘的着陆页包含与“train cakepans”有关的商业提供。尽管厨房产品商店B蛋糕盘着陆页是包含对“train cake pans”的商业提供的着陆页,但是它不与任何广告相关联,或以广告组212中的关键词做广告。因此,广告组分类器602创建链接到厨房产品商店B蛋糕盘着陆页的另一个广告,并且将例如“traincake pans”的候选查询与用于该着陆页的广告进行关联。因此,下一次查询由用户提交时,广告管理系统104将从广告组选择包括指向着陆页的链接的广告用于拍卖。
图6d是图示查询-页面元组与广告的示例关联的另一个框图675。在该示例中,广告主可能没有现有广告活动,因此不存在查询-页面元组可以与之相关联的现有广告数据212。
图6b和6c图示了两个示例过程,通过其将包括选择的候选查询和相关联的web文档的查询-页面元组与广告组212进行关联。还可以使用其它关联过程。
在一些实施方式中,查询-页面元组504可以用于向广告主102建议广告。例如,通过使用广告管理系统104,广告主102可以接收用于它的着陆页中的一个的广告机会的通知以及如由查询-页面元组504所定义的一个或多个建议的查询。如果广告主102接受建议,则可以为广告主创建相应的广告数据212。例如,广告主102可以向广告管理系统104提供创意、出价信息以及预算以开始对用于查询-页面元组504所指示的着陆页的提供做广告。
在一些实施方式中,广告组分类器602可以处理广告主102的网站的站点地图,以及可以建议用于站点地图的内节点的广告数据,其中对于站点地图的内节点,孩子着陆页被包括在查询-页面元组504中。例如,出售服装服饰的零售商可以具有包括节点“Shoes(鞋)”的站点地图,节点“Shoes”进而包括孩子节点“Women′s Shoes(女鞋)”和“Men′s Shoes(男鞋)”。零售商可以在为“Women′s Shoes”和“Men′sShoes”节点的孩子的相应web文档中提供特定品牌的被鞋制造商市场宣传为便装和舒适的鞋的女鞋和男鞋。查询-页面识别器可以为这些web文档中的每一个识别查询-页面元组504,并且向零售商提供这些建议。通过使用查询-页面元组504,零售商可以形成用于特定鞋的广告活动。
§3.5查询-页面元组的其它用途
查询-页面元组504具有除帮助定向广告外的其它用途。例如,查询-页面元组504可以用于生成描述某些类别的相关用户查询的查询-类别图704。图7是图示了查询-页面元组504与查询类别的示例关联的框图700。在一个实施方式中,查询归类器702可以访问查询-页面元组和web目录706来生成查询-类别图704。Web目录706可以是根据层次类别分类的预先存在的web文档目录。示例web目录包括OpenDirectory Project(开放目录专案)、Google Directory(Google目录)或在其中web文档被组织成类别的任何其它目录。
查询归类器702可以识别类别目录中的查询-页面元组的所选择的web文档所属的类别,以及可以将候选查询与所识别的类别进行关联,以使可以响应于对所识别的类别的选择而展示候选查询。
在一些实施方式中,查询-页面识别器114可以将不同的提取标准、真子集标准和过滤标准用于每一个类别。例如,在为包括商业提供的web资产处理web索引120和查询日志128时,可以使用上述的提取标准和过滤标准。相反地,对于与商业提供的主题不相关的web资产,例如政府站点、.edu和.org站点等,其它提取和过滤标准可以用于识别其它主题相关度的相关内容。例如,在为教育主题相关度识别查询-页面元组504时可以包括包含短语“research paper(学术论文)”的查询和/或页面,以及对于教育主题相关度可以排除包括词语“shopping cart(购物车)”的查询和/或页面。同样地,也可以跟随(tail)真子集标准来识别web索引120的与主题相关度有关的子集。
在一些实施方式中,真子集标准可以基于包括在每一个类别中的web资产来定义web资产的真子集,以及可以将对识别查询-页面元组504的随后处理限制在每一个类别子集中的页面。
如果查询-页面元组的着陆页未展示在web目录706中,则在一些实施方式中,查询归类器702可以基于着陆页的可能归类来识别待与候选查询进行关联的类别。例如,查询归类器702可以基于着陆页中的关键词来识别着陆页的可能归类。
帮助定向广告和查询归类是可以如何使用查询-页面元组504的两个示例。使用上述过程,查询-页面元组504可以为例如商业的、教育的、宗教的、政治的等的任何类型的相关度因素创建,以及可以用于帮助更有效和更高效地分发相关信息。例如,可以识别与税务申报有关以及与政府机构的税务相关web文档相关的查询,以及可以在用于那些查询的搜索结果页中提升这些web文档。
§4.0示例过程流程
图8是用于识别查询-页面候选元组的示例过程800的流程图。过程800可以例如由图1的查询-页面识别器114并且如图2-4中所描述的来实现。
阶段802识别候选查询。候选查询可以由查询-页面识别器114或查询提取器302从查询日志识别。在一些实施方式中,只有商业上相关的查询被识别为候选查询。然而,也可以使用用于选择的其它标准,诸如教育上相关、金融上相关等的查询。
阶段804为多个web文档生成相关度分值。相关度分值测量候选查询与多个web文档中的每一个的相关度。例如,查询-页面识别器114或候选查询搜索评估器40可以促使搜索引擎112为在阶段802中识别的候选查询中的每一个搜索用于web文档的web文档索引。响应于候选查询而返回的web文档中的每一个包括关于候选查询的相关度分值。所搜索的web文档可以是存储在web索引120中的以及如由真子集标准406所定义的web文档真子集。
阶段806选择web文档。例如,查询-页面识别器114或候选查询搜索评估器408可以基于web文档的相关度分值从在阶段804中识别的web文档集选择web文档。在一些实施方式中,只有具有超过相关度阈值的相关度分值的web文档才被查询-页面识别器114选择。
阶段808将web文档与候选查询进行关联。例如,如果web文档相关度分值超过相关度阈值,则查询-页面识别器114或候选查询搜索评估器408可以将web文档与候选查询关联成为查询-页面候选元组410。
图9是用于查询提取的过程900的流程图。过程900可以例如由图1的查询-页面识别器114和/或图3的查询提取器302来实现。过程900可以例如用于实现图8的阶段802。
阶段902识别查询。例如,查询-页面识别器114或查询提取器302可以从查询日志128识别查询。
阶段904确定查询是否被提交了多于最少次数。例如,查询-页面识别器114或查询提取器302可以从对查询日志128的分析来确定查询在一段时间期间是否被提交了多于最少次数,例如在一个月期间多于50次。
如果确定查询已被提交了多于最少次数,则阶段906确定查询是否被提交了少于最多次数。例如,查询-页面识别器114或查询提取器302可以从对查询日志128的分析来确定查询在一段时间期间是否被提交了多于最多次数,例如在一个月期间多于50,000次。
如果确定查询已被提交了少于最多次数,则阶段908将查询识别为候选查询。例如,查询-页面识别器114或查询提取器302可以将所选择的查询识别为候选查询,并且将候选查询存储在候选查询存储306中。
其它算法提取过程也可以用于识别候选查询。除图9的最小提交阈值和最大提取阈值外或替代图9的最小提交阈值和最大提取阈值,可以使用这些其它算法提取过程。
真子集标准406可以用于识别web索引120的真子集以生成第一搜索结果集,以及可以搜索整个web索引120来识别第二搜索结果集。
图10是用于过滤查询-页面候选元组的示例过程1000的流程图。过程1000可以例如由图1的查询-页面识别器114和/或图4的候选查询搜索评估器408以及图5的过滤器502来实现。过程1000可以用于对过程800生成的查询-页面候选元组进行过滤。
阶段1002选择候选查询-页面元组。例如,图1的查询-页面识别器114和/或候选查询搜索评估器408可以从查询-页面候选元组410选择候选查询-页面元组。
阶段1004搜索文档集合。例如,查询-页面识别器114或候选查询搜索评估器408可以促使搜索引擎用所选择的查询-页面候选元组的候选查询来搜索整个web索引120。
阶段1006生成第一向量。例如,查询-页面识别器114或过滤器502可以为在查询-页面候选元组中识别的web文档生成建议向量。
阶段1008生成第二向量。例如,查询-页面识别器114或过滤器502可以为响应于在阶段1004中进行的对整个web索引120的搜索而识别的web文档生成意图向量。
阶段1010确定第一向量与第二向量的相似性测量。例如,查询-页面识别器114或过滤器502可以确定在建议向量与意图向量之间的相似性测量。
阶段1012确定第一向量与第二向量的相似性测量是否超过阈值。例如,查询-页面识别器114或过滤器502确定第一向量与第二向量的相似性测量是否超过阈值。
如果阶段1012确定第一向量与第二向量的相似性测量超过阈值,则阶段1014将查询-页面候选元组存储为查询页面元组。例如,查询-页面识别器114或过滤器502可以将所选择的查询-页面候选元组410存储为查询-页面元组504。
如果阶段1012确定第一向量与第二向量的相似性测量超过阈值,则过程1000返回到阶段1002。过程1000然后重复直到没有查询-页面候选元组410剩余待被处理。
图11是用于将查询-页面元组与广告组进行关联的示例过程1100的流程图。过程1100可以例如由查询-页面识别器114或图6的广告组分类器602来实现。
阶段1102将候选查询和相关联的web文档与广告组进行比较。例如,查询-页面识别器114或广告组分类器602可以将来自查询-页面元组的关键词与和广告组212中的广告相关联的关键词进行比较。查询-页面元组的关键词可以包括候选查询的关键词、相关联的web文档的关键词等。广告组的关键词包括来自广告与之相关联的搜索词语的关键词、来自广告的标题以及来自与广告相关联的着陆页的关键词等。
阶段1104确定候选查询和相关联的web文档与广告组是否相关。例如,基于阶段1102的比较,广告组分类器602可以确定查询-页面元组与广告组212是否相关。例如,当与广告组相关联的关键词包括候选查询的关键词中的一个或多个时,广告组分类器602确定候选查询和相关联的web文档与广告组相关。
如果确定候选查询与广告组相关,则阶段1106将候选查询和web文档与广告组进行关联。例如,如果查询-页面识别器114或广告组分类器602确定查询-页面元组与广告组相关,则可以将候选查询与广告组进行关联。广告组分类器602可以将候选查询与现有广告进行关联,或它可以基于现有广告来生成新的广告。
图12是用于将查询与类别进行关联的示例过程1200的流程图。过程1200可以例如由图1的查询-页面识别器114和/或图7的查询归类器702来实现。
阶段1202识别查询-页面元组。例如,查询-页面识别器114和/或查询归类器702可以从查询-页面元组504识别查询-页面元组。
阶段1204在类别目录中识别相关联的着陆页所属的类别。例如,查询-页面识别器114和/或查询归类器702可以识别web目录中的所选择的查询-页面元组的相关联的着陆页所属的类别。
阶段1204将候选查询与所识别的类别进行关联。例如,查询-页面识别器114和/或查询归类器702可以将所选择的查询-页面元组的候选查询与在阶段1204中识别的类别进行关联。
尽管在上面在各种示例中描述了特定类型的web资产,但是不将本说明书的主题限制在这些特定示例。可以将本说明书的主题扩展到任何类型的可选择的内容,所述任何类型的可选择的内容可以被分类入较大内容集的真子集以及为了它可以使用用于搜索较大内容集的查询来搜索真子集。这样的内容的示例包括音乐内容、音频内容、视频内容、印刷内容、广播内容、文章、博客等。
§5.0示例计算机系统
图13是示例计算机系统1300的框图。系统1300可以用于实现图1-7的查询-页面识别器114和/或查询提取器302、候选查询搜索评估器408、过滤器502、广告组分类器602和查询归类器702。然而,也可以使用其它计算机系统。系统1300可以包括处理器1310、存储器1320、存储设备1330以及输入/输出设备1340。组件1310、1320、1330、和1340中的每一个可以例如使用系统总线1350互连。处理器1310能够处理用于在系统1300内执行的指令。在一个实施方式中,处理器1310是单线程处理器。在另一个实施方式中,处理器1310是多线程处理器。处理器1310能够处理存储在存储器1320中或存储设备1330上的指令。
存储器1320存储在系统1300内的信息。在一个实施方式中,存储器1320是计算机可读介质。在一个实施方式中,存储器1320是易失性存储器单元。在另一个实施方式中,存储器1320是非易失性存储器单元。
存储设备1330能够为系统1300提供海量存储。在一个实施方式中,存储设备1330是计算机可读介质。在各种不同的实施方式中,存储设备1330例如可以包括硬盘设备、光盘设备或一些其它大容量存储设备。
输入/输出设备1340为系统1300提供输入/输出操作。在一个实施方式中,输入/输出设备1340可以包括例如以太网卡的网络接口设备、例如RS-232端口的串行通信设备和/或例如802.11卡的无线接口设备中的一个或多个。在另一个实施方式中,输入/输出设备可以包括驱动器设备,其被配置为接收输入数据以及将输出数据发送给例如键盘、打印机和显示设备1360的其它输入/输出设备。
在本说明书中描述的主题和功能性操作的实施例能够在数字电子电路中,或者在计算机软件、固件或硬件,包括在本说明书中公开的结构以及其结构等同物中,或者在以上一个或多个的组合中实现。可以将本说明书中描述的主题的实施例实现为一个或多个计算机程序产品,即,编码在有形的程序载体上的由数据处理装置执行或控制数据处理装置的操作的计算机程序指令的一个或多个模块。有形的程序载体可以是计算机可读介质。计算机可读介质可以是机器可读存储设备、机器可读存储基片、存储器设备、形成机器可读传播信号的物质成分或以上一个或多个的组合。
在此公开的处理设备包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或者多个处理器或计算机。除硬件外装置可以包括创建用于讨论中的计算机程序的执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理系统、操作系统或以上一个或多个的组合的代码。
计算机程序(也称作程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,所述编程语言包括编译或解释语言、或者说明性或过程语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或适于在计算环境中使用的其它单元。计算机程序没有必要对应于文件系统中的文件。可以将程序存储在保持其它程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的一部分、专用于讨论中的程序的单个文件或者多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。可以将计算机程序部署为在一个计算机上或者在位于一个地点或跨多个地点分布并且由通信网络互连的多个计算机上执行。
额外地,还可以利用在本专利文档中描述的逻辑流和结构框图来实现相应的软件结构和算法以及其等同物,所述逻辑流和结构框图描述了特定方法和/或支持步骤的相应动作以及支持所公开的结构性装置的相应功能。在本说明书中描述的过程和逻辑流可以由执行一个或多个计算机程序的一个或多个可编程处理器执行来通过操作输入数据并且生成输出来执行功能。
适于执行计算机程序的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机中的任何一个或多个处理器。通常,处理器从只读存储器或随机存取存储器或两者接收指令和数据。计算机的必要元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还包括或操作地耦接到用于存储数据的一个或多个海量存储设备,例如磁盘、磁光盘或光盘,以从所述一个或多个海量存储设备接收数据或将数据传送到所述一个或多个海量存储设备、或两者。
适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如:半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路补充,或合并入专用逻辑电路。
虽然本说明书包含许多具体的实施方式细节,但是不应当将这些细节解释为对任何发明或可以主张的内容的范围的限制,而应当解释为对可以特定于特定发明的特定实施例的特征的描述。还可以将在本说明书中在分离的实施例的情境中描述的某些特征组合在单个实施例中实现。相反地,也可以将在单个实施例的情境中描述的各个特征分离地在多个实施例中实现或在任何适当的子组合中实现。此外,尽管可能在上面将特征描述为在某些组合中起作用,甚至最初主张如此,但是可以在一些情况下将来自所主张的组合的一个或多个特征从组合中删去,以及可以将所主张的组合指向子组合或者子组合的变体。
类似地,虽然在附图中以特定顺序描绘了操作,但是不应当将这理解为需要以所示的特定顺序或者以连续顺序执行这样的操作、或者需要执行所有图示的操作才能达到期望的结果。在某些情况下,多任务以及并行处理可以是有利的。此外,不应当将在上述实施例中的各种系统组件的分离理解为在所有实施例中均需要这样的分离,而应当理解的是,通常可以将所描述的程序组件和系统集成到一起成为单个软件产品或封装为多个软件产品。
已描述了在本说明书中描述的主题的特定实施例。其它实施例在所附权利要求的范围内。例如,可以以不同的顺序执行权利要求中记载的动作,并且仍然达到期望的结果。作为一个示例,在附图中描绘的过程不必需要所示的特定顺序或连续顺序,才能达到期望的结果。在某些实施方式中,多任务以及并行处理可以是有利的。
Claims (24)
1.一种用于预测性查询识别的方法,包括:
从存储在查询日志中的查询识别候选查询;
为多个web文档生成相关度分值,每一个相关度分值与相应的web文档相关联并且是所述候选查询与所述web文档的相关度的测量,所述生成步骤包括:利用所述候选查询只搜索web文档集合的真子集,所述web文档集合的所述真子集是所述多个web文档;
选择具有超过相关度阈值的相关联的相关度分值的web文档;以及
将所选择的web文档与所述候选查询进行关联,所述关联步骤包括:
利用所述候选查询来搜索所述web文档集合;
从对所述web文档集合的仅仅所述真子集的所述搜索的结果生成第一词语向量;
从对所述web文档集合的所述搜索的所述结果生成第二词语向量;
确定所述第一词语向量与所述第二词语向量的相似性测量;以及
基于所述相似性测量超过相似性阈值,将所选择的web文档与所述候选查询进行关联。
2.根据权利要求1所述的方法,进一步包括:
将所述候选查询和所选择的web文档与广告组进行比较,所述广告组是关键词和广告的关联;
基于所述比较来确定所述候选查询和所选择的web文档与所述广告组是否相关;以及
如果所述候选查询和所选择的web文档与所述广告组相关,则将所述候选查询和所选择的web文档与所述广告组进行关联。
3.根据权利要求2所述的方法,其中将所述候选查询和所选择的web文档与所述广告组进行关联包括:
将所述候选查询与所述广告进行关联;以及
将所选择的web文档与所述广告进行关联,所述关联用来在响应于匹配所述候选查询的查询而提供所述广告时促使所述广告包括指向所选择的web文档的链接。
4.根据权利要求1所述的方法,其中将所选择的web文档与所述候选查询进行关联包括:
利用所述候选查询来搜索所述web文档集合;
从对所述web文档集合的所述搜索的结果生成第一词语向量;
从所述第一词语向量确定意图测量;以及
如果所述意图测量超过意图阈值,则将所选择的web文档与所述候选查询进行关联。
5.根据权利要求1所述的方法,其中从存储在查询日志中的查询识别候选查询包括:
从存储在查询日志中的所述查询识别查询;
确定所述查询在一段时间期间是否被提交了至少最少次数;
确定所述查询在所述一段时间期间是否被提交了少于最多次数;以及
如果所述查询在所述一段时间期间被提交了至少所述最少次数并且少于所述最多次数,则将所述查询识别为所述候选查询。
6.根据权利要求1、2或3所述的方法,其中识别候选查询包括识别针对商业提供的查询。
7.根据权利要求1或2所述的方法,进一步包括:
在类别目录中识别所选择的web文档所属的类别;以及
将所述候选查询与所识别的类别进行关联,以使能够响应于对所识别的类别的选择而展示所述候选查询。
8.根据权利要求1或2所述的方法,其中所述web文档是着陆页。
9.一种用于预测性查询识别的方法,包括:
从存储在查询日志中的查询识别候选查询;
对于每一个候选查询:
接收着陆页集合的相关度分值,所述着陆页集合是多个着陆页的真子集,并且每一个相关度分值与着陆页相关联并且是所述候选查询与所述着陆页的相关度的测量;
识别具有超过相关度阈值的相关联的相关度分值的着陆页;以及
将所述候选查询与所识别的着陆页进行关联,所述关联步骤包括:
从对所述着陆页集合的仅仅真子集的搜索的搜索结果生成第一词语向量;
从对所述着陆页集合的搜索的搜索结果生成第二词语向量;
确定所述第一词语向量与所述第二词语向量的相似性测量;以及
如果所述相似性测量超过相似性阈值,则将所述候选查询与所述着陆页进行关联。
10.根据权利要求9所述的方法,进一步包括,对于每一个候选查询:
将所述候选查询和所识别的着陆页与广告组进行比较,所述广告组是关键词和广告的关联;
基于所述比较来确定所识别的着陆页中的至少一个或所述候选查询与所述广告组是否相关;以及
响应于肯定确定,将所识别的着陆页中的所述至少一个和所述候选查询与所述广告组进行关联。
11.根据权利要求9所述的方法,其中将所述候选查询与所识别的着陆页进行关联包括,对于每一个候选查询:
从对所述着陆页集合的搜索的搜索结果生成第一词语向量;
从所述第一词语向量确定意图测量;以及
如果所述意图测量超过意图阈值,则将所述候选查询与所识别的着陆页进行关联。
12.一种用于预测性查询识别的系统,包括:
查询提取器,所述查询提取器从存储在查询日志中的查询识别候选查询;以及
候选查询搜索评估器,所述候选查询搜索评估器对于每一个候选查询,接收着陆页集合的相关度分值,所述着陆页集合是多个着陆页的真子集,并且每一个相关度分值与着陆页相关联并且是所述候选查询与所述着陆页的相关度的测量,并且将所述相关度分值与相关度阈值进行比较、并且如果相似性测量超出相似性阈值则将具有超过所述相关度阈值的相关度分值的着陆页与所述候选查询进行关联,所述关联步骤包括:
利用所述候选查询搜索所述着陆页集合;
从对着陆页集合的仅仅真子集的搜索的结果生成第一词语向量;
从对所述着陆页集合的搜索的结果生成第二词语向量;
确定所述第一词语向量与所述第二词语向量的相似性测量;以及
基于所述相似性测量超过所述相似性阈值,将具有超过所述相关度阈值的相关度分值的着陆页与所述候选查询进行关联。
13.根据权利要求12所述的系统,进一步包括:
过滤器,所述过滤器接收所述候选查询和相关联的着陆页,以及对于每一个候选查询和相关联的着陆页,基于相关度标准来过滤着陆页与所述查询的关联。
14.根据权利要求12所述的系统,进一步包括:
查询归类器,所述查询归类器对于每一个候选查询,在类别目录中识别所述相关联的着陆页所属的类别,以及将所述候选查询与所识别的类别进行关联,以使能够响应于对所识别的类别中的一个的选择而展示所述候选查询。
15.根据权利要求12所述的系统,进一步包括:
广告组分析器,所述广告组分析器对于每一个候选查询:
将所述候选查询和所述相关联的着陆页与广告组进行比较,所述广告组是关键词和广告的关联;
基于所述比较来确定所述候选查询和所述相关联的着陆页与所述广告组是否相关;以及
如果确定所述候选查询和所述相关联的着陆页与所述广告组相关,则将所述候选查询和所述相关联的着陆页与所述广告组进行关联。
16.一种用于预测性查询识别的方法,包括:
定义查询提取标准,所述查询提取标准被配置为识别与主题相关度有关的查询;
根据所述提取标准从存储在查询日志中的查询识别候选查询;
为第一web文档集生成相关度分值,每一个相关度分值与所述第一web文档集中的相应web文档相关联并且是所述候选查询与所述web文档的所述相关度的测量;
选择具有超过相关度阈值的相关联的相关度分值的web文档;
从所选择的web文档和所述候选查询生成查询-页面候选元组;
生成与所述第一web文档集有关的第一意图测量;
利用所述候选查询搜索第二web文档集,所述第二web文档集包括所述第一web文档集和额外的web文档;
从通过对所述第二web文档集的所述搜索而识别的web文档生成第二意图测量;以及
基于所述第一意图测量和所述第二意图测量来对所述查询-页面候选元组中的所述web文档进行过滤;以及
将过滤后的查询-页面候选元组存储为查询-页面元组。
17.根据权利要求16所述的方法,其中为所述第一web文档集生成相关度分值包括:
定义真子集标准,所述真子集标准被配置为将来自web文档集合的web文档真子集识别为所述第一web文档集,所述web文档真子集与所述主题相关度有关;以及
促使只有所述web文档真子集被使用所述候选查询来搜索。
18.根据权利要求16所述的方法,进一步包括:
将所述查询-页面元组与广告组进行比较,所述广告组是关键词和广告的关联;
基于所述比较来确定所述查询-页面元组与所述广告组是否相关;以及
如果所述查询-页面元组与所述广告组相关,则将所述候选查询和所述查询-页面元组中的至少一个web文档与所述广告组进行关联。
19.根据权利要求16所述的方法,进一步包括:
在类别目录中识别所述查询-页面元组的至少一个web文档所属的类别;以及
将所述候选查询与所识别的类别进行关联,以使能够响应于对所识别的类别的选择而展示所述候选查询。
20.根据权利要求16所述的方法,其中所述主题相关度是商业相关度。
21.根据权利要求16所述的方法,其中所述主题相关度是历史相关度。
22.一种用于预测性查询识别的系统,包括:
用于从查询日志提取候选查询的装置;
用于从所提取的候选查询和web文档集合生成查询-页面候选元组的装置,每一个查询-页面候选元组包括从所述查询日志所提取的查询以及所述web文档集合的至少一个web文档;以及
用于通过以下步骤来从所述查询-页面候选元组生成查询-页面元组的装置:
利用特定查询-页面候选元组的候选查询来搜索所述文档集合;
使用所述候选查询从对web文档集合的仅仅真子集的搜索的结果生成第一词语向量;
使用所述候选查询从对所述web文档集合的搜索的结果生成第二词语向量;
确定所述第一词语向量与所述第二词语向量的相似性测量;以及
基于所述相似性测量超过相似性阈值,生成包括所述候选查询以及所述特定查询-页面候选元组的所述至少一个web文档的查询-页面元组。
23.根据权利要求22所述的系统,进一步包括:用于将至少一个查询-页面元组与广告进行关联的装置。
24.根据权利要求22所述的系统,进一步包括:用于将来自至少一个查询-页面元组的查询与类别图进行关联的装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7494508P | 2008-06-23 | 2008-06-23 | |
US61/074,945 | 2008-06-23 | ||
PCT/US2009/048159 WO2010008800A2 (en) | 2008-06-23 | 2009-06-22 | Query identification and association |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102124462A CN102124462A (zh) | 2011-07-13 |
CN102124462B true CN102124462B (zh) | 2015-04-01 |
Family
ID=41432301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980131937.XA Active CN102124462B (zh) | 2008-06-23 | 2009-06-22 | 查询识别和关联 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8171021B2 (zh) |
EP (1) | EP2313839A4 (zh) |
JP (1) | JP5542812B2 (zh) |
CN (1) | CN102124462B (zh) |
AU (1) | AU2009271386A1 (zh) |
BR (1) | BRPI0914623A2 (zh) |
CA (1) | CA2729067A1 (zh) |
WO (1) | WO2010008800A2 (zh) |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8060503B2 (en) * | 2006-12-22 | 2011-11-15 | Fujitsu Limited | Ranking nodes for session-based queries |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8171021B2 (en) * | 2008-06-23 | 2012-05-01 | Google Inc. | Query identification and association |
US8886636B2 (en) * | 2008-12-23 | 2014-11-11 | Yahoo! Inc. | Context transfer in search advertising |
US8812362B2 (en) * | 2009-02-20 | 2014-08-19 | Yahoo! Inc. | Method and system for quantifying user interactions with web advertisements |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US20110166928A1 (en) * | 2010-01-06 | 2011-07-07 | Sharitable, Llc | Method of Sharing Possessions among Friends Connected through a Social Network |
US20110238686A1 (en) * | 2010-03-24 | 2011-09-29 | Microsoft Corporation | Caching data obtained via data service interfaces |
US8392435B1 (en) * | 2010-04-14 | 2013-03-05 | Google Inc. | Query suggestions for a document based on user history |
US8533044B2 (en) * | 2010-04-14 | 2013-09-10 | Microsoft Corporation | Considering user-relevant criteria when serving advertisements |
US9129300B2 (en) * | 2010-04-21 | 2015-09-08 | Yahoo! Inc. | Using external sources for sponsored search AD selection |
US20110295678A1 (en) * | 2010-05-28 | 2011-12-01 | Google Inc. | Expanding Ad Group Themes Using Aggregated Sequential Search Queries |
US20120016741A1 (en) * | 2010-07-19 | 2012-01-19 | Google Inc. | Targeting content without keywords |
US8515968B1 (en) | 2010-08-13 | 2013-08-20 | Google Inc. | Tie breaking rules for content item matching |
CN102479193B (zh) * | 2010-11-22 | 2015-04-01 | 百度在线网络技术(北京)有限公司 | 一种基于匹配出价系数进行匹配搜索推广的方法和设备 |
US20120150657A1 (en) * | 2010-12-14 | 2012-06-14 | Microsoft Corporation | Enabling Advertisers to Bid on Abstract Objects |
US9519714B2 (en) * | 2010-12-22 | 2016-12-13 | Microsoft Technology Licensing, Llc | Presenting list previews among search results |
US9495461B2 (en) * | 2011-03-22 | 2016-11-15 | Excalibur Ip, Llc | Search assistant system and method |
US10643355B1 (en) | 2011-07-05 | 2020-05-05 | NetBase Solutions, Inc. | Graphical representation of frame instances and co-occurrences |
CN102890685B (zh) * | 2011-07-21 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 一种信息重定向的方法及设备 |
US8756218B1 (en) * | 2011-08-16 | 2014-06-17 | Google Inc. | Query classification based on search engine results |
US8190609B1 (en) * | 2011-08-18 | 2012-05-29 | Google Inc. | Identifying alternative products |
US9104751B2 (en) * | 2011-10-12 | 2015-08-11 | Microsoft Technology Licensing, Llc | Supplemental search results having social connection endorsement data on a SERP |
US9075799B1 (en) * | 2011-10-24 | 2015-07-07 | NetBase Solutions, Inc. | Methods and apparatus for query formulation |
US9727892B1 (en) * | 2011-10-28 | 2017-08-08 | Google Inc. | Determining related search terms for a domain |
US8983996B2 (en) | 2011-10-31 | 2015-03-17 | Yahoo! Inc. | Assisted searching |
US9164985B1 (en) | 2011-11-29 | 2015-10-20 | Google Inc. | Techniques for detecting poor machine translations of key terms |
US9858313B2 (en) * | 2011-12-22 | 2018-01-02 | Excalibur Ip, Llc | Method and system for generating query-related suggestions |
US20130211905A1 (en) * | 2012-02-13 | 2013-08-15 | Microsoft Corporation | Attractiveness-based online advertisement click prediction |
CN103365842B (zh) * | 2012-03-26 | 2016-08-24 | 阿里巴巴集团控股有限公司 | 一种页面浏览推荐方法及装置 |
US20130282481A1 (en) * | 2012-04-20 | 2013-10-24 | Increase Visibility Mexico, S. De R.L. De C.V. | System and methods for electronic advertising management |
US8849799B1 (en) * | 2012-05-09 | 2014-09-30 | Google Inc. | Content selection using boolean query expressions |
US9158857B2 (en) * | 2012-06-05 | 2015-10-13 | Google Inc. | Identifying landing pages for images |
US20140025657A1 (en) * | 2012-07-21 | 2014-01-23 | Trulia, Inc. | Automated landing page generation and promotion for real estate listings |
US10192238B2 (en) * | 2012-12-21 | 2019-01-29 | Walmart Apollo, Llc | Real-time bidding and advertising content generation |
US9536259B2 (en) * | 2013-03-05 | 2017-01-03 | Google Inc. | Entity-based searching with content selection |
US10860557B2 (en) | 2013-03-13 | 2020-12-08 | Salesforce.Com, Inc. | Systems, methods, and apparatuses for implementing change value indication and historical value comparison |
US20140280098A1 (en) * | 2013-03-15 | 2014-09-18 | Quixey, Inc. | Performing application search based on application gaminess |
US9418114B1 (en) | 2013-06-19 | 2016-08-16 | Google Inc. | Augmenting a content item using search results content |
US9305307B2 (en) | 2013-07-15 | 2016-04-05 | Google Inc. | Selecting content associated with a collection of entities |
US9298779B1 (en) | 2013-07-16 | 2016-03-29 | Google Inc. | Combining content with a search result |
US9342839B2 (en) | 2013-07-16 | 2016-05-17 | Google Inc. | Combining content with a search result |
EP2833307A1 (en) | 2013-07-30 | 2015-02-04 | Google, Inc. | Handling search queries |
US9436946B2 (en) | 2013-07-31 | 2016-09-06 | Google Inc. | Selecting content based on entities present in search results |
US9367529B1 (en) | 2013-07-31 | 2016-06-14 | Google Inc. | Selecting content based on entities |
CN103455552A (zh) * | 2013-08-01 | 2013-12-18 | 百度在线网络技术(北京)有限公司 | 基于兴趣词的兴趣点挖掘方法及装置 |
US20150088648A1 (en) * | 2013-09-24 | 2015-03-26 | Google Inc. | Determining commercial intent |
US9299028B2 (en) * | 2013-11-04 | 2016-03-29 | Adobe Systems Incorporated | Identifying suggestive intent in social posts |
US10311364B2 (en) | 2013-11-19 | 2019-06-04 | Salesforce.Com, Inc. | Predictive intelligence for service and support |
EP2884444A1 (en) * | 2013-12-10 | 2015-06-17 | Google, Inc. | Handling search queries |
US9672288B2 (en) | 2013-12-30 | 2017-06-06 | Yahoo! Inc. | Query suggestions |
US9652508B1 (en) | 2014-03-05 | 2017-05-16 | Google Inc. | Device specific adjustment based on resource utilities |
US20150379074A1 (en) * | 2014-06-26 | 2015-12-31 | Microsoft Corporation | Identification of intents from query reformulations in search |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US9747896B2 (en) | 2014-10-15 | 2017-08-29 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10817519B2 (en) * | 2016-06-06 | 2020-10-27 | Baidu Usa Llc | Automatic conversion stage discovery |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
CN109992764B (zh) * | 2017-12-29 | 2022-12-16 | 阿里巴巴集团控股有限公司 | 一种文案生成方法及装置 |
US11314794B2 (en) * | 2018-12-14 | 2022-04-26 | Industrial Technology Research Institute | System and method for adaptively adjusting related search words |
CN110555165B (zh) * | 2019-07-23 | 2023-04-07 | 平安科技(深圳)有限公司 | 信息识别方法、装置、计算机设备和存储介质 |
US20220035675A1 (en) * | 2020-08-02 | 2022-02-03 | Avatar Cognition Barcelona S.L. | Pattern recognition system utilizing self-replicating nodes |
CN115037739B (zh) * | 2022-06-13 | 2024-02-23 | 深圳乐播科技有限公司 | 文件传输方法、装置、电子设备及存储介质 |
US20240004947A1 (en) * | 2022-06-30 | 2024-01-04 | Citrix Systems, Inc. | Systems and Methods of Determining Web Resource Relevance |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1826596A (zh) * | 2002-09-24 | 2006-08-30 | Google公司 | 用于提供相关广告服务的方法和装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772150B1 (en) * | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
US7197497B2 (en) | 2003-04-25 | 2007-03-27 | Overture Services, Inc. | Method and apparatus for machine learning a document relevance function |
US20050033771A1 (en) | 2003-04-30 | 2005-02-10 | Schmitter Thomas A. | Contextual advertising system |
US20040249808A1 (en) * | 2003-06-06 | 2004-12-09 | Microsoft Corporation | Query expansion using query logs |
US7260568B2 (en) | 2004-04-15 | 2007-08-21 | Microsoft Corporation | Verifying relevance between keywords and web site contents |
CA2572468A1 (en) * | 2004-06-30 | 2006-01-12 | Shumeet Baluja | Generating and/or serving local area advertisements, such as advertisements for devices with call functionality |
JP2006079454A (ja) * | 2004-09-10 | 2006-03-23 | Fujitsu Ltd | 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置 |
US7840438B2 (en) * | 2005-07-29 | 2010-11-23 | Yahoo! Inc. | System and method for discounting of historical click through data for multiple versions of an advertisement |
US7962479B2 (en) * | 2005-11-09 | 2011-06-14 | Yahoo! Inc. | System and method for generating substitutable queries |
US7788131B2 (en) * | 2005-12-15 | 2010-08-31 | Microsoft Corporation | Advertising keyword cross-selling |
US20070192293A1 (en) * | 2006-02-13 | 2007-08-16 | Bing Swen | Method for presenting search results |
US7689554B2 (en) * | 2006-02-28 | 2010-03-30 | Yahoo! Inc. | System and method for identifying related queries for languages with multiple writing systems |
US7818315B2 (en) * | 2006-03-13 | 2010-10-19 | Microsoft Corporation | Re-ranking search results based on query log |
US7577643B2 (en) * | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
KR100851041B1 (ko) * | 2006-11-08 | 2008-08-12 | 엔에이치엔(주) | 유알엘 입력을 통한 광고 키워드 추천 방법 및 그 시스템 |
US7739264B2 (en) * | 2006-11-15 | 2010-06-15 | Yahoo! Inc. | System and method for generating substitutable queries on the basis of one or more features |
US7827172B2 (en) * | 2007-03-14 | 2010-11-02 | Yahoo! Inc. | “Query-log match” relevance features |
US20090192983A1 (en) * | 2008-01-28 | 2009-07-30 | Yahoo! Inc. | Method and system for mining, ranking and visualizing lexically similar search queries for advertisers |
US8171021B2 (en) * | 2008-06-23 | 2012-05-01 | Google Inc. | Query identification and association |
JP2010059671A (ja) | 2008-09-03 | 2010-03-18 | Chugoku Electric Power Co Inc:The | コンクリート構造物の型枠の固定装置 |
-
2009
- 2009-06-17 US US12/486,195 patent/US8171021B2/en active Active
- 2009-06-22 CN CN200980131937.XA patent/CN102124462B/zh active Active
- 2009-06-22 JP JP2011516497A patent/JP5542812B2/ja active Active
- 2009-06-22 AU AU2009271386A patent/AU2009271386A1/en not_active Abandoned
- 2009-06-22 CA CA2729067A patent/CA2729067A1/en not_active Abandoned
- 2009-06-22 EP EP09798466A patent/EP2313839A4/en not_active Withdrawn
- 2009-06-22 BR BRPI0914623A patent/BRPI0914623A2/pt not_active IP Right Cessation
- 2009-06-22 WO PCT/US2009/048159 patent/WO2010008800A2/en active Application Filing
-
2012
- 2012-04-30 US US13/460,009 patent/US8631003B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1826596A (zh) * | 2002-09-24 | 2006-08-30 | Google公司 | 用于提供相关广告服务的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011525678A (ja) | 2011-09-22 |
US20120215776A1 (en) | 2012-08-23 |
AU2009271386A1 (en) | 2010-01-21 |
JP5542812B2 (ja) | 2014-07-09 |
WO2010008800A3 (en) | 2010-03-25 |
EP2313839A2 (en) | 2011-04-27 |
WO2010008800A2 (en) | 2010-01-21 |
US20090319517A1 (en) | 2009-12-24 |
BRPI0914623A2 (pt) | 2015-10-20 |
US8631003B2 (en) | 2014-01-14 |
US8171021B2 (en) | 2012-05-01 |
CA2729067A1 (en) | 2010-01-21 |
EP2313839A4 (en) | 2012-12-19 |
CN102124462A (zh) | 2011-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102124462B (zh) | 查询识别和关联 | |
Cheng et al. | Personalized click prediction in sponsored search | |
US8886636B2 (en) | Context transfer in search advertising | |
US7225184B2 (en) | Disambiguation of search phrases using interpretation clusters | |
US20100030647A1 (en) | Advertisement selection for internet search and content pages | |
US7668823B2 (en) | Identifying inadequate search content | |
CN102033883B (zh) | 一种提高网站数据传输速度的方法、装置及系统 | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
CN105447186B (zh) | 一种基于大数据平台的用户行为分析系统 | |
US20170243244A1 (en) | Methods Circuits Devices Systems and Associated Machine Executable Code for Taste-based Targeting and Delivery of Content | |
US20070214050A1 (en) | Delivery of internet ads | |
CN103177384A (zh) | 基于用户兴趣图谱的网络广告投放方法 | |
KR20060103034A (ko) | 인터넷 광고 서비스 시스템 및 방법 | |
CN115905489B (zh) | 一种提供招投标信息搜索服务的方法 | |
Dias et al. | Automating the extraction of static content and dynamic behaviour from e-commerce websites | |
KR101020567B1 (ko) | 저작물 기반 광고 시스템 | |
US7949576B2 (en) | Method of providing product database | |
Prasetyo | Searching cheapest product on three different e-commerce using k-means algorithm | |
CN104809144A (zh) | 一种基于辅助关键词的个性化广告投放方法 | |
JP2011108034A (ja) | 複数の属性を利用したWebページ推薦方法 | |
KR101818716B1 (ko) | 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체 | |
Diapouli et al. | Behavioural Analytics using Process Mining in On-line Advertising. | |
Larsen et al. | The Impact of Large Language Models on Search Advertising: Evidence from Google’s BERT | |
CN115730990A (zh) | 一种广告商品推荐方法和系统 | |
CN114612126A (zh) | 一种基于大数据的信息推送方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: American California Patentee after: Google limited liability company Address before: American California Patentee before: Google Inc. |