CN101069150A - 使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主 - Google Patents

使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主 Download PDF

Info

Publication number
CN101069150A
CN101069150A CNA2005800414203A CN200580041420A CN101069150A CN 101069150 A CN101069150 A CN 101069150A CN A2005800414203 A CNA2005800414203 A CN A2005800414203A CN 200580041420 A CN200580041420 A CN 200580041420A CN 101069150 A CN101069150 A CN 101069150A
Authority
CN
China
Prior art keywords
document
implemented method
computer implemented
scores
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800414203A
Other languages
English (en)
Inventor
蒂莫西·马修·迪克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101069150A publication Critical patent/CN101069150A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0247Calculate past, present or future revenues

Abstract

广告递送系统希望方便有效地发现好的广告伙伴。为此,对诸如爬取网页[320]、访问统计数据、广告出价等可用数据进行分析[310]。基于网页的估算收益对可用的网页评分并排序[330]。然后过滤[360]经评分和排序的网页以去除被认为前景不好的文档和/或具有被认为使文档前景不好的特性的文档[340],然后提供给广告递送系统以进一步使用[370]。

Description

使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主
技术领域
本发明涉及广告业。特别,本发明帮助广告递送系统识别表现出良好前景的网页用来作为广告宿主。
背景技术
使用诸如电视、广播、报纸和杂志的传统媒体的广告是众所周知的。遗憾的是,即使使用了人口统计研究资料和关于各个媒体的典型受众的完全合理的假设,广告主还是发现大量的广告预算纯粹是浪费。而且,要识别和消除这种浪费也很难。
近来,经由更交互式媒体的广告变得普及。例如,随着使用因特网的人数激增,广告主开始认识到经由因特网提供的媒体和服务成为潜在的强有力的广告方式。
交互式的广告向广告主提供了机会,使得他们可以把那些乐于接收的受众作为目标来投放他们的广告。即,有目标投放的广告更可能对最终用户有用,因为这些广告与根据某些用户活动所推断的需求有关(例如,与用户对搜索引擎的搜索查询有关,与用户请求的文档中的内容有关等)。搜索引擎已经在使用与查询关键词相关的广告。总部位于美国加利福尼亚州Mountain View市的谷歌公司(Google)的AdWords广告系统,是查询关键词相关广告的一个示例。类似地,已经提出了内容相关的广告系统。例如,在2002年12月6日提交、发明人为Jeffrey A.Dean、Georges R.Hank和Paul Buchheit、名称为“METHODS AND APPARATUS SERVING RELEVANTADVERTISEMENTS”、序列号为10/314,427的美国专利申请(其内容通过引用并入此处以供参考并称为“427申请”);以及在2003年2月26提交、发明人为Darrell Anderson、Paul Buchheit Alex Carobus、Claire Cui、Jeffrey A.Dean、Georges R.Harik、Deepak Jindal和Narayanan Shivakumar、名称为“SERVING ADVERTISEMENTS BASEDON CONTENT″的序列号为10/375,900的美国专利申请(其内容通过引用并入以供参考并称为″900申请″)都描述了相关于诸如网页之类的文档内容来提供广告的方法和设备。诸如谷歌的AdSense广告系统的内容相关广告已经用于在网页上提供广告。
诸如AdSense的按目标投放的广告系统已经如此普及,因此需要网页上更多的可用广告投放点(ad spot)来满足广告主持续增长的需求。因此,需要好的网页用作广告宿主。广告主和广告递送系统都想将他们的广告放在具有大通信业务量的内容丰富的网站和网页上。而寻找这种网站和网页是有难度的。例如,广告递送系统可以让雇员花费大量时间来搜索和浏览万维网(“网”)寻找内容丰富、具有大通信业务量的网站和网页,即前景良好的广告宿主。提供工具来帮助广告递送系统发现这种网站和网页是有益的。
发明内容
根据本发明的方法可以用于接收文档(例如,网页),对网页进行评分(例如,按照预期的页面浏览次数、每个页面浏览的预期广告收益、和/或预期页面浏览次数与每个页面浏览的预期广告收益的乘积),以及使用分数来排序经评分的各文档。
在根据本发明的至少一个实施例中,过滤各候选文档,以去除那些不大可能是具有良好前景的广告伙伴的文档。
在根据本发明的至少一个实施例中,过滤动作可包括去除属于预定文档集的文档,诸如去除属于预定网页集(例如网站)的网页。例如,过滤动作可以去除政府网页或已知具有排斥广告政策的文档。
附图说明
图1是示出可与广告系统相交互的各方或各实体的示意图。
图2是表示其中本发明可以在其中操作或使用的环境的示意图。
图3是按照本发明的方式执行的示例性操作的数据流图以及可能由这些操作使用和/或这些操作产生的信息。
图4是按照本发明的方式用于发现潜在网站或网页的示例性方法的流程图。
图5是根据本发明的用于至少执行某些操作和存储至少某些信息的设备的方框图。
图6是表示根据本发明示例性实施例的示例操作的框图。
具体实施方式
本发明涉及新颖的方法、设备、消息格式和/或数据结构,用于帮助发现前景良好的网站和/或网页以用作广告宿主。下面的说明使本领域技术人员可实施并使用本发明,并按特定的应用环境及其需求来提供这种说明。因而,在下面依照本发明的具体实施的说明书提供图示和说明,但不是意在穷举或把本发明限制到所公开的精确形式。所公开实施例的各种修改对于本领域技术人员是显而易见的,下面所论述的一般性原理可应用于其他实施例和应用。例如,虽然参照流程图描述了一系列动作,当一个动作的执行不依赖于另一动作的完成时,在其它实施例中各动作的次序可以不同。另外,非相关的动作可以并行执行。在说明书中,没有哪个要素、操作或指令应当被解释为对本发明是关键或必要的,除非明确如此说明。同样,如这里所采用的,不带有数量限定的项是指包括一个项或多个项。当只表示一个项时,使用术语“一个”或类似的语言。因而,本发明不限于所示出的各实施例,并且发明人认为其发明是所描述的任何可专利的主题。
下面,在§1提供本说明书中所使用的各种定义。然后,在§2中描述本发明可以在其中操作或使用的环境。然后,在§3中描述本发明的示例性实施例。在§4中提供操作的示例。最后,在§5中阐明关于本发明的某些结论。
§1定义
诸如下面参考图1、2和3所述的示例性系统或任何其它系统中所使用的在线广告可具有各种特征。这种特征可以由应用和/或广告主规定。这些特征在下文被称为“广告特征”。例如,对于文本广告的情形,广告特征可以包括标题行、广告文本、可执行代码、嵌入式链接等。对于图像广告的情况,广告特征可以另外包括图像等。取决于在线广告的类型,广告特征可以包括一个或多个如下内容:文本,链接,音频文件,视频文件,图像文件,可执行代码,嵌入信息等。
当进行在线广告服务时,一个或多个参数可以用于描述如何、何时和/或在何地进行广告服务。这些参数在下文被称为“服务参数”。服务参数可以包括例如一个或多个以下内容:用来在其上进行广告服务的页面的特征(包括信息)(包括所确定的与页面相关的一个或多个主题或概念,位于页面内的信息或内容,关于诸如该页面的主机(例如AOL,Yahoo等)等页面信息,通过按通信流量、新鲜度、至该页面的链接和该从页面发出的链接的数量和质量等来评价的重要性,该页面在目录结构内的位置等),与进行广告服务相关联的搜索查询或搜索结果,用户特性(例如,他们的地理位置,他们使用的语言,使用的浏览器类型,先前页面浏览,先前行为),发出了要求给予响应的广告服务请求的主机或附属站点(例如,美国在线,谷歌,雅虎),其上进行广告服务的页面上广告的绝对位置,相对于其它所服务广告的位置(空间或时间的),广告的绝对大小,广告相对于其它广告的大小,广告的颜色,所服务的其他广告的数量,所服务的其他广告的类型,服务的日时间,服务的周时间,服务的年时间等。当然,在本发明的范围内还可使用其他参数。
虽然服务参数对于广告特征来说是外在的,但服务参数可以与广告相关联作为条件或约束。当用作服务条件或约束时,这种服务参数被称为“服务约束”。例如,在某些系统中,广告主可以指定它的广告只在工作日(周一至周五)提供,不低于确定位置,只面向特定地点的用户等。作为另一示例,在某些系统中,广告主可以指定只有当页面或搜索查询包括特定的关键词或短语时才提供它的广告。
“广告信息”可以包括广告特征、广告服务约束、可从广告特征或广告服务约束导出的信息(被称为“广告导出信息”)和/或与广告相关的信息(被称为“广告相关信息”)以及该信息扩展(例如,从广告相关信息导出的信息)的任何组合。
“文档(document)”可被广泛的解释为包括计算机可读和机器可储存的工作产品。文档可以是文件(file)、文件的组合、具有至其他文件的嵌入式链接的一个或多个文件等。文件可以具有任何类型,比如文本、音频、图像、视频等。提供给最终用户的部分文档可以被看作是文档的“内容”。在文档中的广告投放点可以通过嵌入信息或指令来定义。在因特网环境下,通用的文档是Web页面。Web页面常常包括内容并可以包括嵌入的信息(比如元信息,超链接等)和/或嵌入的指令(比如javascript等)。许多情况下,文档具有唯一的、可寻址的存储位置并可以通过该可寻址位置来唯一标识。统一资源定位符(URL)是唯一化地址,用于访问因特网上的信息。
“文档信息”可以包括文档中所包含的任何特征,从文档中所包括的信息导出的信息(被称为“文档导出信息”),和/或与文档相关的信息(被称为“文档相关信息”),以及这些信息的扩展(例如,从有关信息导出的信息)。文档导出信息的示例是基于文档的文本内容的类别。文档相关信息的示例包括来自具有链接至当前文档的其它文档的文档信息,以及来自当前文档所链接到的其它文档的文档信息。
来自某个文档的内容可以呈现在某种“内容呈现应用程序或设备”上,内容呈现应用程序包括因特网浏览器(如Explorer或Netscape),媒体播放器(例如,MP3播放器,Realnetworks流式音频文件播放器等),阅览器(例如Abobe Acrobat阅读器)等。
§2其中本发明可以操作或可使用的环境
§2.1示例性的广告环境
图1是广告环境的高级示意图。该环境可以包括广告输入、维护和递送系统(简单地被称为广告服务器)120。广告主110可以直接或间接地输入、维护并且跟踪系统120中的广告信息。广告可以采用图形广告形式,诸如所谓的标题广告、仅有文本的广告、图像广告、音频广告、视频广告、组合任何这类组件的一个或多个的广告等。广告可能还包括嵌入信息,诸如链接和/或机器可执行指令。广告消费者130可以向系统120提交广告请求、从系统120接收对他们请求的广告响应、并向系统120提供使用信息。广告消费者130之外的其他实体可以发出对广告的请求。虽然未示出,但是其它实体可能向系统120提供使用信息(例如,有关该广告的转化(conversion)或点进(click-through)是否发生)。这些使用信息可以包括测量的或观察的与所服务广告有关的用户行为。
广告服务器120可以类似于在图2中描述的2003年2月26日提交并列出Darrell Anderson,Paul Bucheit,Alex Carobus,Claire Cui,Jeffrey A.Dean,Georges R.Harik Harik,Deepak Jindal,和NarayananShivakumar作为发明人的名称为“SERVING ADVERTISEMENTSBASED ON CONTENT”的序列号为10/375,900的美国专利申请。广告计划可以包括关于账户、活动、创意、目标确定等的信息。术语“账户(account)”是指用于给定广告主的信息(例如,唯一的电子邮件地址、口令、计费信息等)。“活动(campaign)”或“广告活动”是指一个或多个广告的一个或多个组,并可包括开始日期、结束日期,预算信息,地理目标信息,附属组织信息等。例如,本田公司可以有一个广告活动用于它的汽车线,以及相独立的广告活动用于它的摩托车线。用于它的汽车线的活动可以有一个或多个广告组,每个组包含一个或多个广告。每个广告组可以包括目标信息(例如,关键词集合,一个或多个主题的集合,地理位置信息,用户简档信息等),以及定价信息(例如,最大成本(每次点进的成本,每次转化的成本等))。作为替换或者除此之外,每个广告组可以包括平均成本(例如,每次点进的平均成本,每次转化的平均成本等)。因此,单个最大成本和/或单个平均成本可以与一个或多个关键词和/或主题相关。如上所述,每个广告组可以具有一个或多个广告或“创意(creative)”(即,最终呈现给最终用户的广告内容)。每个广告可能也包括至URL的链接(例如,登陆网页,诸如广告主的主页,或与特定产品或服务器相关联的网页)。自然地,广告信息可以包括或多或少的信息,并且可以按多种不同的方式组织。
图2示出了其中使用本发明的环境200。用户设备(也被称为“客户端”或“客户端设备”)250可能包括浏览器设施(比如微软公司的Explorer浏览器,挪威的opera软件公司的Opera Web Broswer,AOL/Time Warner的Navigator浏览器等),电子邮件工具(例如,微软公司的Outlook)等。搜索引擎220可以允许用户装置250搜索文档集(例如,网页)。内容服务器210可以允许用户装置250访问文档。00电子邮件服务器(比如Microsoft Network的Hotmail、Yahoo Mail等)240可以用来向用户装置250提供电子邮件功能。广告服务器210可以用来给用户装置250提供广告。广告可以与通过搜索引擎220提供的搜索结果相关联。然而,内容相关的广告可以与内容服务器230提供的内容和/或电子邮件服务器240和/或用户设备电子邮件设施提供的电子邮件相关。
如在序列号为10/375,900的美国专利申请(见前文的介绍)中讨论的,可以把内容服务器所提供的文档作为目标来投放广告。因而,广告消费者130的一个示例是一般内容服务器230,该内容服务器230接收对文档(例如,文章,讨论贴,音乐,视频,图形,搜索结果,网页目录等)的请求,并且响应该请求或其他服务而检索所请求的文档。内容服务器可以向广告服务器120/210提交对广告的请求。该广告请求可以包括多个所需的广告。广告请求可能同时包括文档请求信息。这些信息可以包括:文档本身(例如,页面),对应于文档内容或文档请求的类别或主题(例如,艺术,商业,计算机,艺术电影,艺术音乐等),部分或所有文档请求,内容年龄,内容类型(例如,文本,图形,视频,音频,混合媒体等),地理位置信息,文档信息等。
内容服务器230可以把所请求的文档与由广告服务器120/210提供的一个或多个广告组合在一起。然后将包括文档内容和广告的这种组合信息转发给请求文档的最终用户设备250,用来提供给用户。最后,内容服务器230可以发送关于广告以及如何、何时、和/或在何地呈现广告的信息(例如,位置,是否点进,显现(impression)时间,显现日期,大小,是否转化等)回到广告服务器120/210。或者,否则另外,通过其它的装置将该信息提供返回到广告服务器120/210。
广告消费者130的另一示例是搜索引擎220。搜索引擎220可以接收查询用于搜索结果。作为响应,搜索引擎可以检索相关搜索结果(例如,来自网页的索引)。一种示例性的搜索引擎是在澳大利亚的布里斯班的第七届国际万维网会议上S.Brin和L.Page的文章“TheAnatomy of a Large-Scale Hypertextual Search Engine”和序列号为6,285,999的美国专利中描述(在此将两者内容并入以供参考)。这种搜索结果包括例如网页标题的列表、从这些网页提取的文本摘录、和至这些网页的超文本链接,并且搜索结果可以分组为每组预定数目(例如十个)。
搜索引擎220可以向广告服务器120/210提交广告请求。请求可以包括若干所需的广告。该所需广告的数量可取决于搜索结果、由搜索结果占用的屏幕量或页面空间、广告的大小和形状等。在一个实施例中,所需广告的数目在一到十的范围,并且优选是三到五。对广告的请求还可包括查询(当输入或经句法分析时)、基于查询的信息(诸如地理位置信息,查询是否来自附属机构和该附属机构的标识符,和/或如下所述,涉及和/或源于搜索查询的信息),和/或与搜索结果相关或基于搜索结果的信息。该信息可以包括例如与搜索结果相关的标识符(例如,文档标识符或“docIDs”),与搜索结果评分(例如,信息检索IR)有关的评分(如对应于查询和文档的特征向量的点积),页面分级评分,和/或的IR评分和页面分级评分的组合),从识别文档提取的文本摘录(例如,网页),所识别文档的全文,所识别文档的主题,所识别文档的特征向量等。
搜索引擎220可以把搜索结果与由广告服务器120/210提供的一个或多个广告组合在一起。包括搜索结果和广告的这种组合信息然后转发给提交该搜索的用户,用于提供给该用户。优选的,维持搜索结果与广告相区别,避免使用户不能区分付费广告和中性搜索结果。
搜索引擎220可以把有关广告以及何时、何地、和/或如何呈现广告的信息(例如,位置,是否点进,显现时间,显现日期,大小,是否转化等)发送回到广告服务器120/210。如下所述,这种信息可以包括用于确定在什么基础上确定与广告相关的信息(例如,严格或宽松的匹配,或精确、短语、或宽泛的匹配等)。或者,作为替换或另外,通过其它的装置可将该信息提供回广告服务器120/210。
最后,一般地,电子邮件服务器240可被认为是内容服务器,其中所提供的文档就是电子邮件。进一步地,电子邮件应用程序(诸如Microsoft Outlook)可以用来发送和/或接收电子邮件。因此,电子邮件服务器240或应用程序可以被认为是广告消费者130。因而,电子邮件可以被认为是文档,并且可以与这种文档相关联地提供有目标投放的广告。例如,可以在电子邮件之中、之下、之上提供广告,或者按其他方式与电子邮件相关联。
虽然上述示例描述了由服务器(i)请求广告和(ii)组合广告与内容,但这些操作的一个或二者可以由客户端设备(诸如最终用户计算机)来执行。
§3示例性实施例
§3.1示例性的方法
图3是按照本发明的方式执行的示例性操作的数据流图以及由这些操作产生的和/或由这些操作使用的信息。这些操作可以共同来评分、排序、以及过滤文档信息以生成候选的网页和/或网站作为广告递送系统的潜在伙伴。
该系统可以包括文档评分和排序操作330,以及过滤操作360。文档评分和排序操作330获得文档信息320以及或许其它信息(例如广告信息)310以生成初始候选文档350。过滤操作360使用初始候选文档350,以及被认为是差候选(poor candidate)340的文档以产生候选文档370的最终集合。
文档信息320可以包含诸如爬取网页(crawled webpage)、访问统计数据等各种信息。其它信息310可以包括诸如出价(offer)、种类/主题/类别等的广告信息。
文档评分和排序操作330可以用来对从文档信息320中获取的每个爬取网页估算该网页可能有多少次页面浏览(对于一时间段)。类似地,可以对多个网页的组来估算页面浏览次数。此外,文档评分和排序操作330可以估算将广告置于文档或文档组上的经济值。产生的经济值可以利用所估算的页面浏览次数来加权。例如可以使用加权的经济值来排序列表。这样,可以使用文档评分和排序操作330生成初始候选文档的列表。
列表340可以包含被认为是差候选者的文档或文档特性。例如,竞争者网站和政府网站通常不会将任何广告放在他们的网页上。
过滤操作360使用初始候选文档350的列表,以及被认为是差候选340的文档的列表以产生候选文档370的最终集合。过滤操作360还可以使用其它因素,诸如已包含广告或由相同的广告递送系统在做的广告、不符合广告递送系统的广告标准的网页等。还可以根据市场段(商业类别,地理等)对该列表归类。候选文档370的最终集合可以由广告递送系统的业务开发雇员来使用,用于寻找伙伴网站和/或网页。
图4是按照本发明的方式用于执行本发明一个实施例的示例性方法400的流程图。方法400可以用于为上述的广告递送系统定位具有许多用户访问的内容丰富的网站。
特别,方法400获得候选文档(块410)。然后,候选文档被评分作为潜在的广告伙伴(块420)。然后使用所述评分对各候选文档进行排序(块430)。然后至少对某些经评分的文档进行过滤(块440)。然后在离开该方法400(结点460)之前,提供所过滤的排序文档的列表(块450)。
再参见块410,通过使用该广告递送系统的现有爬取库,方法400可得到一组网页。作为替换或者另外进行新的爬取。
再参见块420,可按下述方式把候选文档评分为潜在广告伙伴。对于每个候选网页,估算该网页(如在给定时段)得到的网页浏览次数。这种估算可以使用历史数据来完成,历史数据描述了在过去已经访问了该网页(或与其相关和/或相类似的网页)多少次。多个候选网页可组合在一起并作为整体估计它们的页面浏览次数。可以按许多方式获得历史数据。例如,可以使用工具条,当用户浏览网页时该工具条向广告递送系统转发网页信息查询。这给予广告递送系统浏览网页次数的采样。尽管如此,获得这种信息的其它方法也是可能的。例如,广告递送系统可以依赖从第三方访问类似数据的估计,诸如点击日志,给出各用户已从搜索结果点击至该网页的次数。作为替换或者补充,例如这种信息可以通过与作为该网页宿主的因特网服务供应商(ISP)的关系获得。
尽管网页的评分可依据页面浏览次数来确定,但还可依据在该候选网页上投放的广告的经济值(费用/页面浏览)的估算来确定。在这种经济值的估算中包括的一些可能因素可以是为识别可能与网页浏览者有关的广告的网页内容分析,以及显示这些相关广告的经济值的估算(例如,这又要依据广告选择率、每点击费用出价、每显现费用出价等的估算来确定)。此外,费用/页面浏览可依赖于网页上潜在可用的广告投放点、网页的主题或题目和以该主题为目标投放的广告的信息。类似地,除了对每个单独网页估算之外,或代替这种单独估算,可对多个候选网页的组估计经济值。
再参照块430,使用所估算的经济值和估算的页面浏览值来排序经评分的文档。至少有几种不同的方式对文档评分。例如,可以简单地使用估算页面浏览次数作为唯一准则来对文档评分。因而,根据具有最高估算页面浏览次数的网页最优先的方式来排序列表。或者,可以简单地使用费用/页面浏览为唯一准则来对文档评分。在这种情况下,根据具有最高费用/页面浏览的网页最优先的方式来排序列表。作为另一种替换,可以通过简单地将每个页面浏览的估算经济值乘以每个页面估算页面浏览次数来对文档评分。从而,根据对所有估算页面浏览具有最高收益的网页优先的方式来排序列表。对文档评分的其它方法,以及排序列表的其他方法也是可能的。
再参照块440,经评分和排序的列表可能包含大量的各种网页,其中一些不适用于广告或具有太低的等级。因此,通过过滤进一步对列表求精。具体地说,可以使用一个或多个因素来过滤列表。例如,可以滤出已经包含广告的网页或已经包含当前广告递送系统的广告的网页。由于某种原因,可以滤出不具有好的广告前景(例如,由竞争广告递送系统运营的网页或不接收广告的政府网页等)或先前已识别并丢弃的网页。可以根据市场段(商业类别、地理位置等)分类列表。
§3.2示例性的设备
图5是执行一个或多个上述操作的机器500的高级框图。机器500基本上包括一个或多个处理器510,一个或多个输入/输出接口单元530,一个或多个存储装置520,以及一个或多个系统总线和/或网络540用于实现所耦合各元件之间的信息通信。一个或多个输入装置532以及一个或多个输出装置534可以与一个或多个输入/输出接口530耦合。
一个或多个处理器510可执行机器可执行指令(如运行在Solaris操作系统或Linux操作系统上的C或C++程序,Solaris操作系统可从总部在美国加利福尼亚Palo Alto市的Sun Microsystems公司得到,Linux操作系统可广泛地从多个厂商获得,诸如北卡罗来那的Durham市的Red Hat公司)以产生本发明的一个或多个方面的效果。至少部分机器可执行指令可以存储(暂时或永久地)在一个或多个存储装置520上和/或可以经由一个或多个输入接口单元530从外部源接收。
在一个实施例中,机器500可以是一个或多个常规的个人计算机。在这种情况下,处理单元510可以是一个或多个微处理器。总线540可以包括系统总线。存储装置520可以包括系统存储器,比如只读存储器(ROM)和/或随机存取存储器(RAM)。存储装置520可能还包括用于读取并写入硬盘的硬盘驱动器、读取并写入(例如,可移除的)磁盘的磁盘驱动器以及读取并写入诸如光盘或其它(磁)光媒体可移动的(磁)光盘的光盘驱动器。
用户通过输入装置532向个人计算机输入命令和信息,输入装置诸如键盘和指示装置(例如鼠标)。还可(或替换地)包括诸如麦克风、游戏杆、游戏板、卫星盘、扫描仪等其他输入装置。这些及其它输入装置常常通过耦合到系统总线540的适当接口530而连接到处理单元510。输出装置534可能包括监视器或其它类型显示装置,它们也可以经由适当接口连接到系统总线540。除了(或取代)监视器,个人计算机可能包括其它(外围)输出装置(未示出),诸如扬声器和打印机。
再参照图2,一个或多个机器500可以用作广告服务器210,搜索引擎220,内容服务器230,电子邮件服务器240,和/或用户设备250。
§3.3改进和替换
本发明不限于上述的特定实施例。例如,可以实现本发明使用非网络内容或不同于网页的文档。可以经由不同于网络爬取的机制来收集文档。可以实现本发明来使用文档集合而不是单个文档(如使用网站而不是网页)。例如,不是估算单个网页的页面浏览次数,可以估算域(domain)的页面浏览次数。当然,其它可能的备选和改进也是可能的。
§4示例操作。
图6是表示根据本发明示例性实施例的操作的示例的框图。在该示例中,文档信息620(回顾图3的320)包括广告递送系统从库中获得的爬取网页。文档信息620包括关于各种网页的信息,诸如网页内容的主题每月页面浏览的次数(例如,如根据从搜索引擎搜索结果页面的选择来估算)。文档信息620可以包括其它信息。
广告信息610可以包括关于广告组的相关信息。特别,广告信息可以包括目标关键词或主题以及对广告集(例如,与确定主题相关的广告)的每次显现估算的成本(例如,每次显现的费用,每个选择时间选择率的费用,每个转化时间转化率的费用等)。
评分操作630确定每个实施例的评分。评分可以是每个月页面浏览次数和每个页面浏览估算收益的乘积。因而,例如,如果网页可以容纳N(例如4)个广告和相关主题Y,并且以主题Y为目标投放的最佳N个广告具有$Z的每显现的累积估算费用,网页的评分应该是Z和该网页的页面浏览的估算数目的乘积。产生的评分是对潜在广告伙伴的列表排列优先顺序的一种方式。
依照文档信息620,文档4是IRS政府网页,它以IRS和税作为它的主题并接收每个月50,000页面浏览。以有关税的网页为目标投放的相应广告集价值$5.00/页面浏览。从而,文档4被给予每个月$250,000的评分,这就是每个月页面浏览数量和每个页面浏览的估算收入量的乘积。文档2是以“视频游戏”作为其主题的网页并接收每个月100,000次页面浏览。以有关视频游戏网页为目标投放的相应广告集价值$0.30/页面浏览。从而,给予文档2每个月$30,000的评分。文档3是以“滑雪胜地”作为其主题的网页并接收每个月1,000的页面浏览。以涉及滑雪胜地的网页为目标投放的相应广告集价值$11.50/页面浏览。这样,给予文档3每个月$11,500的评分。文档1是以“汽车”作为其主题的网页并接收每个月10,000的页面浏览。以涉及汽车的网页为目标投放的相应广告集价值$1.00/页面浏览。因此,给予文档1每个月$10,000的评分。
评分和排序操作630使用其评分来排序各文档。如列表640所示,从最高分到最低分排序文档。因而,文档4具有最高位置,后面是在第二位置的文档2,在第三位置的文档3和在第四位置的文档1。
随后,向过滤操作660提供候选文档的经评分和排序的列表640,该过滤操作660去除认为不适合作潜在广告伙伴的那些文档。过滤操作660使用过滤器信息650来过滤文档。过滤器信息650可以包含网页特性,诸如网页是否来自竞争者的广告递送系统,或是否是政府网页等。因此,可以使用一个或多个因素来过滤列表,比如网址是否是往往不显示广告的竞争者的广告递送系统或它是否是政府网站或不安放广告的其它网站。在示例性示例中,过滤器信息包括滤除具有″.gov″扩展名的网页。因而,可能会通过过滤操作660去除文档4,因为该网页具有“.gov”扩展名。可以通过简单地把附加因素增加到过滤信息650中来应用这些用于过滤文档候选列表的附加因素。因为发现文档1、2和3是合格的潜在广告伙伴,所以它们通过过滤。
然后提供过滤和排序的列表670,作为好的潜在广告伙伴的列表。
§5结论
根据上述说明,可以理解,根据本发明的实施例可以用于定位和识别好的潜在广告伙伴,并避免缓慢的和经常陷于手动操纵的网络搜索与浏览。使用比如爬取网页和访问统计数据等可用数据,可以发现表示良好前景的可作为广告宿主的网页。可以节约手工劳动、成本和时间。可以发现有关潜在收益的最佳前景。
这可以帮助广告递送系统来定位潜在网页和/或网站以有效经济地寻找广告伙伴。此外,这有助于广告递送系统避免利用其人员在常常不利用电子数据的情况下手工寻找潜在伙伴网站。

Claims (21)

1.一种计算机实现的方法,包括:
a)接收文档;
b)对所述文档评分以提供对每个所述文档的分数;
c)使用所述分数来排序所述经评分的文档;以及
d)过滤所述文档以删除不可能是好的潜在广告伙伴的文档。
2.如权利要求1的计算机实现的方法,还包括:
e)在对所述文档进行过滤和评分之后,提供所述文档作为潜在的广告伙伴。
3.如权利要求1的计算机实现的方法,其中对所述文档评分的动作使用在某个时间段内文档显现的估算次数来对每个文档评分。
4.如权利要求1的计算机实现的方法,其中对所述文档评分的动作使用广告信息来对每个文档评分。
5.如权利要求4的计算机实现的方法,其中广告信息包括以所述文档为目标来投放一个或多个广告的信息。
6.如权利要求4的计算机实现的方法,其中广告信息包括以所述文档为目标投放的一个或多个广告的出价信息。
7.如权利要求1的计算机实现的方法,其中所述过滤动作包括删除属于预定文档集的文档。
8.如权利要求1的计算机实现的方法,其中所述文档是网页,并且其中所述过滤动作包括去除属于预定网页集的网页。
9.如权利要求8的计算机实现的方法,其中所述预定网页集是网站。
10.如权利要求1的计算机实现的方法,其中所述文档是网页,并且其中所述过滤动作包括去除政府网页。
11.如权利要求1的计算机实现的方法,其中所述过滤文档的动作包括删除已知具有排斥广告政策的文档。
12.一种计算机实现的方法,包括:
a)接收文档;
b)对所述文档评分以提供每个文档的分数,其中对所述文档评分的动作使用广告信息来对每个文档评分;
c)使用所述分数来排序经评分的文档。
13.如权利要求12的计算机实现的方法还包括:
d)提供经排序的文档作为潜在的广告伙伴。
14.如权利要求12的计算机实现的方法,其中对所述文档评分的动作使用在某个时间段内文档显现的估算次数来对每个文档评分。
15.如权利要求12的计算机实现的方法,其中所述广告信息包括以所述文档为目标来投放一个或多个广告的信息。
16.如权利要求12的计算机实现的方法,其中所述广告信息包括以所述文档为目标投放的一个或多个广告的出价信息。
17.如权利要求12的计算机实现的方法,其中用于每个文档的所述分数使用通过所述文档的显现来提供包含一个或多个广告的集合的估算广告收益来确定。
18.如权利要求17的计算机实现的方法,其中所述分数进一步包括在给定时间段内文档显现的估算次数。
19.如权利要求12的计算机实现的方法,其中用于每个文档的分数包括下述二者的乘积:(i)通过所述文档的显现来提供含有一个或多个广告的集合的估算广告收益和(ii)在给定时段内该文档显现的估算次数。
20.一种装置,包括:
a)接收文档的装置;
b)对所述文档评分以提供每个所述文档的分数的装置;
c)使用所述分数来排序经评分的文档的装置;以及
d)过滤所述文档以删除不可能是好的潜在广告伙伴的文档的装置。
21.一种装置,包括:
a)接收文档的装置;
b)对所述文档评分以提供每个所述文档的分数的装置,其中对所述文档评分的动作使用广告信息来对每个文档评分;
c)使用所述分数来排序经评分的文档的装置。
CNA2005800414203A 2004-11-03 2005-11-01 使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主 Pending CN101069150A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/980,398 US20060095322A1 (en) 2004-11-03 2004-11-03 Determining prospective advertising hosts using data such as crawled documents and document access statistics
US10/980,398 2004-11-03

Publications (1)

Publication Number Publication Date
CN101069150A true CN101069150A (zh) 2007-11-07

Family

ID=36263225

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800414203A Pending CN101069150A (zh) 2004-11-03 2005-11-01 使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主

Country Status (8)

Country Link
US (1) US20060095322A1 (zh)
EP (1) EP1836556A4 (zh)
KR (1) KR20070085691A (zh)
CN (1) CN101069150A (zh)
AU (1) AU2005305145B2 (zh)
BR (1) BRPI0517250A (zh)
CA (1) CA2585928A1 (zh)
WO (1) WO2006052547A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857349A (zh) * 2011-06-30 2013-01-02 无锡智感星际科技有限公司 一种基于rds的个性化信息定制的系统和方法
CN106874368A (zh) * 2016-12-30 2017-06-20 江苏号百信息服务有限公司 一种rtb竞价广告位价值分析方法及系统

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7788132B2 (en) * 2005-06-29 2010-08-31 Google, Inc. Reviewing the suitability of Websites for participation in an advertising network
US7856445B2 (en) * 2005-11-30 2010-12-21 John Nicholas and Kristin Gross System and method of delivering RSS content based advertising
US8924558B2 (en) 2005-11-30 2014-12-30 John Nicholas and Kristin Gross System and method of delivering content based advertising
US9202241B2 (en) * 2005-11-30 2015-12-01 John Nicholas and Kristin Gross System and method of delivering content based advertising
US8417569B2 (en) 2005-11-30 2013-04-09 John Nicholas and Kristin Gross Trust System and method of evaluating content based advertising
US20070244739A1 (en) * 2006-04-13 2007-10-18 Yahoo! Inc. Techniques for measuring user engagement
US7747745B2 (en) 2006-06-16 2010-06-29 Almondnet, Inc. Media properties selection method and system based on expected profit from profile-based ad delivery
WO2007149888A2 (en) * 2006-06-19 2007-12-27 Almondnet, Inc. Providing collected profiles to media properties having specified interests
US20080004956A1 (en) * 2006-06-28 2008-01-03 Andrew Ian Atherton System and method for generating graphical advertisements based on text offers
US8655728B1 (en) * 2008-05-13 2014-02-18 Amdocs Software Systems Limited System, method, and computer program for presenting a non-competing advertisement with content
US20110029374A1 (en) * 2009-08-03 2011-02-03 Muralidharan Kodialam Dynamic ad scheduling method for improving utility in interactive tv environment
US20110035256A1 (en) * 2009-08-05 2011-02-10 Roy Shkedi Systems and methods for prioritized selection of media properties for providing user profile information used in advertising
US9754285B1 (en) * 2009-09-30 2017-09-05 Google Inc. Identifying alternate content distribution locations
CN105183749B (zh) * 2015-07-13 2018-10-12 北京奇虎科技有限公司 一种爬取推广内容并供搜索使用的方法和装置
US11763387B1 (en) * 2023-02-03 2023-09-19 Sharematter Inc. System and method for the valuation and securitization of content

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5920859A (en) * 1997-02-05 1999-07-06 Idd Enterprises, L.P. Hypertext document retrieval system and method
WO2001039022A2 (en) * 1999-11-22 2001-05-31 Avenue A, Inc. Targeting electronic advertising placement in accordance with an analysis of user inclination and affinity
AU2001243637A1 (en) * 2000-03-14 2001-09-24 Blue Dolphin Group, Inc. Method of selecting content for a user
US20030018659A1 (en) * 2001-03-14 2003-01-23 Lingomotors, Inc. Category-based selections in an information access environment
US20030220837A1 (en) * 2002-05-24 2003-11-27 Takao Asayama System and method for selecting a website affiliate based on maximum potential revenue generation
US7231395B2 (en) * 2002-05-24 2007-06-12 Overture Services, Inc. Method and apparatus for categorizing and presenting documents of a distributed database
US20040044571A1 (en) * 2002-08-27 2004-03-04 Bronnimann Eric Robert Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor
US7788132B2 (en) * 2005-06-29 2010-08-31 Google, Inc. Reviewing the suitability of Websites for participation in an advertising network

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857349A (zh) * 2011-06-30 2013-01-02 无锡智感星际科技有限公司 一种基于rds的个性化信息定制的系统和方法
CN102857349B (zh) * 2011-06-30 2014-12-31 无锡智感星际科技有限公司 一种基于rds的个性化信息定制的系统和方法
CN106874368A (zh) * 2016-12-30 2017-06-20 江苏号百信息服务有限公司 一种rtb竞价广告位价值分析方法及系统
CN106874368B (zh) * 2016-12-30 2020-12-22 江苏号百信息服务有限公司 一种rtb竞价广告位价值分析方法及系统

Also Published As

Publication number Publication date
AU2005305145A1 (en) 2006-05-18
BRPI0517250A (pt) 2008-10-07
EP1836556A2 (en) 2007-09-26
CA2585928A1 (en) 2006-05-18
WO2006052547A3 (en) 2007-03-29
EP1836556A4 (en) 2010-05-05
AU2005305145B2 (en) 2009-12-17
US20060095322A1 (en) 2006-05-04
WO2006052547A2 (en) 2006-05-18
KR20070085691A (ko) 2007-08-27

Similar Documents

Publication Publication Date Title
CN101069150A (zh) 使用诸如爬取文档和文档访问统计等数据确定潜在的广告宿主
AU2004260464B2 (en) Improving content-targeted advertising using collected user behavior data
AU2004256801B2 (en) Serving advertisements using a search of advertiser web information
CA2530493C (en) Rendering advertisements with documents having one or more topics using user topic interest information
AU2005323159B2 (en) Associating features with entities, such as categories or web page documents, and/or weighting such features
CN101036157A (zh) 使用过去搜索查询确定广告目标信息和/或广告创意信息
CN1922626A (zh) 产生用户信息以便在定向广告中使用
CN1701331A (zh) 使用与电子邮件有关的信息来提供广告

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071107