CN103514253B - 基于社交活动数据的排序 - Google Patents

基于社交活动数据的排序 Download PDF

Info

Publication number
CN103514253B
CN103514253B CN201310271852.XA CN201310271852A CN103514253B CN 103514253 B CN103514253 B CN 103514253B CN 201310271852 A CN201310271852 A CN 201310271852A CN 103514253 B CN103514253 B CN 103514253B
Authority
CN
China
Prior art keywords
user
result
activity data
social activity
compatibility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310271852.XA
Other languages
English (en)
Other versions
CN103514253A (zh
Inventor
保罗·内森·班尼特
埃姆雷·穆罕默德·基契曼
彼得·理查德·贝利
尼基尔·丹德卡尔
段辉中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN103514253A publication Critical patent/CN103514253A/zh
Application granted granted Critical
Publication of CN103514253B publication Critical patent/CN103514253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本申请描述了基于社交活动数据的排序。本文描述的各种技术涉及使用社交活动数据来对由计算操作针对用户而返回的结果的排序进行个性化。针对计算操作所返回的结果中的每个结果,可以计算用户对相应结果的相应第一亲和性和用户对相应结果的相应第二亲和性,并将相应第一亲和性和相应第二亲和性用于对结果进行排序。可以基于用户的社交活动数据与点击了相应结果的第一组历史用户的社交活动数据之间的相关性来计算用户对相应结果的相应第一亲和性。此外,可以基于用户的社交活动数据与跳过了相应结果的第二组历史用户的社交活动数据之间的相关性来计算用户对相应结果的相应第二亲和性。

Description

基于社交活动数据的排序
技术领域
本发明涉及数据处理领域,更具体而言,涉及基于社交活动数据的排序。
背景技术
社交网络服务是能够有助于(例如,基于共同的兴趣、活动、背景、真实生活联系等)在人们中建立社交网络的在线服务、平台或者站点。社交网络服务可以包括对每个用户的展示(例如,用户简介),并且每个用户可以具有和其他用户的联系。社交网络服务还可以使用户能够将其个人网络中的想法、活动、事件、兴趣等分享到他们的个人网络的子集或者分享给公众(例如,其个人网络之外的用户)。
一些传统技术采用与用户的社交网络相关联的数据来将搜索引擎向该用户返回的搜索结果进行个性化。例如,一些传统方法使用与特定用户有联系的其他用户(例如,该特定用户的一跳或者两跳联系等)的社交网络活动所关联的数据,来对响应于搜索查询而向该特定用户返回的搜索结果进行扩充或者个性化。传统技术的示例包括:基于由与特定用户有联系的其他用户所表达的关于社交网络内容的反馈,来对针对特定用户的搜索结果进行注释;以及对特定用户的、被与该特定用户有联系的其他用户最近阅读或者推荐的搜索结果进行突出显示。然而,与特定用户有联系的其他用户的社交网络活动所关联的数据的稀少性可能导致该特定用户的搜索查询几乎不受这种传统技术影响。
此外,用于对搜索引擎向给定用户返回的搜索结果进行个性化的其他传统技术通常利用该给定用户的搜索历史数据。因此,在使用搜索引擎时与给定用户的活动相关的数据可以用于对该给定用户的搜索结果进行个性化。然而,如果给定用户之前还没有访问过或者使用过该搜索引擎(例如,该给定用户是该搜索引擎的新用户),则使用这种传统技术通常不能够对搜索结果进行个性化。此外,如果该给定用户使用该搜索引擎执行表达新兴趣的新类型搜索,则该给定用户的搜索历史如果被用于对该给定用户的搜索结果进行个性化,则可能不是特别相关。作为示例,如果该给定用户之前使用该搜索引擎执行了关于编程语言的多个搜索,则该给定用户的搜索历史可能与后续的关于餐厅的搜索缺乏相关性,并且由此,如果被用于对响应于关于餐厅的查询而返回的搜索结果进行个性化则可能具有有限的作用。
发明内容
本文所描述的是关于使用社交活动数据来对由计算操作向用户返回的结果的排序进行个性化的各种技术。针对计算操作所返回的结果中的每个结果,可以计算用户对相应结果的相应第一亲和性和用户对相应结果的相应第二亲和性。可以基于用户的社交活动数据与点击了相应结果的第一组历史用户的社交活动数据之间的相关性来计算用户对相应结果的相应第一亲和性。此外,可以基于用户的社交活动数据与跳过了相应结果的第二组历史用户的社交活动数据之间的相关性来计算用户对相应结果的相应第二亲和性。另外,可以至少部分地基于针对结果中的每个结果的相应结果的相应第一亲和性和相应第二亲和性来对计算操作所返回的结果进行排序。因此,用户的社交活动数据可以被用作鉴别特征,以基于对历史用户的行为的经验观察和历史用户的社交活动数据来计算用户对结果中的每个结果的亲和性。
以上发明内容展示了简化的发明内容,以提供对本文论述的系统和/或方法的一些方面的基本理解。该发明内容不是对本文论述的系统和/或方法的详尽综述。其不意在识别关键/重要元素或者描绘这样的系统和/或方法的范围。其唯一的目的是以简化的形式呈现一些构思,作为稍后展示的更详细的描述的前序。
附图说明
图1示出了利用社交活动数据来对计算操作返回的结果的排序进行个性化的示例性系统的功能框图。
图2示出了利用聚合社交活动数据对计算操作返回的结果的排序进行个性化以提供经排序的结果的示例性系统的功能框图。
图3至图8示出了基于对历史用户的行为的经验观察生成聚合社交活动数据以及基于聚合社交活动数据计算当前用户的亲和性的示例。
图9是示出利用社交活动数据对计算操作返回的结果的排序进行个性化的示例性方法的流程图。
图10示出了示例性计算设备。
具体实施方式
现在参照附图来描述关于基于观察到的用户的行为数据来解读社交活动数据的各种技术,其中,遍及全文使用相同的附图标记表示相同的元素。在接下来的描述中,为了说明的目的,陈述了大量具体细节以提供对一个或更多方面的彻底理解。然而,显然可以实践这样的一个方面或多个方面而无需这些具体细节。在其他实例中,为了有助于描述一个或更多方面,以框图形式示出了公知的结构和设备。另外,要理解的是,被描述成由某个系统部件完成的功能性可以由多个部件来执行。类似地,例如,一个部件可以被配置成执行被描述成由多个部件完成的功能性。
此外,术语“或”意在表示包容性的“或”而不是排他性的“或”。也就是说,除非另有指明,或从上下文清楚可知,否则短语“X使用A或B”意在指任何自然的包容性排列。也就是说,以下示例中的任何示例都满足短语“X使用A或B”:X使用A;X使用B;或X使用A和B二者。此外,在本申请和所附权利要求中使用的冠词“a”和“an”应该通常被解读为意指“一个或更多个”,除非另有指明或从上下文清楚可知其指向单数形式。
如本文所提出的,用户的社交活动数据可以被用作鉴别特征以计算用户对计算操作(例如,搜索操作、自动完成操作、广告选择操作、集中浏览操作等)返回的结果的亲和性(affinity)。可以基于对历史用户的行为数据的经验观察以及历史用户的社交活动数据来解读用户的社交活动数据。
现在参照附图,图1示出了利用社交活动数据来对计算操作返回的结果102的排序进行个性化的系统100。系统100包括数据储存库104。根据各实施方式,数据储存库104包括N个历史用户的社交活动数据和该N个历史用户的行为数据,其中,N可以是基本上任何整数。更具体地,数据储存库104可以包括第一历史用户的社交活动数据1106、......、第N历史用户的社交活动数据N108(统称为社交活动数据106至108)。此外,数据储存库104可以包括第一历史用户的行为数据1110、......、第N历史用户的行为数据N112(统称为行为数据110至112)。另外,数据储存库104包括当前用户的社交活动数据114。如本文所使用的,术语“当前用户”指可以针对其来将由计算操作返回的结果102进行个性化的用户。
系统100可以通过将结果102的排序个性化来调整当前用户的体验,以给当前用户提供经排序的结果122。这样的个性化取决于历史用户的过去行为(例如,行为数据110至112)和公共社交活动(例如,当前用户的社交活动数据114与历史用户的社交活动数据106至108之间的相似性)。
社交活动数据106至108和社交活动数据114是相应用户在社交网站上的活动的记录(例如,社交活动数据1106是第一历史用户在社交网站上的活动的记录,社交活动数据114是当前用户在社交网站上的活动的记录,等等)。根据各实施方式,社交活动数据106至108和社交活动数据114可以包括由相应用户所表达的关于社交网络内容的反馈(例如,社交活动数据1106可以包括由第一历史用户所表达的关于社交网络内容的反馈,社交活动数据114可以包括由当前用户所表达的关于社交网络内容的反馈,等等)。所表达的关于社交网络内容的反馈可以是能够表示用户偏好的明确的用户生成信号。作为示例,社交网络内容可以是状态更新、评论、照片、链接、广告、社交网页、事件等。例如,用户(例如,历史用户中的一个用户、当前用户等)可以使用社交网络服务的“喜欢”特征、“跟随”特征、“+1”特征、“推荐”特征等(例如,社交网络服务可以包括能够被用户使用来表达他或她对相应社交网络内容喜欢、享受、支持等的喜欢按钮、跟随按钮、+1按钮、推荐按钮等)来表达关于社交网络内容的反馈。关于社交网络内容的反馈的表达也可以指“喜欢”、“跟随”、“赞同”或“推荐”该社交网络内容。根据另一个示例,用户可以使用“不喜欢”特征或者基本上任何其他内容投票系统例如星级评定系统来表达关于社交网络内容的反馈。
附加地或者可替代地,社交活动数据106至108和社交活动数据114可以包括相应用户的简介数据、由相应用户分享的社交网络内容、相应用户的设备上安装的应用的列表、由相应用户积极使用的应用的列表及它们的组合等。用户的简介数据的示例包括用户的当前城市、家乡、性别、年龄、生日、语言、教育水平、学位、上过的学校、雇主、职位、宗教、政治观点、活动、兴趣、技能、专长、获奖情况、团体等。此外,由用户分享的内容可以是例如状态更新、评论、照片、链接、广告、社交网页、事件等。
在本文提出的很多示例中,社交活动数据106至108和社交活动数据114包括由用户表达的对社交网络内容的“喜欢”(例如,用户已经“喜欢”过该社交网络内容)。然而要理解的是,这些示例可以被扩展到基本上任何其他类型的所表达的关于社交网络内容的反馈或者其他类型的社交活动数据(例如,简介数据、分享的社交网络内容、在设备上安装的应用、被积极使用的应用等)。
此外,可以设想社交活动数据106至108和社交活动数据114可以以各种粒度等级被聚合。例如,以其自然粒度,对摇滚乐队C的喜欢可以与对摇滚乐队D的喜欢不同地被处理。然而,这些喜欢也可以被聚合到单个相关社交活动组(例如对与摇滚乐队C相关的事物的喜欢)中或者聚合到对所有相关音乐的喜欢的更粗粒度组中。可替代地,可以使用更细粒度的喜欢;例如,在周末对摇滚乐队C的喜欢可以是与在工作日对摇滚乐队C的喜欢不同的信号。根据示例,可以基于语义、经验相似性等进行分组。
另外,社交活动数据106至108和社交活动数据114可以附加地或者可替代地包括推断的活动或者简介数据。例如,人Z可能没有表达过对西雅图的喜欢,但是如果人Z的社交网络中的大多数人喜欢西雅图,则可以推断人Z也喜欢西雅图。
行为数据110至112包括所观察到的相应历史用户的行为的记录。可以在与返回结果102的计算操作相关联的情况中观察历史用户的这种行为。例如,在搜索情况中(例如,当计算操作是搜索操作时),行为数据110至112可以包括历史用户与搜索引擎的交互的记录。根据该示例,行为数据110至112可也包括历史用户针对一组搜索查询所点击的搜索结果和所跳过的搜索结果的日志。作为示例,行为数据1110可以包括:第一历史用户针对第一搜索查询所点击的搜索结果和所跳过的搜索结果的日志、第一历史用户针对第二查询所点击的搜索结果和所跳过的搜索结果的日志,等等。根据另一个示例,在广告情况中(例如,当计算操作是广告选择操作时),行为数据110至112可以包括历史用户点击的广告和跳过的广告的日志。作为另一示例,在自动完成情况中(例如,当计算操作是自动完成时),行为数据110至112可以包括历史用户针对一组用户输入(例如,搜索查询或者搜索查询的一部分等)所点击的建议搜索查询(例如,由搜索引擎提供)和所跳过的建议搜索查询的日志。
当在本文中使用时,术语“点击”意指包括基本任何形式的用户选择,而不仅限于通过快速按压和释放按钮所进行的选择。可以使用基本上任何类型的用户界面来进行用户选择。此外,在一些情况下,可以不存在由用户做出的明确选择。例如,可以推断用户偏好的不要求进一步选择的搜索结果答案(例如,天气结果、对问题的直接答案等)。
可以设想可以执行基本上任何由处理器所执行的计算操作,以针对用户返回结果102。根据示例,所述针对用户返回结果102的计算操作可以是响应于搜索查询而针对用户返回搜索结果的搜索操作。
作为另一个示例,所述针对用户返回结果102的计算操作可以是针对用户返回建议的搜索查询的自动完成操作。例如,可以向用户返回建议的搜索查询而不需要用户输入完整的搜索查询(例如,可以基于部分的搜索查询来预测建议的搜索查询)。
根据又一个示例,针对用户返回结果102的计算操作可以是针对用户返回广告的广告选择操作。因此,基于下述的排序,可以针对用户选择一个或更多广告。另外,可以在显示器上针对用户呈现所选择的一个或更多广告。例如,可以使用广告选择操作来选择付费搜索广告;然而,要求保护的主题不限于此。
此外,还可以设想本文描述的技术可以应用于其他应用(例如,可以返回结果102的其他计算操作)。这样的其他应用的示例包括在网站上的关注浏览、普通互联网浏览(例如,生成推荐等)等。
系统100可以基于对历史用户的行为数据110至112的经验观察以及当前用户的社交活动数据114与历史用户的社交活动数据106至108的相似性,来解读当前用户的社交活动数据114。从而,系统100通过对历史用户的经验观察而不是通过基于对社交活动的语义理解的推断来解读社交活动数据114。根据示例,如果当前用户已经表达过关于具有多样的、戏剧的且华丽的风格的流行歌手的社交网页的反馈(例如,当前用户喜欢过该流行歌手的社交网页),则在搜索引擎情况中使用该信息的直接或语义方法可以是在针对当前用户返回的搜索结果中提高该流行歌手的主页的排序。相反地,系统100解读当前用户(例如如前面所述的表达关于该流行歌手的社交网页的反馈的当前用户)的社交活动数据114,从而通过以下方式来经验性地学习信息:通过观察到类似地表达关于该流行歌手的社交网页的反馈的历史用户比普通用户更可能搜索动画片、幽默和科学相关的网站,并且与普通用户相比具有较小可能来搜索体育、园艺或者投资相关网站。此外,系统100还可以确定例如表达关于该流行歌手的社交网页的反馈的用户在发出具体查询之后,更可能或者具有较小可能点击或者跳过某些搜索结果。
要理解的是,经验观察可以源于与社交活动的语义关系、人口统计关系或者起源关系。然而,不论关系的性质如何,系统100可以利用经验信息来对用于当前用户的搜索结果的排序进行个性化。
系统100还包括行为分组部件116,该行为分组部件116针对结果102中的每个结果根据行为数据110至112对N个历史用户进行分组。例如,行为分组部件116可以形成被观察到针对第一结果具有第一行为的第一组历史用户和被观察到针对第一结果具有第二行为的第二组历史用户。此外,行为分组部件116可以形成被观察到针对第二结果具有第一行为的第三组历史用户和被观察到针对第二结果具有第二行为的第四组历史用户。行为分组部件116可以类似地针对除第一结果和第二结果外的剩余结果102来形成组。作为示例,第一行为可以是点击结果,而第二行为可以是跳过该结果,反之亦然。因此,行为分组部件116可以建立更可能点击特定结果的一组历史用户和更可能跳过该特定结果的完全不同的一组历史用户。还可以设想行为分组部件116可以针对结果102中的每个结果形成多于两个的组(例如,如果针对给定结果可以有多于两个的可能行为)。
根据搜索情况中的示例,行为分组部件116可以基于针对查询-结果对的行为数据110至112来从N个历史用户中形成组。根据这个示例,针对响应于特定搜索查询所返回的搜索结果(例如,结果102),行为分组部件可以形成:被观察到点击了响应于该特定搜索查询而返回的第一搜索结果的第一组历史用户、被观察到跳过响应于该特定搜索查询而返回的第一搜索结果的第二组历史用户、被观察到点击了响应于该特定搜索查询而返回的第二搜索结果的第三组历史用户、以及被观察到跳过响应于该特定搜索查询而返回的第二搜索结果的第四组历史用户,等等。然而,根据另一个示例,可以设想行为分组部件116可以基于针对查询的结果102中的每个结果的行为数据110至112来从N个历史用户中形成组。根据该示例,不论返回搜索结果(例如,结果102)的搜索查询如何,行为分组部件116都可以形成被观察到点击了搜索查询的第一搜索结果的第一组历史用户和被观察到跳过搜索查询的第一搜索结果的第二组历史用户,等等。
此外,系统100包括相关性部件118,该相关性部件118确定当前用户的社交活动数据114与在由行为分组部件116针对结果102中的每个结果而形成的各组中的每个组中的历史用户的社交活动数据106至108之间的相关性。针对结果102中的每个结果,相关性部件118可以使用当前用户的社交活动数据114,基于对与前述相关性对应的各组历史用户中的每个组的关联(affiliation)强度,来识别对结果的亲和性。
更具体地,针对由计算操作返回的结果102中的每个结果,相关性部件118可以基于当前用户的社交活动数据114与点击了相应结果的历史用户(例如,由行为分组部件116形成的第一组历史用户)的社交活动数据106至108之间的相关性,来计算当前用户对相应结果的相应正亲和性。此外,针对由计算操作返回的结果102中的每个结果,相关性部件118可以基于当前用户的社交活动数据114与跳过相应结果的历史用户(例如,由行为分组部件116形成的第二组历史用户)的社交活动数据106至108之间的相关性,来计算当前用户对相应结果的相应负亲和性。根据示例,针对每组历史用户并且针对结果102中的每个结果,相关性部件118可以对当前用户的社交活动数据114与针对该结果的组中的历史用户的社交活动数据106至108之间的相关性进行求和,以确定对结果102的亲和性。作为搜索情况中的示例,针对给定的搜索结果(例如,来自结果102),相关性部件118可以使用当前用户的社交活动数据114,基于与已经点击过该搜索结果的一组用户的关联强度来确定当前用户对搜索结果的正亲和性,并且基于与已经跳过该搜索结果的一组用户的关联强度来确定当前用户对搜索结果的负亲和性。
系统100还包括排序部件120,该排序部件120至少部分地基于对结果102的亲和性来对由计算操作返回的结果102进行排序,以输出经排序的结果122。对结果102的亲和性可以是由排序部件120使用的影响对结果102的排序的指标。然而要理解的是,可以向排序部件120提供除对结果102的亲和性之外的指标,并且使用所述指示对结果102进行排序。例如,对结果102的亲和性可以是被输入到搜索引擎的标准排序算法中的特征。根据此示例,对点击结果的较强亲和性可以使得该结果在排序中比用户不太可能点击的结果(例如,由对跳过结果的较强亲和性所表示的结果)的排序要高。
根据示例,行为分组部件116和相关性部件118可以根据如下等式来计算当前用户u对响应于查询q而返回的结果d的正亲和性和负亲和性:
在上式中,Imp(q,hu)是一组搜索(例如,一组过去痕迹(past impression)),针对该组搜索,历史用户hu被观察为进行了查询q,<hu,u>是历史用户hu与当前用户u的相似性函数(例如,点积),根据对社交网络内容的分享的喜欢来计算,并且clicke(I,hu,d)和skipped(I,hu,d)是指标函数,在搜索I的情况中,如果用户点击结果或者跳过结果,则这两个函数分别返回1,否则,返回0。因此,正亲和性(PosAffinity)可以被计算成当前用户u的社交活动数据114与进行查询q且点击了结果d的历史用户hu(例如,省略进行查询q且跳过结果d的历史用户hu)的社交活动数据106至108之间的点积的过去痕迹的总和(a sum overpast impressions of a dot product)。类似地,负亲和性(NegAffinity)可以被计算成当前用户u的社交活动数据114与进行查询q且跳过结果d的历史用户hu(例如,省略进行查询q且点击了结果d的历史用户hu)的社交活动数据106至108之间的点积的过去痕迹的总和。
根据示例,可以设想相关性部件118可以合并针对特定结果的亲和性(例如,经合并的亲和性得分可以被提供给排序部件120并且被用作对结果102进行排序的特征)。例如,相关性部件118可以合并针对特定结果的正亲和性和负亲和性(例如,通过从正亲和性中减去负亲和性来生成经合并的亲和性分数)。作为另一个示例,可以由相关性部件118将合并的亲和性分数直接计算成正亲和性与负亲和性之差。根据又一个示例,相关性部件118可以计算(例如,直接计算或者间接计算)正亲和性与负亲和性之间的加权合并。根据此示例,可以对亲和性施加基本上任何权重(例如,相同的权重、不同的权重)。然而,还可以设想可以向排序部件120提供针对特定结果的独立的亲和性(例如,正亲和性和负亲和性可以作为独立的特征用于对结果102进行排序)。
根据另一个示例,相关性部件118可以选择历史用户的社交活动数据106至108和当前用户的社交活动数据的114的属性的子集。属性的示例可以是当前用户或历史用户是否表达过对棒球队V的喜欢;因此,社交活动数据106至108和社交活动数据114均可以包括可以被选择的属性(例如,元素)的数组。所选择的属性的子集可以被用于计算亲和性。属性的子集可以全部被选择,或者可以根据查询来选择(例如,对摇滚乐队的喜欢可以针对音乐查询具有信息性,而针对烹饪查询不具有信息性,等等)。此外,因为社交活动数据106至108和社交活动数据114的不同属性可以具有不等同的信息性,所以用于属性的权重可以被导出并且被用于完成选择。根据该示例,社交活动数据106至108和社交活动数据114的一些属性可以被用于执行点积,而其他属性可以被忽略(例如,其他属性可能不具有信息性,引入噪声等)。
现在参照图2,图2示出了系统200,系统200利用聚合社交活动数据来对由计算操作返回的结果102的排序进行个性化,从而提供经排序的结果122。系统200包括:数据储存库104、相关性部件118和排序部件120。此外,数据储存库104包括当前用户的社交活动数据114。
数据储存库104还包括历史用户的聚合社交活动数据(例如,可以合并历史用户的社交活动数据以形成在数据储存库104中所保存的聚合社交活动数据)。可以以各种粒度等级来构造(例如,聚合)历史用户的聚合社交活动数据。粒度等级的示例包括结果级、查询-结果级、域级或者查询-域级。因此,历史用户的社交活动数据106至108可以基于历史用户的针对取决于粒度等级的单位的行为来进行聚合(例如,单位可以是结果、查询-结果对、域、或者域-结果对)。例如,在搜索情况中,可以以搜索结果级(例如,URL级)、查询-搜索结果级(例如,查询-URL级)、域级(例如,域可以是URL的最高级域或者第二级域)或者查询-域级来构造聚合社交活动数据。
因此,数据储存库104可以包括:具有针对单位1的第一行为的历史用户的聚合社交活动数据202;......;和具有针对单位M的第一行为的历史用户的聚合社交活动数据204(统称为具有第一行为的历史用户的聚合社交活动数据202至204),其中,M可以是基本任何整数。此外,数据储存库104可以包括:具有针对单位1的第二行为的历史用户的聚合社交活动数据206;......;和具有针对单位M的第二行为的历史用户的聚合社交活动数据208(统称为具有第二行为的历史用户的聚合社交活动数据206至208)。具有第一行为的历史用户的聚合社交活动数据202至204和具有第二行为的历史用户的聚合社交活动数据206至208被统称为聚合社交活动数据202至208。在接下来的示例中,第一行为是点击结果,而第二行为是跳过结果;然而,可以设想第一行为可以是跳过结果而第二结果可以是点击结果,第一行为或者第二行为中的至少一个行为可以是除了点击结果和跳过结果之外的行为,等等。另外,可以设想数据储存库104也可以包括具有除针对该M个单位的第一行为和第二行为之外的一个或多个行为的历史用户的聚合社交活动数据。
相关性部件118可以确定当前用户的社交活动数据114与对应于结果102的聚合社交活动数据202至208的子集之间的相关性。具体地,针对由计算操作返回的结果102,相关性部件118可以基于当前用户的社交活动数据114与对应于结果102的具有第一行为(例如,点击)的历史用户的聚合社交活动数据202至204之间的相关性,来计算当前用户对结果102的相应正亲和性。此外,针对由计算操作返回的结果102,相关性部件118可以基于当前用户的社交活动数据114与对应于结果102的具有第二行为(例如,跳过)的历史用户的聚合社交活动数据206至208之间的相关性,来计算当前用户对结果102的相应负亲和性。因此,相关性部件118不是如上针对等式(1)和等式(2)所述地在计算亲和性时将过去痕迹求和,而是可以使用聚合社交活动数据202至208。
根据示例,如果以查询-结果级建立了聚合社交活动数据202至208(例如,M个单位中的每个单位都是查询-结果对),则相关性部件118可以根据如下等式来计算用户u对响应于查询q而返回的结果d的正亲和性和负亲和性:
因此,正亲和性(PosAffinity)可以被计算成当前用户u的社交活动数据114与进行查询q且点击了结果d的历史用户hu的聚合社交活动数据(例如,具有第一行为的历史用户的聚合社交活动数据的子集202至204)之间的点积。类似地,负亲和性(NegAffinity)可以被计算成当前用户u的社交活动数据114与进行查询q且跳过结果d的历史用户hu的聚合社交活动数据(例如,具有第二行为的历史用户的聚合社交活动数据的子集206至208)之间的点积。
作为另一个示例,较之查询-结果级,通过以结果级(例如,通过对查询进行求和)来聚合历史用户的社交活动数据106至108可以减小存储成本。根据该示例,相关性部件118可以根据如下等式来计算当前用户u对响应于查询q而返回的结果d的正亲和性和负亲和性:
正亲和性(PosAffinity)可以被计算成当前用户u的社交活动数据114与在不同查询中点击了结果d的历史用户hu的聚合社交活动数据(例如,具有第一行为的历史用户的聚合社交活动数据的子集202至204)之间的点积。类似地,负亲和性(NegAffinity)可以被计算成当前用户u的社交活动数据114与在不同查询中跳过结果d的历史用户hu的聚合社交活动数据(例如,具有第二行为的历史用户的聚合社交活动数据的子集206至208)之间的点积。
根据又一个示例,通过以域级(例如,结果在针对查询合计的域中的一个分布)来聚合历史用户的社交活动数据106至108可以进一步减小存储成本。因此,相关性部件118可以根据如下公式来计算当前用户u对相应于查询q而返回的结果d的正亲和性和负亲和性:
在上式中,Site(d)是结果d的域。因此,正亲和性(PosAffinity)可以被计算成当前用户u的社交活动数据114与在查询中点击了域Site(d)中的结果的历史用户hu的聚合社交活动数据(例如,具有第一行为的历史用户的聚合社交活动数据的子集202至204)之间的点积。类似地,负亲和性(NegAffinity)可以被计算成当前用户u的社交活动数据114与在查询中跳过域Site(d)中的结果的历史用户hu的聚合社交活动数据(例如,具有第二行为的历史用户的聚合社交活动数据的子集206至208)之间的点积。
图3至图8示出了基于对历史用户的行为的经验观察来生成聚合社交活动数据的示例。此外,利用当前用户的社交活动数据作为鉴别特征以基于聚合社交活动数据来计算当前用户对响应于计算操作所返回的结果的亲和性。在描述的示例中,用户可以表达关于社交网络内容的四个项目(例如,用户可以表达喜欢的四个项目)的反馈;因此,用户的社交活动数据被表示为包括四个元素的数组。此外,在示出的示例中,两个历史用户(历史用户1和历史用户2)和当前用户提供了返回六个搜索结果的共有搜索查询。然而要理解的是,提供此示例仅是为了说明的目的,所要求保护的主题不限于此。
如图3所示,第一历史用户(历史用户1)与社交活动数据300相关联。根据描述的示例,第一历史用户已经对社交网络内容的第一项目表达过喜欢(例如,第一历史用户的社交活动数据300的数组中的第一元素被设置为值1)。另外,第一历史用户还没有对社交网络内容的剩余三个项目表达过喜欢(例如,第一历史用户的社交活动数据300的数组中的第二元素、第三元素和第四元素被设置为值0)。
如上所述,搜索引擎响应于搜索查询返回六个搜索结果,即:第一搜索结果302、第二搜索结果304、第三搜索结果306、第四搜索结果308、第五搜索结果310和第六搜索结果312(统称为搜索结果302至312)。例如,搜索结果302至312可以被显示成:第一搜索结果302被置于第二搜索结果304的上方,第二搜索结果304被置于第三搜索结果306的上方,等等。然而,可以设想要求保护的主题不限于此。
图4示出了第一历史用户的行为数据。更具体地,第一历史用户被示出为已经跳过第一搜索结果302和第二搜索结果304。另外,第一历史用户被示出为已经点击了第三搜索结果306(例如,在第一历史用户的查询-点击日志中所指示)。例如,显示位置在被点击的查询结果之上的搜索结果可以被认为被跳过。显示位置在被点击的搜索结果之下的搜索结果可以被认为或者不被认为被跳过(例如,用户被认为与既没有被跳过也没有被点击的搜索结果没有交互)。
根据示例,被显示成在被点击的搜索结果下方一个位置的搜索结果可以被认为被跳过。因此,如图5所描绘的,第四搜索结果308可以被认为是已经被第一历史用户跳过。然而,根据其他示例,可以设想被显示成在被点击的搜索结果下方多于一个位置的搜索结果可以被认为是被跳过(例如,与被点击的搜索结果显示在同一页面上的在被点击的搜索结果下方的X个位置,等等,其中X是整数)。
转到图6,图6示出了社交活动数据聚合模型(例如,聚合社交活动数据202至208),第一历史用户的社交活动数据300可以根据第一历史用户的行为数据被添加到该社交活动数据聚合模型。在图6中示出的示例示出了以查询-搜索结果级的粒度针对每个用户行为构造的社交活动数据聚合模型。因此,可以针对历史用户点击响应于搜索查询而返回的搜索结果,来构造下述社交活动数据聚合模型:针对历史用户点击第一搜索结果302的模型600、针对历史用户点击第二搜索结果304的模型602、针对历史用户点击第三搜索结果306的模型604、针对历史用户点击第四搜索结果308的模型606、针对历史用户点击第五搜索结果310的模型608、以及针对历史用户点击第六搜索结果312的模型610。此外,可以针对历史用户跳过响应于搜索查询而返回的搜索结果,来构造下述社交活动数据聚合模型:针对历史用户跳过第一搜索结果302的模型612、针对历史用户跳过第二搜索结果304的模型614、针对历史用户跳过第三搜索结果306的模型616、针对历史用户跳过第四搜索结果308的模型618、针对历史用户跳过第五搜索结果310的模型620、以及针对历史用户跳过第六搜索结果312的模型622(统称为模型600至模型622)。
如上所述,第一历史用户点击了第三搜索结果306并且跳过搜索结果302、304和308。因此,当建立模型600至模型622时,第一历史用户的社交活动数据300被添加到针对历史用户点击第三搜索结果306的模型604、针对历史用户跳过第一搜索结果302的模型612、针对历史用户跳过第二搜索结果304的模型614和针对历史用户跳过第四搜索结果308的模型618。此外,第一历史用户的社交活动数据300没有被添加至剩余的模型。
现在参照图7,第二历史用户(历史用户2)被示为与社交活动数据700关联。根据所描述的示例,第二历史用户已经对社交网络内容的第三项目表示过喜欢(例如,第二历史用户的社交活动数据700的数组中的第三元素被设置为值1)。此外,第二历史用户还没有对社交网络内容的剩余三个项目表示喜欢(例如,第二历史用户的社交活动数据700的数组中的第一元素、第二元素和第四元素被设置为值0)。
另外,第二历史用户被示出为已经跳过第一搜索结果302并且已经点击了第二搜索结果304。此外,第三搜索结果306(例如,紧跟在被点击的搜索结果之后的搜索结果)被认为已经被第二历史用户跳过。第二历史用户被认为与第四搜索结果308、第五搜索结果310和第六搜索结果312缺少交互。当构造模型600至模型622时,第二历史用户的社交活动数据700被添加到针对历史用户点击第二搜索结果304的模型602、针对历史用户跳过第一搜索结果302的模型612和针对历史用户跳过第三搜索结果306的模型616;社交活动数据700没有被添加到剩余的模型。
图8示出了利用聚合社交活动数据(例如,模型600至模型622)来计算当前用户的亲和性。当前用户与社交活动数据800相关联。如上所述,当前用户对社交网络内容的第三项目和第四项目已经表达过喜欢,而对社交网络内容的第一项目和第二项目还没有表达过喜欢。
可以通过计算当前用户的社交活动数据800与模型600至模型622中的每个模型的相应点积来计算针对搜索结果302至312的亲和性。例如,当前用户对第一搜索结果302的正亲和性可以被计算成当前用户的社交活动数据800与针对历史用户点击第一搜索结果302的模型600的点积,并且当前用户对第一搜索结果302的负亲和性可以被计算成当前用户的社交活动数据800与针对历史用户跳过第一搜索结果302的模型612的点积。可以类似地计算针对剩余结果的正亲和性和负亲和性。根据所描述的示例可以确定,针对当前用户,亲和性可以影响到使第二搜索结果304排序更高并且使第一搜索结果302和第三搜索结果306排序更低(例如,如果对每个搜索结果,从对应正亲和性中减去负亲和性以生成合并的亲和性得分,则第一搜索结果302和第三搜索结果306均可以具有合并的亲和性得分-1,第二搜索结果304可以具有合并的亲和性得分1,并且剩余的搜索结果均可以具有合并的亲和性得分0)。
总之,本文提出的技术不是在语义上或者直接地解读用户的社交活动数据(例如,基于与社交活动关联的初级信号),而是涉及到确定与这些社交活动相关联的二次信号。因此,可以使用本文提出的技术来识别初级信号所不能捕捉的用户的行为和偏好与用户的社交活动数据之间的相关性。
图9示出了关于使用当前用户的社交活动数据作为鉴别特征以基于对历史用户行为的经验观察和历史用户的社交活动数据来计算当前用户对搜索结果的亲和性的示例性方法。虽然该方法被示为并且被描述为按序列进行的一系列动作,但是要明白并且理解的是该方法不限于该序列的顺序。例如,可以以与本文所描述的顺序不同的顺序来进行一些动作。另外,一个动作可以与另一个动作同时进行。此外,在一些示例中,可能不需要所有的动作来实现本文所描述的方法。
此外,本文所描述的动作可以是计算机可执行的指令,该指令可以通过一个或更多个处理器来实施并且/或者可以被存储在计算机可读的介质或媒体上。计算机可执行的指令可以包括例行程序、子例行程序、程序、执行的线程等。再进一步地,方法中的动作的结果可以被存储在计算机可读的介质中,被显示在显示设备上,等等。
图9示出了利用社交活动数据对计算操作返回的结果的排序进行个性化的方法900。在902处,可以进行给用户(例如,当前用户)返回结果的计算操作。例如,计算操作可以由处理器来执行。在904处,可以针对计算操作返回的结果中的每个结果来计算用户对相应结果的相应第一亲和性。可以基于用户的社交活动数据与点击了相应结果的第一组历史用户的社交活动数据之间的相关性,来计算用户对相应结果的相应第一亲和性。在906处,可以针对计算操作返回的结果中的每个结果来计算用户对相应结果的相应第二亲和性。可以基于用户的社交活动数据与跳过相应结果的第二组历史用户的社交活动数据之间的相关性,来计算用户对相应结果的相应第二亲和性。在908处,可以至少部分地基于针对结果中的每个结果的相应结果的相应第一亲和性和相应第二亲和性,来对计算操作返回的结果进行排序。
现在参照图10,图10示出了根据本文所公开的系统和方法可以使用的示例性计算设备1000的高层图示。例如,计算设备1000可以被用在使用社交活动数据来对计算操作返回的结果的排序进行个性化的系统中。计算设备1000包括执行存储在存储器1004中的指令的至少一个处理器1002。指令可以是例如用于实施由上述一个或更多部件完成的功能性的指令,或者可以是用于实施上述一个或更多个方法的指令。处理器1002可以以系统总线1006的方式来访问存储器1004。存储器1004除了存储可执行的指令,还存储社交活动数据、行为数据、聚合社交活动数据(例如,社交活动数据聚合模型)、结果、经排序的结果等。
计算设备1000附加地包括数据存储装置1008,处理器1002通过系统总线1006的方式能够访问该数据存储装置1008。数据存储装置1008可以包括可执行的指令、社交活动数据、行为数据、聚合社交活动数据(例如,社交活动数据聚合模型)、结果、经排序的结果等。计算设备1000还包括使外部设备能够与计算设备1000通信的输入接口1010。例如,输入接口1010可以用于从外部计算机设备、从用户等接收指令。计算设备1000还包括将计算设备1000与一个或更多个外部设备对接的输出接口1012。例如,计算设备1000可以通过输出接口1012的方式来显示文本、图像等。
可以设想通过输入接口1010和输出接口1012与计算设备1000通信的外部设备可以被包括在提供用户可以与之交互的基本任何类型的用户接口的环境中。用户接口类型的示例包括图形用户界面、自然用户界面等。例如,图形用户界面可以接受来自使用一个或多个输入设备例如键盘、鼠标、遥控器等的用户的输入,并且在输出设备例如显示器上提供输出。另外,自然用户界面可以使用户能够以不受由输入设备例如键盘、鼠标、遥控器等所强加的限制的方式来与计算设备1000交互。更确切地,自然用户界面可以依靠语音识别、触摸和指示笔识别、在屏幕上和屏幕附近的动作识别、空中手势、头部和眼部追踪、声音和语音、视觉、触摸、手势、机器智能等。
另外,虽然计算设备1000被示出为单个系统,但是要理解的是计算设备1000可以是分布式系统。因此,例如,若干设备可以通过网络连接的方式通信,并且可以共同执行被描述为由计算设备1000执行的任务。
当在本文中使用时,术语“部件”和“系统”意在包括由当被处理器执行时使得某些功能性能够完成的计算机可执行指令所配置的计算机可读数据存储器。该计算机可执行指令可以包括例行程序、函数等。还要理解的是,部件或系统可以被设置在单个设备上或者被分布在若干设备中。
另外,当在本文中使用时,术语“示例性”意在指“作为某事物的示范或者示例”。
本文所描述的各种功能可以以硬件、软件或者其任意组合来实现。如果以软件来实现,则功能可以作为一个或更多指令或代码被存储或者传输到计算机可读介质上。计算机可读介质包括计算机可读存储介质。计算机可读存储介质可以是能够被计算机访问的任何可用存储介质。作为示例而非限制,这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或者其他光盘存储器、磁盘存储器或其他磁存储装置、或者能够被用于承载或者存储以指令或者数据结构形式的期望的程序代码并且能够被计算机访问的任何其他介质。当在本文使用时,磁盘或者光盘包括紧致光盘(CD)、激光光盘、光盘、数字通用光盘(DVD)、软磁盘、蓝光光盘(BD),其中磁盘通常磁性地复制数据,而光盘通常用激光光学地复制数据。另外,传播信号不包括在计算机可读存储介质的范围内。计算机可读介质还包括通信介质,该通信介质包括有助于将计算机程序从一个位置传输到另一个位置的任何介质。例如,连接可以是通信介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线(DSL)或者无线技术例如红外线、无线电和微波从网站、服务器或者其他远程源传输软件,则同轴线缆、光纤线缆、双绞线、DSL或者无线技术例如红外线、无线电和微波被包括在通信介质的定义中。上述的组合也应该包括在计算机可读介质的范围内。
可替代地或者附加地,本文的功能性描述可以至少部分地通过一个或更多个硬件逻辑部件来实现。例如但不做限制,可以使用的硬件逻辑部件的示例性类型包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、系统级芯片系统(SOC)、复杂可编程逻辑器件(CPLD)等。
根据上述描述可知,本公开的实施例包括但不限于如下技术方案:
技术方案1.一种利用社交活动数据来对由计算操作所返回的结果的排序进行个性化的方法,包括:
执行针对用户返回结果的计算操作,其中,所述计算操作由处理器执行;
针对所述计算操作所返回的结果中的每个结果:
基于所述用户的社交活动数据与点击了相应结果的第一组历史用户的社交活动数据之间的相关性,来计算所述用户对所述相应结果的相应第一亲和性;以及
基于所述用户的社交活动数据与跳过了所述相应结果的第二组历史用户的社交活动数据之间的相关性,来计算所述用户对所述相应结果的相应第二亲和性;以及
至少部分地基于针对所述结果中的每个结果的所述相应结果的所述相应第一亲和性和所述相应第二亲和性,来对所述计算操作所返回的结果进行排序。
技术方案2.根据技术方案1所述的方法,其中,针对用户返回结果的所述计算操作是针对用户返回响应于搜索查询的搜索结果的搜索操作。
技术方案3.根据技术方案1所述的方法,其中,针对用户返回结果的所述计算操作是针对用户返回建议的搜索查询的自动完成操作。
技术方案4.根据技术方案1所述的方法,其中,针对用户返回结果的所述计算操作是针对用户返回广告的广告选择操作,所述方法还包括:
选择已排序的广告中的一个或更多个广告;以及
将所选择的所述广告中的所述一个或更多个广告呈现在显示器上。
技术方案5.根据技术方案1所述的方法,其中,所述用户的社交活动数据、所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据包括由所述用户、所述第一组中的历史用户和所述第二组中的历史用户所分别表达的关于社交网络内容的反馈。
技术方案6.根据技术方案1所述的方法,其中,所述用户的社交活动数据、所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据包括所述用户、所述第一组中的历史用户和所述第二组中的历史用户的各自的简介数据、各自的所分享的社交网络内容、各自的已安装的应用的列表或各自的积极使用的应用的列表中的至少一个。
技术方案7.根据技术方案1所述的方法,还包括:针对所述计算操作所返回的结果中的每个结果,基于所述历史用户的相应行为数据来形成点击了所述相应结果的所述第一组历史用户和跳过了所述相应结果的所述第二组历史用户。
技术方案8.根据技术方案1所述的方法,还包括:合并所述相应结果的所述相应第一亲和性和所述相应第二亲和性,以生成用于排序的所述相应结果的相应的经合并的亲和性得分。
技术方案9.根据技术方案1所述的方法,还包括:
将所述用户对所述相应结果的所述相应第一亲和性计算成所述用户的社交活动数据与点击了所述相应结果的所述第一组中的历史用户的社交活动数据之间的点积的过去痕迹的总和;以及
将所述用户对所述相应结果的所述相应第二亲和性计算成所述用户的社交活动数据与跳过了所述相应结果的所述第二组中的历史用户的社交活动数据之间的点积的过去痕迹的总和。
技术方案10.根据技术方案1所述的方法,还包括:
将所述用户对所述相应结果的所述相应第一亲和性计算成所述用户的社交活动数据与点击了所述相应结果的所述第一组中的历史用户的聚合社交活动数据之间的点积;以及
将所述用户对所述相应结果的所述相应第二亲和性计算成所述用户的社交活动数据与跳过了所述相应结果的所述第二组中的历史用户的聚合社交活动数据之间的点积。
技术方案11.根据技术方案1所述的方法,其中,基于以查询-结果级、结果级、查询-域级或域级之一的所述历史用户的相应行为数据来对所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据进行聚合。
技术方案12.根据技术方案1所述的方法,将所述用户对所述相应搜索结果的相应的经合并的亲和性直接计算成相应第一亲和性与相应第二亲和性之差。
技术方案13.根据技术方案1所述的方法,还包括:选择所述用户的社交活动数据、所述第一组历史用户的社交活动数据和所述第二组历史用户的社交活动数据的属性的子集,其中,所述相应第一亲和性和所述相应第二亲和性是基于所选择的所述属性的子集来计算的。
技术方案14.根据技术方案13所述的方法,还包括根据查询来选择所述属性的子集,其中,所述计算操作响应于所述查询来针对所述用户返回结果。
技术方案15.一种利用社交活动数据来对由搜索操作响应于搜索查询而向用户返回的搜索结果的排序进行个性化的系统,其中,所述搜索操作由处理器执行,所述系统包括:
数据存储库,所述数据储存库包括用户的社交活动数据和历史用户的社交活动数据;
相关性部件,所述相关性部件针对所述搜索操作所返回的结果中的每个结果,计算所述用户对相应搜索结果的相应正亲和性和所述用户对所述相应搜索结果的相应负亲和性,其中,所述正亲和性是基于所述用户的社交活动数据与点击了所述相应结果的第一组历史用户的社交活动数据之间的相关性来计算的,并且其中,所述负亲和性是基于所述用户的社交活动数据与跳过了所述相应结果的第二组历史用户的社交活动数据之间的相关性来计算的;以及
排序部件,所述排序部件至少部分地基于针对所述搜索结果中的每个搜索结果的所述相应搜索结果的所述相应正亲和性和所述相应负亲和性来对所述搜索操作所返回的搜索结果进行排序。
技术方案16.根据技术方案15所述的系统,其中,所述用户的社交活动数据和所述历史用户的社交活动数据包括由所述用户和所述历史用户所分别表达的关于社交网络内容的反馈。
技术方案17.根据技术方案15所述的系统,其中,所述用户的社交活动数据和所述历史用户的社交活动数据包括所述用户和所述历史用户的各自的简介数据、各自的所分享的社交网络内容、各自的已安装的应用的列表或各自的积极使用的应用的列表中的至少一个。
技术方案18.根据技术方案15所述的系统,还包括行为分组部件,所述行为分组部件根据在所述数据储存库中保存的历史用户的行为数据来形成所述第一组历史用户和所述第二组历史用户,其中,所述历史用户的行为数据包括针对一组搜索查询被所述历史用户点击的搜索结果和被所述历史用户跳过的搜索结果的相应日志。
技术方案19.根据技术方案15所述的系统,其中,基于以查询-结果级、结果级、查询-域级或域级中之一的所述历史用户的相应行为数据来将所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据进行聚合。
技术方案20.一种包括计算机可执行指令的计算机可读存储介质,当所述计算机可执行指令被处理器执行时,使得所述处理器执行以下动作,所述动作包括:
执行响应于搜索查询而针对用户返回搜索结果的搜索操作,其中,所述搜索操作由处理器执行;
针对所述搜索操作所返回的搜索结果中的每个搜索结果,将所述用户对相应搜索结果的相应的经合并的亲和性直接计算成相应正亲和性与相应负亲和性之差,其中:
所述相应正亲和性是所述用户的社交活动数据与点击了所述相应搜索结果的第一组历史用户的聚合社交活动数据之间的点积;以及
所述相应负亲和性是所述用户的社交活动数据与跳过了所述对应搜索结果的第二组历史用户的聚合社交活动数据之间的点积;以及
至少部分地基于针对所述搜索结果中的每个搜索结果的所述相应搜索结果的所述相应的经合并的亲和性,来对所述搜索操作所返回的搜索结果进行排序。
以上所描述的内容包括一个或更多个实施方式的示例。当然不可能为了描述前述各方面的目的而描述以上设备和方法的每一个可能的修改和变更,但是本领域的普通技术人员可以意识到可以对各个方面做出很多另外的修改和置换。因此,所描述的方面意在包括落在所附权利要求的精神和范围内的所有这些变更、修改和变形。此外,关于在详细的说明书或者权利要求中使用的术语“包括(include)”,如当“包括(comprising)”在权利要求中被用作过渡性词汇时所被解释的那样,这样的术语“包括(incIude)”意在与术语“包括(comprising)”类似地是开放式的。

Claims (8)

1.一种利用社交活动数据来对由计算操作所返回的结果的排序进行个性化的方法,包括:
执行针对用户返回结果的计算操作,其中,所述计算操作由处理器执行;
针对所述计算操作所返回的结果中的每个结果:
基于历史用户的行为数据来形成点击了相应结果的第一组历史用户和跳过了所述相应结果的第二组历史用户,其中,所述历史用户的所述行为数据包括所述历史用户点击的结果和跳过的结果的相应日志;
基于所述用户的社交活动数据与点击了所述相应结果的所述第一组历史用户的社交活动数据之间的相关性,来计算所述用户对所述相应结果的相应第一亲和性;以及
基于所述用户的社交活动数据与跳过了所述相应结果的所述第二组历史用户的社交活动数据之间的相关性,来计算所述用户对所述相应结果的相应第二亲和性;以及
至少部分地基于针对所述结果中的每个结果的所述相应结果的所述相应第一亲和性和所述相应第二亲和性,来对所述计算操作所返回的结果进行排序。
2.根据权利要求1所述的方法,其中,所述用户的社交活动数据、所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据包括由所述用户、所述第一组中的历史用户和所述第二组中的历史用户所分别表达的关于社交网络内容的反馈。
3.根据权利要求1所述的方法,其中,所述用户的社交活动数据、所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据包括所述用户、所述第一组中的历史用户和所述第二组中的历史用户的各自的简介数据、各自的所分享的社交网络内容、各自的已安装的应用的列表或各自的积极使用的应用的列表中的至少一个。
4.根据权利要求1所述的方法,还包括:合并所述相应结果的所述相应第一亲和性和所述相应第二亲和性,以生成用于排序的所述相应结果的相应的经合并的亲和性得分。
5.根据权利要求1所述的方法,还包括:
将所述用户对所述相应结果的所述相应第一亲和性计算成所述用户的社交活动数据与点击了所述相应结果的所述第一组中的历史用户的社交活动数据之间的点积的过去痕迹的总和;以及
将所述用户对所述相应结果的所述相应第二亲和性计算成所述用户的社交活动数据与跳过了所述相应结果的所述第二组中的历史用户的社交活动数据之间的点积的过去痕迹的总和。
6.根据权利要求1所述的方法,还包括:
将所述用户对所述相应结果的所述相应第一亲和性计算成所述用户的社交活动数据与点击了所述相应结果的所述第一组中的历史用户的聚合社交活动数据之间的点积;以及
将所述用户对所述相应结果的所述相应第二亲和性计算成所述用户的社交活动数据与跳过了所述相应结果的所述第二组中的历史用户的聚合社交活动数据之间的点积。
7.根据权利要求1所述的方法,其中,基于以查询-结果级、结果级、查询-域级或域级之一的所述历史用户的相应行为数据来对所述点击了所述相应结果的所述第一组历史用户的社交活动数据和所述跳过了所述相应结果的所述第二组历史用户的社交活动数据进行聚合。
8.一种利用社交活动数据来对由搜索操作响应于搜索查询而向用户返回的搜索结果(102)的排序进行个性化的系统(100),其中,所述搜索操作由处理器执行,所述系统包括:
数据存储库(104),所述数据储存库包括用户的社交活动数据(114)和历史用户的社交活动数据(106,108);
行为分组部件,针对所述搜索操作所返回的所述搜索结果中的每个结果,所述行为分组部件根据保存在所述数据存储库中的历史用户的行为数据来形成点击了相应结果的第一组历史用户和跳过了所述相应结果的第二组历史用户,其中,所述历史用户的所述行为数据包括针对一组搜索查询所述历史用户点击的搜索结果和跳过的搜索结果的相应日志;
相关性部件(118),所述相关性部件针对所述搜索操作所返回的结果中的每个搜索结果,计算所述用户对所述相应搜索结果的相应正亲和性和所述用户对所述相应搜索结果的相应负亲和性,其中,所述正亲和性是基于所述用户的社交活动数据与点击了所述相应搜索结果的所述第一组历史用户的社交活动数据之间的相关性来计算的,并且其中,所述负亲和性是基于所述用户的社交活动数据与跳过了所述相应搜索结果的所述第二组历史用户的社交活动数据之间的相关性来计算的;以及
排序部件(120),所述排序部件至少部分地基于针对所述搜索结果中的每个搜索结果的所述相应搜索结果的所述相应正亲和性和所述相应负亲和性来对所述搜索操作所返回的搜索结果进行排序。
CN201310271852.XA 2012-06-22 2013-06-21 基于社交活动数据的排序 Active CN103514253B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/531,488 2012-06-22
US13/531,488 US8972399B2 (en) 2012-06-22 2012-06-22 Ranking based on social activity data

Publications (2)

Publication Number Publication Date
CN103514253A CN103514253A (zh) 2014-01-15
CN103514253B true CN103514253B (zh) 2017-05-31

Family

ID=48699350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310271852.XA Active CN103514253B (zh) 2012-06-22 2013-06-21 基于社交活动数据的排序

Country Status (3)

Country Link
US (1) US8972399B2 (zh)
CN (1) CN103514253B (zh)
WO (1) WO2013192255A2 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135250B1 (en) 2012-02-24 2015-09-15 Google Inc. Query completions in the context of a user's own document
US8959086B2 (en) * 2012-06-29 2015-02-17 International Business Machines Corporation Automated online social network inter-entity relationship management
US9852233B2 (en) * 2013-03-15 2017-12-26 Ebay Inc. Autocomplete using social activity signals
US10372715B1 (en) * 2013-04-03 2019-08-06 Google Llc Multiple entity merge for ranking objects in a social network
WO2015094158A1 (en) * 2013-12-16 2015-06-25 Hewlett-Packard Development Company, L.P. Determining preferred communication explanations using record-relevancy tiers
US9367628B2 (en) * 2014-01-03 2016-06-14 Facebook, Inc. Object recommendation based upon similarity distances
US20160335683A1 (en) * 2014-07-17 2016-11-17 Mark Edward Roberts Rating System and Method
US20160132905A1 (en) * 2014-10-31 2016-05-12 Innoventions Holdings, Llc System for measuring audience reception towards artists and for directing resources to artists based upon their measured audience reception
US20170004434A1 (en) * 2015-06-30 2017-01-05 International Business Machines Corporation Determining Individual Performance Dynamics Using Federated Interaction Graph Analytics
CN109582744B (zh) * 2017-09-29 2021-08-10 阿里巴巴(中国)有限公司 一种用户满意度评分方法及装置
US11430006B2 (en) * 2019-10-28 2022-08-30 Oracle International Corporation Determining a target group based on product-specific affinity attributes and corresponding weights
US11631036B2 (en) * 2020-05-11 2023-04-18 Fujitsu Limited Bias mitigation in machine learning pipeline

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1288795A1 (en) * 2001-08-24 2003-03-05 BRITISH TELECOMMUNICATIONS public limited company Query systems
US20030135499A1 (en) 2002-01-14 2003-07-17 Schirmer Andrew Lewis System and method for mining a user's electronic mail messages to determine the user's affinities
US7181447B2 (en) * 2003-12-08 2007-02-20 Iac Search And Media, Inc. Methods and systems for conceptually organizing and presenting information
US7844671B1 (en) * 2004-04-07 2010-11-30 Cisco Technology, Inc. Communication systems and methods with social network filtering
US7577646B2 (en) * 2005-05-02 2009-08-18 Microsoft Corporation Method for finding semantically related search engine queries
US7849104B2 (en) 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US20110022621A1 (en) 2007-08-17 2011-01-27 Google Inc. Dynamically naming communities within online social networks
US9348912B2 (en) * 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations
US20100070488A1 (en) 2008-09-12 2010-03-18 Nortel Networks Limited Ranking search results based on affinity criteria
US20100082434A1 (en) 2008-09-29 2010-04-01 Yahoo! Inc. Personalized search results to multiple people
US8032535B2 (en) 2009-04-21 2011-10-04 Yahoo! Inc. Personalized web search ranking
US8661050B2 (en) 2009-07-10 2014-02-25 Microsoft Corporation Hybrid recommendation system
CN101944218A (zh) * 2010-01-27 2011-01-12 北京大学 社会网络下的基于图的个性化推荐方法及其系统
US8180804B1 (en) * 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US20120011112A1 (en) 2010-07-06 2012-01-12 Yahoo! Inc. Ranking specialization for a search
US9268865B2 (en) 2010-09-24 2016-02-23 Facebook, Inc. Ranking search results by social relevancy
US8886643B2 (en) * 2010-09-24 2014-11-11 Google Inc. Presenting social search results
US20120173320A1 (en) * 2011-01-05 2012-07-05 Epcsolutions, Inc. Method and system for facilitating commerce, social interaction and charitable activities
US20120229625A1 (en) * 2011-03-08 2012-09-13 Bank Of America Corporation Providing affinity program information
US20120295633A1 (en) * 2011-05-19 2012-11-22 Elad Yom-Tov Using user's social connection and information in web searching
US10395256B2 (en) * 2011-06-02 2019-08-27 Visa International Service Association Reputation management in a transaction processing system

Also Published As

Publication number Publication date
WO2013192255A2 (en) 2013-12-27
US20130346404A1 (en) 2013-12-26
US8972399B2 (en) 2015-03-03
WO2013192255A3 (en) 2014-09-18
CN103514253A (zh) 2014-01-15

Similar Documents

Publication Publication Date Title
CN103514253B (zh) 基于社交活动数据的排序
Kopalle et al. Examining artificial intelligence (AI) technologies in marketing via a global lens: Current trends and future research opportunities
US11798053B2 (en) Information provision system, information provision method, and storage medium
CN103853824B (zh) 一种基于深度语义挖掘的内文广告发布方法与系统
Banerjee et al. Using supervised learning to classify authentic and fake online reviews
Verbert et al. Visualizing recommendations to support exploration, transparency and controllability
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
US8661050B2 (en) Hybrid recommendation system
CN103890761B (zh) 自动生成推荐的方法和装置
KR102347306B1 (ko) 빅데이터를 활용한 모임 구성원 매칭 방법 및 시스템
US10733658B2 (en) Methods and systems of discovery of products in E-commerce
US20160055563A1 (en) Methods and systems of discovery of products in e-commerce
CA2729716A1 (en) Information processing with integrated semantic contexts
Wu et al. An approach of product usability evaluation based on Web mining in feature fatigue analysis
US20140288999A1 (en) Social character recognition (scr) system
US20150160847A1 (en) System and method for searching through a graphic user interface
CN106294500A (zh) 内容项目的推送方法、装置及系统
Hong et al. Development of a new knowledge-based fabric recommendation system by integrating the collaborative design process and multi-criteria decision support
US11488223B1 (en) Modification of user interface based on dynamically-ranked product attributes
CN102866997B (zh) 用户数据的处理方法和装置
KR20180010147A (ko) 사용자 맞춤식 가치 정보 검색 및 소셜 네트워크 구성 시스템 및 그 방법
US20220292156A1 (en) Optimized artificial intelligence search system and method for providing content in response to search queries
JP4975273B2 (ja) 話題遷移制御装置、話題遷移制御システム、及び、話題遷移制御方法
Yamaba et al. On a serendipity-oriented recommender system based on folksonomy
de Paiva et al. An ontology-based recommender system architecture for semantic searches in vehicles sales portals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1191421

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150624

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150624

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1191421

Country of ref document: HK