CN102419755A - 一种搜索结果的排序方法和装置 - Google Patents

一种搜索结果的排序方法和装置 Download PDF

Info

Publication number
CN102419755A
CN102419755A CN2010102991000A CN201010299100A CN102419755A CN 102419755 A CN102419755 A CN 102419755A CN 2010102991000 A CN2010102991000 A CN 2010102991000A CN 201010299100 A CN201010299100 A CN 201010299100A CN 102419755 A CN102419755 A CN 102419755A
Authority
CN
China
Prior art keywords
daily record
record document
query requests
correlativity
expectation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102991000A
Other languages
English (en)
Other versions
CN102419755B (zh
Inventor
金华兴
郑伟
黄鹏
杨旭
林锋
冯炯
张勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2010102991000A priority Critical patent/CN102419755B/zh
Priority to TW099140211A priority patent/TWI512506B/zh
Priority to US13/381,069 priority patent/US8538975B2/en
Priority to PCT/US2011/053290 priority patent/WO2012047593A2/en
Priority to JP2013530401A priority patent/JP5864586B2/ja
Priority to EP11831251.1A priority patent/EP2622514A4/en
Publication of CN102419755A publication Critical patent/CN102419755A/zh
Priority to HK12106883.3A priority patent/HK1166162A1/xx
Application granted granted Critical
Publication of CN102419755B publication Critical patent/CN102419755B/zh
Priority to US13/961,390 priority patent/US8862604B2/en
Priority to US14/486,666 priority patent/US9372899B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Abstract

本申请实施例公开了一种搜索结果的排序方法和装置。其中,所述方法包括:从日志系统中提取出被曝光的日志文档;计算所述日志文档与查询请求的相关性的贝叶斯后验概率;根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;按照期望值从大到小的顺序对查询到的日志文档进行排序。根据本申请实施例,可以减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。

Description

一种搜索结果的排序方法和装置
技术领域
本申请涉及通信和计算机技术领域,特别是涉及一种搜索结果的排序方法和装置。
背景技术
当用户向搜索引擎提交一个查询请求后,搜索引擎会检索到大量与用户的查询请求相关的信息。同时,搜索引擎会根据每个信息与查询请求的相关性程度,对信息进行排序,以便用户可以快速地通过搜索引擎查找到最想要的信息。
目前,搜索引擎大多利用CTR(Click-Through-Rate,点击到达率)反映每个信息与用户查询请求的相关性程度,其中,CTR为信息被点击的次数与信息被曝光次数的商。当搜索引擎计算得到每个信息的CTR后,在搜索结果列表中,按照CTR从大到小的顺序对信息进行排序。
但是,发明人在研究中发现,一个信息与用户查询请求的相关性程度往往与该信息在搜索结果列表中的位置和在搜索结果列表中的点击顺序有关。例如,在同一个搜索结果展现页面中,即使相关性相同,不同位置的信息的CTR也会不一样。或者,在先被用户点击的信息,会影响位于其后面的信息的被点击概率。
然而,现有技术中在对搜索结果进行排序的过程中一方面只考虑到了信息被点击的次数和信息被曝光的次数,而没有考虑到在整个排序过程中,信息在搜索结果列表中的位置因素和在搜索结果列表中的被点击顺序的因素,使排序时所依据的相关性分数存在较大偏差,在多数情况下把用户想要获得的信息排在了搜索结果列表的后面,最终导致对搜索结果的排序效果差。另一方面,当对搜索结果的排序效果较差的时,用户通常需要进一步浏览和点击更多的信息才能获得最想要的信息,而用户在网站上“盲目地”进行大范围的浏览和点击的过程时,势必会增加网络系统,特别是搜索引擎服务器的负载,降低了网络系统的利用率。从而增加了搜索过程对于搜索引擎服务器的消耗,同时,也浪费了搜索引擎服务器的系统资源。
发明内容
为了解决上述技术问题,本申请实施例提供了一种搜索排序方法和装置,以减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
本申请实施例公开了如下技术方案:
一种搜索结果的排序方法,包括:从日志系统中提取出被曝光的日志文档;计算所述日志文档与查询请求的相关性的贝叶斯后验概率;根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;按照期望值从大到小的顺序对查询到的日志文档进行排序。
一种搜索结果的排序装置,包括:提取模块,用于从日志系统中提取出被曝光的日志文档;概率计算模块,用于计算所述日志文档与查询请求的相关性的贝叶斯后验概率;期望值计算模块,用于根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;索引建立模块,用于将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;检索模块,用于当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;排序模块,用于按照期望值从大到小的顺序对查询到的日志文档进行排序。
由上述实施例可以看出,本申请在整个排序过程中,考虑到了信息在搜索结果列表中的位置因素和在搜索结果列表中的被点击顺序的因素,即,基于贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,当从检索数据结构中查询到与用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值后,按照相关性的期望值从大到小的顺序对日志文档进行排序,从而使排序时所依据的相关性更好。同时,也使用户减少浏览的时间和点击的次数,快速地获得最想要的信息,减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一种搜索结果的排序方法的一个实施例的流程图;
图2为本申请一种构建的概率模型结构示意图;
图3为本申请一种搜索结构的排序方法的另一个实施例的流程图;
图4为本申请一种搜索排序系统的结构示意图;
图5为本申请一种搜索结果的排序装置的一个实施例的结构示意图;
图6为本申请一种搜索结果的排序装置的另一个实施例的结构示意图;
图7为本申请一种搜索结果的排序装置的另一个实施例的结构示意图;
图8为本申请一种搜索结果的排序装置的另一个实施例的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例进行详细描述。
实施例一
请参阅图1,其为本申请一种搜索结果的排序方法的一个实施例的流程图,该方法包括以下步骤:
步骤101:从日志系统中提取出被曝光的日志文档;
其中,在日志系统中以增量更新的方式保存有历史被曝光的日志文档和当天被曝光的日志文档。从日志系统中提取出在日志系统保存的所有被曝光的日志文档。用户通过搜索引擎进行查询时,与查询请求相关的搜索结果会展示给用户,该展示给用户的搜索结果即为被曝光的搜索结果,该被曝光的搜索结果以日志文档的形式保存在日志系统中。
步骤102:计算所述日志文档与查询请求的相关性的贝叶斯后验概率;
其中,发明人在研究中发现,一个信息与用户查询请求的相关性程度往往与该信息在搜索结果列表中的位置和在搜索结果列表中的被点击顺序有关。例如,当用户面对一个搜索结果展示页面时,一般会从上至下逐一浏览日志文档在网页中所展示的展示信息,如果发现某一个日志文档的展示信息符合自身的搜索意图,就会点击该展示信息并查看详细内容。当查看完该展示信息的详细内容后,可能会继续浏览下面的日志文档的展示信息,也有可能因为查看到了需要的内容而结束浏览。由此可见,用户是否点击某个日志文档主要取决于用户是否浏览到该日志文档,以及该日志文档与用户查询请求的相关性程度。而用户是否继续浏览下面的日志文档主要取决于之前日志文档的点击情况。
基于上述情况,建立一个数学模型。如图2所示,其为本申请一种构建的概率图模型结构示意图。图2中的每个节点代表一个随机变量,S表示日志文档与用户查询请求的相关性,E表示用户是否看到日志文档,C表示用户是否点击日志文档,下标表示日志文档在一个搜索结果展示页面中的位置,M表示一个搜索结果展示页面中的日志文档总数目。根据前述分析可知,用户是否点击某个日志文档与用户是否浏览到该日志文档,以及该日志文档与用户查询请求的相关性程度有关,用户是否浏览下面的日志文档与之前日志文档的点击情况有关,因此,从图2中可以看出,在该模型中,例如,S1和E1分别指向C1,表示用户是否点击一个日志文档C1与用户是否浏览到该日志文档E1,以及该日志文档与用户查询请求的相关性程度S1有关,而C1指向E2,表示用户是否继续浏览下面的日志文档E2与之前日志文档C1的点击情况有关。
根据如图2所示的数学模型的概率推论,当先验分布在[0,1]上服从均匀分布时,其中,0和1表示实数值区间的两个端点,即,相关性变量的先验分布是从0到1的实数值区间上的均匀分布,在用户点击日志文档C1、C2...和CN的情况下,日志文档与查询请求的相关性的联合后验分布计算公式为:
p ( R | c 1 : N ) = 1 z Π j = 1 N R j N j Π ( r , d ) ∈ T ( 1 - β r , d R j ) N ~ j , r , d
其中,上述公式中的Rj表示日志文档j与用户查询请求的相关性随机变量,Nj表示日志文档j被点击的总次数,表示日志文档j位于r+d处且没有被点击,位置r处的日志文档被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数,T表示所有(r,d)的可能取值,βr,d为一个全局参数,N表示从日志系统中提取的日志文档的总数目,z表示归一化系数。
从上述联合分布的形式可以看出,联合分布可以分解为单个文档分布的乘积。因此,单个文档j的相关性后验分布计算公式为:
p ( R j | c 1 : N ) = 1 z R j N j Π 0 ≤ r ≤ M - 1,1 ≤ d ≤ M - r ( 1 - β r , d R j ) N ~ j , r , d
z = ∫ 0 1 R j N j Π 0 ≤ r ≤ M - 1,1 ≤ d ≤ M - r ( 1 - β r , d R j ) N ~ j , r , d d R j
其中,βr,d为一个全局参数,其估计值
Figure BSA00000292202100055
Nr,d为在日志文档j所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;
Figure BSA00000292202100056
为在日志文档j所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示日志文档j所在的同一点击序列中所有日志文档的总数。其中,所述同一个点击序列即为针对同一个用户查询请求而获得的所有查询结果构成的序列。例如,针对用户查询请求“MP3”,有100个日志文档为该用户查询请求的所有查询结果,则100个日志文档构成针对“MP3”的同一个点击序列。
步骤103:根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;
其中,根据上述步骤得到的贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,期望值的计算公式为:
E ( R j ) = ∫ 0 1 R j p ( R j | C 1 : N ) d R j
需要说明的是,由于计算期望值的开销比较大,会消耗较大的系统资源。为了避免计算期望值所带来的资源消耗,在本步骤计算日志文档的相关性的期望值之前,对日志文档进行过滤。其中,有一些日志文档与用户查询请求的相关性不好也不坏。在实际应用中,为了节省空间和时间,需要对这种相关性不好也不坏的日志文档进行过滤。
通常,当日志文档与用户查询请求的相关性的期望值为0.5时,表示相关性不好也不坏,因此,可以过滤掉与用于查询请求的相关性的期望值为0.5的日志文档。而本申请需要提供一种在计算期望值之前,就可以过滤掉相关性不好也不坏的日志文档。
优选的,在所述根据贝叶斯后验概率计算日志文档与查询请求的相关性的期望值之前,还包括:根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤。其中,全局参数指的是和用户查询请求无关的一个参数,反应的是用户对一个搜索引擎的评价的一组指标参数。在给定的情况下,全局参数与日志文档与查询请求的相关性的期望值通过概率分布函数建立起了对应关系,按照期望值的阈值过滤等价于全局参数的阈值过滤,这种关系的推导需要预先做出解析,然后在系统初始化阶段根据期望值的阈值计算全局参数的阈值,在日志处理阶段就可以根据全局参数的阈值进行过滤。
例如,从提取出的被曝光的日志文档中筛选出被曝光一次且没有被点击的日志文档;从筛选出的日志文档中按照过滤条件公式
Figure BSA00000292202100071
过滤全局参数小于对应的预设阈值的日志文档,其中,βr,d为全局参数,
Figure BSA00000292202100072
Nr,d为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;例如,为了便于描述,以一个包含5个日志文档的同一个点击序列为例来说明,已知位置排列第一、第三和第五的日志文档被点击,位置排列第二和第四的日志文档没有被点击。则位置排列第一和第三的日志文档都被点击,而位置排列位于第二和第二之间,即位置排列位于第二的日志文档没有被点击,该情况的发生次数为1次,同时,位置排列第三和第五的日志文档都被点击,而位置排列位于第三和第五之间,即位置排列位于第四的日志文档没有被点击,该情况的发生次数为1次。因此,在以上的同一个点击序列中,Nr,d为2。
Figure BSA00000292202100073
为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示被筛选出的日志文档所在的同一点击序列中所有日志文档的总数,Eth为与日志文档与查询请求的相关性的期望值对应的预设阈值。
需要说明的是,上述Eth为与相关性的期望值对应的预设阈值。通常,对日志文档与查询请求的相关性的期望值设定一个阈值,如设定阈值为0.5,则可以过滤掉相关性的期望值为0.5的日志文档。当然,可以根据用户的使用需求和应用场景任意设定与相关性的期望值对应的预设阈值,本申请实施例对此并不限定。
当对日志文档进行过滤后,在本步骤中,计算过滤后的日志文档的期望值。
另外,当计算了日志文档与查询请求的相关性的期望值后,且在将日志文档与查询请求的相关性的期望值作为value存储在检索数据结构之前,优选的,还可以再进行一次日志文档的过滤,以保证经过二次过滤后,检索数据结构中保存的日志文档与查询请求的相关性更高,搜索引擎可以快速地从检索数据结构中检索到与用户提交的查询请求相关的日志文档和其期望值。此处,由于已经计算得到了日志文档与查询请求的相关性的期望值,因此,可以直接利用日志文档与查询请求的相关性的期望值进行过滤,即,当日志文档与查询请求的相关性的期望值等于预设数值时,过滤掉该日志文档。
此外,还可以根据贝叶斯后验概率计算日志文档与查询请求的相关性的方差,可以直接利用日志文档与查询请求的相关性的方差进行过滤,即,当日志文档与查询请求的相关性的方差等于预设数值时,过滤掉该日志文档。其中,方差的计算公式为:
Figure BSA00000292202100081
还需要说明的是,可以根据用户的使用需求和应用场景任意设定与日志文档与查询请求的相关性的期望值或者方差对应的预设阈值,本申请实施例对此并不限定。
步骤104:将查询请求和日志文档的标识作为key,将所述日志文档与查询请求的相关性的期望值作为value存储在检索数据结构中;
例如,key=查询请求和日志文档的标识所占内存的连续块,其中,查询请求的一个字符占一个内存字节,日志文档的标识用4个字节的内存表示;value=期望值乘以10000的整数部分所占内存。key和value在检索数据结构中的索引可以采用常用的trie树建立,本申请实施例对此不再做详细说明。
优选的,为了保证检索数据结构的准确性,在将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中之后,还包括:对所述检索数据结构进行校验;则所述从检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值为:从通过校验的检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值。
其中,将检索数据结构中的键作为输入数据,经过搜索引擎在检索数据结构的检索后,如果输出的结果是与作为输入数据的键对应的值,则通过验证。例如,在检索数据结构中有一组键值对,该键值对中键对应的查询请求为“MP3”,对应的日志文档标识为ID1、ID2和ID3,该键值对中值对应的日志文档与查询请求的相关性的期望值为0.5、0.8和0.7。分别将“MP3和ID1”、“MP3和ID2”和“MP3和ID3”作为输入数据,经过搜索引擎在检索数据结构中检索后,如果输出的结果分别为0.5、0.8和0.7,则通过检验,否则,没有通过检验。
将检索数据结构中的所有键按照上述方式逐一地校验,当所有键都通过校验后,则该检索数据结构通过校验。
步骤105:当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;
步骤106:按照期望值从大到小的顺序对查询到的日志文档进行排序。
由上述实施例可以看出,本申请基于贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,当从检索数据结构中查询到与用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值后,按照期望值从大到小的顺序对日志文档进行排序,考虑到了信息的位置因素和点击顺序的因素,使用户快速获得最想要的信息。减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
实施例二
下面详细说明一种搜索结果的排序方法的优选实施方式。请参阅图3,其为本申请一种搜索结果的排序方法的另一个实施例的流程图,所述方法包括以下步骤:
步骤301:从日志系统中提取出当天被曝光的日志文档和历史被曝光的日志文档;
其中,还可以分别保留一定时间段内当天被曝光的日志文档和历史被曝光的日志文档,例如,保留一个滑动时间窗口内的日志文档,作为一种备份,一旦系统运行过程中发现异常情况,可以用来排查问题和恢复数据。
步骤302:根据日志系统中提取出的当天被曝光的日志文档和历史被曝光的日志文档,分别计算当天局部统计量和历史局部统计量;
其中,局部统计量包括NjNj表示日志文档j被点击的总次数,表示日志文档j位于r+d处且没有被点击,位置r处的日志文档被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数,T表示所有(r,d)的可能取值。
步骤303:将当天局部统计量和历史局部统计量进行合并;
其中,还可以分别保存一段时间内的当天局部统计量和历史局部统计量,以支持增量更新和排查运行中可能出现的问题,以及恢复数据。
步骤304:根据日志系统中提取的当天被曝光的日志文档和历史被曝光的日志文档,分别计算当天全局统计量和历史全局统计量;
其中,全局统计量包括Nr,d
Figure BSA00000292202100102
Nr,d为在日志文档j所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;
Figure BSA00000292202100103
为在日志文档j所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数,r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示日志文档j所在的同一点击序列中所有日志文档的总数。
步骤305:将当天局部统计量和历史局部统计量进行合并;
其中,还可以分别保存一段时间内的当天全局统计量和历史全局统计量,以支持增量更新和排查运行中可能出现的问题,以及恢复数据。
步骤306:根据合并后的全局统计量,计算全局参数;
其中,全局参数为
Figure BSA00000292202100104
Figure BSA00000292202100105
步骤307:根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤;
步骤308:计算过滤后的日志文档与查询请求的相关性的贝叶斯后验概率;
其中,计算日志文档与查询请求的相关性的贝叶斯后验概率的过程已经在实施例一中进行了详细地说明,故此处不再赘述,相关计算过程可以参见实施例一。
步骤309:根据贝叶斯后验概率计算过滤后的日志文档与查询请求的相关性的期望值;
其中,计算日志文档与查询请求的相关性的期望值的过程已经在实施例一中进行了详细地说明,故此处不再赘述,相关计算过程可以参见实施例一。
步骤310:根据日志文档与查询请求的相关性的期望值对日志文档进行过滤,使相关性的期望值等于预设预置的日志文档被过滤掉;
步骤311:将查询请求和日志文档的标识作为key,将所述日志文档与查询请求的相关性的期望值作为value存储在检索数据结构中;
其中,还可以对检索数据结构进行校验,得到通过校验的检索数据结构。
步骤312:当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;
步骤313:按照期望值从大到小的顺序对查询到的日志文档进行排序。
本申请中的搜索结果的排序方法可以应用在搜索领域,如图4所示,其为本申请一种搜索排序系统的结构示意图。每天提取新的搜索日志,每天增量更新,输出相关性的索引数据,更新到搜索排序系统中,作为排序的一个重要因素。
另外,本申请中的搜索结果的排序方法还可以应用在排序的评价系统。例如,给定一个查询请求,通过本申请中的排序方法得到日志文档序列中的每个日志文档与查询请求的相关性分值,这种分值是用户对排序的一种隐式评价,可以归一化该相关性分值序列,形成一个概率分布函数p(x)。同时,用待评价的排序方法对同一个日志文档序列中的每个日志文档计算相关性分值并进行归一化,形成一个概率分布函数g(x)。将p(x)和g(x)的距离作为对待评价的排序方法的评估,差距越小,则待评价的排序方法的评价越高。距离计算公式可以为:
Figure BSA00000292202100111
另外,本申请中的搜索结果的排序方法还可以应用在排序的训练系统。例如,通过本申请中的排序方法得到(查询,文档)对的相关性分值,用Y表示,然后抽取(查询,文档)对的特征,用X表示,如文本特征和图像特征。然后,用于机器学习方法训练得到相关性算法Y=f(X)。
由上述实施例可以看出,本申请基于贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,当从检索数据结构中查询到与用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值后,按照期望值从大到小的顺序对日志文档进行排序,考虑到了信息的位置因素和点击顺序的因素,使用户快速获得最想要的信息。减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
实施例三
与上述一种搜索结果的排序方法相对应,本申请实施例还提供了一种搜索结果的排序装置。请参阅图5,其为本申请一种搜索结果的排序装置的一个实施例的结构示意图,包括:提取模块501、概率计算模块502、期望值计算模块503、索引建立模块504、检索模块505和排序模块506。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
提取模块501,用于从日志系统中提取出被曝光的日志文档;
概率计算模块502,用于计算所述日志文档与查询请求的相关性的贝叶斯后验概率;
期望值计算模块503,用于根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;
索引建立模块504,用于将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;
检索模块505,用于当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;
排序模块506,用于按照期望值从大到小的顺序对查询到的日志文档进行排序。
优选的,请参阅图6,其为本申请一种搜索结果的排序装置的另一个实施例的结构示意图。除了包括有提取模块501、概率计算模块502、期望值计算模块503、索引建立模块504、检索模块505和排序模块506之外,所述装置还包括:第一过滤模块507,用于在根据所述贝叶斯后验概率计算日志文档与查询请求的相关性的期望值之前,根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤;
则期望值计算模块503,用于根据贝叶斯后验概率计算过滤后的日志文档与查询请求的相关性的期望值。
其中,第一过滤模块507进一步包括:筛选子模块5071和过滤子模块5072,
筛选子模块5071,用于从提取出的被曝光的日志文档中筛选出被曝光一次且没有被点击的日志文档;
过滤子模块5072,从筛选出的日志文档中,按照过滤条件公式
Figure BSA00000292202100131
过滤掉全局参数小于对应的预设阈值的日志文档,其中,βr,d为全局参数,
Figure BSA00000292202100132
Nr,d为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下的发生次数;
Figure BSA00000292202100133
为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数;r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示被筛选出的日志文档所在的同一点击序列中所有日志文档的总数,Eth为与相关性的期望值对应的预设阈值。
优选的,请参阅图7,其为本申请一种搜索结果的排序装置的另一个实施例的结构示意图。所述装置还包括:第二过滤模块508,用于在所述将查询请求和日志文档的标识作为key,将所述日志文档的期望值作为value存储在检索数据结构中之前,根据日志文档与查询请求的相关性的期望值或者方差对日志文档进行过滤,使期望值或者方差等于对应的预设阈值的日志文档被过滤,
则索引建立模块504,用于将查询请求和日志文档的标识作为key,将过滤后的日志文档的期望值作为value存储在检索数据结构中。
优选的,请参阅图8,其为本申请一种搜索结果的排序装置的另一个实施例的结构示意图。除了包括有提取模块501、概率计算模块502、期望值计算模块503、索引建立模块504、检索模块505和排序模块506之外,所述装置还包括:校验模块509,用于在所述将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中之后,对所述检索数据结构进行校验,
则检索模块505,用于从通过校验的检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值。
由上述实施例可以看出,本申请基于贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,当从检索数据结构中查询到与用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值后,按照期望值从大到小的顺序对日志文档进行排序,考虑到了信息的位置因素和点击顺序的因素,使用户快速获得最想要的信息。减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上对本申请所提供的一种搜索结果的排序方法和装置进行了详细介绍,本文中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种搜索结果的排序方法,其特征在于,包括:
从日志系统中提取出被曝光的日志文档;
计算所述日志文档与查询请求的相关性的贝叶斯后验概率;
根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;
将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;
当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;
按照期望值从大到小的顺序对查询到的日志文档进行排序。
2.根据权利要求1所述的排序方法,其特征在于,在所述根据贝叶斯后验概率计算日志文档与查询请求的相关性的期望值之前,还包括:
根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤;
则所述根据贝叶斯后验概率计算日志文档与查询请求的相关性的期望值为:根据贝叶斯后验概率计算过滤后的日志文档与查询请求的相关性的期望值。
3.根据权利要求2所述的排序方法,其特征在于,所述根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤包括:
从提取出的被曝光的日志文档中筛选出被曝光一次且没有被点击的日志文档;
从筛选出的日志文档中,按照过滤条件公式
Figure FSA00000292202000011
过滤全局参数小于对应的预设阈值的日志文档,其中,βr,d为全局参数,
Figure FSA00000292202000012
Nr,d为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数;
Figure FSA00000292202000013
为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数;r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示被筛选出的日志文档所在的同一点击序列中所有日志文档的总数,Eth为与相关性的期望值对应的预设阈值。
4.根据权利要求1所述的排序方法,其特征在于,在所述将查询请求和日志文档的标识作为键,将所述日志文档的期望值作为值存储在检索数据结构中之前,还包括:
根据日志文档与查询请求的相关性的期望值或者方差对日志文档进行过滤,使期望值或者方差等于对应的预设阈值的日志文档被过滤;
则所述将查询请求和日志文档的标识作为键,将所述日志文档的期望值作为值存储在检索数据结构中为:将查询请求和日志文档的标识作为键,将过滤后的日志文档的期望值作为值存储在检索数据结构中。
5.根据权利要求1所述的排序方法,其特征在于,在所述将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中之后,还包括:
对所述检索数据结构进行校验;
则所述从检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值为:从通过校验的检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值。
6.根据权利要求1-5中的任意一项所述的方法,其特征在于,所述计算日志文档与查询请求的相关性的贝叶斯后验概率具体为:
根据用户是否点击日志文档与用户是否浏览到该日志文档,以及该日志文档与用户查询请求的相关性程度有关,用户是否浏览下面的日志文档与之前日志文档的点击情况有关,当先验分布在[0,1]上服从均匀分布时,计算用户点击日志文档后,日志文档与查询请求的相关性的联合后验分布。
7.一种搜索结果的排序装置,其特征在于,包括:
提取模块,用于从日志系统中提取出被曝光的日志文档;
概率计算模块,用于计算所述日志文档与查询请求的相关性的贝叶斯后验概率;
期望值计算模块,用于根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;
索引建立模块,用于将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;
检索模块,用于当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;
排序模块,用于按照期望值从大到小的顺序对查询到的日志文档进行排序。
8.根据权利要求7所述的排序装置,其特征在于,还包括第一过滤模块,用于在根据所述贝叶斯后验概率计算日志文档与查询请求的相关性的期望值之前,根据全局参数对日志文档进行过滤,使全局参数小于对应的预设阈值的日志文档被过滤;
则所述期望值计算模块,用于根据贝叶斯后验概率计算过滤后的日志文档与查询请求的相关性的期望值。
9.根据权利要求8所述的排序装置,其特征在于,所述第一过滤模块包括:
筛选子模块,用于从提取出的被曝光的日志文档中筛选出被曝光一次且没有被点击的日志文档;
过滤子模块,从筛选出的日志文档中,按照过滤条件公式
Figure FSA00000292202000031
过滤掉全局参数小于对应的预设阈值的日志文档,其中,βr,d为全局参数,
Figure FSA00000292202000032
Nr,d为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档和位置r+d处的日志文档都被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数;
Figure FSA00000292202000033
为在被筛选出的日志文档所在的同一个点击序列中,位置r处的日志文档被点击,位置r+d处的日志文档没有被点击,位置r到r+d之间的日志文档没有被点击在所有情况下发生的次数;r的取值范围为小于或等于M-1的所有自然数,d的取值范围为小于或等于M-r的所有整数,M表示被筛选出的日志文档所在的同一点击序列中所有日志文档的总数,Eth为与相关性的期望值对应的预设阈值。
10.根据权利要求7所述的排序装置,其特征在于,还包括第二过滤模块,用于在所述将查询请求和日志文档的标识作为键,将所述日志文档的期望值作为值存储在检索数据结构中之前,根据日志文档与查询请求的相关性的期望值或者方差对日志文档进行过滤,使期望值或者方差等于对应的预设阈值的日志文档被过滤,
则所述索引建立模块,用于将查询请求和日志文档的标识作为键,将过滤后的日志文档的期望值作为值存储在检索数据结构中。
11.根据权利要求7所述的排序装置,其特征在于,还包括校验模块,用于在所述将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中之后,对所述检索数据结构进行校验,
则所述检索模块,用于从通过校验的检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值。
CN2010102991000A 2010-09-28 2010-09-28 一种搜索结果的排序方法和装置 Active CN102419755B (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN2010102991000A CN102419755B (zh) 2010-09-28 2010-09-28 一种搜索结果的排序方法和装置
TW099140211A TWI512506B (zh) 2010-09-28 2010-11-22 Sorting method and device for search results
PCT/US2011/053290 WO2012047593A2 (en) 2010-09-28 2011-09-26 Method and apparatus of ordering search results
JP2013530401A JP5864586B2 (ja) 2010-09-28 2011-09-26 検索結果を順位付ける方法および装置
US13/381,069 US8538975B2 (en) 2010-09-28 2011-09-26 Method and apparatus of ordering search results
EP11831251.1A EP2622514A4 (en) 2010-09-28 2011-09-26 METHOD AND DEVICE FOR REQUESTING SEARCH RESULTS
HK12106883.3A HK1166162A1 (en) 2010-09-28 2012-07-12 Method and apparatus for ordering search results
US13/961,390 US8862604B2 (en) 2010-09-28 2013-08-07 Method and apparatus of ordering search results
US14/486,666 US9372899B2 (en) 2010-09-28 2014-09-15 Method and apparatus of ordering search results

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102991000A CN102419755B (zh) 2010-09-28 2010-09-28 一种搜索结果的排序方法和装置

Publications (2)

Publication Number Publication Date
CN102419755A true CN102419755A (zh) 2012-04-18
CN102419755B CN102419755B (zh) 2013-04-24

Family

ID=45928307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102991000A Active CN102419755B (zh) 2010-09-28 2010-09-28 一种搜索结果的排序方法和装置

Country Status (7)

Country Link
US (3) US8538975B2 (zh)
EP (1) EP2622514A4 (zh)
JP (1) JP5864586B2 (zh)
CN (1) CN102419755B (zh)
HK (1) HK1166162A1 (zh)
TW (1) TWI512506B (zh)
WO (1) WO2012047593A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103123653A (zh) * 2013-03-15 2013-05-29 山东浪潮齐鲁软件产业股份有限公司 基于贝叶斯分类学习的搜索引擎检索排序方法
CN105488195A (zh) * 2015-12-07 2016-04-13 中国人民大学 一种基于层次结构子话题的搜索结果多样化排序方法
CN106649396A (zh) * 2015-11-03 2017-05-10 腾讯科技(深圳)有限公司 游戏等级数据的排序方法、系统及装置
CN110309121A (zh) * 2018-03-22 2019-10-08 腾讯科技(深圳)有限公司 日志处理方法及装置、计算机可读介质和电子设备
CN111563158A (zh) * 2020-04-26 2020-08-21 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质
CN113220922A (zh) * 2021-06-04 2021-08-06 北京有竹居网络技术有限公司 图像搜索方法、装置和电子设备
WO2023226353A1 (zh) * 2022-05-26 2023-11-30 上海二三四五网络科技有限公司 基于点击位置因素改进的ctr热门内容计算方法及装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419755B (zh) 2010-09-28 2013-04-24 阿里巴巴集团控股有限公司 一种搜索结果的排序方法和装置
US10606883B2 (en) 2014-05-15 2020-03-31 Evolv Technology Solutions, Inc. Selection of initial document collection for visual interactive search
US10102277B2 (en) * 2014-05-15 2018-10-16 Sentient Technologies (Barbados) Limited Bayesian visual interactive search
US20150331908A1 (en) 2014-05-15 2015-11-19 Genetic Finance (Barbados) Limited Visual interactive search
CN103995869B (zh) * 2014-05-20 2017-02-22 东北大学 一种基于Apriori算法的数据缓存方法
US9390275B1 (en) * 2015-01-27 2016-07-12 Centurion Holdings I, Llc System and method for controlling hard drive data change
US11868354B2 (en) * 2015-09-23 2024-01-09 Motorola Solutions, Inc. Apparatus, system, and method for responding to a user-initiated query with a context-based response
CN105512232B (zh) * 2015-11-30 2020-02-28 北京金山安全软件有限公司 数据存储方法及装置
CN105512230B (zh) * 2015-11-30 2020-05-22 北京金山安全软件有限公司 数据存储方法及装置
CN107423298B (zh) * 2016-05-24 2021-02-19 北京百度网讯科技有限公司 一种搜索方法和装置
WO2017212459A1 (en) 2016-06-09 2017-12-14 Sentient Technologies (Barbados) Limited Content embedding using deep metric learning algorithms
US10755142B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US10755144B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US11030634B2 (en) 2018-01-30 2021-06-08 Walmart Apollo, Llc Personalized mechanisms to resolve explore-exploit dilemma with dynamically shared learnings
US11055742B2 (en) 2018-01-30 2021-07-06 Walmart Apollo, Llc Automated mechanisms to resolve explore-exploit dilemma with adaptive revival opportunities
US11042895B2 (en) 2018-01-30 2021-06-22 Walmart Apollo, Llc Automatic resolution of the explore-exploit decision in omnichannel settings

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211769A (zh) * 1997-06-26 1999-03-24 香港中文大学 基于贝叶斯网络的用于文件检索的方法和设备
CN101334773A (zh) * 2007-06-28 2008-12-31 联想(北京)有限公司 一种过滤搜索引擎查询结果的方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010043794A (ko) * 1998-06-05 2001-05-25 샌제이브 사이두 추상형 지역 탐색 기술을 사용한 컴퓨터 구현 방식의스케줄링 시스템 및 프로세스
US7702537B2 (en) 1999-05-28 2010-04-20 Yahoo! Inc System and method for enabling multi-element bidding for influencing a position on a search result list generated by a computer network search engine
US7599911B2 (en) * 2002-08-05 2009-10-06 Yahoo! Inc. Method and apparatus for search ranking using human input and automated ranking
US7424469B2 (en) * 2004-01-07 2008-09-09 Microsoft Corporation System and method for blending the results of a classifier and a search engine
US7287012B2 (en) * 2004-01-09 2007-10-23 Microsoft Corporation Machine-learned approach to determining document relevance for search over large electronic collections of documents
US7761447B2 (en) 2004-04-08 2010-07-20 Microsoft Corporation Systems and methods that rank search results
WO2006036781A2 (en) 2004-09-22 2006-04-06 Perfect Market Technologies, Inc. Search engine using user intent
US7865495B1 (en) 2004-10-06 2011-01-04 Shopzilla, Inc. Word deletion for searches
US7689615B2 (en) * 2005-02-25 2010-03-30 Microsoft Corporation Ranking results using multiple nested ranking
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US20070288399A1 (en) * 2006-05-16 2007-12-13 Mark Reynolds Qualitative retirement advice and management system and method for creating a retirement plan
US7769776B2 (en) 2006-06-16 2010-08-03 Sybase, Inc. System and methodology providing improved information retrieval
US7664744B2 (en) * 2006-07-14 2010-02-16 Yahoo! Inc. Query categorizer
NZ578672A (en) 2006-12-29 2012-08-31 Thomson Reuters Glo Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US7895206B2 (en) 2008-03-05 2011-02-22 Yahoo! Inc. Search query categrization into verticals
US8412702B2 (en) * 2008-03-12 2013-04-02 Yahoo! Inc. System, method, and/or apparatus for reordering search results
US8180766B2 (en) 2008-09-22 2012-05-15 Microsoft Corporation Bayesian video search reranking
US9449078B2 (en) 2008-10-01 2016-09-20 Microsoft Technology Licensing, Llc Evaluating the ranking quality of a ranked list
US8671093B2 (en) * 2008-11-18 2014-03-11 Yahoo! Inc. Click model for search rankings
JP4912384B2 (ja) * 2008-11-21 2012-04-11 日本電信電話株式会社 文書検索装置、文書検索方法、および文書検索プログラム
US8126894B2 (en) * 2008-12-03 2012-02-28 Microsoft Corporation Click chain model
US8620900B2 (en) 2009-02-09 2013-12-31 The Hong Kong Polytechnic University Method for using dual indices to support query expansion, relevance/non-relevance models, blind/relevance feedback and an intelligent search interface
CN102419755B (zh) 2010-09-28 2013-04-24 阿里巴巴集团控股有限公司 一种搜索结果的排序方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1211769A (zh) * 1997-06-26 1999-03-24 香港中文大学 基于贝叶斯网络的用于文件检索的方法和设备
CN101334773A (zh) * 2007-06-28 2008-12-31 联想(北京)有限公司 一种过滤搜索引擎查询结果的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103123653A (zh) * 2013-03-15 2013-05-29 山东浪潮齐鲁软件产业股份有限公司 基于贝叶斯分类学习的搜索引擎检索排序方法
CN106649396A (zh) * 2015-11-03 2017-05-10 腾讯科技(深圳)有限公司 游戏等级数据的排序方法、系统及装置
CN106649396B (zh) * 2015-11-03 2019-11-08 腾讯科技(深圳)有限公司 游戏等级数据的排序方法、系统及装置
CN105488195A (zh) * 2015-12-07 2016-04-13 中国人民大学 一种基于层次结构子话题的搜索结果多样化排序方法
CN110309121A (zh) * 2018-03-22 2019-10-08 腾讯科技(深圳)有限公司 日志处理方法及装置、计算机可读介质和电子设备
CN110309121B (zh) * 2018-03-22 2023-05-26 腾讯科技(深圳)有限公司 日志处理方法及装置、计算机可读介质和电子设备
CN111563158A (zh) * 2020-04-26 2020-08-21 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质
CN111563158B (zh) * 2020-04-26 2023-08-29 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质
CN113220922A (zh) * 2021-06-04 2021-08-06 北京有竹居网络技术有限公司 图像搜索方法、装置和电子设备
CN113220922B (zh) * 2021-06-04 2024-02-02 北京有竹居网络技术有限公司 图像搜索方法、装置和电子设备
WO2023226353A1 (zh) * 2022-05-26 2023-11-30 上海二三四五网络科技有限公司 基于点击位置因素改进的ctr热门内容计算方法及装置

Also Published As

Publication number Publication date
US20130325857A1 (en) 2013-12-05
US20130191381A1 (en) 2013-07-25
US8538975B2 (en) 2013-09-17
CN102419755B (zh) 2013-04-24
JP2014500534A (ja) 2014-01-09
EP2622514A2 (en) 2013-08-07
TW201214168A (en) 2012-04-01
US8862604B2 (en) 2014-10-14
US9372899B2 (en) 2016-06-21
TWI512506B (zh) 2015-12-11
US20150039604A1 (en) 2015-02-05
JP5864586B2 (ja) 2016-02-17
EP2622514A4 (en) 2015-04-22
WO2012047593A2 (en) 2012-04-12
HK1166162A1 (en) 2012-10-19
WO2012047593A3 (en) 2013-10-10

Similar Documents

Publication Publication Date Title
CN102419755B (zh) 一种搜索结果的排序方法和装置
CN100595759C (zh) 查询扩展方法和装置以及相关检索词库
CN103207899B (zh) 文本文件推荐方法及系统
Maki Fact and fiction in economics: models, realism and social construction
CN101241512B (zh) 一种重新定义查询词的搜索方法及装置
CN104361102B (zh) 一种基于群组匹配的专家推荐方法及系统
US10438133B2 (en) Spend data enrichment and classification
US20150220529A1 (en) Split elimination in mapreduce systems
US20080114750A1 (en) Retrieval and ranking of items utilizing similarity
US20150310073A1 (en) Finding patterns in a knowledge base to compose table answers
CN102760138A (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN111400432A (zh) 事件类型信息处理方法、事件类型识别方法及装置
CN102737021A (zh) 搜索引擎及其实现方法
CN115145871A (zh) 文件查询方法、装置和电子设备
CN102201007A (zh) 一种大规模数据搜索系统
CN102270201B (zh) 用于网络文件的多维索引的方法和设备
CN101963993A (zh) 一种数据库单表记录快速查找的方法
CN101840438B (zh) 面向源文献元关键词的检索系统
Tsai et al. Database optimization for novelty mining of business blogs
CN100495403C (zh) 联机分析处理系统中处理非空数据的方法和装置
CN107766537A (zh) 一种职位搜索排序方法及计算设备
US20180075006A1 (en) System and method for logical identification of differences between spreadsheets
CN104615685A (zh) 一种面向网络话题的热度评价方法
Jingli et al. Web clustering based on tag set similarity
Wu et al. RLC: ranking lag correlations with flexible sliding windows in data streams

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1166162

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1166162

Country of ref document: HK

TR01 Transfer of patent right

Effective date of registration: 20200421

Address after: Building 8, No. 16, Zhuantang science and technology economic block, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: ALIYUN COMPUTING Co.,Ltd.

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Ltd.

TR01 Transfer of patent right