CN102236663B - 一种基于垂直搜索的查询方法、系统和装置 - Google Patents

一种基于垂直搜索的查询方法、系统和装置 Download PDF

Info

Publication number
CN102236663B
CN102236663B CN201010160535.7A CN201010160535A CN102236663B CN 102236663 B CN102236663 B CN 102236663B CN 201010160535 A CN201010160535 A CN 201010160535A CN 102236663 B CN102236663 B CN 102236663B
Authority
CN
China
Prior art keywords
classification
commodity
query
weight
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010160535.7A
Other languages
English (en)
Other versions
CN102236663A (zh
Inventor
莫毅
宁伟
聂绪平
肖和
傅其乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201010160535.7A priority Critical patent/CN102236663B/zh
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to EP11775505.8A priority patent/EP2564305A4/en
Priority to PCT/US2011/033977 priority patent/WO2011137125A1/en
Priority to JP2013508166A priority patent/JP5778255B2/ja
Priority to US13/202,172 priority patent/US8661027B2/en
Publication of CN102236663A publication Critical patent/CN102236663A/zh
Priority to HK12100318.1A priority patent/HK1160248A1/zh
Priority to US14/148,440 priority patent/US20140122468A1/en
Application granted granted Critical
Publication of CN102236663B publication Critical patent/CN102236663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请公开了一种基于垂直搜索的查询方法、系统和装置,该方法包括:获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。通过本申请,提高了用户查询结果与用户查询意图的相关度,提高用户体验感。

Description

一种基于垂直搜索的查询方法、系统和装置
技术领域
本申请涉及网络技术领域,特别是涉及一种基于垂直搜索的查询方法、系统和装置。
背景技术
随着互联网的日益发展,互联网上存储的信息量日趋庞大。当人们需要获取某方面的专用信息时,通过搜索引擎进行搜索。但由于互联网上的信息量过大,采用通用搜索方式获取的查询结果缺乏准确性,于是垂直搜索方式得到了快速的发展。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索等,几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
当垂直搜索用于购物搜索时,用户在B2C(Business to Customer,企业对消费者购物模式)或C2C(Consumer to Customer,消费者对消费者购物模式)购物网站输入查询词购物,如图1(a)和图1(b)所示,通常会返回两部分的结果:1.商品分类的导航信息,即商品类目,2.与推送的商品类目对应的属性类目,3.对应商品类目下推送的商品。导航的商品分类名称依据树的结构组织起来,方便用户沿树结构的路径自上而下通过商品分类的信息定位到更准确的查询结果。属性类目为根据用户的历史点击记录获得的用户关注度较高的商品类目中关注度较高的商品属性。
商品类目树结构保存在数据库相对应的数据表,数据的输入与维护需要人工进行,在B2C或C2C网站中每一个商品的展示都必须属于该商品类目树的某一个节点或多个节点。
当前的电子商务网站往往商品数量过于庞大,导致商品分类过多。在上亿规模的商品数量上,商品类目树通常会接近一万个节点,每一层级的类目节点数量往往会多达几十个。在用户查询时,显示给用户的商品分类信息过多,并且无法告诉用户这些商品类目哪些对用户的查询更重要。对该问题,目前主流的解决方式是当用户查询时,逐个统计每个类目下的返回结果数量。然后把这些商品类目依据商品数量按照从大到小进行排序,并且设置一定的阀值。把商品数低于这个阀值的类目隐藏起来。达到减少分类数量的目的。
在实现本申请的过程中,发明人发现现有技术至少存在如下问题:
(1)显示的类目与用户的查询相关性很低。
(2)商品分类之间没有机制决定哪个商品类目更重要。
(3)对于商品的类目显示的数量仅仅用阀值控制会把相关性高的类目隐藏起来。
发明内容
本申请实施例提供一种基于垂直搜索的查询方法、系统和装置,用于提高用户查询结果与用户查询意图的相关度,提高用户体验感。
本申请实施例提供一种基于垂直搜索的查询方法,包括:
获取用户的查询信息;
根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;
对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
其中,所述生成最终查询结果之后,还包括:
将所述最终查询结果发送给用户,使所述用户进行查看,并根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,对所述日志进行统计分析获得类目模型,将所述类目模型更新到所述类目模型库中。
其中,所述类目模型还包括:与所述商品类目对应的属性类目;
所述生成第二查询结果的方法,还包括:根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
其中,所述查询信息仅包括用户输入的关键字时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括:
判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;
根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
其中,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括:
判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
其中,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括:
获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;
获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;
对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
其中,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括:
获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;
获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;
对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
其中,所述根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,具体包括:
获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;
根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;
存储所生成的日志。
其中,所述对所述日志进行统计分析获得类目模型,具体包括:
根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;
根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
其中,所述根据所述统计分析结果生成类目模型,具体包括:
判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;
当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
本申请实施例还提供一种基于垂直搜索的查询系统,包括查询服务器、建模服务器和日志服务器,其中,
所述查询服务器,用于获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;
所述日志服务器,用于根据所述用户对所述查询服务器生成的最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给所述建模服务器;
所述建模服务器,用于对所述日志进行统计分析,获得类目模型。
其中,所述建模服务器,还用于将所述类目模型发送给所述查询服务器;
所述查询服务器,还用于将所述最终查询结果发送给用户,使所述用户进行查看;将来自所述建模服务器的类目模型更新到所述类目模型库中。
其中,所述类目模型还包括:与所述商品类目对应的属性类目;
所述查询服务器,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
其中,所述日志服务器,具体用于获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。
其中,所述建模服务器,具体用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
其中,所述建模服务器,具体用于判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
本申请实施例还提供一种查询服务器,包括:
获取模块,用于获取用户的查询信息;
查询模块,用于根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;
合并模块,用于对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
其中,所述查询服务器,还包括:
发送模块,用于将所述最终查询结果发送给用户,使所述用户进行查看,并使日志服务器根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给建模服务器进行统计分析获得类目模型并将所述类目模型更新到所述商品类目服务器的类目模型库中。
其中,所述类目模型还包括:与所述商品类目对应的属性类目;
所述查询模块,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
其中,所述查询信息仅包括用户输入的关键字时,所述查询模块,具体包括:
判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块,用于若判断子模块判断存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;
生成子模块,用于根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
其中,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述查询模块,具体包括:
判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块,用于若判断子模块判断存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
提取子模块,用于从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
生成子模块,用于所述查询服务器获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
其中,所述合并模块,具体包括:
第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;
第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;
权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
其中,所述合并模块,具体包括:
第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;
第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;
权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
本申请具有以下优点:通过在由用户的历史点击操作生成的类目模型库和商品库中查询用户的请求,并对二者进行合并,从而提高了用户查询结果与用户查询意图的相关度,提高用户体验感。通过对第一查询结果、第二查询结果的权重进行加权合并,可以将更重要的商品类目提供给用户。另外,本申请与现有技术相比,只需在类目模型库中以及商品库中匹配查找与查询信息相匹配的商品类目,作为排序结果的商品类目仅仅是所有商品类目中的一部分;而现有技术需要统计每一个商品类目下的商品数量,并按照商品数量的大小对所有商品类目进行排序,因此,本申请节省了对商品类目的排序时间,能够更加快速的生成查询结果。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对本申请或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1(a)为现有技术中返回查询结果的结构示意图;
图1(b)为现有技术中返回的查询结果;
图2为本申请中的一种基于垂直搜索的查询方法流程图;
图3为本申请中的一种基于垂直搜索的查询系统结构示意图;
图4为本申请中的前端查询服务器的结构示意图;
图5为本申请中的类目查询服务器的结构示意图;
图6为本申请中的商品查询服务器的结构示意图;
图7为本申请中的建模服务器的结构示意图;
图8为本申请中的一种基于垂直搜索的查询方法流程图;
图9为本申请中的类目查询服务器检索与查询信息相匹配的商品类目和对应的属性类目的流程图;
图10为本申请中的一种基于垂直搜索的查询方法流程图;
图11为本申请中的一种基于垂直搜索的查询系统结构示意图;
图12为本申请中的一种查询服务器的结构示意图;
图13为本申请中的查询服务器中查询模块的结构示意图;
图14为本申请中的查询服务器中合并模块的结构示意图。
具体实施方式
本申请的实施例包括:在由用户的点击操作生成的类目模型库和商品库中查询用户的请求,并对二者进行合并作为最终的查询结果返回给用户,提高了查询结果的相关度,提高用户体验感。其中类目模型为根据用户历史的查询信息中的关键词和对应的点击记录生成的与关键词对应的商品类目和与商品类目对应的属性类目,每一个类目模型中的商品类目和属性类目为用户根据某一关键词查询时,用户所关注的查询结果,按照商品类目树的形式组织。商品库是指将各类商品按照商品类目树的形式进行存储的数据库,通过商品类目对商品进行导航,对于其中的每一个商品,存储有其对应的属性信息。
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种基于垂直搜索的查询方法,如图2所示,包括以下步骤:
步骤101、获取用户的查询信息。
其中,所述查询信息可以包括:所述用户输入的关键词、用户输入或选择的由查询系统提供的商品类目、商品属性。其中,商品类目是指将商品按照不同的种类进行划分,所得的种类名称,例如:“服装”、“手机”,用于对商品进行导航。而且商品类目是有层次和父子关系的,例如:“服装->男装->另式牛仔裤”,其中“男士牛仔裤”是“男装”的子类目,“服装”是“男装”的父类目。每一个商品都有一些属性,并从属于一个或多个类目,例如:某一品牌的男士牛仔裤,既属于“男装”商品类目,也属于“休闲装”商品类目,拥有“品牌:苹果/款式:直筒”等商品属性。与商品类目类似,将商品按照不同的属性划分,得到属性类目,例如:“品牌->国产”。
例如:若用户输入关键词“Nokia”,并未选择由查询系统提供的商品类目或商品属性,此时查询信息为“Nokia”;或用户输入关键词“Nokia”并选择由查询系统提供的商品类目“手机”,此时查询信息为“Nokia手机”。
步骤102、根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,所述类目模型包括与用户输入的关键词对应的商品类目和与商品类目对应的属性类目,并根据检索到的类目模型生成第一查询结果。
其中根据查询信息的不同,该步骤包括以下两种情况:
情况1、所述查询信息仅包括用户输入的关键字,此时根据所述查询信息在类目模型库中检索与所述查询信息相匹配的商品类目和对应的属性类目,生成第一查询结果包括以下步骤:
(1)判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字。
(2)若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止。
(3)从所获取的类目模型中获取峰值类目,并根据该峰值类目获取对应的直达属性的属性类目。其中,峰值类目是能够突出地反映用户的查询意图和需求的商品类目,可以是权重最高的商品类目,举例来说,可以是用户历史点击次数或点击概率最高的商品类目。直达属性的属性类目是从峰值类目的多个商品属性中提取的属性类目,该提取过程与从全部商品类目中获得作为查询结果中的商品类目的方法类似,此处不再赘述。
例如:当查询信息仅包括关键字“Nokia”时,在类目模型库获取到的匹配的类目模型为:手机(4000)和手机外壳(2000),其中4000为商品类目“手机”对应的权重,2000为商品类目“手机外壳”对应的权重。若此时权重门限为500,则此时峰值类目为“手机”,按照类似的流程从“手机”一商品类目下的多个属性中提取出直达属性的属性类目,例如:根据直达属性“品牌”获得“品牌”属性类目。
需要说明的是,若没有满足条件的峰值类目,则可以设定权重最高的商品类目为峰值类目,或者无峰值类目,此时无需获取直达属性的属性类目。具体的设定条件不影响本申请的保护范围,例如:权重最高的两个商品类目,此时直达属性的属性类目从该两个商品类目中各取一半。
(4)根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
具体地,将商品类目按照权重由高到低的顺序排列,生成第一查询结果中商品类目集合,同时将属性类目按照权重由高到低的顺序排列,生成第一查询结果的属性类目集合,第一查询结果中的商品类目和属性类目集合均将推送给用户。优选地,属性类目按照所属的不同属性进行分类排列。
例如:基于步骤(3),生成的第一查询结果中的商品类目集合为:手机(4000);手机外壳(2000);生成的第一查询结果中的属性类目集合为:按属性“品牌”划分的国产品牌(2000);欧美品牌(1000)。当然,属性类目集合还可以包括:按属性“网络制式”划分的GSM(1000);CDMA(500)。
情况2、所述查询信息包括用户输入的关键字和用户所选择的商品类目,此时根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括以下步骤:
判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
获取与该商品类目匹配的类目模型中的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,生成第一查询结果。
例如:当查询信息为“Nokia手机”时,由于该“手机”商品类目下没有子类目,因此第一查询结果中仅有属性类目集合,即:按属性“品牌”划分的国产品牌(2000);欧美品牌(1000)。当然,属性类目集合还可以包括:按属性“网络制式”划分的GSM(1000);CDMA(500)。
需要说明的是,若“手机”商品类目下没有子类目时,也可将该层类目作为第一查询结果中的商品类目集合,例如:手机(4000);手机外壳(2000)。
步骤103、根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和对应的属性类目,生成第二查询结果。
该步骤与现有技术类似,即在商品库中按照商品树的结构查找匹配的商品类目和对应的属性类目,生成商品类目集合和属性类目集合,此处不再赘述。
需要说明的是,第一查询结果中的类目模型是根据用户对查询结果的历史点击数据生成的,因此作为排序标准的权重为对应的点击次数或概率,而第二查询结果中商品库的商品类目是按照商品自身的分类而组织的,因此作为排序标准的权重为该商品类目、或商品属性在所有商品中的数量分布。
例如:生成的第二查询结果为:生成的第二查询结果中的商品类目集合为:手机(4000);手机挂链(2000),其中4000为商品类目“手机”对应的权重,2000为商品类目“手机挂链”对应的权重;生成的第二查询结果中的属性类目集合为:按属性“品牌”划分的国产品牌(2000);欧美品牌(500)。
步骤104、对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
具体地,第一查询结果和第二查询结果分别由商品类目集合和对应的属性类目集合组成,因此分别将两个查询结果中的商品类目集合和对应的属性类目集合进行合并,生成最终查询结果中的商品类目集合和属性类目集合,包括以下步骤:
(1)获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得。
其中,具体的加权方式可根据实际情况预先设定,如进行1比1的加权,或进行2比1的加权。
(2)获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与该商品类目对应的属性类目及其对应权重。
(3)对第一合并结果中的权重进行权重提升,使第一合并结果中的每一个权重高于第二合并结果中的每一个权重。此时,若第一合并结果中的对应集合中每一个权重已经高于第二合并结果中的每一个权重,则无需进行权重提升。
(4)按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
本申请实施例中以第一查询结果为:手机(4000);手机外壳(2000);按属性“品牌”划分的国产品牌(2000);欧美品牌(1000);生成的第二查询结果为:手机(4000);手机挂链(2000);按属性“品牌”划分的国产品牌(2000);欧美品牌(500)为例说明。
此时,对上述两个查询结果进行合并,具体地,获取商品类目集合中相同的商品类目“手机”,并对分别来自第一查询结果的权重“4000”和来自第二查询结果的“4000”进行加权,加权比例为2比1,此时,商品类目“手机”的权重为“12000”;类似地,得出按属性“品牌”划分的国产品牌(6000);欧美品牌(2500),得到第一合并结果。获取只在第一查询结果中的手机外壳(2000),进行加权后,得到第二合并结果为手机外壳(4000)。
优选地,在上述最终查询结果中提取具体的商品,并作为最终查询结果中的一部分返回给用户。例如:从最终查询结果中排在第一位的商品类目中提取点击率最高的商品及其详细信息作为最终查询结果的一部分。
步骤105、将所述最终查询结果发送给用户,使所述用户进行查看。
步骤106、根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志。
优选地,根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志包括:
获取用户对作为请求响应返回的商品类目、对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。
例如:用户在查询信息“Nokia”的最终查询结果中依次点击了“手机->Nokia->1600万色”,并在此时选择了一款手机商品进行点击查看。此时,根据用户的每一次点击操作生成日志记录,该日志记录中包括:查询信息,点击对象,相关点击对象(即点击“手机”为点击“1600万色”的相关点击操作)等等。
步骤107、根据接收的日志进行统计分析获得类目模型。
具体地,根据接收的日志进行统计分析获得类目模型包括以下步骤:
根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和对应的属性类目点击次数和/或点击概率;
根据所述统计分析结果生成类目模型;
将所述统计分析结果按照商品类目树进行排列,生成类目模型。
其中,根据所述统计分析结果生成类目模型包括:
判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;
当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
例如:对一天之内的日志进行统计分析,得到当查询信息为“Nokia”时,点击商品类目“手机”的次数为1000,点击“手机外壳”次数为500,点击“手机”下的网络制式的次数为300,其中点击“GSM”的次数为100次,点击“CDMA”的次数为50次。此时,生成的类目模型为:商品类目:手机(1000)手机外壳(500);属性类目:GSM(100)CDMA(50)。
步骤108、将所述类目模型更新到所述类目模型库中。
该步骤不断地通过用户的历史点击记录更新类目模型库,而更新后的类目模型库用于根据后续用户的查询返回查询结果,从而不断地保持类目模型库的精度,提高返回的查询结果的准确性。
当然,也可以对时间较早的数据进行数据淘汰。
需要说明的是,上述步骤102和步骤103之间无先后顺序。
为实现上述基于垂直搜索的查询方法,本申请实施例提供一种基于垂直搜索的查询系统,如图3所示,包括:日志服务器、建模服务器、查询服务器、商品库和商品类目模型库。其中,查询服务器包括为:前端查询服务器,类目查询服务器和商品查询服务器,商品类目模型库存储在类目查询服务器,商品库存储在商品查询服务器。其中,前端服务器作为用户与后台交互的媒介,用于接收用户的查询请求,并将后台的查询结果反馈给用户。而类目查询服务器和商品查询服务器用于根据前台服务器转发的查询请求在商品库和商品类目模型库中进行查询。其中,商品类目模型库中的类目模型是由建模服务器根据日志服务器记录的日志生成的。
以下分别对上述功能模块进行进一步的介绍。
其中,如图4所示,前端查询服务器包括:接收模块,用于接收用户的查询请求和类目查询服务器和商品查询服务器返回的查询结果;合并模块,用于对类目查询服务器和商品查询服务器返回的查询结果进行合并,生成最终的查询结果;发送模块,用于将用户的查询请求发送给类目查询服务器和商品查询服务器,并将接收的查询结果发送给用户。
如图5所示,类目查询服务器包括:接收模块,用于接收前端查询服务器发送的查询请求,该查询请求中携带查询信息;查询模块,用于根据查询信息在类目模型库中检索与所述查询信息相匹配的商品类目以及对应的权重和对应的属性类目以及对应的权重;发送模块,用于将查询结果发送给前端查询服务器。
如图6所示,商品查询服务器包括:接收模块,用于接收前端查询服务器发送的查询请求,该查询请求中携带查询信息;查询模块,用于根据查询信息在商品库检索与所述查询信息相匹配的商品类目以及对应的权重和对应的属性类目以及对应的权重;发送模块,用于并将查询结果发送给前端查询服务器。
如图7所示,建模服务器包括:接收模块,用于接收日志服务器生成的日志记录;统计分析模块,用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和对应的属性类目点击次数和/或点击概率。生成模块,根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。发送模块,用于将生成的类目模型发送给商品类目模型库。
上述各种服务器之间的交互过程具体包括以下两个阶段:(1)查询阶段;(2)更新阶段。
其中,查询阶段为:前端查询服务器接收用户的查询请求,所述查询请求中携带查询信息。前端查询服务器将该查询信息分别发送给类目查询服务器和商品查询服务器。类目查询服务器根据该查询信息在类目模型库中检索与所述查询信息相匹配的商品类目和/或属性类目,生成第一查询结果,并将该第一查询结果发送给前端查询服务器。商品查询服务器根据该查询信息在商品库中检索与所述查询信息相匹配的商品类目和/或属性类目,生成第二查询结果,并将该第二查询结果发送给前端查询服务器。前端查询服务器将二个查询结果进行合并,生成最终查询结果发送给用户,使用户进行点击查看。
查询后的更新阶段为:当用户在最终查询结果中进行点击查看时,前端查询服务器将该操作发送给日志服务器,使日志服务器根据该点击操作生成日志;日志服务器将一段时间内的批量日志发送给建模服务器,建模服务器根据本批数据进行统计分析,获取统计分析结果,并根据该统计分析结果生成类目模型,发送给类目查询服务器,使类目查询服务器将该生成的类目模型更新到类目模型库中。而对于商品搜索服务器中的商品库,则根据商品自身的所属类目和属性进行维护和更新。
由上述交互过过程可知,查询阶段和更新阶段是一个整体循环过程,查询的返回结果供用户点击查看,根据用户的点击查看进行更新,在根据更新后的数据进行查询,如此往复,不断更新,以提高查询的相关度。
以下结合具体应用场景,对本申请中的基于垂直搜索的查询方法进行详细阐述。
如图8所示,为本申请实施例提供的一种基于垂直搜索的查询方法,为根据查询请求在类目模型库和商品库中进行查询的过程(即查询阶段),具体包括以下步骤:
步骤301、前端查询服务器获取用户的查询请求,该查询请求中携带查询信息。
前端查询服务器通过对查询请求进行解析,获取查询信息。该解析过程具体包括,分析该查询请求是用户通过查询输入框输入的关键字还是用户在查询系统提供的商品类目或属性类目中选择的某一商品类目或属性类目。因此,所述查询请求中携带的查询信息可以为用户输入的查询关键字,也可以是用户输入的查询关键字和用户选择的商品类目或属性类目的组合。
例如:当查询请求中携带的内容为“Nokia手机滑盖”时,前端服务器从该内容中提取出查询信息“Nokia”,“手机”,“滑盖”,并分析该三个查询信息的来源,若“Nokia”为用户通过查询输入框输入的关键词,“手机”为用户选择的商品类目,“滑盖”为用户选择的属性类目,则该查询请求为用户输入的查询关键字和用户选择的商品类目或属性类目的组合。
步骤302、前端查询服务器将接收的查询信息分别转发给类目查询服务器和商品查询服务器。
步骤303、类目查询服务器根据所述查询信息在类目模型库中检索与该查询信息相匹配的商品类目和对应的属性类目,生成第一查询结果,并将第一查询结果返回给前端查询服务器。
类目模型库存储有大量的类目模型,每一个类目模型由若干个商品类目及其权重和对应的属性类目及其权重组成,并与关键词一一对应。其中由商品类目及其权重组成根据对应的关键词推送的商品类目集合,与商品类目对应的属性及其权重组成根据对应的关键词推送的属性集合,且每个集合中按照权重由高到低的顺序进行排列。需要说明的是,每一个类目模型的生成根据对应的关键词的历史点击数据完成,具体生成过程详见后续说明。
优选地,该类目模型以关键字为单位按照商品类目树的结构(当然,也可以为其他顺序)进行存储,具体地,该类目模型的格式如表1所示:
表1、类目模型
  关键字   商品类目及其对应的权重   属性类型   属性类目及其对应的权重
其中,表1中的类目模型按商品类目树的关系进行组织(当然,也可以商品类目树的形式体现,具体表现形式不应视为对本申请保护范围的限制),即存在以下三层关系:商品类目,每一种商品类目对应的多种商品属性类型(含一种),每一种商品属性类型对应的多个属性。例如:手机类目--品牌/网络制式等属性类型--诺基亚/GSM等属性。
具体地,类目查询服务器根据所述查询信息在类目模型库中检索与该查询信息相匹配的商品类目和对应的属性类目,如图9所示,包括以下步骤:
步骤3031、类目查询服务器提取查询信息中的关键字。
步骤3032、类目查询服务器判断该关键字是否在类目模型库中。
具体地,类目查询服务器判断该关键字是否在类目模型库中包括以下两种情况中的任一种:
(1)当判断该关键字不在类目模型库中时,转到步骤3033;
(2)当判断该关键字在类目模型库中时,转到步骤3034;
步骤3033、类目查询服务器对该关键字进行改写。
类目查询服务器在保留核心意图的基础上,对该关键字进行改写,该步骤具体包括:首先,对查询信息进行分词,删除不重要的词,辅以同义词替换;其次,对经分词所获取的每个词进行类型标注,例如:比如产品词/品牌词等等;第三,根据每个词标注的类型,按照预设的规则标明每个词的权重;最后,根据每个词的权重确定改写后的关键词,转到步骤3032。
例如:当查询信息为“Nokia手机红色”时,首先,对查询信息进行分词,得到“Nokia”、“手机”和“红色”;其次,对获取的各个分词进行标注,例如:将“Nokia”标注为品牌词、将“手机”标注为产品词、将“红色”标注为商品属性;第三,按照预设的标注类型和权重的对应关系标明每个分词的权重,例如:预设品牌词对应的权重为50、产品词对应的权重为30、商品属性对应的权重为2,则“Nokia”的权重为50、“手机”的权重为30和“红色”的权重为2;最后,由于“红色”的权重较低,可以忽略不计,因此改写后的关键字为“Nokia手机”。
步骤3034、类目查询服务器判断该查询信息中是否指定了商品类目。
具体地,判断该查询信息中是否指定了商品类目包括以下两种情况中的任一种:
(1)当判断该查询信息中指定了商品类目时,转到步骤3035;
(2)当判断该查询信息中未指定商品类目时,转到步骤3036。
例如:当查询信息仅为用户输入的关键词“Nokia”时,判断该查询信息中未包括商品类目;当查询信息为用户输入的关键词“Nokia”以及用户在查询系统提供的商品类目中选取了“手机”时,判断该查询信息中指定了商品类目。
步骤3035、类目查询服务器根据该关键词和所指定的商品类目在模型库中检索,获取匹配的类目模型,转到步骤304。
(1)根据该关键词,在类目模型库中检索,获取与该关键字对应的类目模型树。
(2)根据所指定的商品类目,在所获取的类目模型树中获取与所指定的商品类目匹配的类目模型,根据类目模型中的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重生成第一查询结果,包括推送的商品类目集合和属性类目集合。即从获取的类目模型树选择所包括的商品类目所在的分支,并获取以该商品类目为父节点的树状结构的类目模型。
例如:当查询信息为“Nokia手机”时,在对应的“手机”和“手机外壳”这一层中选择“手机”这一支对应的树状结构的类目模型。
步骤3036、类目查询服务器在获取的匹配的类目模型中提取峰值类目,并根据该峰值类目获取对应的直达属性的属性类目。
具体地,类目查询服务器在获取的匹配模型中提取峰值类目包括以下步骤:
(1)将匹配的类目模型中的商品类目按照权重从高到低的顺序进行排序。
(2)获取排序第一的商品类目。
(3)判断该排序第一的商品类目的权重是否大于权重门限a。
当判断该排序第一的商品类目的权重大于权重门限a时,转到步骤(4)。优选地,权重门限a可以根据历史数据中,用户对查询结果中的商品类目的点击次数设置,例如:历史记录中查询结果中某一商品类目的点击率高于50%,则设置该商品类目对应的权重为权重门限a。
(4)判断该排序第一的类目模型的权重与排序第二的类目模型的权重差是否大于权重门限b。
该排序第一的商品类目的权重与排序第二的类目模型的权重差大于权重门限b时,说明历史记录中,该商品类目的用户点击率较高,因此可以针对该商品类目进行优先推送,即将该商品类目的属性类目推送给用户,从而提高用户查询的效率,转到步骤(5)。
(5)该排序第一的商品类目所对应的商品类目为峰值类目,根据该峰值类目的属性获取对应的直达属性,将该直达属性的属性类目通过查询结果推送给用户。
例如:当查询信息为“Nokia”时,选择“手机”和“手机外壳”为父节点的树状结构的类目模型推送给用户。其当“手机”为峰值类目时,从其属性中选择出直达属性“网络制式”,并将按“网络制式”分类的“GSM”和“CDMA”推送给用户。
需要说明的是,本申请实施例中以峰值类目仅为排序第一的商品类目为例进行说明,当然峰值类目也可以为排序在前几位的商品类目,此处不再赘述。
优选地,根据该峰值类目的属性获取直达属性的属性类目可以为按照权重将该峰值类目的属性按照由高到低的顺序进行排列,过滤掉权重低于预设值的属性,权重高于预设值的属性即为直达属性的属性类目,对其进行推送。
需要说明的是,对属性类目按照一定的顺序推送给用户的流程与推送商品类目的流程基本一致,即按照权重进行排序推送,只是属性类目是附属于商品类目的,所以必须首先进行类目的推送,然后对同一个类目下的属性进一步进行推送,此处不再赘述。
此时,查询结果为与该关键字匹配的类目模型中的商品类目和获取的直达属性的属性类目。
步骤304、商品查询服务器根据所述查询信息在商品库中搜索与该查询信息相匹配的商品类目及其对应的权重和对应的属性类目及其对应的权重,生成第二查询结果,并将第二查询结果返回给前端查询服务器。
例如:生成的第二查询结果为:生成的第二查询结果中的商品类目集合为:手机(4000);手机挂链(2000);生成的第二查询结果中的属性类目集合为:按属性“品牌”划分的国产品牌(2000);欧美品牌(500)。
步骤305、前端查询服务器对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
具体地,前端查询服务器对所述第一查询结果和所述第二查询结果合并,生成最终查询结果包括以下多种情况中的任一种:
情况一:对于第一查询结果和第二查询结果中都存在的商品类目和对应的属性类目,表明此类商品类目和对应的属性类目在用户历史以往的点击操作中点击查看次数比较高,即关注度较高,且在商品库中此类商品类目的分布也较高,此时对此类商品类目和对应的属性类目的权重进行叠加,优选地,叠加的过程中来自于两个查询结果中的数据可以进行加权叠加,生成最终此类中每一个商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,并按照对商品类目和对应的属性类目分别按照权重由高到低的顺序进行排列,作为第一合并结果。
情况二:对于仅存在于第二查询结果中的商品类目和对应的属性类目,表明此类商品类目在商品库的分布较高,但用户的关注度较低,也将仅在第二查询结果中将商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重分别由高到低的顺序进行排列,作为第二合并结果。
情况三:对于仅存在第一查询结果中的商品类目和对应属性类目,表明此类商品类目在商品库中无法得到匹配(该结果产生的可能性较低),因此不对此类目放在最终查询结果中。
(4)确定最终查询结果中商品类目的排列顺序。
分别对第一合并结果中的商品类目和属性类目权重进行权重提升,即按照预设的规则提高权重值,分别使第一合并结果中商品类目集合和属性类目集合中的每一个权重高于第二合并结果中的每一个权重,此时将所有的商品类目和对应的属性类目分别按照权重由高到低的顺序排列。
例如:第一合并结果中的权重值分别为:商品类目a:120、商品类目b:100和商品类目c:80;第二合并结果中的权重值分别为商品类目i:110、商品类目j:90和商品类目k:70。若不进行提升,则按照权重由高到低的顺序排列的结果为:商品类目a-商品类目i-商品类目b-商品类目j-商品类目c-商品类目k。设此时权重提升的规则为将原始权重的2倍作为提升后的权重,此时第一合并结果中的权重值分别为:商品类目a:240、商品类目b:200和商品类目c:162,按照权重由高到低的顺序排列的结果为:商品类目a-商品类目b-商品类目c-商品类目i-商品类目j-商品类目k。
步骤306、前端查询服务器将生成的最终查询结果发送给用户,使用户进行点击查看。
需要说明的是,上述步骤303和步骤304没有先后顺序。
需要说明的是,上述权重提升的使用仅为本申请实施例中一种优选的实施方式,权重提升不仅可以用于查询结果合并过程中,也可以用于根据查询信息进行查询的过程中,以及任何需要根据权重进行调整的过程中,例如:类目模型的建立等。此外,本申请实施例同样适用于仅推送商品类目,不退送属性类目的推送方式,此时不获取所要推送的属性类目即可。
如图10所示,为本申请实施例提供的一种基于垂直搜索的查询方法,根据用户对商品的点击查看更新用于查询的类目模型库和商品库(即更新阶段),具体包括以下步骤:
步骤401、前端查询服务器将最终查询结果发送给用户,以供用户进行点击查看。
前端查询服务器接收类目查询服务器和商品查询服务器的查询结果后,对二组查询结果进行合并,生成最终查询结果,并将该最终查询结果发送给用户。
例如:对于查询信息“Nokia”,返回的商品类目为:手机(4000);手机外壳(2000);返回的属性类目为:按属性“品牌”划分的国产品牌(2000);欧美品牌(1000)。
步骤402、日志服务器接收用户的点击操作。
当用户在返回的最终查询结果中选择所关注的商品类目、属性类目或商品进行点击时,后台的日志服务器将记录下该用户的点击操作。
该点击操作包含的信息包括:用户点击的商品类目、属性类目或商品;与此次查询对应的查询信息。例如:点击商品类目“手机”,通过点击“手机”后或直接点击属性类目国产品牌;点击某一符合查询信息的具体产品,如一款黑色的Nokia N97。
需要说明的是,对于一次查询,用户所点击的商品类目、属性类目或商品通常为多个,日志服务器可以将对应此次查询的所有点击对象作为一组数据进行处理。
步骤403、日志服务器根据该点击操作生成日志。
日志服务器根据接收到的用户在浏览器一侧的点击操作转化为对应的文本文件,
步骤404、日志服务器将批量日志发送给建模服务器。
日志服务器可以根据预设的周期到来(例如:一天)或接收到请求,或达到预设的发送条件(如日志服务器中待建模服务器处理的日志达到一定数量)时等,日志服务器将批量日志发送给建模服务器。
需要说明的是,凡是使日志服务器向建模服务器发送日志的方式均属于本申请的保护范围。
步骤405、建模服务器根据本批数据进行统计分析,获取统计分析结果。
日志记录包括以下多种情况中的任一种:
(1)该日志中的日志记录为用户点击具体商品的日志记录。
(2)该日志中的日志记录为用户点击商品类目的日志记录。
(3)该日志中的日志记录为用户点击属性类目的日志记录。
通常日志记录是以天为单位进行统计分析的。具体地,统计分析包括以下两个步骤:
(1)从所接收的数据中对新增的以天为单位的所有用户的日志记录进行单天处理。
具体地,抽取出单天内所有用户的日志记录,并按照不同的关键字进行统计,最后得到按关键词组织的格式化数据。其中,按照不同的关键字进行统计包括:在通过每一个关键字进行查询时,统计通过该关键字进行点击的商品及其对应的商品的属性和通过该关键字点击的商品类目和属性类目。
例如:对于关键词“Nokia”,统计了通过该关键词进行点击的商品类目“手机”的点击数为1000次、属性类目“网络制式”的点击数为300次,“网络制式”下的“GSM”点击数为100次、“手机”类目下网络制式为GSM的一款手机黑色Nokia N97的点击数为50次,则其对应的属性类目的点击数也为50次。其中,对于存在因果关系的点击记录,需要将结果事件的点击数折算到原因事件的点击数,例如:将点击的商品黑色Nokia N97所对应的属性“GSM”折算到用于推送的属性类目“GSM”中,将商品黑色Nokia N97的点击数折算到对应的商品类目“手机”中,具体的折算比例可按照经验值或者实际需求设置,例如:折算后的点击次数分别为:手机--1500次;网络制式--500次,GSM--200。然后进行多天合并处理,累加了每一天的“Nokia”关键词对应的点击数,并按照商品类目树的形式组织。
需要说明的是,上述统计方法仅为本申请实施例中一种优选的实施方式,凡是根据日志记录进行点击统计的方式均属于本申请的保护范围。
(2)对包括新增的一天在内往前回溯一个周期(比如40天),进行多天合并处理。
步骤406、建模服务器根据该统计分析结果生成类目模型,并将生成的类目模型发送给类目查询服务器。
判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;
当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立按照商品类目树的形式组织,生成类目模型。
步骤407、类目查询服务器将生成的类目模型更新到类目模型库中。
该步骤不断地通过用户的历史点击记录更新类目模型库,而更新后的类目模型库用于根据后续用户的查询返回查询结果,该过程为闭环循环过程,从而不断地保持类目模型库的精度,提高返回的查询结果的准确性。
本申请实施例提供一种基于垂直搜索的查询系统,如图11所示,包括查询服务器1110、日志服务器1120和建模服务器1130,其中,
查询服务器1110,用于获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,所述类目模型包括:与关键词对应的商品类目,并根据检索到的类目模型生成第一查询结果;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
其中,所述类目模型还包括:与所述商品类目对应的属性类目;
上述查询服务器1110,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
日志服务器1120,用于根据所述用户对所述查询服务器1110生成的最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给所述建模服务器。
上述日志服务器1120,具体用于获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。
建模服务器1130,用于对所述日志进行统计分析,获得类目模型。
具体地,上述建模服务器1130,可以具体用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
上述建模服务器1130,还可以具体用于判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
上述建模服务器1130,还用于将所述类目模型发送给所述查询服务器1110;相应地,上述查询服务器1110,还用于将所述最终查询结果发送给用户,使所述用户进行查看;将来自所述建模服务器1130的类目模型更新到所述类目模型库中。
本申请实施例提供一种查询服务器,如图12所示,查询服务器1200包括:
获取模块1210,用于获取用户的查询信息。
查询模块1220,用于根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,所述类目模型包括:与关键词对应的商品类目,并根据检索到的类目模型生成第一查询结果;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果。
其中,类目模型还包括:与所述商品类目对应的属性类目;
上述查询模块1220,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
合并模块1230,用于对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
上述查询服务器1200,还可以进一步包括:
发送模块1240,用于将所述最终查询结果发送给用户,使所述用户进行查看,并使日志服务器根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给建模服务器进行统计分析获得类目模型并将所述类目模型更新到所述商品类目服务器的类目模型库中。
其中,所述查询信息仅包括用户输入的关键字时,如图13所示,查询模块1220,具体包括:
判断子模块1221,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块1222,用于若判断子模块判断存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;
提取子模块1223,用于从所获取的类目模型中获取峰值类目,并根据该峰值类目获取对应的直达属性的属性类目;
生成子模块1224,用于根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
其中,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,
判断子模块1221,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块1222,用于若判断子模块判断存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
提取子模块1223,用于从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
生成子模块1224,用于所述查询服务器获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
其中,如图14所示,合并模块1230具体包括:
第一合并子模块1231,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;
第二合并子模块1232,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;
权重提升子模块1233,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
生成子模块1234,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
本申请具有以下优点:通过在由用户的点击操作生成的类目模型库和商品库中查询用户的请求,并对二者进行合并,提高了用户查询结果与用户查询意图的相关度,提高用户体验感。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本申请的保护范围。

Claims (21)

1.一种基于垂直搜索的查询方法,其特征在于,包括:
获取用户的查询信息;
根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;
对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;
将所述最终查询结果发送给用户,使所述用户进行查看,并根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,对所述日志进行统计分析获得类目模型,将所述类目模型更新到所述类目模型库中。
2.如权利要求1所述的方法,其特征在于,所述类目模型还包括:与所述商品类目对应的属性类目;
所述生成第二查询结果的方法,还包括:根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
3.如权利要求1所述的方法,其特征在于,所述查询信息仅包括用户输入的关键字时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括:
判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;
根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果;其中,所述直达属性的属性类目是从峰值类目的多个商品属性中提取的属性类目,所述峰值类目是能够突出地反映用户的查询意图和需求的商品类目。
4.如权利要求1所述的方法,其特征在于,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括:
判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
5.如权利要求1所述的方法,其特征在于,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括:
获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;
获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;
对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到底的顺序排列,并返回给用户;其中,所述属性类目通过将商品按照不同的属性划分得到。
6.如权利要求2所述的方法,其特征在于,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括:
获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;
获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;
对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到底的顺序排列,并返回给用户。
7.如权利要求1所述的方法,其特征在于,所述根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,具体包括:
获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;
根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;
存储所生成的日志。
8.如权利要求1所述的方法,其特征在于,所述对所述日志进行统计分析获得类目模型,具体包括:
根据所述日志中的查询信息和对应的点击信息对所述日志进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;
根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
9.如权利要求8所述的方法,其特征在于,所述根据所述统计分析结果生成类目模型,具体包括:
判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;
当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
10.一种基于垂直搜索的查询系统,其特征在于,包括查询服务器、建模服务器和日志服务器,其中,
所述查询服务器,用于获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;
所述日志服务器,用于根据所述用户对所述查询服务器生成的最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给所述建模服务器;
所述建模服务器,用于对所述日志进行统计分析,获得类目模型。
11.如权利要求10所述的系统,其特征在于,
所述建模服务器,还用于将所述类目模型发送给所述查询服务器;
所述查询服务器,还用于将所述最终查询结果发送给用户,使所述用户进行查看;将来自所述建模服务器的类目模型更新到所述类目模型库中。
12.如权利要求10所述的系统,其特征在于,所述类目模型还包括:与所述商品类目对应的属性类目;
所述查询服务器,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
13.如权利要求10所述的系统,其特征在于,
所述日志服务器,具体用于获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。
14.如权利要求10所述的系统,其特征在于,
所述建模服务器,具体用于根据所述日志中的查询信息和对应的点击信息对所述日志进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
15.如权利要求14所述的系统,其特征在于,
所述建模服务器,具体用于判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
16.一种查询服务器,其特征在于,包括:
获取模块,用于获取用户的查询信息;
查询模块,用于根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目,;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;
合并模块,用于对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;
发送模块,用于将所述最终查询结果发送给用户,使所述用户进行查看,并使日志服务器根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给建模服务器进行统计分析获得类目模型并将所述类目模型更新到所述商品类目服务器的类目模型库中。
17.如权利要求16所述的服务器,其特征在于,所述类目模型还包括:与所述商品类目对应的属性类目;
所述查询模块,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
18.如权利要求16所述的服务器,其特征在于,所述查询信息仅包括用户输入的关键字时,所述查询模块,具体包括:
判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块,用于若判断子模块判断存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;
生成子模块,用于根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果;其中,所述直达属性的属性类目是从峰值类目的多个商品属性中提取的属性类目,所述峰值类目是能够突出地反映用户的查询意图和需求的商品类目。
19.如权利要求16所述的服务器,其特征在于,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述查询模块,具体包括:
判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;
匹配子模块,用于若判断子模块判断存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;
提取子模块,用于从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;
生成子模块,用于所述查询服务器获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
20.如权利要求16所述的服务器,其特征在于,所述合并模块,具体包括:
第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;
第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;
权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到底的顺序排列,并返回给用户;其中,所述属性类目通过将商品按照不同的属性划分得到。
21.如权利要求17所述的服务器,其特征在于,所述合并模块,具体包括:
第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;
第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;
权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;
生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到底的顺序排列,并返回给用户。
CN201010160535.7A 2010-04-30 2010-04-30 一种基于垂直搜索的查询方法、系统和装置 Active CN102236663B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201010160535.7A CN102236663B (zh) 2010-04-30 2010-04-30 一种基于垂直搜索的查询方法、系统和装置
PCT/US2011/033977 WO2011137125A1 (en) 2010-04-30 2011-04-26 Vertical search-based query method, system and apparatus
JP2013508166A JP5778255B2 (ja) 2010-04-30 2011-04-26 垂直検索に基づいたクエリの方法、システム、および装置
US13/202,172 US8661027B2 (en) 2010-04-30 2011-04-26 Vertical search-based query method, system and apparatus
EP11775505.8A EP2564305A4 (en) 2010-04-30 2011-04-26 VERTICAL SEARCH BASED QUERY PROCEDURE AND SYSTEM AND DEVICE THEREFOR
HK12100318.1A HK1160248A1 (zh) 2010-04-30 2012-01-11 種基於垂直搜索的查詢方法、系統和裝置
US14/148,440 US20140122468A1 (en) 2010-04-30 2014-01-06 Vertical Search-Based Query Method, System and Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010160535.7A CN102236663B (zh) 2010-04-30 2010-04-30 一种基于垂直搜索的查询方法、系统和装置

Publications (2)

Publication Number Publication Date
CN102236663A CN102236663A (zh) 2011-11-09
CN102236663B true CN102236663B (zh) 2014-04-09

Family

ID=44861893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010160535.7A Active CN102236663B (zh) 2010-04-30 2010-04-30 一种基于垂直搜索的查询方法、系统和装置

Country Status (6)

Country Link
US (2) US8661027B2 (zh)
EP (1) EP2564305A4 (zh)
JP (1) JP5778255B2 (zh)
CN (1) CN102236663B (zh)
HK (1) HK1160248A1 (zh)
WO (1) WO2011137125A1 (zh)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9119110B2 (en) * 2010-09-22 2015-08-25 Qualcomm, Incorporated Request to send (RTS) and clear to send (CTS) for multichannel operations
CN102479191B (zh) 2010-11-22 2014-03-26 阿里巴巴集团控股有限公司 提供多粒度分词结果的方法及其装置
US20120226681A1 (en) * 2011-03-01 2012-09-06 Microsoft Corporation Facet determination using query logs
US8977629B2 (en) * 2011-05-24 2015-03-10 Ebay Inc. Image-based popularity prediction
US8738612B1 (en) * 2011-07-27 2014-05-27 Google Inc. Resolving ambiguous queries
US20130097139A1 (en) * 2011-10-17 2013-04-18 Simon Thoresen Programmable multi-filtering
CN103207876B (zh) * 2012-01-17 2017-04-12 阿里巴巴集团控股有限公司 一种信息投放的方法及装置
CN103310343A (zh) * 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
CN107066509B (zh) * 2012-04-26 2020-12-04 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
CN103425664A (zh) * 2012-05-16 2013-12-04 阿里巴巴集团控股有限公司 一种对实体数据单元进行搜索、显示的方法和设备
CN103425691B (zh) * 2012-05-22 2016-12-14 阿里巴巴集团控股有限公司 一种搜索方法和系统
CN103577436B (zh) * 2012-07-27 2017-10-13 阿尔派株式会社 内容检索装置及内容检索方法
CN102841946B (zh) * 2012-08-24 2016-05-25 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
CN103729362B (zh) * 2012-10-12 2017-07-21 阿里巴巴集团控股有限公司 导航内容的确定方法和装置
CN103870507B (zh) * 2012-12-17 2017-04-12 阿里巴巴集团控股有限公司 一种基于类目的搜索方法和装置
US9477759B2 (en) 2013-03-15 2016-10-25 Google Inc. Question answering using entity references in unstructured data
US20140289269A1 (en) * 2013-03-22 2014-09-25 Tencent Technology (Shenzhen) Company Limited Method, Device and System for Data Searching
CN104077286A (zh) * 2013-03-26 2014-10-01 北京京东尚科信息技术有限公司 商品信息的搜索方法及系统
CN103425744A (zh) * 2013-07-17 2013-12-04 百度在线网络技术(北京)有限公司 一种用于识别用户的查询序列中的寻址需求的方法与设备
CN103530385A (zh) * 2013-10-18 2014-01-22 北京奇虎科技有限公司 基于垂直搜索频道的信息搜索方法及装置
CN103514299B (zh) * 2013-10-18 2018-04-17 北京奇虎科技有限公司 信息搜索方法和装置
CN103559253A (zh) * 2013-10-31 2014-02-05 北京奇虎科技有限公司 相关垂直资源搜索方法及设备
US9864781B1 (en) 2013-11-05 2018-01-09 Western Digital Technologies, Inc. Search of NAS data through association of errors
US9996588B2 (en) * 2013-12-09 2018-06-12 International Business Machines Corporation Managing a search
CN103744897A (zh) * 2013-12-24 2014-04-23 华为技术有限公司 故障信息的关联搜索方法、系统和网络管理系统
CN104951461A (zh) * 2014-03-27 2015-09-30 乐蜂(上海)信息技术有限公司 一种分类筛选方法及装置
CN103970848B (zh) * 2014-05-01 2016-05-11 刘莎 一种通用型互联网信息数据挖掘方法
US10565188B2 (en) * 2014-05-30 2020-02-18 Macy's West Stores, Inc. System and method for performing a pattern matching search
US9959351B2 (en) * 2014-06-09 2018-05-01 Ebay Inc. Systems and methods to identify values for a selected filter
CN105446802A (zh) * 2014-08-13 2016-03-30 阿里巴巴集团控股有限公司 一种基于转化率的操作执行方法及装置
CN104616167A (zh) * 2014-12-19 2015-05-13 百度在线网络技术(北京)有限公司 在用户设备及网络设备处用于提供直达服务的方法及装置
CN106302568B (zh) * 2015-05-13 2019-05-24 厦门美柚信息科技有限公司 一种用户行为评价方法、装置及系统
EP3098727B1 (en) * 2015-05-26 2020-05-06 Ontoforce NV A data processing system for curating search result facets
RU2632138C2 (ru) * 2015-09-14 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
CN106681999B (zh) * 2015-11-05 2021-01-26 阿里巴巴集团控股有限公司 一种数据表查询方法及设备
CN105468729A (zh) * 2015-11-23 2016-04-06 深圳大粤网络视界有限公司 一种互联网移动垂直搜索引擎
US10606907B1 (en) * 2016-03-07 2020-03-31 Google Llc Interactive browsable content items
CN106446069B (zh) * 2016-09-07 2019-10-15 北京百度网讯科技有限公司 基于人工智能的推送信息的方法和装置
US10268734B2 (en) * 2016-09-30 2019-04-23 International Business Machines Corporation Providing search results based on natural language classification confidence information
CN108664515B (zh) * 2017-03-31 2019-09-17 北京三快在线科技有限公司 一种搜索方法及装置,电子设备
CN108733696B (zh) * 2017-04-19 2021-05-04 创新先进技术有限公司 一种征信表单的生成方法及装置
CN107316645B (zh) * 2017-06-01 2021-10-12 北京京东尚科信息技术有限公司 一种语音购物的方法和系统
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置
CN107908615A (zh) * 2017-10-17 2018-04-13 北京京东尚科信息技术有限公司 一种获取搜索词对应商品类目的方法和装置
CN107833059B (zh) * 2017-11-03 2021-06-18 广州杰赛科技股份有限公司 客服的服务质量评价方法与系统
CN108052613B (zh) * 2017-12-14 2021-12-31 北京百度网讯科技有限公司 用于生成页面的方法和装置
US11108757B2 (en) * 2017-12-21 2021-08-31 Mastercard International Incorporated Systems and methods relating to digital identities
CN108121815B (zh) * 2017-12-28 2022-03-11 深圳开思时代科技有限公司 汽车配件查询方法、装置及系统、电子设备和介质
WO2019129520A1 (en) 2017-12-28 2019-07-04 Datawalk Spolka Akcyjna Systems and methods for combining data analyses
CN109285024B (zh) * 2018-07-23 2021-05-11 北京三快在线科技有限公司 在线特征确定方法、装置、电子设备及存储介质
CN110955772B (zh) * 2018-09-26 2023-06-06 阿里巴巴集团控股有限公司 文本结构化模型组件部署方法、装置、设备及存储介质
CN111428123A (zh) * 2019-01-09 2020-07-17 阿里巴巴集团控股有限公司 查询方法和装置
CN109948048A (zh) * 2019-01-28 2019-06-28 广州大学 一种商品搜索、排序、展示方法及系统
CN110083758A (zh) * 2019-04-30 2019-08-02 闻康集团股份有限公司 一种医疗搜索引擎数据平台系统
CN110909043A (zh) * 2019-11-15 2020-03-24 上海易点时空网络有限公司 基于模糊查询关键词的违章数据查询方法及系统
CN111159552A (zh) * 2019-12-30 2020-05-15 北京每日优鲜电子商务有限公司 商品搜索方法、装置、服务器和存储介质
CN111400436A (zh) * 2020-02-19 2020-07-10 北京值得买科技股份有限公司 一种基于用户意图识别的搜索方法以及装置
CN111882401A (zh) * 2020-08-03 2020-11-03 施兴明 一种电商自动提醒方法及系统
CN112115177A (zh) * 2020-09-30 2020-12-22 欧冶云商股份有限公司 一种加工服务资源查找匹配方法、匹配系统及介质
CN112949041B (zh) * 2021-02-01 2022-08-05 广东工业大学 一种基于数字孪生的自动化立体仓库构建方法
CN113570428B (zh) * 2021-07-23 2024-02-02 上海普洛斯普新数字科技有限公司 一种用于线上商品一致性筛选的系统
CN113792125B (zh) * 2021-08-25 2024-04-02 北京库睿科技有限公司 基于文本相关性和用户意图的智能检索排序方法和装置

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US7007008B2 (en) * 2000-08-08 2006-02-28 America Online, Inc. Category searching
US20020078045A1 (en) * 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US7149746B2 (en) * 2002-05-10 2006-12-12 International Business Machines Corporation Method for schema mapping and data transformation
US7152059B2 (en) 2002-08-30 2006-12-19 Emergency24, Inc. System and method for predicting additional search results of a computerized database search user based on an initial search query
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US20040260677A1 (en) * 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
US7836083B2 (en) 2004-02-20 2010-11-16 Factiva, Inc. Intelligent search and retrieval system and method
US8041713B2 (en) * 2004-03-31 2011-10-18 Google Inc. Systems and methods for analyzing boilerplate
US7567962B2 (en) 2004-08-13 2009-07-28 Microsoft Corporation Generating a labeled hierarchy of mutually disjoint categories from a set of query results
CN1609859A (zh) 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
JP4745839B2 (ja) 2005-01-28 2011-08-10 富士通株式会社 データ転送システム、送信プログラム、受信プログラム及びデータ送信方法
WO2006083684A2 (en) * 2005-01-28 2006-08-10 Aol Llc Web query classification
US20070027840A1 (en) * 2005-07-27 2007-02-01 Jobserve Limited Searching method and system
US20070038608A1 (en) 2005-08-10 2007-02-15 Anjun Chen Computer search system for improved web page ranking and presentation
JP4787590B2 (ja) * 2005-10-04 2011-10-05 株式会社リコー 蔵書検索方法、蔵書検索システム及び蔵書検索プログラム
US7917519B2 (en) * 2005-10-26 2011-03-29 Sizatola, Llc Categorized document bases
IL174107A0 (en) * 2006-02-01 2006-08-01 Grois Dan Method and system for advertising by means of a search engine over a data network
US7702700B2 (en) * 2006-03-29 2010-04-20 Nhn Corporation Automatic matching method and automatic matching system
US20070233678A1 (en) * 2006-04-04 2007-10-04 Bigelow David H System and method for a visual catalog
CA2649534A1 (en) * 2006-04-13 2007-10-25 Searchme, Inc. Systems and methods for performing searches within vertical domains
US7805432B2 (en) 2006-06-15 2010-09-28 University College Dublin National University Of Ireland, Dublin Meta search engine
CN101286151A (zh) * 2007-04-13 2008-10-15 国际商业机器公司 建立多维模型和数据仓库模式的映射的方法及相关系统
US20080313142A1 (en) 2007-06-14 2008-12-18 Microsoft Corporation Categorization of queries
CA2693803A1 (en) * 2007-07-13 2009-01-22 Spot Runner, Inc. Methods and systems for performing media searches, media creation and for secure distribution of media
US20090094223A1 (en) 2007-10-05 2009-04-09 Matthew Berk System and method for classifying search queries
US20100076964A1 (en) 2007-12-18 2010-03-25 Daniel Joseph Parrell Instance-Class-Attribute Matching Web Page Ranking
US20090228774A1 (en) * 2008-03-06 2009-09-10 Joseph Matheny System for coordinating the presentation of digital content data feeds
US8358308B2 (en) * 2008-06-27 2013-01-22 Microsoft Corporation Using visual techniques to manipulate data
US8010537B2 (en) * 2008-08-27 2011-08-30 Yahoo! Inc. System and method for assisting search requests with vertical suggestions
KR101078864B1 (ko) 2009-03-26 2011-11-02 한국과학기술원 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
US20100268723A1 (en) 2009-04-17 2010-10-21 Buck Brian J Method of partitioning a search query to gather results beyond a search limit
US9298761B2 (en) * 2009-04-30 2016-03-29 Hewlett Packard Enterprise Development Lp Adaptive merging in database indexes
US20100299342A1 (en) 2009-05-22 2010-11-25 Nbc Universal, Inc. System and method for modification in computerized searching

Also Published As

Publication number Publication date
JP2013525921A (ja) 2013-06-20
US20130054569A1 (en) 2013-02-28
US20140122468A1 (en) 2014-05-01
JP5778255B2 (ja) 2015-09-16
HK1160248A1 (zh) 2012-09-07
EP2564305A4 (en) 2014-09-24
CN102236663A (zh) 2011-11-09
WO2011137125A1 (en) 2011-11-03
EP2564305A1 (en) 2013-03-06
US8661027B2 (en) 2014-02-25

Similar Documents

Publication Publication Date Title
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
CN102053983B (zh) 一种垂直搜索的查询方法、系统和装置
AU2022201654A1 (en) System and engine for seeded clustering of news events
US8190556B2 (en) Intellegent data search engine
CN103400286B (zh) 一种基于用户行为进行物品特征标注的推荐系统及方法
CN102253936B (zh) 记录用户访问商品信息的方法及搜索方法和服务器
CN106327227A (zh) 一种信息推荐系统及信息推荐方法
CN102129431B (zh) 应用于网上交易平台的检索方法和系统
CN105488697A (zh) 一种基于客户行为特征的潜在客户挖掘方法
CN107105031A (zh) 信息推送方法和装置
CN103914492A (zh) 查询词融合方法、商品信息发布方法和搜索方法及系统
CN104216881A (zh) 一种个性化标签的推荐方法及装置
CN104077286A (zh) 商品信息的搜索方法及系统
CN103577432A (zh) 一种商品信息搜索方法和系统
CN103514181A (zh) 一种搜索方法和装置
CN109241403A (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
CN108885624A (zh) 信息推荐系统及方法
CN104077407A (zh) 一种智能数据搜索系统及方法
CN103020128B (zh) 与终端设备交互数据的方法与装置
CN107092610A (zh) App应用的搜索方法和装置、app应用图标的分类方法和装置
CN104899229A (zh) 基于群体智能的行为聚类系统
CN106095738A (zh) 推荐表单片段
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN103699549B (zh) 一种图形码库更新、查询方法及相关装置
CN103778206A (zh) 一种网络服务资源的提供方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1160248

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1160248

Country of ref document: HK