CN102567408B - 推荐搜索关键词的方法和装置 - Google Patents

推荐搜索关键词的方法和装置 Download PDF

Info

Publication number
CN102567408B
CN102567408B CN201010618555.4A CN201010618555A CN102567408B CN 102567408 B CN102567408 B CN 102567408B CN 201010618555 A CN201010618555 A CN 201010618555A CN 102567408 B CN102567408 B CN 102567408B
Authority
CN
China
Prior art keywords
searched key
key word
recommendation
word
way
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010618555.4A
Other languages
English (en)
Other versions
CN102567408A (zh
Inventor
朱力
朱小聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201010618555.4A priority Critical patent/CN102567408B/zh
Priority to TW100105663A priority patent/TWI525458B/zh
Priority to US13/335,201 priority patent/US8799306B2/en
Priority to PCT/US2011/067176 priority patent/WO2012092196A1/en
Priority to EP11853187.0A priority patent/EP2659398A4/en
Priority to JP2013547593A priority patent/JP5736469B2/ja
Publication of CN102567408A publication Critical patent/CN102567408A/zh
Priority to HK12108976.7A priority patent/HK1168920A1/zh
Application granted granted Critical
Publication of CN102567408B publication Critical patent/CN102567408B/zh
Priority to US14/313,808 priority patent/US9092549B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Abstract

本申请公开了一种推荐搜索关键词的方法和装置,用以解决现有技术中向没有明确搜索意图的用户推荐搜索关键词时推荐效果不佳,造成搜索引擎服务器系统资源浪费的问题。方法包括:接收输入的搜索关键词;比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。

Description

推荐搜索关键词的方法和装置
技术领域
本申请涉及信息搜索技术领域,尤其涉及一种推荐搜索关键词的方法和装置。
背景技术
现有搜索引擎通常都提供搜索关键词推荐的功能。例如,用户在搜索栏中输入搜索关键词,并点击“开始搜索”的按钮后,跳转到的页面中不仅包含搜索结果(对网页搜索来说,搜索结果是匹配搜索关键词的网页的链接地址和其他展示信息),还包括搜索引擎推荐的与用户输入的搜索关键词相关的其他搜索关键词或搜索关键词的组合。或者,用户在搜索栏中输入搜索关键词,会在搜索栏的下拉菜单中弹出与用户输入的搜索关键词相关的推荐关键词,以便用户选择某一推荐关键词后进行搜索。
现有的推荐搜索关键词的方案通常都是基于搜索日志的,将搜索日志中与用户输入的搜索关键词相关度较高的搜索关键词作为推荐的搜索关键词的,基本原理如下:
首先建立搜索日志。搜索日志中包含的搜索关键词有以下来源:其一为用户每次在搜索栏中输入的搜索关键词;其二为搜索引擎推荐的搜索关键词。并确定搜索日志中的搜索关键词对应的重要性参数的参数值,搜索日志中的搜索关键词对应的重要性参数的参数值主要取决于以下因素,具体可以按照各因素加权求和的方式来确定每个搜索关键词重要性参数的参数值:
1、点击因素,即该搜索关键词的搜索结果是否存在被用户点击的记录、被点击的次数以及点击的位置等,具体地,若用户只利用该搜索关键词进行了搜索但未点击搜索结果中的网页链接地址,则该搜索关键词的点击因素的参数值较低,例如设定的该因素的参数值为0;若用户利用该搜索关键词进行了搜索后且点击了搜索结果,则该搜索关键词的点击因素的参数值较高,例如设定该因素的参数值为搜索结果被点击的次数。如果搜索关键词存在点击记录、且被点击的次数较多,则该搜索关键词的点击参数的参数值更高,从而使得加权求和后重要性参数的参数值较高。
2、该搜索关键词的质量因素。搜索关键词的质量因素包括搜索关键词的长度、语义项数目、以及是否包含预定搜索关键词集合中的搜索关键词等。搜索关键词的长度即搜索关键词包含的字符数目,具体地,为不同字符数目分别预先设定对应的该因素的参数值,例如设定长度为2的搜索关键词对应的该因素的参数值为1、设定长度为3的搜索关键词对应的该因素的参数值为0.8、设定长度为4的搜索关键词对应的该因素的参数值为0.5等等;语义项数目是指对该搜索关键词进行分词处理后,将分词处理获得的语义项(Term)数目与设定的比较阈值进行比较,根据比较结果确定搜索关键词对应的语义项因素的参数值;预定的搜索关键词集合例如违禁词集合、产品品牌词集合或特殊商业意图词集合等,根据比较搜索关键词中是否包含这些预定的搜索关键词集合中的样本词,来确定搜索关键词对应的该因素的参数值。
在进行搜索关键词推荐时,搜索引擎接收到用户在搜索栏中输入搜索关键词后,针对搜索日志中包含的每个搜索关键词,执行:
确定搜索日志中包含的各搜索关键词与输入的搜索关键词的相似度值,具体确定两个搜索关键词相似度值的方法有很多,例如基于两个搜索关键词最长公共子串等方法,然后对确定出的相似度值和搜索日志中包含的该搜索关键词的重要性参数的参数值进行加权求和的方式来确定搜索日志中包含的该搜索关键词的推荐度值。
按照对应的推荐度值由高到底的顺序,对搜索日志中包含的搜索关键词进行排序,选择排序靠前的N个搜索关键词作为推荐给用户的搜索关键词。
上述基于搜索日志的推荐搜索关键词的方案的优点在于能够逐步引导具有明确搜索意图的用户完成或修正搜索过程。例如,用户输入的搜索关键词为“手机”,按照上述基于搜索日志的推荐搜索关键词的方案第一次推荐出的搜索关键词为“S品牌手机”,用户点击了推荐的搜索关键词“S品牌手机”进一步进行搜索时,相当于本次输入的搜索关键词为“S品牌手机”,按照上述基于搜索日志的推荐搜索关键词的方案第二次推荐出的搜索关键词为“S品牌智能手机”,依此类推。
然而对于没有明显搜索意图的用户而言,例如用户输入的搜索关键词为“代理加盟”,上述不断细化的推荐方式难以满足需求,推荐出的搜索关键词往往是与输入的搜索关键词语义上基本一致或在输入的搜索关键词基础上添加其他限定词后的词,并且推荐出的搜索关键词往往局限于某个特定的领域,推荐搜索关键词的效果不佳,即推荐出的关键词很少被用户进一步点击。并且,由于搜索引擎服务器进行相关关键词的推荐时,需要调取搜索日志、进行相似度值的计算、排序等操作,占用了搜索引擎服务器的系统资源,然而推荐的相关关键词确无法满足用户的需求,因此,这造成了搜索引擎服务器系统资源的浪费,影响了搜索引擎服务器的处理效率。
发明内容
本申请实施例提供一种推荐搜索关键词的方法和装置,用以解决现有技术中向没有明确搜索意图的用户推荐搜索关键词时推荐效果不佳,造成搜索引擎服务器系统资源浪费的问题。
本申请实施例提供的技术方案如下:
一种推荐搜索关键词的方法,包括:
接收输入的搜索关键词;比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。
一种推荐搜索关键词的装置,包括:
接收单元,用于接收输入的搜索关键词;比较单元,用于比较接收单元接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图此集合中的样本词;第一推荐单元,用于在比较单元得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。
本申请实施例通过首先对用户输入的搜索关键词进行搜索意图识别,识别搜索关键词是否有明显搜索意图;对于没有明显搜索意图的搜索关键词,以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略来确定推荐的搜索关键词,由于第一预定推荐方式为适用于在没有明显搜索意图情况下的基于知识库的推荐方式和/或基于会话相关性的推荐方式,因此改善了搜索关键词的推荐效果,提高了搜索引擎服务器的处理效率。
附图说明
图1为本申请实施例的主要实现原理流程图;
图2为本申请实施例一中推荐搜索关键词的装置的原理示意图;
图3a为本申请实施例一提供搜索关键词推荐方案的流程图;
图3b为本申请实施例一中动态调整a、b、c值的流程图;
图4为本申请实施例一中基于知识库的推荐方式的原理示意图;
图5为本申请实施例一中四个包含不同词条类型词条的集合的示意图;
图6为本申请实施例一中基于会话相关性的推荐方式的原理示意图;
图7为本申请实施例二提供搜索关键词推荐方案的流程图;
图8为本申请实施例提供的一种推荐搜索关键词的装置的具体结构示意图。
具体实施方式
针对现有搜索关键词推荐方案存在的为没有明显搜索意图的用户推荐搜索关键词时效果不佳,造成搜索引擎服务器系统资源浪费的问题。本申请实施例提出了一种关键词推荐方案,该方案首先对用户输入的搜索关键词是否反映出明确搜索意图进行判定,对于有明确搜索意图和没有明确搜索意图的用户输入的搜索关键词,采用有区分的搜索关键词推荐方式来推荐搜索关键词。
此外,本申请实施例还提供了两种适用于向没有明确搜索意图的用户推荐搜索关键词的方法。
下面结合各个附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
如图1所示,本申请实施例的主要实现原理流程如下:
步骤10,接收输入的搜索关键词;
步骤20,比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词,当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,进入步骤30,而当比较结果为接收的搜索关键词不包含非意图词集合中的样本词时,进入步骤40,在本步骤20中,确定输入的搜索关键词是否包含设定的非意图词集合(或意图词集合)中的样本词的依据为输入的搜索关键词是否包含与非意图词集合中(或意图词集合)的样本词相同的子串;
步骤30,可以确定接收的搜索关键词对应的搜索意图标识为非明确搜索意图标识,进入步骤50;
步骤40,可以确定接收的搜索关键词对应的搜索意图标识为明确搜索意图标识,进入步骤60;
步骤50,以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略,来确定推荐搜索关键词,其中,第一预定推荐方式可以为基于知识库的推荐方式和/或基于会话相关性的推荐方式。其中,当以基于知识库的推荐方式为主方式时,包含基于会话相关性的推荐方式在内的其他推荐方式可以看做是基于知识库的推荐方式的辅助推荐方式,而当以基于会话相关性为主方式时,包含基于知识库的推荐方式在内的其他推荐方式可以看做是基于会话相关性的推荐方式的辅助推荐方式,流程结束。
步骤60,以第二预定推荐方式来确定推荐搜索关键词,流程结束。其中,第二预定推荐方式可以为基于搜索日志的推荐方式,也可以为以基于搜索日志的推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的推荐方式。
上述步骤中,步骤30可以不用执行,从而可以在比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,直接转为执行步骤50;类似地,步骤40也可以不用执行,从而可以在比较结果为接收的搜索关键词不包含非意图词集合中的样本词时,直接转为执行步骤60。
在本申请实施例中,由于基于知识库的推荐方式或基于会话相关性的推荐方式均为适合针对具备非明确搜索意图标识的搜索关键词进行推荐并能得到较好推荐效果的方式(以基于知识库的推荐方式或基于会话相关性的推荐方式为主时的搜索关键词推荐流程将在后文的具体实施例中进行详细描述),因此,当确定出接收的搜索关键词中仅包含非意图词集合中的样本词时,通过这两种方式中的任意一种方式为主来进行搜索关键词的推荐,均能够改善搜索关键词的推荐效果,解决现有搜索关键词推荐方案存在的为没有明显搜索意图的用户推荐搜索关键词时效果不佳从而造成搜索引擎服务器系统资源浪费的问题。
在本申请实施例中,为了进一步改善搜索关键词的推荐效果,当步骤50中采用上述策略来确定推荐的搜索关键词时,根据输入的搜索关键词所推荐的所有搜索关键词可以满足条件:采用上述策略中所述的第一预定推荐方式所推荐的搜索关键词的数目在所述所有搜索关键词的总数中所占比例大于采用所述其他推荐方式确定推荐的搜索关键词的数目在该总数中所占比例。这样可以使得用户所面对的推荐的关键词中包含大量的由上述第一预定推荐方式确定的搜索关键词。前文已提到,第一预定推荐方式是针对非明确搜索意图标识的搜索关键词进行推荐并能得到较好推荐效果的方式,从而使该第一预定推荐方式所对应的所述比例较大,能够改善搜索关键词的推荐效果。
下面将依据本申请上述发明原理,详细介绍两个实施例来对本申请方法的主要实现原理进行详细的阐述和说明。
实施例一
附图2为本实施例提供的推荐搜索关键词的装置的原理示意图。该装置中包括意图识别模块、推荐方式选择模块和搜索关键词推荐模块。
其中,各模块功能的简单介绍如下:
意图识别模块,主要用于在输入的搜索关键词包含设定的非意图词集合中的样本词但不包含设定的意图词集合中的样本词时,确定输入的搜索关键词对应的搜索意图标识为非明确搜索意图标识,而在输入的搜索关键词不包含设定的非意图词集合中的样本词时,确定输入的搜索关键词对应的搜索意图标识为明确搜索意图标识,并将输入的搜索关键词的搜索意图标识发送给推荐方式选择模块进行处理;
推荐方式选择模块,主要用于从预先设置的不同搜索意图标识与推荐策略的对应关系中,选择出意图识别模块发来的搜索意图标识对应的推荐策略;
搜索关键词推荐模块,主要用于根据用户输入的搜索关键词以及推荐方式选择模块选择出的推荐策略,确定推荐的搜索关键词。
附图3a为本申请实施例提供的搜索关键词推荐方案的具体流程图。
步骤301,用户在搜索引擎页面中的搜索栏中输入搜索关键词;
在本实施例中,用户输入的搜索关键词为“代理加盟”;
步骤302,搜索引擎中的意图识别模块通过比较用户输入的搜索关键词与预先存储的非意图词集合和意图词集合,确定用户输入的搜索关键词对应的搜索意图标识(非明确搜索意图标识或明确搜索意图标识);
所述非意图词集合和意图词集合中均存储着大量样本词。非意图词集合中的样本词是能够表征非搜索意图的词,而意图词集合中的样本词则是能够表征具备搜索意图的词。一般来说,非意图样本词是指没有明确对应实体的词,例如商业意图词等,非意图样本词不能为产品名称或品牌等,例如“编程”、“风险分析”、“法律投诉”等等都是非意图样本词;而意图词是指有明确对应实体的词,实际物品、商品的名称都是意图词,例如“手机”、“汽车”、“灭火器”等等。
意图识别模块在输入的搜索关键词包含设定的非意图词集合中的样本词而不包含设定的非意图词集合中的样本词时,确定输入的搜索关键词对应的搜索意图标识为非明确搜索意图标识;而在输入的搜索关键词不包含设定的非意图词集合中的样本词时,可以确定输入的搜索关键词对应的搜索意图标识为明确搜索意图标识。非明确搜索意图标识和明确搜索意图标识可以预先设定,例如“NEG”为非明确搜索意图标识、“POS”为明确搜索意图标识;或者“0”为非明确搜索意图标识、“1”为明确搜索意图标识。
步骤303,意图识别模块将确定出的用户输入的搜索关键词对应的搜索意图标识发送给推荐方式选择模块;
步骤304,推荐方式选择模块从预先设置的不同搜索意图标识与推荐策略的对应关系中,选择出意图识别模块发来的搜索意图标识对应的推荐策略;
不同搜索意图标识与推荐策略的对应关系如表1所示。其中,推荐方式A为基于知识库(KBS,Knowledge-Based System)的推荐方式、推荐方式B为基于会话相关性(Session)的推荐方式、推荐方式C为基于搜索日志的推荐方式。
表1
  搜索意图标识   推荐策略
  明确搜索意图标识   推荐方式C
  非明确搜索意图标识   推荐方式A或推荐方式B
当然,每种不同搜索意图标识对应的推荐策略也可以是多种推荐方式的组合,非明确搜索意图标识对应的推荐策略可以为以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式;明确搜索意图标识对应的推荐策略则可以为以基于搜索日志的推荐方式为推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式。具体地,可以用每种推荐方式推荐出的搜索关键词数目在推荐的搜索关键词总数中所占比例来体现这种主辅关系,如表2所示。
表2
Figure BDA0000042364710000091
假定推荐方式A推荐出的搜索关键词数目在推荐的搜索关键词总数中所占比例为a;推荐方式B推荐出的搜索关键词数目在推荐的搜索关键词总数中所占比例为b;推荐方式C推荐出的搜索关键词数目在推荐的搜索关键词总数中所占比例为c。对于明确搜索意图标识对应的推荐策略而言,c>=a+b;对于非明确搜索意图标识对应的推荐策略而言,a+b>=c。后续为了便于描述,可以将a、b、c这样的比例称为“推荐比例”。
步骤305,搜索关键词推荐模块根据推荐方式选择模块选择出的推荐策略、以及用户输入的搜索关键词,确定推荐的搜索关键词。
需要说明的是,在上述步骤304中推荐策略中各推荐方式推荐出的搜索关键词数目在推荐的搜索关键词总数中所占比例a、b、c的具体数值可以采用自适应的方法来动态调整,例如可以采用基于曝光反馈率(CTR,Click-Through-Rate)的方法来动态调整a、b、c的值。根据用户输入的搜索关键词或推荐出的搜索关键词进行搜索得到搜索结果,被称为该搜索关键词被曝光了一次,如果用户点击了搜索结果,则说明该搜索关键词得到了一次反馈。对于推荐方式来说,如果本次搜索结果是利用推荐方式A推荐出的搜索关键词进行搜索而得到的,称为推荐方式A获得了1次曝光,如果用户本次所点击的搜索结果是采用推荐方式A(基于知识库的推荐方式)推荐出的搜索关键词而得到的,那么称推荐方式A获得了一次反馈。
推荐方式的曝光反馈率是指该推荐方式得到的曝光次数与基于该曝光次数获得的反馈次数之间的比值。例如,推荐方式A的曝光反馈率是指在预定时间段内推荐方式A被曝光的次数与推荐方式A获得的反馈次数之间的比值。
调整a、b、c数值的流程请参照附图3b所示:
S1,搜索引擎针对预定时间段内每次用户点击搜索结果的行为,若搜索结果是根据推荐出的搜索关键词获得的搜索结果,记录本次搜索关键词所采用的推荐方式,即记录预定时间段内每种推荐方式得到的曝光次数;
假定5天之内,推荐方式A得到了1000次曝光、推荐方式B得到了500次曝光、推荐方式C得到了300次曝光。
S2,搜索引擎统计所述设定时间段内,每种推荐方式推荐出的搜索关键词获得反馈的次数;
假定5天之内,推荐方式A得到了500次反馈、推荐方式B得到了200次反馈、推荐方式C得到了100次反馈。
S3,搜索引擎根据S1得到的预定时间段内每种推荐方式得到的曝光次数,以及S2获得额所述预定时间段内每种推荐方式获得的反馈次数,计算每种推荐方式对应的曝光反馈率;
推荐方式A对应的曝光反馈率为1000次曝光/500次反馈=2;
推荐方式B对应的曝光反馈率为500次曝光/200次反馈=2.5;
推荐方式C对应的曝光反馈率为300次曝光/100次反馈=3;
S4,搜索引擎按照设定的调整步长,增大具有最小曝光反馈率数值的推荐方式(可以理解为获得反馈的效率较高的推荐方式)确定的推荐搜索关键词数目在各推荐方式确定的推荐搜索关键词总数中所占比例,减少具有最大曝光反馈率数值的推荐方式(可以理解为获得反馈的效率较低的推荐方式)对应的该比例;
假定调整之前a=40%、b=40%、c=20%,由于推荐方式A曝光反馈率数值最小,而推荐方式C曝光反馈率数值最大,按照每次调整5%的调整步长,修改a、c的值,a’=a+5%=45%,c’=c-5%=15%。
下面分别对基于知识库的推荐方式和基于会话相关性的推荐方式进行详细的描述。
一、基于知识库的推荐方式
附图4为基于知识库的推荐方式的原理示意图。
步骤401,数据库中存储有搜索日志、数据挖掘引擎对数据库中存储的搜索关键词进行聚类处理,从而获得至少两个词条集合,其中,同一词条集合中包含的各词条之间存在逻辑对应关系且各词条类型相同,而不同词条结合对应的词条类型不同;
在本实施例中,可以获取四类不同类型的词条集合,具体为:复合类型词条的集合、单一类型词条的集合、品牌类型词条的集合和产品型号类型词条的集合。不同类型词条集合中的词条之间存在逻辑对应关系。
例如,请参照附图5所示,复合类型词条集合中的词条“智能3G手机”、单一类型词条的集合中的词条“手机”、品牌类型词条的集合中的词条“品牌S”、产品型号类型词条的集合中的词条“i9000”两两之间存在逻辑关系;
复合类型词条集合中的词条“数码相框”与单一类型词条的集合中的词条“相框”存在逻辑关系,同时与品牌类型词条的集合中的词条“品牌A”、产品型号类型词条的集合中的词条“v630”存在逻辑关系;
复合类型词条集合中的词条“代理加盟”与单一类型词条的集合中的词条“代理”存在逻辑关系,同时与品牌类型词条的集合中的词条“品牌A代理商”、产品型号类型词条的集合中的词条“T50b”存在逻辑关系等等。
步骤402、根据接收到的搜索关键词,从步骤401中获得的各个词条集合中,确定包含与该搜索关键词匹配一致的词条的集合;
逐一将用户输入的搜索关键词与上述四个词条集合中的词条进行比对,从而确定输入的搜索关键词所在的集合,这里若假定用户输入的搜索关键词为“加盟代理”,则确定用户输入的搜索关键词所在的集合为复合类型词条集合。
步骤403,从存储的规则集合中,选择出以该输入的搜索关键词所在的集合中包含的词条类型为链首的规则,规则集合中的每个规则包含各词条类型的先后顺序链;
例如,规则1:复合类型->品牌类型->产品型号类型;
规则2:单一类型->复合类型->品牌类型->产品型号类型;
规则3:产品型号类型->品牌类型;
规则4:品牌类型->产品型号类型;
例如,前文所述的用户输入的搜索关键词为“加盟代理”,而与“加盟代理”对应的结合为包含复合型词条的集合,因此,针对“加盟代理”这一搜索关键词,选择出的规则为以复合类型为链首的规则1。
步骤404,针对每个选择出的规则,确定该规则包含的先后顺序链中链首之后的词条类型后,进入步骤405;
在规则1中,在链首“复合类型”之后的词条类型为品牌类型。
步骤405,将包含所述链首之后的词条类型词条的集合中与该输入的搜索关键词存在逻辑对应关系的词条作为推荐的搜索关键词;
参见附图5,由于在品牌类型词条集合中与复合类型词条集合中的“代理加盟”存在逻辑关系的词条为“品牌A代理商”,因此将词条“品牌A代理商”作为推荐的搜索关键词。
需要说明的是在步骤403中选择出的规则的数目为至少一个,因而在步骤405中对应推荐出至少一个搜索关键词。当采用基于知识库的推荐方式推荐出的搜索关键词的数目m超过按照搜索策略需要采用基于知识库的推荐方式推荐出的搜索关键词的数目a*n(n为推荐的搜索关键词总数),即m>a*n时,从采用基于知识库的推荐方式推荐出的m个搜索关键词中选择出a*n个搜索关键词,具体的优选方式包括根据搜索关键词的重要性参数值来选取等。
二、基于会话相关性Session的推荐方式
附图6为基于会话相关性的推荐方式的原理示意图。
步骤601,预先根据搜索日志中同一用户使用的相邻搜索关键词(相邻搜索关键词是指搜索关键词的输入时间间隔小于预定阈值的不同搜索关键词)之间的点击关系和时间间隔,确定并存储每次搜索过程对应的搜索关键词链,搜索关键词链中包含至少两个搜索关键词;
搜索日志中通常会存储同一用户的搜索记录,搜索记录中包含根据输入的搜索关键词进行网页搜索的时间,以及是否点击搜索结果等信息。
两个相邻搜索关键词存在点击关系是指同一用户在设定的时间内,例如5分钟内,分别根据这两个搜索关键词进行了网页搜索,且用户分别点击了根据两个搜索关键词获得的搜索结果中的页面连接。其中,用户点击了根据搜索关键词获得的搜索结果中的页面连接反映出用户通过该搜索关键词进行了较为满意的搜索过程。其中,相邻搜索关键词中输入时间靠后的一搜索关键词可以是用户从根据输入时间靠前的一搜索关键词推荐出的搜索关键词中选取的搜索关键词,也可以是用户再次输入的搜索关键词。
通过上述方法,可以获得搜索过程对应的包含至少两个搜索关键词的搜索关键词链。
假定在本实施例中获得了如下搜索关键词链:
搜索关键词链1:“代理-代理加盟-A品牌加盟商-A品牌型号为T50b的产品”
搜索关键词链2:“代理加盟-服装专卖店加盟-加盟热线”;
搜索关键词链3:“K品牌快餐店-代理加盟-加盟热线”
步骤602,接收输入的搜索关键词;
这里假定用户在搜索栏输入的搜索关键词为“代理加盟”;
步骤603,确定存储的包含有输入的搜索关键词的各搜索关键词链中在输入的搜索关键词后面位置的搜索关键词;
搜索关键词链1中在“代理加盟”后面位置的搜索关键词为“A品牌加盟商”、“A品牌型号为T50b的产品”;搜索关键词链2中在“代理加盟”后面位置的搜索关键词为“服装专卖店加盟”、“加盟热线”;搜索关键词链3中在“代理加盟”后面位置的搜索关键词为“加盟热线”;
步骤604,根据所述后面位置的搜索关键词确定推荐的搜索关键词;
步骤604的具体方式实现方式包括但不限于以下两种:
1、根据预先存储有各种行业类别词条的集合(例如商业类型词条集合、电子产品类型词条集合等),从各搜索关键词链的位于输入的搜索关键词后面位置的搜索关键词中,选择出与输入的搜索关键词处于同一行业类别词条集合的搜索关键词作为推荐的搜索关键词;
2、分别统计后面位置的搜索关键词中各不同搜索关键词在所有后面位置的搜索关键词中的出现概率,并对应出现概率由高到低的顺序,依次选择预定数量的出现概率对应的搜索关键词作为推荐的搜索关键词。
例如共有100个搜索关键词链中出现了“代理加盟”,在其中50个搜索关键词链中“代理加盟”后面位置的搜索关键词为“加盟热线”、在其中15个搜索关键词链中“代理加盟”后面位置的搜索关键词为“服装专卖店”、在其中15个搜索关键词链中“代理加盟”后面位置的搜索关键词为“加盟商培训”、在其中20个搜索关键词链中“代理加盟”后面位置的搜索关键词为“加盟返利”,则“加盟热线”出现的概率为0.5、“加盟返利”出现的概率为0.2、“服装专卖店”出现的概率为0.15、“加盟商培训”出现的概率为0.15,那么按照概率由高到低的顺序排列后,推荐的顺序为“加盟热线”-“加盟返利”-“服装专卖店”-“加盟商培训”,若需要推荐出1个搜索关键词,则将“加盟热线”作为推荐的搜索关键词。
当然,上述两种后一位置的搜索关键词确定推荐的搜索关键词的方式也可以结合使用,例如先筛选出后一位置的搜索关键词中选择出与输入的搜索关键词处于同一行业类别词条集合中的后一位置的搜索关键词,再从筛除出的搜索关键词中进一步选择出出现概率最高的搜索关键词作为推荐的搜索关键词。
上述基于知识库的推荐方式或基于会话相关性的推荐方式能够扩大推荐关键词时的行业领域,采用行业领域发散的思路来推荐关键词,而不是仅根据重要性参数值来推荐搜索关键词。
本申请实施例提供的搜索关键词的推荐方案中,首先对用户输入的搜索关键词进行搜索意图识别,识别用户输入的搜索关键词是否有明显搜索意图;对于没有明显搜索意图的用户输入的搜索关键词,根据第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略来确定推荐搜索关键词,由于第一预定推荐方式可以为基于知识库或基于会话相关性的推荐方式,因此可以针对没有明显搜索意图的用户输入的搜索关键词完成较优的搜索关键词推荐,从而扩大了推荐搜索关键词时的行业领域,避免现有的基于日志的关键词推荐方式存在的逐级细化的问题,能够改善搜索关键词的推荐效果。对于有明显搜索意图的用户输入的搜索关键词,可以将基于知识库的推荐方式或基于会话相关性的推荐方式作为现有的基于日志的推荐方式的合理补充。
实施例二
实施例一中提供的基于意图识别的搜索关键词推荐方案还可以与搜索关键词的行业类别识别相结合,从而获得更佳的推荐效果。行业类别识别是指预先将搜索日志中的搜索关键词按照行业类别进行分类,例如分为电子产品类别、商业活动类别、农业产品类别、服装产品类别等等,并存储每个行业类别对应的搜索关键词集合。当至少两个行业类别对应的搜索关键词集合中都包含用户输入的搜索关键词时,根据每个行业类别分别对应的搜索关键词集合中用户输入的搜索关键词的点击因素的参数值,确定输入的搜索关键词属于每个行业类别的概率,并进而根据确定出的概率以及推荐搜索关键词的总数,确定每个行业类别对应的需要推荐出的搜索关键词数目;针对每个行业类别,可以采用实施例一中提供的方案中步骤304确定出的推荐策略来确定推荐的搜索关键词。具体过程请参照附图7所示:
步骤701,根据预先存储的各行业类别分别对应的搜索关键词集合,确定包含有用户输入的搜索关键词的搜索关键词集合对应的行业类别,从而获得输入的搜索关键词对应的行业类别集合;
假定,输入的搜索关键词为“苹果”,服装行业类别对应的搜索关键词集合和农产品类别对应的搜索关键词集合中均包括输入的搜索关键词“苹果”,则苹果对应的行业类别集合S为{服装行业类别、农产品类别}。
步骤702,针对步骤701确定出的行业类别集合中的每个行业类别,确定输入的搜索关键词在该行业类别对应的搜索关键词集合中的点击因素的属性值;
例如,在最简单的一种情况下,每个行业类别对应的搜索关键词集合中搜索关键词点击因素的属性值为根据该搜索关键词获得的搜索结果被点击的次数,假定服装行业类别对应的搜索关键词集合中搜索关键词“苹果”的搜索结果被点击的次数为20次,点击因素的属性值为20;农产品类别对应的搜索关键词集合中搜索关键词“苹果”的搜索结果被点击的次数为80次,点击因素的属性值为80。
步骤703,根据步骤702确定出的点击因素的属性值,确定输入的搜索关键词属于步骤701中获得的行业类别集合中各行业类别的概率;
对步骤701中获得的行业类别集合中每个行业类别中输入的搜索关键词的点击因素的属性值进行归一化处理,将归一化处理结果作为输入的搜索关键词属于各行业类别的概率,即搜索关键词“苹果”属于农产品类别的概率为80%,属于服装类行业类别的概率为20%。
步骤704,根据步骤703确定出的概率、以及所需推荐的关键词的数目,确定所述行业类别集合中每个行业类别对应需要推荐的关键词的数目;
若所需推荐的搜索关键词的总数为10个,则农产品类别对应的需要推荐的关键词的数目为10*80%=8个,服装类行业类别对应的需要推荐的关键词的数目为10*20%=2个。
步骤705,针对每个行业类别,根据该行业类别对应的搜索关键词集合,可以采用实施例一中步骤304确定出的推荐策略来确定该行业类别推荐的搜索关键词;
步骤706,将每个行业类别推荐的搜索关键词组成的集合,作为推荐的搜索关键词集合。
较佳地,还可以根据步骤703确定出的概率,对步骤706获得的推荐的搜索关键词进行排序,例如将对应的概率值较高的行业类别推荐的搜索关键词排在靠前的位置,将对应的概率值较低的行业类别推荐的搜索关键词排在靠后的位置。
需要说明的是,附图3中的步骤301~步骤303和步骤701~步骤703可以并行地执行。
相应地,本申请实施例还提供了一种推荐搜索关键词的装置,该装置的具体结构示意图如图8所示,包括以下功能单元:
接收单元81,用于接收输入的搜索关键词;
比较单元82,用于比较接收单元81接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图此集合中的样本词;
第一推荐单元83,用于在比较单元82得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。
此外,该装置还可以包括第二推荐单元,用于在比较单元82得到的比较结果为接收的搜索关键词不包含非意图词集合中的样本词时,以第二预定推荐方式为确定推荐搜索关键词的主方式,以除第二预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词。
在本发明实施例中,当第一预定推荐方式为基于知识库的推荐方式时,上述第一推荐单元83具体可以划分为以下功能模块:
集合确定模块,用于在比较单元82得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,从基于数据挖掘算法预先获得的至少两个词条集合中,确定接收单元81接收的搜索关键词包含的词条所在的集合,其中,同一词条集合包含的各词条之间存在逻辑对应关系且各词条类型相同,不同词条集合对应的词条类型不同;规则选择模块,用于从存储的包含各词条类型的先后顺序链的多个规则中,选择包含以集合确定模块确定的集合所包含词条的词条类型为链首的先后顺序链的规则;选取模块,用于针对规则选择模块选择出的每个规则,执行:确定该规则包含的先后顺序链的链首之后的词条类型,并根据所述逻辑对应关系,从确定的词条类型对应的集合中,选取与接收的搜索关键词包含的词条存在逻辑对应关系的词条作为确定的推荐搜索关键词。
而当第一预定推荐方式为基于会话相关性的推荐方式时,第一推荐单元83具体可以划分为以下功能模块:
第一确定模块,用于从预先存储的每次搜索过程对应的搜索关键词链中,确定位于接收单元接收的搜索关键词后面位置的搜索关键词,其中,搜索关键词链是根据搜索日志中同一用户使用的相邻搜索关键词之间的点击关系和时间间隔确定的,且任意搜索关键词链均包含至少两个搜索关键词;第二确定模块,用于根据第一确定模块确定的搜索关键词确定推荐搜索关键词。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种推荐搜索关键词的方法,其特征在于,包括:
接收输入的搜索关键词;
比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;
当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式;
其中,所述基于知识库的推荐方式,包括:
接收输入的搜索关键词;以及
从基于数据挖掘算法预先获得的至少两个词条集合中,确定接收的搜索关键词所在的集合,其中,同一词条集合包含的各词条之间存在逻辑对应关系且各词条类型相同,不同词条集合对应的词条类型不同;并
从存储的包含各词条类型的先后顺序链的多个规则中,选择包含以确定的所述集合所包含词条的词条类型为链首的先后顺序链的规则;
针对选择出的每个规则,执行:
确定该规则包含的先后顺序链的链首之后的词条类型,并根据所述逻辑对应关系,从确定的词条类型对应的集合中,选取与接收的搜索关键词存在逻辑对应关系的词条作为确定的推荐搜索关键词;
所述基于会话相关性的推荐方式,包括:
接收输入的搜索关键词;
从预先存储的每次搜索过程对应的搜索关键词链中,确定位于接收的搜索关键词后面位置的搜索关键词,其中,所述搜索关键词链是根据搜索日志中同一用户使用的相邻搜索关键词之间的点击关系和时间间隔确定的,且任意搜索关键词链均包含至少两个搜索关键词;并
根据确定的搜索关键词确定推荐搜索关键词。
2.如权利要求1所述的方法,其特征在于,以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,具体包括:
依据采用第一预定推荐方式所确定的推荐搜索关键词的数目在采用第一预定推荐方式及所述其他推荐方式确定的所有推荐搜索关键词的总数中所占比例大于采用所述其他推荐方式确定的推荐搜索关键词的数目在该总数中所占比例的原则,确定推荐搜索关键词。
3.如权利要求1或2所述的方法,其特征在于,还包括:
当比较结果为接收的搜索关键词不包含非意图词集合中的样本词时,以第二预定推荐方式为确定推荐搜索关键词的主方式,以除第二预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词。
4.如权利要求3所述的方法,其特征在于,以第二预定推荐方式为确定推荐搜索关键词的主方式,以除第二预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,具体包括:
依据由第二预定推荐方式所确定的推荐搜索关键词的数目在采用第二预定推荐方式及除第二预定推荐方式外的其他推荐方式所确定的所有推荐搜索关键词的总数中所占比例大于采用所述除第二预定推荐方式外的其他推荐方式确定的推荐搜索关键词的数目在该总数中所占比例的原则,确定推荐搜索关键词。
5.如权利要求2或4所述的方法,其特征在于,还包括:
在确定推荐搜索关键词之前,基于曝光反馈率,自适应动态调整各推荐方式分别确定的推荐搜索关键词数目在推荐搜索关键词总数目中所占比例。
6.如权利要求5所述的方法,其特征在于,基于曝光反馈率,自适应动态调整各推荐方式分别确定的推荐搜索关键词数目在推荐搜索关键词总数目中所占比例,具体包括:
分别记录用于确定推荐搜索关键词的各推荐方式在预定时间段内的曝光次数与获得反馈的次数;
根据记录的曝光次数与获得反馈的次数,分别确定各推荐方式对应的曝光反馈率;
按照设定的调整步长,增大具有最小曝光反馈率数值的推荐方式确定的推荐搜索关键词数目在所述各推荐方式确定的推荐搜索关键词总数中所占比例,减小具有最大曝光反馈率数值的推荐方式确定的推荐搜索关键词数目在所述各推荐方式确定的推荐搜索关键词总数中所占比例。
7.如权利要求1所述的方法,其特征在于,接收到输入的搜索关键词之后,还包括:
根据预先存储的各行业类别分别对应的搜索关键词集合,确定包含有接收的搜索关键词的搜索关键词集合;并
从预先存储的各搜索关键词集合包含的搜索关键词的点击因素的属性值中,分别确定接收的搜索关键词的点击因素的属性值,并根据所述点击因素的属性值,分别确定接收的搜索关键词属于确定的搜索关键词集合对应的各行业类别的概率;
根据确定出的概率以及所需推荐的搜索关键词的数目,分别确定各行业类别所对应的需推荐的搜索关键词的数目;以及
以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,具体包括:
针对确定的搜索关键词集合对应的各行业类别中的任一行业类别,执行下述步骤,直至确定出各行业类别分别对应的推荐搜索关键词:
按照采用第一预定推荐方式确定的推荐搜索关键词的数目在采用包含第一预定推荐方式以及所述其他推荐方式确定的搜索关键词总数中所占的比例大于采用所述其他推荐方式确定的推荐搜索关键词的数目在所述总数中所占比例的原则,确定针对该行业类别所确定的推荐搜索关键词。
8.如权利要求7所述的方法,其特征在于,在确定出各行业类别分别对应的推荐搜索关键词之后,还包括:
根据确定出的接收的搜索关键词属于各行业类别的概率,按照从大到小的概率对应由前至后的推荐搜索关键词排列位置的顺序,依次对针对该行业类别所确定出的推荐搜索关键词进行排序。
9.如权利要求1所述的方法,其特征在于,根据确定的搜索关键词确定推荐搜索关键词,具体包括:
从确定的搜索关键词中,选择与接收的搜索关键词属于同一行业类别的搜索关键词;并
将选择的搜索关键词作为确定的推荐搜索关键词。
10.如权利要求1所述的方法,其特征在于,根据确定的搜索关键词确定推荐搜索关键词,具体包括:
分别确定所述确定的搜索关键词中各搜索关键词在所有的所述确定的搜索关键词中的出现概率;
对应于出现概率的由高至低顺序,依次选择预定数量的出现概率对应的搜索关键词作为推荐搜索关键词。
11.一种推荐搜索关键词的装置,其特征在于,包括:
接收单元,用于接收输入的搜索关键词;
比较单元,用于比较接收单元接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;
第一推荐单元,用于在比较单元得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式;
其中,所述第一预定推荐方式为基于知识库的推荐方式时,所述第一推荐单元具体包括:
集合确定模块,用于在比较单元得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,从基于数据挖掘算法预先获得的至少两个词条集合中,确定接收单元接收的搜索关键词包含的词条所在的集合,其中,同一词条集合包含的各词条之间存在逻辑对应关系且各词条类型相同,不同词条集合对应的词条类型不同;
规则选择模块,用于从存储的包含各词条类型的先后顺序链的多个规则中,选择包含以集合确定模块确定的集合所包含词条的词条类型为链首的先后顺序链的规则;
选取模块,用于针对规则选择模块选择出的每个规则,执行:确定该规则包含的先后顺序链的链首之后的词条类型,并根据所述逻辑对应关系,从确定的词条类型对应的集合中,选取与接收的搜索关键词包含的词条存在逻辑对应关系的词条作为确定的推荐搜索关键词;
所述第一预定推荐方式为基于会话相关性的推荐方式时,所述第一推荐单元具体包括:
第一确定模块,用于从预先存储的每次搜索过程对应的搜索关键词链中,确定位于接收单元接收的搜索关键词后面位置的搜索关键词,其中,所述搜索关键词链是根据搜索日志中同一用户使用的相邻搜索关键词之间的点击关系和时间间隔确定的,且任意搜索关键词链均包含至少两个搜索关键词;
第二确定模块,用于根据第一确定模块确定的搜索关键词确定推荐搜索关键词。
12.如权利要求11所述的装置,其特征在于,所述第一推荐单元以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,具体为:
所述第一推荐单元依据采用第一预定推荐方式所确定的推荐搜索关键词的数目在采用第一预定推荐方式及所述其他推荐方式确定的所有推荐搜索关键词的总数中所占比例大于采用所述其他推荐方式确定的推荐搜索关键词的数目在该总数中所占比例的原则,确定推荐搜索关键词。
13.如权利要求11所述的装置,其特征在于,还包括:
第二推荐单元,用于在比较单元得到的比较结果为接收的搜索关键词不包含非意图词集合中的样本词时,以第二预定推荐方式为确定推荐搜索关键词的主方式,以除第二预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词。
CN201010618555.4A 2010-12-31 2010-12-31 推荐搜索关键词的方法和装置 Active CN102567408B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201010618555.4A CN102567408B (zh) 2010-12-31 2010-12-31 推荐搜索关键词的方法和装置
TW100105663A TWI525458B (zh) 2010-12-31 2011-02-21 Recommended methods and devices for searching for keywords
US13/335,201 US8799306B2 (en) 2010-12-31 2011-12-22 Recommendation of search keywords based on indication of user intention
EP11853187.0A EP2659398A4 (en) 2010-12-31 2011-12-23 Recommendation of search keywords based on indication of user intention
PCT/US2011/067176 WO2012092196A1 (en) 2010-12-31 2011-12-23 Recommendation of search keywords based on indication of user intention
JP2013547593A JP5736469B2 (ja) 2010-12-31 2011-12-23 ユーザ意図の有無に基づく検索キーワードの推薦
HK12108976.7A HK1168920A1 (zh) 2010-12-31 2012-09-13 推薦搜索關鍵詞的方法和裝置
US14/313,808 US9092549B2 (en) 2010-12-31 2014-06-24 Recommendation of search keywords based on indication of user intention

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010618555.4A CN102567408B (zh) 2010-12-31 2010-12-31 推荐搜索关键词的方法和装置

Publications (2)

Publication Number Publication Date
CN102567408A CN102567408A (zh) 2012-07-11
CN102567408B true CN102567408B (zh) 2014-06-04

Family

ID=46381715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010618555.4A Active CN102567408B (zh) 2010-12-31 2010-12-31 推荐搜索关键词的方法和装置

Country Status (7)

Country Link
US (2) US8799306B2 (zh)
EP (1) EP2659398A4 (zh)
JP (1) JP5736469B2 (zh)
CN (1) CN102567408B (zh)
HK (1) HK1168920A1 (zh)
TW (1) TWI525458B (zh)
WO (1) WO2012092196A1 (zh)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977642B2 (en) 2010-03-19 2015-03-10 Intuit Inc. Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform
US9405832B2 (en) * 2012-05-31 2016-08-02 Apple Inc. Application search query classifier
CN103577416B (zh) 2012-07-20 2017-09-22 阿里巴巴集团控股有限公司 扩展查询方法及系统
CN103577426B (zh) * 2012-07-24 2019-04-12 百度在线网络技术(北京)有限公司 用于提供搜索建议的附加应用信息的方法、装置与系统
CN103593371B (zh) * 2012-08-16 2016-04-13 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
KR101387914B1 (ko) * 2012-10-16 2014-04-23 주식회사 와이즈넛 검색어 자동 완성 기능과 연동되는 추천 결과 제공 방법
CN103853771B (zh) * 2012-12-03 2018-12-14 百度在线网络技术(北京)有限公司 一种搜索结果的推送方法及系统
WO2014143076A1 (en) * 2013-03-13 2014-09-18 Intuit Inc. Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform
US20140280294A1 (en) * 2013-03-13 2014-09-18 Google, Inc. Connecting users in search services based on received queries
US9372929B2 (en) * 2013-03-20 2016-06-21 Securboration, Inc. Methods and systems for node and link identification
CN104111941B (zh) * 2013-04-18 2018-11-16 阿里巴巴集团控股有限公司 信息展示的方法及设备
US9241242B2 (en) * 2013-04-19 2016-01-19 Tencent Technology (Shenzhen) Company Limited Information recommendation method and apparatus
CN103235812B (zh) * 2013-04-24 2015-04-01 中国科学院计算技术研究所 查询多意图识别方法和系统
US9524319B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Search relevance
US9524520B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Training a classification model to predict categories
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
US9477728B2 (en) * 2013-08-09 2016-10-25 Oracle International Corporation Handling of errors in data transferred from a source application to a target application of an enterprise resource planning (ERP) system
CN104657397B (zh) * 2013-11-25 2020-03-03 腾讯科技(深圳)有限公司 一种信息处理方法及终端
CN103631939B (zh) * 2013-12-06 2017-04-05 无锡艾德思奇软件有限公司 用于搜索引擎的数据处理方法和装置
CN104063418A (zh) * 2014-03-17 2014-09-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104933081B (zh) * 2014-03-21 2018-06-29 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
US9639601B2 (en) * 2014-06-06 2017-05-02 Xerox Corporation Question answering system adapted to style of user requests
WO2016103383A1 (ja) * 2014-12-25 2016-06-30 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
WO2016151690A1 (ja) 2015-03-20 2016-09-29 株式会社 東芝 文書検索装置、方法及びプログラム
KR101638821B1 (ko) * 2015-04-16 2016-07-12 네이버 주식회사 도메인 속성을 이용한 질의어 추천 방법과 시스템 및 기록매체
GB2555967A (en) * 2015-10-27 2018-05-16 Beijing Didi Infinity Technology & Dev Co Ltd Systems and methods for delivering a message
CN106774969B (zh) * 2015-11-20 2021-12-14 北京搜狗科技发展有限公司 一种输入方法和装置
CN105404680A (zh) * 2015-11-25 2016-03-16 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
CN105512180B (zh) * 2015-11-25 2019-07-23 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
WO2018029852A1 (ja) * 2016-08-12 2018-02-15 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
CN107784029B (zh) * 2016-08-31 2022-02-08 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
CN106528531B (zh) * 2016-10-31 2019-09-03 北京百度网讯科技有限公司 基于人工智能的意图分析方法及装置
CN106503233A (zh) * 2016-11-03 2017-03-15 北京挖玖电子商务有限公司 热门搜索词推荐系统
TWI647638B (zh) * 2016-11-15 2019-01-11 財團法人工業技術研究院 互動式推薦系統與方法
CN106777217B (zh) * 2016-12-23 2020-10-30 北京奇虎科技有限公司 一种搜索词推荐方法及装置
CN106844609A (zh) * 2017-01-17 2017-06-13 百度在线网络技术(北京)有限公司 一种搜索方法及装置
CN108664513B (zh) * 2017-03-31 2022-04-12 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
CN107577667B (zh) * 2017-09-14 2020-10-27 北京奇艺世纪科技有限公司 一种实体词处理方法和装置
CN110020045B (zh) * 2017-09-25 2021-07-27 北京国双科技有限公司 关键词路径分析方法及装置
CN110033338A (zh) * 2018-01-11 2019-07-19 北京搜狗科技发展有限公司 推荐方法和装置、用于推荐的装置
CN108776901B (zh) * 2018-04-27 2021-01-15 微梦创科网络科技(中国)有限公司 基于搜索词的广告推荐方法及系统
CN108920531B (zh) * 2018-06-08 2021-10-15 Oppo(重庆)智能科技有限公司 搜索内容推荐方法、装置、终端设备及存储介质
CN109213848B (zh) * 2018-11-23 2022-03-11 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备
CA3131370A1 (en) * 2019-02-25 2020-09-03 Liveperson, Inc. Intent-driven contact center
CN111831848A (zh) * 2019-04-23 2020-10-27 广东小天才科技有限公司 作文好词句的推荐方法及装置、终端设备
CN111339239B (zh) * 2019-06-13 2021-01-05 海通证券股份有限公司 知识检索方法及装置、存储介质、服务器
CN110322139B (zh) * 2019-06-28 2023-11-28 创新先进技术有限公司 策略推荐方法及装置
CN110765354B (zh) * 2019-10-22 2022-11-22 北京字节跳动网络技术有限公司 信息的推送方法、装置、电子设备及存储介质
JP6960483B2 (ja) * 2020-02-04 2021-11-05 株式会社カカクコム 情報処理装置、サーバ、情報処理方法及び情報処理プログラム
CN111782935A (zh) * 2020-05-12 2020-10-16 北京三快在线科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN111581481B (zh) * 2020-05-13 2024-03-08 北京达佳互联信息技术有限公司 搜索词推荐方法、装置、电子设备以及存储介质
WO2021246248A1 (ja) * 2020-06-03 2021-12-09 ソニーグループ株式会社 情報処理装置及び情報処理方法
CN113570404B (zh) * 2021-06-30 2023-12-05 深圳市东信时代信息技术有限公司 一种目标用户定位的方法、装置及相关设备
CN113486253B (zh) * 2021-07-30 2024-03-19 抖音视界有限公司 搜索结果展示方法、装置、设备和介质
CN113536777A (zh) * 2021-07-30 2021-10-22 深圳豹耳科技有限公司 新闻关键词的抽取方法、装置、设备及存储介质
CN113626715A (zh) * 2021-08-26 2021-11-09 北京字跳网络技术有限公司 查询结果显示方法、装置、介质和电子设备
CN115238049B (zh) * 2022-06-17 2023-08-04 北京优酷科技有限公司 剧本标注方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
CN101751437A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 基于强化学习的网页页面主动式检索系统
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219957A (ja) 1994-01-28 1995-08-18 Matsushita Electric Ind Co Ltd 情報分類装置、情報検索装置及び情報収集装置
US6460029B1 (en) * 1998-12-23 2002-10-01 Microsoft Corporation System for improving search text
US6567797B1 (en) 1999-01-26 2003-05-20 Xerox Corporation System and method for providing recommendations based on multi-modal user clusters
US6502091B1 (en) 2000-02-23 2002-12-31 Hewlett-Packard Company Apparatus and method for discovering context groups and document categories by mining usage logs
JP2002092033A (ja) 2000-09-12 2002-03-29 Sanyo Electric Co Ltd 情報検索装置
US6845374B1 (en) 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7149804B2 (en) 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US7092936B1 (en) 2001-08-22 2006-08-15 Oracle International Corporation System and method for search and recommendation based on usage mining
JP4003468B2 (ja) 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
EP1395056A1 (en) 2002-08-30 2004-03-03 Sony International (Europe) GmbH Methods to create a user profile and to specify a suggestion for a next selection of the user
JP2005031949A (ja) 2003-07-11 2005-02-03 Canon Inc 情報検索方法、情報検索装置およびプログラム
US8086619B2 (en) 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7451131B2 (en) 2003-12-08 2008-11-11 Iac Search & Media, Inc. Methods and systems for providing a response to a query
US7428529B2 (en) 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US7707220B2 (en) 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US20060129531A1 (en) * 2004-12-09 2006-06-15 International Business Machines Corporation Method and system for suggesting search engine keywords
JP4461233B2 (ja) * 2005-03-30 2010-05-12 独立行政法人情報通信研究機構 メディアデータ選択装置、メディアデータ選択方法、メディアデータ選択プログラムおよびそのプログラムを記録した記録媒体
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US8200687B2 (en) * 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7577665B2 (en) 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US7627548B2 (en) 2005-11-22 2009-12-01 Google Inc. Inferring search category synonyms from user logs
US7756855B2 (en) 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7689554B2 (en) 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
CN100495398C (zh) 2006-03-30 2009-06-03 国际商业机器公司 文件系统中搜索排序的方法及相关搜索引擎
US8073860B2 (en) * 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
JP4958476B2 (ja) 2006-05-24 2012-06-20 株式会社日立製作所 検索装置
US7840538B2 (en) * 2006-12-20 2010-11-23 Yahoo! Inc. Discovering query intent from search queries and concept networks
US7725453B1 (en) 2006-12-29 2010-05-25 Google Inc. Custom search index
JP4909748B2 (ja) 2007-01-22 2012-04-04 ヤフー株式会社 ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ
US20080222119A1 (en) 2007-03-08 2008-09-11 Microsoft Corporation Detecting a user's location, local intent and travel intent from search queries
JP2008293211A (ja) 2007-05-23 2008-12-04 Hitachi Ltd アイテム推薦システム
US7734641B2 (en) 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US7818320B2 (en) 2007-05-31 2010-10-19 Yahoo! Inc. Enhanced search results based on user feedback relating to search result abstracts
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
JP4962967B2 (ja) * 2008-01-11 2012-06-27 ヤフー株式会社 Webページ検索サーバ及びクエリ推薦方法
CN101241512B (zh) 2008-03-10 2012-01-11 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
US20090259646A1 (en) 2008-04-09 2009-10-15 Yahoo!, Inc. Method for Calculating Score for Search Query
US7890516B2 (en) 2008-05-30 2011-02-15 Microsoft Corporation Recommending queries when searching against keywords
JP4869292B2 (ja) * 2008-06-20 2012-02-08 ヤフー株式会社 検索キーワードを推薦するサーバ、方法、およびプログラム
JP2010146366A (ja) * 2008-12-19 2010-07-01 Toshiba Corp 情報提供サーバ
US8515966B2 (en) 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
US8719249B2 (en) 2009-05-12 2014-05-06 Microsoft Corporation Query classification
US8423568B2 (en) * 2009-09-16 2013-04-16 Microsoft Corporation Query classification using implicit labels
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
US9177045B2 (en) * 2010-06-02 2015-11-03 Microsoft Technology Licensing, Llc Topical search engines and query context models
US8612432B2 (en) * 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
WO2012040872A1 (en) * 2010-09-29 2012-04-05 Yahoo! Inc. Training search query intent classifier using wiki article titles and search click log

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
CN101751437A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 基于强化学习的网页页面主动式检索系统
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置

Also Published As

Publication number Publication date
WO2012092196A1 (en) 2012-07-05
JP2014501422A (ja) 2014-01-20
TW201227368A (en) 2012-07-01
JP5736469B2 (ja) 2015-06-17
HK1168920A1 (zh) 2013-01-11
US9092549B2 (en) 2015-07-28
US20140379745A1 (en) 2014-12-25
EP2659398A4 (en) 2017-01-25
EP2659398A1 (en) 2013-11-06
US20120173562A1 (en) 2012-07-05
TWI525458B (zh) 2016-03-11
US8799306B2 (en) 2014-08-05
CN102567408A (zh) 2012-07-11

Similar Documents

Publication Publication Date Title
CN102567408B (zh) 推荐搜索关键词的方法和装置
AU2022201654A1 (en) System and engine for seeded clustering of news events
CN102402605B (zh) 用于搜索引擎索引的混合分布模型
US10354308B2 (en) Distinguishing accessories from products for ranking search results
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
US8380697B2 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
US9317613B2 (en) Large scale entity-specific resource classification
CN109885773B (zh) 一种文章个性化推荐方法、系统、介质及设备
CN102799591B (zh) 一种提供推荐词的方法及装置
CN102236663A (zh) 一种基于垂直搜索的查询方法、系统和装置
WO2019169978A1 (zh) 资源推荐方法及装置
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
CN104123332A (zh) 搜索结果的显示方法及装置
CN104951468A (zh) 数据搜索处理方法和系统
WO2012177901A1 (en) Search method and apparatus
US10366108B2 (en) Distributional alignment of sets
CN103838798A (zh) 页面分类系统及页面分类方法
CN101211368B (zh) 一种对查询词分类的方法、装置及搜索引擎系统
US9262513B2 (en) Search method and apparatus
CN104239552A (zh) 生成关联关键词、提供关联关键词的方法及系统
CN105706081A (zh) 结构化信息链接注释
CN111191111A (zh) 内容推荐方法、装置及存储介质
CN103186650B (zh) 一种搜索方法和装置
US9779140B2 (en) Ranking signals for sparse corpora
US20080313166A1 (en) Research progression summary

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1168920

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1168920

Country of ref document: HK