CN103365839A - 一种搜索引擎的推荐搜索方法和装置 - Google Patents

一种搜索引擎的推荐搜索方法和装置 Download PDF

Info

Publication number
CN103365839A
CN103365839A CN2012100818976A CN201210081897A CN103365839A CN 103365839 A CN103365839 A CN 103365839A CN 2012100818976 A CN2012100818976 A CN 2012100818976A CN 201210081897 A CN201210081897 A CN 201210081897A CN 103365839 A CN103365839 A CN 103365839A
Authority
CN
China
Prior art keywords
search
query word
tendentiousness
weight
vertical search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100818976A
Other languages
English (en)
Other versions
CN103365839B (zh
Inventor
何军
匡健锋
泮华杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210081897.6A priority Critical patent/CN103365839B/zh
Priority to PCT/CN2013/073129 priority patent/WO2013143429A1/zh
Publication of CN103365839A publication Critical patent/CN103365839A/zh
Priority to US14/497,993 priority patent/US9934312B2/en
Application granted granted Critical
Publication of CN103365839B publication Critical patent/CN103365839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种搜索引擎的推荐搜索方法和装置,包括:日志记录模块记录搜索过程中查询词的搜索日志和点击日志;倾向性分析模块根据日志分析查询词的垂直搜索倾向性权重;查询词推荐模块在搜索框检测到查询词后确定相关的推荐查询词;垂直搜索倾向性推荐模块查询各推荐查询词对应的垂直搜索倾向性权重并确定推荐查询词的倾向性垂直搜索类型;推荐显示模块显示所述各推荐查询词及其倾向性垂直搜索类型的链接;响应模块在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。利用本发明可以提高搜索引擎进行垂直搜索的搜索效率。

Description

一种搜索引擎的推荐搜索方法和装置
技术领域
本发明涉及互联网信息搜索技术,尤其涉及一种搜索引擎的推荐搜索方法和装置。
背景技术
互联网搜索引擎是指根据一定的策略、运用特定的程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务。搜索引擎根据用户输入的关键词检索出的相关信息,并将检索出的相关信息作为搜索结果展示给用户。
搜索引擎技术发展的一个重要目标就是尽量减少用户的人机操作次数,尽量向用户展示符合用户搜索意图的搜索结果。为了达到这个目标,搜索引擎技术正在不断地改进和发展。
目前,出现了一种搜索引擎的推荐查询词展示技术,这种技术的主要处理过程是:用户在搜索引擎的搜索检索框中输入查询词的过程中,搜索引擎会根据用户的输入的查询词,如查询词abc,通过文本索引找出命中abc的候选查询词,再通过查询次数和/或点击率等统计数据对候选词进行筛选得到最终推荐给用户的查询词(在业界这种推荐的查询词也被称为推荐查询词),并实时显示所述最终推荐给用户的推荐查询词,从而帮助用户筛选出可能感兴趣的查询词,节约用户输入最终查询词的时间,提高搜索效率。图1为现有技术中用户输入查询词时搜索引擎自动计算显示出推荐查询词的一种界面图,如图1所示,用户在搜索框中输入了查询词“王菲”101,则搜索引擎立刻进行推荐计算处理得到推荐查询词,并显示出包含所述推荐查询词的列表102。当用户对推荐出的某个推荐查询词感兴趣时,则可能会点击该推荐查询词,完成一次网页搜索的行为。
上述这种方式虽然节约了用户输入的时间,但是网页的搜索结果并不能很好的满足用户的垂直搜索需求。所谓垂直搜索,就是针对某一行业的专业搜索技术,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎技术方式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
例如,目前搜索引擎的网页搜索引擎为一种通用的、综合的搜索技术,其根据查询词搜索出的结果包含各种细分信息类型的结果,例如其搜索结果页面中囊括了视频、图片、新闻、音乐等各种类型的搜索结果。而垂直搜索需要将不同的信息类型区分开来,一种垂直搜索引擎只搜索一种类型的内容。例如视频垂直搜索引擎专门用于搜索视频类的结果,新闻垂直搜索引擎专门用来搜索新闻类的搜索结果。目前的大多数搜索引擎都具备了不同的垂直搜索引擎(业界也称所述垂直搜索引擎为垂直搜索频道),分别对应搜索不同种类的垂直搜索类型。如图2所示为现有一种搜索引擎主页的界面示意图,其中包括网页搜索引擎201(即通用的搜索引擎),也包括图片搜索引擎202、视频搜索引擎203、音乐搜索引擎204、问答搜索引擎205(即图中的“问问”)、新闻搜索引擎206等等这种垂直搜索引擎。
图1所述的现有技术虽然节约了用户输入的时间,但是并不能很好的满足用户的垂直搜索需求。比如图1中如果用户点击了推荐查询词“王菲传奇”103或“王菲西安演唱会”104,则会直接显示对应的网页搜索结果。但是,不同的推荐查询词的实际搜索意图大部分对应相应的垂直搜索类型,例如“王菲传奇”103的实际搜索意图大部分对应音乐内容,而“王菲西安演唱会”104的实际搜索意图大部分对应视频内容。而在图1所示的现有技术中,不能单独列出更为直观的相关性较高的垂直搜索种类,如果查询对应的垂直搜索内容还需要用户进行二次点击相关的垂直搜索频道链接,才能找到对应的垂直搜索内容,例如音乐类内容或者视频类内容。
因此现有技术在垂直搜索时的搜索效率不高,不方便用户从搜索结果中找到与查询词相关性较高的垂直搜索结果,用户也无法得知与各个推荐查询词相关性最高的垂直搜索类型;同时,用户为了选择最终的垂直搜索结果,往往需要二次点击相关的垂直搜索频道链接,导致用户与互联网机器侧的人机交互次数增多,而每一次人机交互操作都会发出操作请求信息、触发计算过程并产生响应结果信息,从而会占用机器侧的大量资源,包括客户端资源、服务器资源、网络带宽资源等等。
发明内容
有鉴于此,本发明的主要目的在于提供一种搜索引擎的推荐搜索方法和装置,以提高垂直搜索的搜索效率。
本发明的技术方案是这样实现的:
一种搜索引擎的推荐搜索方法,包括:
记录搜索过程中查询词的搜索日志和点击日志;
根据所记录的日志分析查询词的垂直搜索倾向性权重;
在搜索框中检测到查询词之后,确定与该查询词相关的推荐查询词,查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型,显示所述各推荐查询词及其倾向性垂直搜索类型的链接;
在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词,展示搜索结果。
一种搜索引擎的推荐搜索装置,包括:
日志记录模块,用于记录搜索过程中查询词的搜索日志和点击日志;
倾向性分析模块,用于根据所记录的日志分析查询词的垂直搜索倾向性权重;
查询词推荐模块,用于在搜索框中检测查询词,在检测到查询词后确定与该查询词相关的推荐查询词;
垂直搜索倾向性推荐模块,用于查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型;
推荐显示模块,用于显示所述各推荐查询词及其倾向性垂直搜索类型的链接;
响应模块,用于在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。
与现有技术相比,本发明通过对查询词进行垂直搜索的倾向性分析,加入垂直搜索类型倾向性的链接,为搜索用户提供更为直观的、智能化的垂直搜索链接,引导用户直接到达相应的垂直搜索结果,提高了垂直搜索的效率,同时还节省用户二次点击的行为,不但降低了人机交互次数,节省了计算和带宽资源,而且为用户提供更加满意的搜索结果,使用户获得更好的搜索体验。
附图说明
图1为现有技术中用户输入查询词时搜索引擎自动计算显示出推荐查询词的一种界面图;
图2为现有一种搜索引擎主页的界面示意图;
图3为本发明所述一种搜索引擎的推荐搜索方法的处理流程图
图4为本发明所述一种搜索引擎的推荐搜索装置的组成示意图;
图5为本发明在用户向搜索框中输入查询词时所述推荐搜索装置自动分析显示出推荐查询词及其垂直搜索倾向性类型的一种界面图;
图6为本发明所述在用户点击推荐查询词对应的倾向性垂直搜索类型链接后的搜索结果示意图;
图7为在网页搜索结果中显示的视频类搜索结果的界面示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
图3为本发明所述一种搜索引擎的推荐搜索方法的处理流程图。参见图3,该方法主要包括:
步骤301、记录搜索过程中查询词的搜索日志和点击日志。
步骤302、根据所记录的日志分析查询词的垂直搜索倾向性权重。
步骤303、在搜索框中检测到查询词之后,确定与该查询词相关的推荐查询词,查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型,并显示所述各推荐查询词及其倾向性垂直搜索类型的链接。
步骤304、在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。
图4为本发明所述一种搜索引擎的推荐搜索装置的组成示意图。该推荐搜索装置用于执行本发明的方法,主要包括:
日志记录模块401,用于记录用户历史搜索过程中查询词的搜索日志和点击日志。所述的历史搜索过程是指在指定的时间内的用户每一次搜索过程,其中的“历史”是相对于查询词推荐模块403而言,是指用户在搜索框实时输入查询词之前的搜索过程。
倾向性分析模块402,用于根据所记录的日志分析查询词的垂直搜索倾向性权重。
查询词推荐模块403,用于在搜索框中检测查询词,在检测到查询词后确定与该查询词相关的推荐查询词。
垂直搜索倾向性推荐模块404,用于从所述倾向性分析模块402中查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型。
推荐显示模块405,用于显示所述各推荐查询词及其倾向性垂直搜索类型的链接。
响应模块406,用于在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,展示垂直搜索的搜索结果。
图5为本发明在用户向搜索框中输入查询词时所述推荐搜索装置自动分析显示出推荐查询词及其垂直搜索倾向性类型的一种界面图。如图5所示,当用户在搜索引擎的输入框中输入查询词501时,本发明所述的推荐搜索装置会自动确定出与用户输入的查询词相关联的一组查询词502,并将该组查询词502显示在所述搜索框下方,并且对其中倾向性明确的查询词给出对应的倾向性垂直搜索类型的链接503显示在对应查询词的旁边,例如图5所示为显示在对应查询词后的符号之后。此后,用户不仅可以点击其中的某个推荐查询词进行网页搜索,而且可以直接点击所述符号后面的倾向性垂直搜索类型链接直接调用对应类型的垂直搜索引擎对相应的查询词进行搜索,比如用户可点击图5中查询词“王菲西安演唱会”对应的垂直搜索类型链接“视频”,则会调用视频类的垂直搜索引擎搜索所述查询词“王菲西安演唱会”,并会返回如图6所示的视频搜索结果。通过本发明的方案,可以节省用户在大量网页搜索结果中查找感兴趣的垂直资源的过程,得到更加符合用户需求的搜索结果,提高了搜索效率。
所述图5和图6所示的界面实例是以在计算机搜索引擎为例进行说明,在无线搜索场景下,本发明同样可以适用无线搜索引擎。
下面对本发明所述各个步骤进行更为详细的说明:
步骤301中所述记录搜索过程中查询词的搜索日志和点击日志是在用户的搜索过程中进行的。所述搜索过程是指在进行本发明所述的推荐查询词及其倾向性垂直搜索类型之前的搜索过程,也可以称为相对的历史搜索过程。这种搜索过程主要包括:用户在使用搜索引擎时提交一个搜索请求,其中包括查询词,前端服务器得到该搜索请求后向搜索引擎的后台系统发出检索请求,搜索引擎经过检索后返回给用户一个搜索结果列表。如果用户找到感兴趣的搜索结果,则会点击其中的某个或者某几个搜索结果链接进行查看。在这个搜索过程中,本发明的日志记录模块需要记录两种日志:一种是搜索日志,一种是点击日志。
其中,所述搜索日志主要是针对各类型的垂直搜索引擎,记录查询词的搜索日志的具体方法为:针对各类垂直搜索引擎,记录在该类垂直搜索引擎中每次搜索时输入的查询词的内容、搜索结果中被点击的链接数、以及该垂直搜索引擎的类型;
所述点击日志主要是针对网页搜索引擎,记录查询词的点击日志的具体方法为:记录在网页搜索引擎中每次搜索时输入的查询词的内容、搜索结果中被点击的链接、被点击链接对应的垂直搜索类型。
在得到所述搜索日志和点击日志之后,则将这两种日志数据输入到倾向性分析模块进行分析计算,利用步骤302的方法得到一个带有倾向性的查询词推荐集合。
步骤302所述根据所记录的日志分析查询词的垂直搜索倾向性权重具体是确定各查询词对各类垂直搜索类型的倾向性权重,其中针对某一查询词对某一垂直搜索类型的倾向性权重的具体方法包括如下步骤321至323,下面以查询词“王菲西安演唱会”对视频类垂直搜索的倾向性权重为例进行说明:
步骤321,根据所述搜索日志分析该查询词“王菲西安演唱会”对该视频类垂直搜索的第一倾向性权重pw1,具体的确定方法包括:确定查询权重X/Y,其中X为在指定时间段内,该查询词在该视频类垂直搜索引擎中的查询次数,Y为所述指定时间段内该视频类垂直搜索引擎的总查询次数;确定点击权重N/M,其中N为所述指定时间段内该查询词“王菲西安演唱会”在该视频类垂直搜索引擎的搜索结果中被点击的链接数,M为所述指定时间段内该视频类垂直搜索引擎页面的总搜索结果(即该视频类垂直搜索引擎所有查询词的搜索结果)中被点击的链接数;对所述查询权重和点击权重进行加权计算得到该查询词“王菲西安演唱会”对视频类垂直搜索的第一倾向性权重pw1。
具体的,所述对查询权重和点击权重进行加权计算得到所述查询词对所述垂直搜索类型的第一倾向性权重的具体方式可以使用加权求和的方式得到,也可以使用乘积形式得到。
所述利用加权求和的方式计算第一倾向性权重pw1具体为:采用公式(α×X/Y+β×N/M),得到第一倾向性权重pw1,其中α为查询权重因子,β为点击权重因子,这两个因子可以预先设定好。
所述利用乘积形式计算第一倾向性权重pw1具体为:采用公式(1+X/Y)×(1+N/M)并归一化到(0,1)区间的一个浮点数,该浮点数为所述第一倾向性权重pw1。
步骤322、根据所述点击日志分析该查询词“王菲西安演唱会”对视频类垂直搜索的第二倾向性权重pw2,该第二倾向性权重pw2为x/y,其中x为该查询词在指定时间段内在网页搜索引擎中的查询次数,例如在指定时间段t内用户在网页搜索引擎页面中搜索了x次“王菲西安演唱会”;y为该查询词的网页搜索结果中被点击的与视频类垂直搜索对应的链接的个数,例如用户点击了针对查询词“王菲西安演唱会”的搜索结果中的y条视频类的搜索结果。图7为在网页搜索结果中显示的视频类搜索结果的界面示意图,比如用户点击了图7中的3条视频类搜索结果701、702、703,则y=3,如果用户点击的视频类搜索结果越多,则所述第二倾向性权重pw2越高,表示用户对查询词“王菲西安演唱会”对应的视频类搜索结果感兴趣,该查询词的视频类垂直搜索的倾向性越高。
步骤323、将所述第一倾向性权重pw1和第二倾向性权重pw2相乘得到该查询词针对该垂直搜索类型的倾向性权重。
通过对各类垂直搜索引擎的搜索日志以及网页搜索引擎的点击日志的分析计算,最终可以得到一组带有倾向性权重的推荐查询词,如下表1:
  查询词   查询次数qv  点击次数clk   倾向性权重
  王菲的微博   303   230   0
  王菲的歌曲   260   300   音乐0.9
  王菲西安演唱会   230   320   音乐0.9,视频0.8
  王菲传奇   200   260   音乐0.9
  王菲李亚鹏   131   100   新闻0.7
  王菲成名史   110   80   问问0.5
  王菲最新消息   103   123   新闻0.6
表1
本实施例中可以设定一个倾向性权重的阈值,用于对所述倾向性权重进行过滤,如果某查询词的某类垂直搜索类型的倾向性权重低于该设定的阈值,在表示无明确倾向性,则该查询词对应的该类垂直搜索类型的倾向性权重为0,如果该查询词对应的各类的垂直搜索类型的倾向性权重都为0,则表1中该查询词对应的倾向性权重可以设为0。如果某查询词的某类垂直搜索类型的倾向性权重大于所述阈值,则表示该查询词对该类垂直搜索类型具有一定的倾向性,其倾向性权重分值越高,表示倾向性越高。对上述这些查询词建立索引,由本发明的推荐搜索装置加载到内存中。
当检测到用户在搜索框中输入查询词“王菲”时,本发明的查询词推荐模块首先通过文本索引找出命中王菲的候选词,再通过查询次数qv和点击次数clk对候选词进行筛选得到最终推荐给用户的推荐查询词,所述确定与该查询词“王菲”相关的推荐查询词的具体过程可以参见现有技术,本文不再赘述。
在确定了所述推荐查询词列表之后,所述垂直搜索倾向性推荐模块查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型。
所述根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型的具体方法可以有两种,一种是采用上述倾向性权重过滤的结果,如果所述推荐查询词对所有类型的垂直搜索倾向性权重都为0,则确定该推荐查询词没有倾向性垂直搜索类型;否则将所述推荐查询词倾向性权重最高的垂直搜索类型确定为该推荐查询词的倾向性垂直搜索类型;另一种是不采用上述倾向性权重过滤的处理,直接将所述推荐查询词的倾向性权重最高的垂直搜索类型确定为该推荐查询词的倾向性垂直搜索类型。
在确定各推荐查询词及其倾向性垂直搜索类型之后,由所述推荐显示模块显示所述各推荐查询词及其倾向性垂直搜索类型的链接,如图5所示为显示结果,该图5中是采用了所述倾向性权重过滤处理的,如果某推荐查询词(如图5中的推荐查询词“王菲微博”等)对所有类型的垂直搜索倾向性权重都为0,则确定该推荐查询词没有倾向性垂直搜索类型,不显示其倾向性垂直搜索类型的链接。
如果响应模块在检测到用户点击了某一推荐查询词对应的倾向性垂直搜索类型的链接后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,然后跳到相应的垂直搜索类型的页面展示搜索结果。例如用户可点击图5中查询词“王菲西安演唱会”对应的垂直搜索类型链接“视频”,则会调用视频类的垂直搜索引擎搜索所述查询词“王菲西安演唱会”,并会返回如图6所示的视频搜索结果。
如果所述响应模块检测到用户点击了某一推荐查询词,而不是该推荐查询词后面的倾向性垂直搜索类型链接,则利用网页搜索引擎搜索该推荐查询词的匹配内容,展示网页搜索结果,这个网页搜索结果的展示过程与现有技术相同,本文不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种搜索引擎的推荐搜索方法,其特征在于,包括:
记录搜索过程中查询词的搜索日志和点击日志;
根据所记录的日志分析查询词的垂直搜索倾向性权重;
在搜索框中检测到查询词之后,确定与该查询词相关的推荐查询词,查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型,显示所述各推荐查询词及其倾向性垂直搜索类型的链接;
在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词,展示搜索结果。
2.根据权利要求1所述的方法,其特征在于,
所述记录查询词的搜索日志的具体方法为:针对各类垂直搜索引擎,记录在该类垂直搜索引擎中每次搜索时输入的查询词的内容、搜索结果中被点击的链接数、以及该垂直搜索引擎的类型;
所述记录查询词的点击日志的具体方法为:记录在网页搜索引擎中每次搜索时输入的查询词的内容、搜索结果中被点击的链接、被点击链接对应的垂直搜索类型。
3.根据权利要求2所述的方法,其特征在于,所述根据所记录的日志分析查询词的垂直搜索倾向性权重具体是确定各查询词对各类垂直搜索类型的倾向性权重,其中针对某一查询词对某一垂直搜索类型的倾向性权重的具体方法为:
根据所述搜索日志分析该查询词对该类垂直搜索的第一倾向性权重,包括:确定查询权重X/Y,其中X为在指定时间段内,该查询词在该类垂直搜索引擎中的查询次数,Y为所述指定时间段内该类垂直搜索引擎的总查询次数;确定点击权重N/M,其中N为所述指定时间段内该查询词在该类垂直搜索引擎的搜索结果中被点击的链接数,M为所述指定时间段内该垂直搜索引擎页面的总搜索结果中被点击的链接数;对所述查询权重和点击权重进行加权计算得到该查询词对该类垂直搜索的第一倾向性权重;
根据所述点击日志分析该查询词对该类垂直搜索的第二倾向性权重,该第二倾向性权重为x/y,其中x为该查询词在指定时间段内在网页搜索引擎中的查询次数,y为该查询词的网页搜索结果中被点击的与该类垂直搜索对应的链接的个数;
将所述第一倾向性权重和第二倾向性权重相乘得到该查询词针对该垂直搜索类型的倾向性权重。
4.根据权利要求3所述的方法,其特征在于,所述对查询权重和点击权重进行加权计算得到所述查询词对所述垂直搜索类型的第一倾向性权重的具体方式为:采用公式(α×X/Y+β×N/M),得到第一倾向性权重,其中α为查询权重因子,β为点击权重因子。
5.根据权利要求3所述的方法,其特征在于,所述对查询权重和点击权重进行加权计算得到所述查询词对所述垂直搜索类型的第一倾向性权重的具体方式为:采用公式(1+X/Y)×(1+N/M)并归一化到(0,1)区间的一个浮点数,该浮点数为所述第一倾向性权重。
6.根据权利要求1至5任一项所述的方法,其特征在于,
所述根据所记录的日志分析查询词的垂直搜索倾向性权重之后,进一步包括:对所述倾向性权重进行过滤,具体为:将查询词的各类垂直搜索倾向性权重与设定的阈值进行比较,如果某类的垂直搜索倾向性权重低于该阈值则将该类垂直搜索倾向性权重设置为0;
所述根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型的具体方法为:如果所述推荐查询词对所有类型的垂直搜索倾向性权重都为0,则确定该推荐查询词没有倾向性垂直搜索类型;否则将所述推荐查询词倾向性权重最高的垂直搜索类型确定为该推荐查询词的倾向性垂直搜索类型。
7.根据权利要求1至5任一项所述的方法,其特征在于,
所述根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型的具体方法为:将所述推荐查询词的倾向性权重最高的垂直搜索类型确定为该推荐查询词的倾向性垂直搜索类型。
8.根据权利要求1所述的方法,其特征在于,在检测到某一推荐查询词被点击后,利用网页搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。
9.一种搜索引擎的推荐搜索装置,其特征在于,包括:
日志记录模块,用于记录搜索过程中查询词的搜索日志和点击日志;
倾向性分析模块,用于根据所记录的日志分析查询词的垂直搜索倾向性权重;
查询词推荐模块,用于在搜索框中检测查询词,在检测到查询词后确定与该查询词相关的推荐查询词;
垂直搜索倾向性推荐模块,用于查询各推荐查询词对应的垂直搜索倾向性权重并根据所述倾向性权重确定推荐查询词的倾向性垂直搜索类型;
推荐显示模块,用于显示所述各推荐查询词及其倾向性垂直搜索类型的链接;
响应模块,用于在检测到推荐查询词对应的倾向性垂直搜索类型的链接被点击后,利用该垂直搜索类型对应的垂直搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。
10.根据权利要求9所述的装置,其特征在于,所述响应模块进一步用于在检测到某一推荐查询词被点击后,利用网页搜索引擎搜索该推荐查询词的匹配内容,展示搜索结果。
CN201210081897.6A 2012-03-26 2012-03-26 一种搜索引擎的推荐搜索方法和装置 Active CN103365839B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210081897.6A CN103365839B (zh) 2012-03-26 2012-03-26 一种搜索引擎的推荐搜索方法和装置
PCT/CN2013/073129 WO2013143429A1 (zh) 2012-03-26 2013-03-25 搜索引擎的推荐搜索方法、装置及计算机可读存储介质
US14/497,993 US9934312B2 (en) 2012-03-26 2014-09-26 Recommendation search method for search engine, device and computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210081897.6A CN103365839B (zh) 2012-03-26 2012-03-26 一种搜索引擎的推荐搜索方法和装置

Publications (2)

Publication Number Publication Date
CN103365839A true CN103365839A (zh) 2013-10-23
CN103365839B CN103365839B (zh) 2017-12-12

Family

ID=49258208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210081897.6A Active CN103365839B (zh) 2012-03-26 2012-03-26 一种搜索引擎的推荐搜索方法和装置

Country Status (3)

Country Link
US (1) US9934312B2 (zh)
CN (1) CN103365839B (zh)
WO (1) WO2013143429A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761326A (zh) * 2014-01-29 2014-04-30 百度在线网络技术(北京)有限公司 图片搜索方法以及搜索引擎
CN104268268A (zh) * 2014-10-13 2015-01-07 宁波公众信息产业有限公司 一种网页信息关联方法及系统
CN104572853A (zh) * 2014-12-17 2015-04-29 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104615723A (zh) * 2015-02-06 2015-05-13 百度在线网络技术(北京)有限公司 查询词权重值的确定方法和装置
CN104699751A (zh) * 2014-12-30 2015-06-10 北京奇虎科技有限公司 一种基于搜索词进行搜索推荐的方法和装置
CN105045901A (zh) * 2015-08-05 2015-11-11 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105573887A (zh) * 2015-12-14 2016-05-11 合一网络技术(北京)有限公司 搜索引擎的质量评估方法和装置
CN106250369A (zh) * 2016-07-28 2016-12-21 海信集团有限公司 语音交互方法、装置和终端
CN110188261A (zh) * 2019-05-30 2019-08-30 江苏神州信源系统工程有限公司 一种热点对象确定方法及装置
CN110390052A (zh) * 2019-07-25 2019-10-29 腾讯科技(深圳)有限公司 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN111324705A (zh) * 2018-12-14 2020-06-23 财团法人工业技术研究院 自适应性调整关连搜索词的系统及其方法
CN115878905A (zh) * 2023-03-03 2023-03-31 北京缔业科技有限公司 一种智慧商圈的个性服务推荐系统

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9703859B2 (en) * 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
CN105488221A (zh) * 2015-12-25 2016-04-13 北京奇虎科技有限公司 一种在搜索界面推荐查询词进行搜索的方法和系统
US20180089309A1 (en) * 2016-09-28 2018-03-29 Linkedln Corporation Term set expansion using textual segments
CN106503258B (zh) * 2016-11-18 2020-05-12 深圳市世强元件网络有限公司 一种网站站内精确搜索方法
CN108268522B (zh) * 2016-12-30 2021-01-22 北京国双科技有限公司 网站栏目内容的展现方法及装置
CN107577707B (zh) * 2017-07-31 2021-06-18 北京奇艺世纪科技有限公司 一种目标数据集生成方法、装置及电子设备
RU2692045C1 (ru) 2018-05-18 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для рекомендации свежих саджестов поисковых запросов в поисковой системе
KR102532203B1 (ko) * 2018-07-31 2023-05-12 삼성전자 주식회사 전압 생성기, 전압 파형 생성기, 반도체 소자 제조 장치, 전압 파형 발생 방법 및 반도체 소자의 제조 방법
CN109190049B (zh) * 2018-11-02 2021-11-23 北京字节跳动网络技术有限公司 关键词推荐方法、系统、电子设备和计算机可读介质
WO2021227059A1 (zh) * 2020-05-15 2021-11-18 深圳市世强元件网络有限公司 一种基于多叉树的搜索词推荐方法及系统
CN111752436A (zh) * 2020-06-28 2020-10-09 北京搜狗科技发展有限公司 一种推荐方法、装置和用于推荐的装置
US20230214431A1 (en) * 2022-01-06 2023-07-06 Ebay Inc. Query modality recommendation for e-commerce search

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010076897A1 (en) * 2008-12-29 2010-07-08 Julien Yuki Hamonic A method for document retrieval based on queries that are composed of concepts and recommended terms
CN102043833A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种基于查询词进行搜索的方法和搜索装置
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN102375885A (zh) * 2011-10-21 2012-03-14 北京百度网讯科技有限公司 一种提供与查询序列相对应的搜索建议的方法与设备

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US8122019B2 (en) * 2006-02-17 2012-02-21 Google Inc. Sharing user distributed search results
KR100886767B1 (ko) * 2006-12-29 2009-03-04 엔에이치엔(주) 지유아이 검색 서비스 제공 방법 및 시스템
US8930356B2 (en) * 2007-09-20 2015-01-06 Yahoo! Inc. Techniques for modifying a query based on query associations
US8583670B2 (en) * 2007-10-04 2013-11-12 Microsoft Corporation Query suggestions for no result web searches
US8572112B2 (en) * 2007-11-02 2013-10-29 Microsoft Corporation Syndicating search queries using web advertising
US20100082649A1 (en) * 2008-09-22 2010-04-01 Microsoft Corporation Automatic search suggestions from server-side user history
US9317602B2 (en) * 2008-12-11 2016-04-19 Yahoo! Inc. System and method for in-context exploration of search results
US20100191740A1 (en) * 2009-01-26 2010-07-29 Yahoo! Inc. System and method for ranking web searches with quantified semantic features
US8738641B2 (en) * 2009-03-31 2014-05-27 Ebay Inc. Ranking algorithm for search box auto-complete
IT1399261B1 (it) * 2009-06-11 2013-04-11 Galileo Avionica S P A Ora Selex Galileo Spa Rivelazione attiva a distanza di sostanze chimiche
KR101772147B1 (ko) * 2009-08-31 2017-08-28 구글 인코포레이티드 쿼리 제안들로서 사용자 입력에 관련된 답변 상자들을 선택 및 제시하기 위한 프레임워크
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US8504437B1 (en) * 2009-11-04 2013-08-06 Google Inc. Dynamically selecting and presenting content relevant to user input
US8676828B1 (en) * 2009-11-04 2014-03-18 Google Inc. Selecting and presenting content relevant to user input
US20110314419A1 (en) * 2010-06-22 2011-12-22 Microsoft Corporation Customizing a search experience using images
US8650173B2 (en) * 2010-06-23 2014-02-11 Microsoft Corporation Placement of search results using user intent
US8600979B2 (en) * 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
US9031970B1 (en) * 2011-01-26 2015-05-12 Google Inc. Query autocompletions
CN102184230B (zh) * 2011-05-11 2016-08-17 北京百度网讯科技有限公司 一种搜索结果的展示方法及装置
US9317605B1 (en) * 2012-03-21 2016-04-19 Google Inc. Presenting forked auto-completions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010076897A1 (en) * 2008-12-29 2010-07-08 Julien Yuki Hamonic A method for document retrieval based on queries that are composed of concepts and recommended terms
CN102043833A (zh) * 2010-11-25 2011-05-04 北京搜狗科技发展有限公司 一种基于查询词进行搜索的方法和搜索装置
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN102375885A (zh) * 2011-10-21 2012-03-14 北京百度网讯科技有限公司 一种提供与查询序列相对应的搜索建议的方法与设备

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761326A (zh) * 2014-01-29 2014-04-30 百度在线网络技术(北京)有限公司 图片搜索方法以及搜索引擎
CN104268268A (zh) * 2014-10-13 2015-01-07 宁波公众信息产业有限公司 一种网页信息关联方法及系统
CN104268268B (zh) * 2014-10-13 2018-05-22 宁波公众信息产业有限公司 一种网页信息关联方法及系统
CN104572853A (zh) * 2014-12-17 2015-04-29 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104699751A (zh) * 2014-12-30 2015-06-10 北京奇虎科技有限公司 一种基于搜索词进行搜索推荐的方法和装置
CN104615723A (zh) * 2015-02-06 2015-05-13 百度在线网络技术(北京)有限公司 查询词权重值的确定方法和装置
CN104615723B (zh) * 2015-02-06 2018-08-07 百度在线网络技术(北京)有限公司 查询词权重值的确定方法和装置
CN105045901B (zh) * 2015-08-05 2019-04-30 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105045901A (zh) * 2015-08-05 2015-11-11 百度在线网络技术(北京)有限公司 搜索关键词的推送方法和装置
CN105573887B (zh) * 2015-12-14 2018-07-13 合一网络技术(北京)有限公司 搜索引擎的质量评估方法和装置
CN105573887A (zh) * 2015-12-14 2016-05-11 合一网络技术(北京)有限公司 搜索引擎的质量评估方法和装置
CN106250369A (zh) * 2016-07-28 2016-12-21 海信集团有限公司 语音交互方法、装置和终端
CN106250369B (zh) * 2016-07-28 2019-08-06 海信集团有限公司 语音交互方法、装置和终端
CN111324705A (zh) * 2018-12-14 2020-06-23 财团法人工业技术研究院 自适应性调整关连搜索词的系统及其方法
CN111324705B (zh) * 2018-12-14 2023-05-02 财团法人工业技术研究院 自适应性调整关联搜索词的系统及其方法
CN110188261A (zh) * 2019-05-30 2019-08-30 江苏神州信源系统工程有限公司 一种热点对象确定方法及装置
CN110390052A (zh) * 2019-07-25 2019-10-29 腾讯科技(深圳)有限公司 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN110390052B (zh) * 2019-07-25 2022-10-28 腾讯科技(深圳)有限公司 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN115878905A (zh) * 2023-03-03 2023-03-31 北京缔业科技有限公司 一种智慧商圈的个性服务推荐系统

Also Published As

Publication number Publication date
WO2013143429A1 (zh) 2013-10-03
US20150012519A1 (en) 2015-01-08
CN103365839B (zh) 2017-12-12
US9934312B2 (en) 2018-04-03

Similar Documents

Publication Publication Date Title
CN103365839A (zh) 一种搜索引擎的推荐搜索方法和装置
US11354356B1 (en) Video segments for a video related to a task
US9576251B2 (en) Method and system for processing web activity data
US8909652B2 (en) Determining entity popularity using search queries
US9317550B2 (en) Query expansion
US8244750B2 (en) Related search queries for a webpage and their applications
JP5721818B2 (ja) 検索におけるモデル情報群の使用
CN102722498B (zh) 搜索引擎及其实现方法
US10585927B1 (en) Determining a set of steps responsive to a how-to query
US20110282860A1 (en) Data collection, tracking, and analysis for multiple media including impact analysis and influence tracking
CN111708740A (zh) 基于云平台的海量搜索查询日志计算分析系统
US20090299964A1 (en) Presenting search queries related to navigational search queries
CN101176058A (zh) 使用已知高级查询的查询修订
CN102722501B (zh) 搜索引擎及其实现方法
CN106776860A (zh) 一种搜索摘要生成方法及装置
KR101566616B1 (ko) 빅데이터 처리를 통한 광고의사결정시스템 및 방법
CN102722499B (zh) 搜索引擎及其实现方法
CN108537596B (zh) 搜索框内车型推荐的方法、装置、系统及存储器
US20180096067A1 (en) Creation and optimization of resource contents
CN103412958A (zh) 一种搜索结果显示方法和装置
US10698888B1 (en) Answer facts from structured content
US9760641B1 (en) Site quality score
CN107085573B (zh) 热点信息的获取方法及装置
US20130332440A1 (en) Refinements in Document Analysis
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131021

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131021

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant