CN104123351B - 交互式搜索方法和装置 - Google Patents

交互式搜索方法和装置 Download PDF

Info

Publication number
CN104123351B
CN104123351B CN201410326117.9A CN201410326117A CN104123351B CN 104123351 B CN104123351 B CN 104123351B CN 201410326117 A CN201410326117 A CN 201410326117A CN 104123351 B CN104123351 B CN 104123351B
Authority
CN
China
Prior art keywords
information
query
word
words
query information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410326117.9A
Other languages
English (en)
Other versions
CN104123351A (zh
Inventor
赵世奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410326117.9A priority Critical patent/CN104123351B/zh
Publication of CN104123351A publication Critical patent/CN104123351A/zh
Priority to EP14197971.6A priority patent/EP2966457A1/en
Priority to JP2014255192A priority patent/JP6005714B2/ja
Priority to US14/575,384 priority patent/US10055453B2/en
Application granted granted Critical
Publication of CN104123351B publication Critical patent/CN104123351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本发明公开了一种交互式搜索方法和装置。其中,交互式搜索方法包括:S1、获得查询信息;以及S2、基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,以用于显示在查询信息所在的客户端页面上。本发明实施例的交互式搜索方法和装置,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,并通过客户端页面显示给用户,可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。

Description

交互式搜索方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种交互式搜索方法和装置。
背景技术
随着科技的不断进步,搜索引擎已成为人们生活中必不可少的部分。目前,传统的搜索引擎的交互方式是用户输入查询信息,搜索引擎返回与查询信息相关的搜索结果,并按照相关性由高到低的顺序排序。其中,查询信息可包括一个或多个关键词。用户可浏览和点击搜索结果,并从中选择感兴趣或有需求的信息和内容。如果用户在现有的查询信息的基础上没有搜索到符合自己需求的信息和内容或为了获得更精准的搜索结果时,可通过增加关键词或者改写其中一个关键词的方式生成新的查询信息,从而进行更进一步地搜索。
但是,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:随意地增加关键词或者改写其中一个关键词都有可能使用户的搜索意图发生改变。例如,对于查询信息“好看的电影”,用户可能输入的新的查询信息可包括:“好看的3D电影”、“好看的欧美电影”、“好看的惊悚电影”、“好看的张艺谋电影”、“好看的文艺电影”等等,上述新增加的关键词处于不同的需求维度,得到的搜索结果也不尽相同,导致用户很难获得真正需要的信息和内容,用户的搜索体验差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种交互式搜索方法。该方法可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。
本发明的第二个目的在于提出一种交互式搜索装置。
为了实现上述目的,本发明第一方面实施例的交互式搜索方法,包括:S1、获得查询信息;以及S2、基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息,以用于显示在所述查询信息所在的客户端页面上。
本发明实施例的交互式搜索方法,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,并通过客户端页面显示给用户,可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。
为了实现上述目的,本发明第二方面实施例的交互式搜索装置,包括:获得模块,用于获得查询信息;以及生成模块,用于基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息,以用于显示在所述查询信息所在的客户端页面上。
本发明实施例的交互式搜索装置,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,并通过客户端页面显示给用户,可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。
附图说明
图1是根据本发明一个实施例的交互式搜索方法的流程图。
图2是根据本发明一个实施例的交互式搜索方法的交互效果示意图一。
图3是根据本发明一个实施例的交互式搜索方法的交互效果示意图二。
图4是根据本发明一个实施例的交互式搜索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的交互式搜索方法和装置。
图1是根据本发明一个实施例的交互式搜索方法的流程图,本实施例从搜索引擎侧进行描述,其中,交互式搜索是指搜索引擎通过自然语言交互的方式接收用户的搜索需求,并向用户提供搜索结果。
如图1所示,交互式搜索方法包括:
S1,获得查询信息。
在本发明的实施例中,可获得用户输入的查询信息。例如:好看的电影、茄汁鱼的做法等。
S2,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,以用于显示在查询信息所在的客户端页面上。
其中,语义知识库中可包含具有语义上下位关系的词语,例如:“家具”是“衣柜”的上位词,“水果”是“苹果”的上位词。相应地,“衣柜”是“家具”的下位词,“苹果”是“水果”的下位词。语义知识库中也可包含具有同位关系的词语,例如:“苹果”、“香蕉”、“菠萝”、“葡萄”为同位词,它们共同的上位词为“水果”。
具体地,可将查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和语义知识库获得至少一个切分后词语的下位词集合,基于下位词集合生成用于澄清查询意图的交互候选项。假设查询信息包含n个词语,则对于该查询信息可表示为w1,w2,…wi,…wn。如果历史搜索日志中具有查询信息w1,w2,…wi-1,x,wi+1,…wn(x∈H(wi),其中H(wi)表示wi的下位词的集合),则表示用户可能对wi有细化的需求,可将x抽取出来作为澄清查询意图的交互候选项。例如:查询信息为“茄汁鱼的做法”,则wi为“鱼”。如果有用户搜索过“茄汁青鱼的做法”、“茄汁沙丁鱼的做法”、“茄汁鲅鱼的做法”等,而“青鱼”、“沙丁鱼”、“鲅鱼”是“鱼”的下位词,则可将“青鱼”、“沙丁鱼”、“鲅鱼”等作为交互候选项。最终,如图2所示,“茄汁青鱼的做法”、“茄汁沙丁鱼的做法”、“茄汁鲅鱼的做法”为“茄汁鱼的做法”的意图澄清信息。
另外,也可将查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和语义知识库获得同位词集合,并基于同位词集合生成用于澄清查询意图的交互候选项。假设查询信息包含n个词语,则对于该查询信息可表示为w1,w2,…wi,…wn。如果历史搜索日志中具有查询信息w1,w2,…wi-1,x,wi,…wn(x∈H(h),其中H(h)表示h的下位词的集合),则表示用户在wi-1之后,wi之前,可能有增加一个词语的需求,可将x抽取出来作为澄清查询意图的交互候选项。例如:查询信息为“好看的电影”,则wi-1为“好看的”,wi为“电影”,可在它们之间插入“惊悚”、“爱情”、“战争”、“喜剧”等词语,并将“惊悚”、“爱情”、“战争”、“喜剧”等作为交互候选项。而“惊悚”、“爱情”、“战争”、“喜剧”等共同的上位词h为“类型”。最终,如图3所示,“好看的惊悚电影”、“好看的爱情电影”、“好看的战争电影”、“好看的喜剧电影”为“好看的电影”的意图澄清信息。
在本发明的实施例中,在基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息时,还可生成引导信息,以用于显示在查询信息所在的客户端页面上。其中,客户端页面主要用于显示查询信息、搜索结果、意图澄清信息、引导信息等信息。
具体地,可基于配置模板获得第一信息,再基于生成交互候选项的词语集合获得第二信息,然后基于查询信息获得第三信息,最后将第一信息、第二信息和第三信息组合在一起构成引导信息。其中,词语集合可包括下位词集合和同义词集合。
举例来说,如图2所示,第一信息为固定的内容,可以通过配置模板来实现,例如“您要找的是以下具体”。基于生成交互候选项的词语集合可获得第二信息,例如“哪种鱼”。基于查询信息可获得第三信息,例如“的做法”。最终,可将第一信息、第二信息和第三信息组合在一起构成引导信息“您要找的是以下具体哪种鱼的做法?”。
再举例来说,如图3所示,第一信息为固定的内容,可以通过配置模板来实现,例如“您要找的是以下具体”。基于生成交互候选项的词语集合可获得第二信息,例如“哪种类型”。基于查询信息可获得第三信息,例如“的电影”。最终,可将第一信息、第二信息和第三信息组合在一起构成引导信息“您要找的是以下具体哪种类型的电影?”。
更具体地,可从切分后的词语中获得下位词集合的上位词,基于预定语言模型将疑问词集合和上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。其中,预定语言模型可为VE=QT+wi。VE表示第二信息;QT表示疑问词,如哪个、哪种、什么、哪位等;wi表示上位词。对于wi,匹配的疑问词是对应的。如:wi“鱼”对应的疑问词QT应该为“哪种”,如果疑问词QT为“哪位”,则是不合适的。因此,可将每一个候选的疑问词均与wi进行匹配,然后获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。例如:疑问词“哪种”+wi“鱼”生成第二信息“哪种鱼”。
当然,也可获得同义词集合的上位词,基于预定语言模型将疑问词集合和上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。其中,预定语言模型可为VE=QT+h。VE表示第二信息;QT表示疑问词,如哪个、哪种、什么、哪位等;h表示上位词。对于h,匹配的疑问词是对应的。如:h“类型”对应的疑问词QT应该为“哪种”,如果疑问词QT为“哪位”,则是不合适的。因此,可将每一个候选的疑问词均与h进行匹配,然后获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。例如:疑问词“哪种”+h“类型”生成第二信息“哪种类型”。
本发明实施例的交互式搜索方法,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,并通过客户端页面显示给用户,可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。
为了实现上述实施例,本发明还提出一种交互式搜索装置。
图4是根据本发明一个实施例的交互式搜索装置的结构示意图。
如图4所示,交互式搜索装置包括:获得模块110和生成模块120。
获得模块110用于获得查询信息。
在本发明的实施例中,获得模块110可获得用户输入的查询信息。例如:好看的电影、茄汁鱼的做法等。
生成模块120用于基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,以用于显示在查询信息所在的客户端页面上。
其中,语义知识库中可包含具有语义上下位关系的词语,例如:“家具”是“衣柜”的上位词,“水果”是“苹果”的上位词。相应地,“衣柜”是“家具”的下位词,“苹果”是“水果”的下位词。语义知识库中也可包含具有同位关系的词语,例如:“苹果”、“香蕉”、“菠萝”、“葡萄”为同位词,它们共同的上位词为“水果”。
具体地,生成模块120可将查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和语义知识库获得至少一个切分后词语的下位词集合,基于下位词集合生成用于澄清查询意图的交互候选项。假设查询信息包含n个词语,则对于该查询信息可表示为w1,w2,…wi,…wn。如果历史搜索日志中具有查询信息w1,w2,…wi-1,x,wi+1,…wn(x∈H(wi),其中H(wi)表示wi的下位词的集合),则表示用户可能对wi有细化的需求,生成模块120可将x抽取出来作为澄清查询意图的交互候选项。例如:查询信息为“茄汁鱼的做法”,则wi为“鱼”。如果有用户搜索过“茄汁青鱼的做法”、“茄汁沙丁鱼的做法”、“茄汁鲅鱼的做法”等,而“青鱼”、“沙丁鱼”、“鲅鱼”是“鱼”的下位词,则可将“青鱼”、“沙丁鱼”、“鲅鱼”等作为交互候选项。最终,如图2所示,“茄汁青鱼的做法”、“茄汁沙丁鱼的做法”、“茄汁鲅鱼的做法”为“茄汁鱼的做法”的意图澄清信息。
另外,生成模块120也可将查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和语义知识库获得同位词集合,并基于同位词集合生成用于澄清查询意图的交互候选项。假设查询信息包含n个词语,则对于该查询信息可表示为w1,w2,…wi,…wn。如果历史搜索日志中具有查询信息w1,w2,…wi-1,x,wi,…wn(x∈H(h),其中H(h)表示h的下位词的集合),则表示用户在wi-1之后,wi之前,可能有增加一个词语的需求,生成模块120可将x抽取出来作为澄清查询意图的交互候选项。例如:查询信息为“好看的电影”,则wi-1为“好看的”,wi为“电影”,可在它们之间插入“惊悚”、“爱情”、“战争”、“喜剧”等词语,并将“惊悚”、“爱情”、“战争”、“喜剧”等作为交互候选项。而“惊悚”、“爱情”、“战争”、“喜剧”等共同的上位词h为“类型”。最终,如图3所示,“好看的惊悚电影”、“好看的爱情电影”、“好看的战争电影”、“好看的喜剧电影”为“好看的电影”的意图澄清信息。
在本发明的实施例中,在基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息时,生成模块120还可生成引导信息,以用于显示在查询信息所在的客户端页面上。其中,客户端页面主要用于显示查询信息、搜索结果、意图澄清信息、引导信息等信息。
具体地,生成模块120可基于配置模板获得第一信息,再基于生成交互候选项的词语集合获得第二信息,然后基于查询信息获得第三信息,最后将第一信息、第二信息和第三信息组合在一起构成引导信息。其中,词语集合可包括下位词集合和同义词集合。
如图2所示,第一信息为固定的内容,可以通过配置模板来实现,例如“您要找的是以下具体”。基于生成交互候选项的词语集合可获得第二信息,例如“哪种鱼”。基于查询信息可获得第三信息,例如“的做法”。最终,生成模块120将第一信息、第二信息和第三信息组合在一起构成引导信息“您要找的是以下具体哪种鱼的做法?”。
再举例来说,如图3所示,第一信息为固定的内容,可以通过配置模板来实现,例如“您要找的是以下具体”。基于生成交互候选项的词语集合可获得第二信息,例如“哪种类型”。基于查询信息可获得第三信息,例如“的电影”。最终,生成模块120将第一信息、第二信息和第三信息组合在一起构成引导信息“您要找的是以下具体哪种类型的电影?”。
更具体地,生成模块120可从切分后的词语中获得下位词集合的上位词,基于预定语言模型将疑问词集合和上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。其中,预定语言模型可为VE=QT+wi。VE表示第二信息;QT表示疑问词,如哪个、哪种、什么、哪位等;wi表示上位词。对于wi,匹配的疑问词是对应的。如:wi“鱼”对应的疑问词QT应该为“哪种”,如果疑问词QT为“哪位”,则是不合适的。因此,可将每一个候选的疑问词均与wi进行匹配,然后获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。例如:疑问词“哪种”+wi“鱼”生成第二信息“哪种鱼”。
当然,生成模块120也可获得同义词集合的上位词,基于预定语言模型将疑问词集合和上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。其中,预定语言模型可为VE=QT+h。VE表示第二信息;QT表示疑问词,如哪个、哪种、什么、哪位等;h表示上位词。对于h,匹配的疑问词是对应的。如:h“类型”对应的疑问词QT应该为“哪种”,如果疑问词QT为“哪位”,则是不合适的。因此,可将每一个候选的疑问词均与h进行匹配,然后获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为第二信息。例如:疑问词“哪种”+h“类型”生成第二信息“哪种类型”。
本发明实施例的交互式搜索装置,基于与查询信息相关的历史搜索日志和预设的语义知识库生成查询信息的意图澄清信息,并通过客户端页面显示给用户,可以有效地对用户的需求进行澄清,使用户能够方便地获得真正需要的信息和内容,进而提升用户的搜索体验。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种交互式搜索方法,其特征在于,包括:
S1、获得查询信息;以及
S2、基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息,以用于显示在所述查询信息所在的客户端页面上;
其中,所述S2包括:
将所述查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和所述语义知识库获得至少一个切分后词语的下位词集合,基于所述下位词集合生成用于澄清查询意图的交互候选项;和/或
将所述查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和所述语义知识库获得同位词集合,基于所述同位词集合生成用于澄清查询意图的交互候选项。
2.根据权利要求1所述的方法,其特征在于,在所述基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息时,还包括:
S3、生成引导信息,以用于显示在所述查询信息所在的客户端页面上。
3.根据权利要求1或2所述的方法,其特征在于,所述语义知识库中包含具有语义上下位关系和/或同位关系的词语。
4.根据权利要求2所述的方法,其特征在于,所述S3包括:
基于配置模板获得第一信息,基于生成所述交互候选项的词语集合获得第二信息,基于所述查询信息获得第三信息,其中,所述词语集合包括下位词集合和同义词集合;以及将所述第一信息、第二信息和第三信息组合在一起构成所述引导信息。
5.根据权利要求4所述的方法,其特征在于,所述基于生成所述交互候选项的词语集合获得第二信息,包括:
从所述切分后的词语中获得所述下位词集合的上位词,基于预定语言模型将疑问词集合和所述上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为所述第二信息;或者
获得所述同义词集合的上位词,基于预定语言模型将疑问词集合和所述上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为所述第二信息。
6.一种交互式搜索装置,其特征在于,包括:
获得模块,用于获得查询信息;以及
生成模块,用于基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息,以用于显示在所述查询信息所在的客户端页面上;
其中,所述生成模块,具体用于:
将所述查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和所述语义知识库获得至少一个切分后词语的下位词集合,基于所述下位词集合生成用于澄清查询意图的交互候选项;和/或
将所述查询信息切分为至少一个词语,基于与切分后词语相关的历史搜索日志和所述语义知识库获得同位词集合,基于所述同位词集合生成用于澄清查询意图的交互候选项。
7.根据权利要求6所述的装置,其特征在于,所述生成模块,还用于:
在所述基于与所述查询信息相关的历史搜索日志和预设的语义知识库生成所述查询信息的意图澄清信息时,生成引导信息,以用于显示在所述查询信息所在的客户端页面上。
8.根据权利要求6或7所述的装置,其特征在于,所述语义知识库中包含具有语义上下位关系和/或同位关系的词语。
9.根据权利要求7所述的装置,其特征在于,所述生成模块,具体用于:
基于配置模板获得第一信息,基于生成所述交互候选项的词语集合获得第二信息,基于所述查询信息获得第三信息,其中,所述词语集合包括下位词集合和同义词集合;以及
将所述第一信息、第二信息和第三信息组合在一起构成所述引导信息。
10.根据权利要求9所述的装置,其特征在于,所述生成模块,具体用于:
从所述切分后的词语中获得所述下位词集合的上位词,基于预定语言模型将疑问词集合和所述上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为所述第二信息;或者
获得所述同义词集合的上位词,基于预定语言模型将疑问词集合和所述上位词进行匹配,获得匹配概率最高的表达方式,将匹配概率最高的表达方式作为所述第二信息。
CN201410326117.9A 2014-07-09 2014-07-09 交互式搜索方法和装置 Active CN104123351B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201410326117.9A CN104123351B (zh) 2014-07-09 2014-07-09 交互式搜索方法和装置
EP14197971.6A EP2966457A1 (en) 2014-07-09 2014-12-15 Interactive searching method and apparatus
JP2014255192A JP6005714B2 (ja) 2014-07-09 2014-12-17 インタラクティブ検索方法および装置
US14/575,384 US10055453B2 (en) 2014-07-09 2014-12-18 Interactive searching method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410326117.9A CN104123351B (zh) 2014-07-09 2014-07-09 交互式搜索方法和装置

Publications (2)

Publication Number Publication Date
CN104123351A CN104123351A (zh) 2014-10-29
CN104123351B true CN104123351B (zh) 2017-08-25

Family

ID=51768762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410326117.9A Active CN104123351B (zh) 2014-07-09 2014-07-09 交互式搜索方法和装置

Country Status (4)

Country Link
US (1) US10055453B2 (zh)
EP (1) EP2966457A1 (zh)
JP (1) JP6005714B2 (zh)
CN (1) CN104123351B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699689B (zh) * 2014-01-09 2017-02-15 百度在线网络技术(北京)有限公司 事件知识库的构建方法及装置
CN104699784B (zh) * 2015-03-13 2017-12-19 苏州思必驰信息科技有限公司 一种基于交互式输入的数据搜索方法及装置
CN105183850A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的信息查询方法及装置
CN106126588B (zh) * 2016-06-17 2019-09-20 广州视源电子科技股份有限公司 提供相关词的方法和装置
JP6782591B2 (ja) * 2016-09-12 2020-11-11 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
CN106649768B (zh) 2016-12-27 2021-03-16 北京百度网讯科技有限公司 基于深度问答的问答澄清方法和装置
US10713317B2 (en) * 2017-01-30 2020-07-14 Adobe Inc. Conversational agent for search
CN108763264B (zh) * 2018-03-30 2022-06-17 斑马网络技术有限公司 基于车辆的智能搜索系统及其搜索方法
CN108920497B (zh) * 2018-05-23 2021-10-15 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN110971754B (zh) * 2019-10-28 2022-09-27 深圳绿米联创科技有限公司 信息处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
CN101937437A (zh) * 2009-06-30 2011-01-05 华为技术有限公司 一种搜索方法、装置和系统
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US20120121055A1 (en) * 2009-10-29 2012-05-17 Mitsubishi Heavy Industries, Ltd. Operational support device and operational support method for a nuclear power plant

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523028B1 (en) * 1998-12-03 2003-02-18 Lockhead Martin Corporation Method and system for universal querying of distributed databases
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US8694530B2 (en) * 2006-01-03 2014-04-08 Textdigger, Inc. Search system with query refinement and search method
US20090144262A1 (en) * 2007-12-04 2009-06-04 Microsoft Corporation Search query transformation using direct manipulation
JP4848388B2 (ja) * 2008-04-09 2011-12-28 ヤフー株式会社 検索クエリに関するスコアを算出する方法
US20110173174A1 (en) * 2010-01-13 2011-07-14 Flitcroft Investments Ltd Linguistically enhanced search engine and meta-search engine
US8719246B2 (en) * 2010-06-28 2014-05-06 Microsoft Corporation Generating and presenting a suggested search query
US9047567B2 (en) * 2011-07-15 2015-06-02 International Business Machines Corporation Utilizing failures in question and answer system responses to enhance the accuracy of question and answer systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
CN101937437A (zh) * 2009-06-30 2011-01-05 华为技术有限公司 一种搜索方法、装置和系统
US20120121055A1 (en) * 2009-10-29 2012-05-17 Mitsubishi Heavy Industries, Ltd. Operational support device and operational support method for a nuclear power plant
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置

Also Published As

Publication number Publication date
CN104123351A (zh) 2014-10-29
US20160012103A1 (en) 2016-01-14
JP2016018553A (ja) 2016-02-01
US10055453B2 (en) 2018-08-21
JP6005714B2 (ja) 2016-10-12
EP2966457A1 (en) 2016-01-13

Similar Documents

Publication Publication Date Title
CN104123351B (zh) 交互式搜索方法和装置
US10566009B1 (en) Audio classifier
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
US10019515B2 (en) Attribute-based contexts for sentiment-topic pairs
Carlson et al. The emergence of semantic meaning in the ventral temporal pathway
US9514405B2 (en) Scoring concept terms using a deep network
CN104239495B (zh) 搜索方法和搜索装置
CN106462640B (zh) 对多媒体内容进行的场境搜索
Hamilton Sex, work, meat: The feminist politics of veganism
CN104298658B (zh) 获取搜索结果的方法和装置
JP2017508214A (ja) 検索推奨の提供
US20200134398A1 (en) Determining intent from multimodal content embedded in a common geometric space
CN105975499A (zh) 一种文本主题检测方法及系统
US20170255625A1 (en) Computer-implemented method for providing multimedia content and device
US9818080B2 (en) Categorizing a use scenario of a product
CN104268192B (zh) 一种网页信息提取方法、装置及终端
US20200257761A1 (en) Ontology-based document analysis and annotation generation
CN109086265A (zh) 一种语义训练方法、短文本中多语义词消歧方法
Ebert et al. CIS-positive: A combination of convolutional neural networks and support vector machines for sentiment analysis in Twitter
Calabrese et al. Fatality killed the cat or: BabelPic, a multimodal dataset for non-concrete concepts
Zhang et al. Snap-and-ask: Answering multimodal question by naming visual instance
Parent The most frequent English homonyms
JP2017151588A (ja) 画像評価学習装置、画像評価装置、画像検索装置、画像評価学習方法、画像評価方法、画像検索方法、およびプログラム
CN103995881B (zh) 搜索结果的展现方法及装置
Pereira et al. Sentiment retrieval on web reviews using spontaneous natural speech

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180116

Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2

Patentee after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right