CN102542012B - 分类搜索查询的结果 - Google Patents

分类搜索查询的结果 Download PDF

Info

Publication number
CN102542012B
CN102542012B CN201110420064.3A CN201110420064A CN102542012B CN 102542012 B CN102542012 B CN 102542012B CN 201110420064 A CN201110420064 A CN 201110420064A CN 102542012 B CN102542012 B CN 102542012B
Authority
CN
China
Prior art keywords
search
search results
quality
inquiry
result set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110420064.3A
Other languages
English (en)
Other versions
CN102542012A (zh
Inventor
G.库马
S.阿哈里
F.候赛尼
N.罕
A.阿杜尔卡德
A.古普塔
G.库马兰
V.奈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN102542012A publication Critical patent/CN102542012A/zh
Application granted granted Critical
Publication of CN102542012B publication Critical patent/CN102542012B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Abstract

提供了用于将搜索结果分类为高质量或低质量的计算机可读介质、计算机系统和计算方法。首先,选择部分搜索结果(如最高排名的文档)用以评价。使用分类处理确定每个选择的搜索结果的质量水平,分类处理包括以下步骤:确定由待评价的选定搜索结果展示的目标特征;评价所选择的特征来为每个选择的搜索结果产生质量水平分数;将该分数与预先定义的阈值进行比较;以及基于该比较为每个选择的搜索结果分配绝对量度。当分数少于阈值时,该绝对量度表明低质量。在识别出选择的搜索结果为低质量时,自动执行重新编制所发布的搜索查询的校正动作。

Description

分类搜索查询的结果
背景技术
搜索引擎一般设计为具有通过帮助用户以快速有效地方式来找到与他们的搜索查询相匹配的相关搜索结果(如文档)来简化用户生活的意图。例如,搜索引擎的用户可撰写并提交搜索查询,以针对服务、产品、特定信息或该用户在该搜索查询背后的意图所目标确定的其他任何数据来进行在线搜索。由传统搜索引擎产生的搜索结果集常常质量低下,这意味着该搜索结果集中至少一部分没有恰当满足该用户在该搜索查询背后的意图。特别地,在一项研究中,研究人员发现十个搜索结果集中大致有一个列在顶端的结果与该用户相应的搜索查询的意图不相关。
产生低质量的搜索结果有各种原因。一些原因涉及该搜索引擎所询问的网络索引中缺少高质量的文档,或核心排名算法未能定位存在在该网络索引中的高质量文档。
发明内容
提供本发明内容来以简化形式介绍将在下面具体实施方式中进一步描述的概念选集。本发明内容不意图标识所要求保护主题的关键特征或基本特征,也不意图孤立地作为确定所要求保护主题的范围的辅助。
本发明的实施例将产生低质量搜索结果的各种原因归结为包括以下:搜索查询的贫乏用户构词具有与低质量文档或不满足用户在该搜索查询背后的意图的其他文档相匹配的格式。这些缺陷性撰写的搜索查询可要么包括极其常见的、可以大量不同方式解释的词条(产生离题的搜索结果),要么包括不匹配任何返回的有意义的文档的罕见词(产生模糊的搜索结果)。
然而,搜索引擎将这些离题的或模糊的搜索结果返回给该用户而不管其是否实际上与该用户的意图相关。这给了该用户假象:因为搜索结果与其搜索查询相匹配,因此返回的搜索结果一定是相关的。然而经检查,用户常常发现这些搜索结果不相关。进一步地,如果该用户想要更好的、高质量的文档(在此可与短语“搜索结果”交换使用),该用户被迫重新撰写他们的搜索查询而没有得到任何帮助。搜索引擎的这个缺陷导致了低效率和混乱的用户搜索体验。
因此,因为搜索引擎未能识别出作为该用户缺陷性撰写的搜索查询的结果而提供给该用户的低质量搜索结果,因此一个自动确定返回的搜索结果何时是低质量的、以及当确定低质量搜索结果时、采取校正动作来改进该搜索查询(即在在线搜索的环境下重新明确表达该用户的意图)的新颖搜索引擎会提供增强的整体用户体验。
本发明的实施例解决许多用户不具有熟练的搜索查询表述技能的问题。例如,用户常常输入过于广泛的或过少包含的搜索查询,且在将该搜索查询发送至搜索引擎后,用户接收与该用户的真实意图不相关的搜索结果。其他实施例解决这样的有疑问的问题:一些搜索查询本来就模糊(如使用常见词)或难以满足(如使用罕见词)而不管怎么表述它们。
相应地,本发明的实施例引入了检测不相关的搜索结果并辅助用户改进搜索结果相关性的各种方法。在一个示例中,对不相关搜索结果的检测由搜索引擎执行,它试图建立分类处理,以便在运行时针对给定的用户发起的搜索查询,自动确定在搜索引擎结果页面(SERP)中的搜索结果的质量水平。在示例实施例中,该搜索引擎实现此分类处理来部分基于所确定的质量水平确定搜索结果就绝对意义(如,要么高质量要么低质量)而言是否可接受。进一步地,当这些搜索结果确定为低质量时,它们被如此标记以使得如果适当可执行一个或多个校正动作。
因为对用户搜索查询的修改(如对其中用语的小调整)常常改进了返回的搜索结果的相关性,所以校正动作之一可涉及代表该用户来隐含地重写该搜索查询。在其中该改变会改进搜索结果有较高置信度的情况下,该重写的搜索查询由该搜索引擎以透明方式自动地准备并提交。在其中该改变会改进搜索结果的置信度较低的情况下,修改关键用语(如移除或替换)的选项将明确地呈现给该用户,以征求他或她关于重新编制该搜索查询的反馈。除了帮助该用户重新编制他或她的搜索查询的之外,另一个校正动作还可包括呈现标识为高质量的搜索结果,而抑制低质量结果的那些。因此节省了该用户在低质量搜索结果中详细查看所涉及的时间。
附图说明
下文中通过参考附图详细说明本发明的实施例,其中:
图1是适合实现本发明的实施例的示例计算设备的框图;
图2是示出了根据本发明的实施例的示例分类处理的各种输入和输出的框图;
图3是适合在实现本发明的实施例中使用的示例网络环境的框图;
图4是根据本发明的实施例的、在协作地实施在线搜索的实体之间的示例处理流的框图;
图5是示出了根据本发明的实施例的、使用搜索结果集的质量水平来激活一个或多个校正动作的整体方法的流程图;以及
图6是示出了根据本发明的实施例的、将搜索结果分类为高质量或低质量的整体方法的流程图。
具体实施方式
在此公开的本发明的实施例的主题通过特别描述来满足法定要求。然而,描述本身不意图限制本专利的范围。相反地,发明者已经预期要求保护的主题也可以其他方式体现,来包括与本文档描述的步骤相似的不同步骤或步骤组合,并结合其他当前或未来的技术。
根据下文公开部分可推断,本发明的各种实施例涉及确定搜索结果的质量水平,并可能利用基于任务的引擎(如决定引擎、任务引擎、单独应用或操作、小程序系统、操作系统以及基于任务的移动系统)或试图将搜索结果与在发布的搜索结果内固有的用户意图相匹配的一般系统,来采取校正动作以改进所确定的质量水平。为了简化论述,这些引擎和/或系统在此后将被称为“搜索引擎”。
在此描述的本发明的实施例包括具有其上包含计算机可执行指令的计算机可读介质。在(如用处理器)执行时,该计算机可执行指令执行一种使用搜索结果集的质量水平来激活一个或多个校正动作的方法。在实施例中,该方法包括步骤:访问该搜索结果集,并通过向那里应用多个分类标准来分别确定该搜索结果集的质量水平。在示例中,应用分类标准包括评价由搜索结果分别评价的排名特征、质量级别特征、标题级别特征、会话级别特征和/或聚集特征。下文参考图2更全面地讨论这些各种类型特征中的每一个。
该方法可通过为该搜索结果集中至少一个搜索结果分配在绝对标度中的分数来继续,其中该分数基于所确定的质量水平。该分数可与在绝对标度的阈值进行比较。因此,可基于该比较的结果,选择并执行一个或多个校正动作。
在第二个示例实施例中,本发明引入了一种用于进行至少一个搜索结果的质量的绝对分类的计算机系统。该计算机系统典型地包括计算机软件部件,这些部件包括下列:查询接收部件、分类部件、分配部件和应用部件。在实施例中,查询接收部件被配置为接收用户发布的搜索查询。典型地,该查询接收部件(即前端部件)返回基于该搜索查询而(如用后端部件)产生的搜索结果集。分类部件一般负责实现分类处理,其自动确定在该搜索结果集中的一个或多个搜索结果的质量分类。如下文参考图3更全面的讨论所述,该分类处理至少涉及以下步骤(没有特定顺序):检查该搜索结果呈现的各种特征以确定质量的整体水平;以及分别根据为每个搜索结果确定的整体质量水平来导出绝对量度。在示例实施例中,该绝对量度将搜索结果标识为高质量或低质量。
在实施例中,分配部件基于分类处理的结果将每个搜索结果标记为高质量或低质量。在随后的时间点处,或在访问搜索结果时实时地,应用部件可激活与该搜索结果被如何标记相对应的适当校正动作。一般地,部分基于自动重写的搜索查询会提供新的、与该用户发布搜索查询的意图更相关(比较当前搜索结果)的搜索结果的置信度级别,来选择适当的校正动作。
在第三个示例实施例中,提供由(在处理器上运行的)搜索引擎执行的计算机化的方法,以将搜索结果分类为高质量或低质量。首先,该方法包括提供响应于用户撰写并发布的搜索查询而返回的搜索结果集。该搜索结果集可能互相排名。在一个示例中,根据每个搜索结果与发布的搜索查询的相关性而计算该排名。该搜索引擎可然后选择排名为与发布的搜索查询高度相关的一个或多个搜索结果来进行评价。
每个选择的搜索结果的质量水平可通过使用分类处理来确定。在示例实施例中,该分类处理包括一个或多个以下步骤:确定由要评价的选定搜索结果展示的目标特征;评价该目标特征来为每个选定搜索结果分别产生质量水平的分数;将该分数与预先定义的阈值进行比较;以及,基于该该比较,为每个选定搜索结果分配绝对量度。在示例中,当该分数比阈值高时,该绝对量度指示高质量。否则,该绝对量度指示该选定搜索结果具有低质量。在识别到选定搜索结果被分配了指示低质量的绝对量度时,自动执行在识别时重新表述所发布的搜索查询的校正动作。
已经描述了本发明的实施例的概述,下文描述了本发明的实施例可在其中实现的示例操作环境,以便为本发明的各个方面提供一般环境。
首先特别地参考图1,示出了用于实现本发明实施例的示例操作环境,并一般性地将其指定为计算设备100。计算设备100只是合适的计算环境的一个示例,不意图暗示关于本发明使用或功能范围的限制。计算设备100也不应解释为具有任何涉及示出的部件的任何一个或其组合的依赖性或要求。
本发明可在计算机代码或机器可用指令的一般环境中进行描述,机器可用指令包括由计算机或其他机器(如个人数据助手或其他手持设备)执行的计算机可执行指令(如程序模块)。程序模块一般包括例程、程序、对象、部件、数据结构等,是指执行特定任务或实现特定抽象数据类型的代码。本发明可在各种系统配置中使用,包括手持设备、消费者电子产品、通用计算机、更专用的计算设备等。本发明也可在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中实践。
参考图1,计算设备100包括总线110,总线直接或间接地耦接以下设备:存储器112、一个或多个处理器114、一个或多个呈现部件116、输入/输出(I/O)端口118、输入/输出(I/O)部件120和示例电源122。总线110代表可能是一个或多个总线(如地址总线、数据总线或它们的组合)。虽然为了清晰起见,图1的各个框图显示为带线的,但实际上,划界各个部件并不如此清晰,打个比方,这些线条更准确地将是灰色和模糊的。例如,人可将呈现部件(如显示设备)认为是输入/输出部件。处理器也具有存储器。发明者意识到这是本领域的本性,并重申图1中的图表只是可结合一个或多个本发明的实施例使用的示例计算设备的说明。在如“工作站”、“服务器”、“膝上型计算机”、“手持设备”等这样的类别之间不作区别,因为它们所有被考虑在图1的范围内并称为“计算设备”。
计算设备100典型地包括各种计算机可读介质。计算机可读介质可以是任何可得到的、可被计算设备100访问的介质,它包括易失的和非易失的介质、可移除和不可移除的介质。通过示例(但不是限制),计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以任何方式或技术实现的、用于存储信息(如计算机可读指令、数据结构、程序模块或其他数据)的易失和非易失的、可移除和不可移除的介质。计算机存储介质包括(但不限于)随机访问存储器RAM、只读存储器ROM、带电可擦可编程只读存储器EEPROM、闪存存储器或其他存储技术、CD-ROM、数字多用途光盘(DVD)或其他光学存储设备,盒式磁带、卡式磁带、磁盘存储设备或其他磁性存储设备或任何可用于存储想要的信息并可被计算设备100访问的其他介质。在实施例中,计算机存储介质代表有形的计算机可读介质,如体现在处理器上的介质。
通信介质典型地以调制的数据信号(如载波或其他传送机制)体现计算机可读指令、数据结构、程序模块或其他数据,并包括任何信息递送介质。术语“调制的数据信号”意指具有一个或多个其特征以在信号中编码信息的方式设置和改变的信号。通过示例(但不是限制),通信介质包括有线介质(如有线网络或直接有线连接)和无线介质(如声音、RF、红外线或其他无线介质)。以上任何的组合也应该包括在计算机可读介质的范围中。在实施例中,通信介质代表非暂时的计算机可读介质。
存储器112包括易失和/或非易失存储器形式的计算机存储介质。该存储器可以是可移除、不可移除的或它们的组合。示例硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从各种实体(如存储器112和/或I/O部件120)中读取数据的一个或多个处理器。呈现部件(多个)116将数据指示呈现给用户或其他设备。典型的呈现部件包括显示设备、扬声器、打印部件、振动部件等。
I/O端口118允许计算设备100逻辑地耦接至其他设备(包括I/O部件120,可内置它们中的一些)。示例部件包括麦克风、控制杆、游戏垫、圆盘式卫星、扫描仪、打印机、无线设备等。
现在转向图2,示出了根据本发明实施例的示例分类处理220的各种输入250和输出230及240的框图。一般地,在访问从发布的搜索查询返回的搜索结果集时,该搜索引擎使用分类处理220确定整个搜索结果集中的一部分的质量水平。首先,分类处理220可涉及将各种分类标准分别应用于一个或多个搜索结果。在示例中,短语“分类标准”广泛地涉及用来评价由可被检查的搜索结果展示的任何特征的参数。如示例,一些可被评价的、由搜索结果展示的特征是排名特征251、质量级别特征252、标题级别特征253、会话级别特征254和/或聚集特征255。在操作中,可确定这些特征中的一个或多个目标用于评价,聚集这些特征(多个)的评价来为每个搜索结果产生质量水平分数。
虽然已经描述了被用作到分类处理220的输入250的该搜索结果的特定特征,但应该理解和领会的是,可使用用于确定质量水平的其他类型的合适输入和与搜索结果相关的特征,且本发明的实施例不限于在此描述的这5个不同的特征251-255。也就是说,可使用实际上或可能有助于分类处理220的输出230及240的准确性的其他输入250。例如,如果存在并且可访问用户简档(如包括为特定用户追踪的会话交互)或查询日志(如,包括为多个用户记录的社会行为),则它可以用作输入250,以影响该搜索结果的质量水平。
首先,排名特征251代表用于量度搜索查询内的关键用语和搜索结果集的内容(如文档、网页、博客之类的)之间的关系的那些特征。在示例实施例中,排名特征251与搜索结果依赖查询的特征有关,如搜索查询用语和搜索结果内容之间匹配的数量。为了在搜索引擎结果页面(SERP)上建立搜索结果顺序,常常采用一个或多个排名特征251用于将搜索结果相对于彼此排名的任务。
在一个示例中,排名特征251可包括搜索查询中的用语和该搜索结果的标题、指向该搜索结果的锚文本、该搜索结果的正文和/或该搜索结果的关键部分(如页面顶端)之间匹配的数量/频率。在实施例中,未考虑该搜索查询的所有用语。搜索引擎典型地关注该搜索结果是否与该搜索查询的语言头(如关键用语、罕见用语之类)在某种方式上相匹配。因此,在实施例中,可以从搜索查询中提取语言头并采用该语言头来评价搜索结果的排名特征251,同时为了分类目的可以忽略搜索查询中非关键、常用和自然的语言。
在另一个示例中,排名特征251涉及搜索结果中匹配的关键用语的接近性。典型地,搜索结果内匹配的词出现得越靠近,搜索结果就相对于该搜索查询越相关,因此保证了高的质量水平指定。正如全文所述,通常给指定为具有高质量水平的搜索结果分配在绝对标度中的高分数,这常常转化为“高质量”的绝对量度240中。
质量级别特征252一般代表单独量化搜索结果集的整体质量而独立于搜索查询的特征。在实施例中,通过检查该搜索结果的内容/标题/锚文本和/或集成到搜索结果的域名来确定整体质量。在一个示例中,检查该搜索结果的内容涉及列举文档正文中的若干拼写错误,其中的大量拼写错误典型地降低了与该搜索结果相关的质量水平。在另一个示例中,检查该搜索结果的域名涉及确定该搜索结果是否导航至可信任网站。正如所看到的,质量级别特征252关注该搜索结果的属性而独立于搜索查询中的用语。
在一个示例中,标题级别特征253代表列举该搜索查询中的关键用语与搜索结果集中的每一个特定的、搜索引擎预备的概要(即,摘要或示例回答)之间的匹配数目的特征。在另一个示例中,标题级别特征与确定是否良好地形成这些摘要(表示高质量搜索结果)、或这些摘要是否包括不完备的句子、美国信息交换标准码(ASCII)垃圾资料、大量数字/符号/统一资源定位符(URL),和/或非文本数据(表示低质量搜索结果)有关。
会话级别特征254一般代表根据在线会话过程期间用户发起的搜索结果改进将搜索结果集中的搜索结果标记为相关或不相关的特征。在一个示例中,该改进与该用户在在线会话期间修改其该搜索查询的次数有关。经常地,该搜索查询的越多改进表示该用户对返回的搜索结果不满意,这相当于分配给响应该搜索查询而给出的搜索结果的较低质量水平。在另一个示例中,该改进与指向基于该搜索查询而产生的搜索结果的用户交互(如选择)的量有关。经常地,当几乎没有指向该搜索结果的用户发起的选择(如鼠标点击动作)时,用户常常对该搜索结果没有兴趣,从而表明该搜索结果在某种方式上不相关或不受欢迎。被发现不受欢迎的搜索结果一般被指定为具有低质量水平。
聚集特征255一般代表考虑搜索结果集的内容、在搜索结果页面中发布的广告和/或组成由搜索引擎提供的连同搜索结果集的相关搜索的用语之间的变化的特征。作为一般规则,在实施例中,高质量搜索结果是呈现足够量的彼此之间的相互差异而没有过多改变的的搜索结果。在一个示例中,这种相互差异表述为交叉结果熵。正如在此使用的,“交叉结果”熵指的是由SERP的组成表示的随机性或不一致性。在一个示例中,在搜索结果相似(如共享一个或两个域名和/或在其内容中透露共同的主题)的地方,该交叉结果熵非常低。这个低交叉结果熵可在该用户输入过于详细的搜索查询时出现,这降低了搜索结果的质量水平,因为一些相互差异对该用户有益。在另一个示例中,在搜索结果完全不同(如包含广泛的各种域名和/或由于在其内容中缺少共同的主题而妨碍搜索结果的聚集)的地方,该交叉结果熵非常高。这个高交叉结果熵可在该用户输入不够详细的搜索查询时出现,这也降低了搜索结果的质量水平,因为太多的相互差异对于该用户是混乱的。
虽然已经描述了与搜索结果相关联的内容和域名,应理解和领会的是,可以采用搜索结果的任何其他合适的属性或SERP中的合适信息来计算或影响交叉结果熵,且本发明的实施例不限于以上描述的属性。例如,可在调整搜索结果的质量水平时考虑广告和/或相关搜索数据之间的熵。
在假设的示例中,现在将关于“显示蓝钻石筹码价值多少(SHOW HOW MUCH BLUE DIAMOND CHIPS ARE WORTH)”的搜索查询来讨论特征251-255,其中该搜索查询中该用户的意图是确定在特定赌场赌博用的“蓝钻石”扑克牌筹码的价值。首先,该搜索引擎可从该搜索查询中提取语言头,以便关键用语“蓝(blue)”、“钻石(diamond)”、“筹码(chips)”和“价值(worth)”在分类处理220中使用,而为了分类目的可忽略搜索查询中非关键的、常见和自然的语言(如“show how much”)。在一个示例中,排名首位的搜索结果可以是标题为“大批的散钻石碎片(Wholesale Loose Diamond Chips)”的文档。这个示例的搜索结果将用于下文的讨论中,以说明分类处理220的功能性应用。
首先,可应用该示例搜索结果的排名特征251来度量该搜索查询中的关键用语和该示例搜索结果的内容之间的关系。在示例实施例中,在搜索查询用语“diamond”、“chips”和“worth”之间可以有很高的匹配数量,而很少与“blue”的匹配。这些匹配可具体出现在包括“Diamond Chips”的标题中,并可频繁地出现在该搜索结果的内容中。(这可能是相对于SERP上的其他搜索结果,示例搜索结果是排名首位的搜索结果的原因。)。结果,分类处理220可根据对排名特征251的分析,将该示例搜索结果评价为与搜索查询的用户意图相关。因此,排名特征251可将示例搜索结果标识为“高质量”搜索结果,且排名特征251的评价结果可另外地提高该示例搜索结果在绝对标度中的分数值。
在另一个示例中,可应用该示例搜索结果的质量级别特征252来单独量化示例搜索结果的整体质量而独立于搜索查询。在这个假设的示例中,该示例搜索结果的整体质量通过检查该示例搜索结果的内部特征而确定。在一个示例中,可检查该示例搜索结果的内容,以列举该文档正文中的拼写错误数量。因为该示例搜索结果由钻石碎片经销商维护,所以可在该文档的正文中检测出很多拼写错误(如比起一般网页有相对更高频率的拼写错误)。因此,根据质量级别特征252的分析,分类处理220可将该示例搜索结果评价为具有低质量。因此,质量级别特征252可将该示例搜索结果标识为“低质量”搜索结果,且质量水平特征252的评价结果可另外地降低该示例搜索结果在绝对标度中的分数值。
在另一个示例中,关于质量级别特征252,可检查该示例搜索结果的域名,以确定该示例搜索结果是否导航至可信任的网站。再次因为该示例搜索结果由钻石碎片经销商维护,与一个大的、知名且声誉好的公司的网站相反,提供该示例搜索结果的网站的地址将可能是不可信任的网站。作为结果,根据质量级别特征252的分析,分类处理220可再次将该示例搜索结果评价为具有低质量。因此,质量级别特征252可将该示例搜索结果标识为“低质量”搜索结果,且可再次另外地降低该示例搜索结果在绝对标度中的分数值。
在另一个示例中,可以应用该示例搜索结果的标题级别特征253来列举该搜索查询中的关键用语和搜索引擎准备好的、上面写着“钻石购买是买方注意销售…你获得了一幅可能显示了该钻石在其颜色最好时的图片(DIAMOND BUYING IS BUYER BEWARE SELLING … YOU GET A PICTURE THAT MAY SHOW THE DIAMOND IN ITS BEST COLORS)”的示例搜索结果的摘要。在这个摘要中,关键用语“diamond”匹配了两次,关键用语“blue”与摘要用语“colors”有关,且关键用语“chips”和“worth”根本没有匹配。因而,分类处理220可根据标题级别特征253的分析,将该示例搜索结果评价为具有差的摘要。
在另一个示例中,可以应用该示例搜索结果的会话级别特征254来根据在线会话过程期间用户发起的搜索结果改进、将该示例搜索结果标记为相关或不相关。在一个示例中,如果在相同的在线会话期间在SERP中出现了该示例搜索结果,且对查看该示例搜索结果作出响应,用户改进了该搜索查询,则会话级别特征254表明用户对该示例搜索结果不满意,且该示例搜索结果是低质量的。在另一个示例中,如果在相同的在线会话期间在SERP中出现了该示例搜索结果,但它几乎没有接收到用户发起的选择(如鼠标点击动作),则会话级别特征254表明用户发现该示例搜索结果与用户的意图不相关。
在最后的示例中,可以应用该示例搜索结果的聚集特征255来考虑该搜索结果的内容相比较该示例搜索结果之间的差异。例如,如果所有的搜索结果(包括该示例搜索结果在内)都与钻石经销商相关(在其内容中透露共同的主题),那么交叉结果熵非常低,这降低了搜索结果质量水平,这是因为一些相互差异对该用户有益。
根据评价各种特征(如图2中的特征251-255)和/或其他分类标准,分类处理220可预测搜索结果质量水平。在示例实施例中,该预测部分地基于每个输入250经评价后指示哪个评级(好或差)。当大量的输入250指向共同方向时,则完成该预测。例如,参考以上假设的示例,输入250的评价导致以下结果:表明高质量的排名特征251;表明低质量的质量级别特征252;表明低质量的标题级别特征253;表明低质量的会话级别特征254;以及表明低质量的聚集特征255。因为根据在该示例搜索结果上的应用,五类分析特征251-255中的四个表明该示例搜索结果是低质量的,因此,分类处理220产生的预测可将该示例搜索结果分类为低质量水平,从而可能触发校正动作。
在产生预测后,在实施例中,分类处理220可采用机器学习步骤。即该预测可随后与(或映射至)相似搜索结果集的人类判断的评级结果进行比较。根据比较,分类处理220确定该预测的准确性,并通过相对于人类判断的评级进行训练来调适评价方法。调适可涉及在汇编评级以确定预测的搜索结果质量水平时,学习如何加权各种输入250、特征类别以及特征251-255。换句话说,将分类处理配置为学习标识最能确定质量水平的分类标准。
在产生质量水平之后,可基于该质量水平为正被分类处理220评价的搜索结果分配分数230。该分数230可随后与阈值进行比较以确定该搜索结果是高质量还是低质量。在示例实施例中,分配的分数230代表绝对标度中的值(0到100之间的数值),阈值代表折合的累计增益(DCG)阈值,它是在绝对标度中量化搜索结果质量的度量标准。
因此,该分数与阈值的比较将搜索结果质量水平从预先定义的范围中的参数变换为绝对量度240。在实施例中,绝对量度240是排除了难处理的回答范围的“是或否”或“肯定或否定”的回答。换句话说,绝对量度240仅限于两个两个不同结果(即高质量或低质量)中的一个。在操作中,绝对量度240的绝对值指令搜索引擎是否执行一个或多个校正动作,而在由绝对量度240触发后,搜索引擎采用下文讨论的置信度级别来选择一个或多个校正动作来执行。
现在将参考图3讨论用于实现进行至少一个搜索结果质量的绝对分类(如图2中的绝对量度240)并基于绝对分类值采取一个或多个校正动作方法的系统体系结构。首先,图3是说明适于在实现本发明实施例中使用的分布式计算环境300的框图。示例计算环境300包括用户设备310、数据存储设备335、网络服务器350、移动设备370和互联这些项中的每一个的网络380。图3所示的用户设备310、数据存储设备335、网络服务器350和移动设备370中的每个都可采用为各种类型计算设备的形式,例如上文参考图1描述的计算设备100。只是举例不是限制,用户设备310、网络服务器350和/或移动设备370可以是个人计算机、台式计算机、膝上型计算机、消费者电子设备、手持设备(如个人数字助理)、各种服务器、处理设备等。然而应注意的是,本发明不限于在这些计算设备上实现,而是在本发明实施例的范围内可在不同类型计算设备的任何一种上实现。
用户设备310、网络服务器350和移动设备370中的每个典型地都包括(或链接于)某种形式的计算单元(如中央处理单元、微处理器等),以支持其上运行的部件(多个)(如查询接收部件351、分类部件352、分配部件353、应用部件354等)的操作。正如在此使用的,短语“处理单元”一般指的是带有处理能力和存储器的专用计算设备,其支持软件、应用、计算机程序在其上执行的基础的操作软件。在一个示例中,为了使每个设备能执行通信相关的处理和其他操作(如执行图2中的分类处理220),计算单元配置有分别集成到或可操作地耦接至用户设备310、网络服务器350和/或移动设备370的有形硬件元件或机器。在另一个示例中,该计算单元可包括耦接至由用户设备310、网络服务器350和/或移动设备370中的每个容纳的计算机可读介质的处理器(多个,未显示)。
通常,计算机可读介质包括至少暂时地存储多个可由该处理器执行的计算机软件部件的物理存储器。如在此使用的,术语“处理器”不意图是限定性的,并可包括以计算能力行动的计算单元中的任何元件。在这个能力中,该处理器可被配置为处理指令的有形物体。在示例实施例中,处理可涉及读取、解码/解释、执行和回写指令。
除了处理指令之外,该处理器还可往返于布置在用户设备310、网络服务器350和移动设备370上或集成到其中的其他资源来传递信息。资源一般指使用户设备310、网络服务器350和移动设备370能执行特定功能的软件部件或硬件机构。只是举例来说,由网络服务器350容纳的资源(多个)进行操作以辅助搜索引擎345从用户设备310或移动设备370的用户处接收输入,和/或响应于输入而提供合适的通信(如,呈现搜索结果325)。
用户设备310可包括输入设备(未显示)和呈现设备315。一般,提供输入设备以接收特别地影响由搜索引擎345呈现并且在用户界面(UI)显示器320处表面显示的搜索结果325的输入(多个)。说明性的输入设备包括图1中的鼠标、控制杆、小键盘、麦克风、I/O部件120或能够接收用户输入并将该输入的指示传输给用户设备310的其他任何部件。只是举例而言,输入设备便于搜索查询375的输入,其通过网络380传输至网络服务器350以便由搜索引擎345处理。
在实施例中,呈现设备315被配置为呈现和/或在其上给出UI显示320。可与用户设备310的输出操作耦接的呈现设备315可被配置为能将信息呈现给用户的任何呈现部件,如数字监视器、电子显示面板、触摸屏、模拟机顶盒、等离子显示屏、扬声器、盲文面板等。在一个示例实施例中,呈现设备315配置成呈现丰富内容,如搜索结果325、相关广告和数字图像和视频。在另一个示例实施例中,呈现设备315能够呈现其他形式的介质(即音频信号)。
见图2,数据存储设备335通常被配置为存储与评价搜索结果质量水平、确定分数230和基于以上导出绝对量度240相关联的信息395。在操作中,当用户正在搜索引擎345处实施搜索时,搜索引擎345可访问驻留在数据存储设备335处的信息395,如该用户的简档(捕捉该用户的历史搜索动作)、一般社会行为的数据记录(捕捉多个用户的历史在线动作)和/或一个或多个到分类处理220的输入250(见图2)。
在其他实施例中,可将数据存储设备335配置为可被搜索,以便适当地访问由此维护的信息。例如,针对分类处理220的输入250和人类判断评级可搜索数据存储设备335来训练分类处理220。本领域普通技术人员要理解和领会的是,数据存储设备335中存储的信息可以是可配置的,并可包括与搜索结果质量水平的确定和/或检索、以及对从中触发的校正动作的选择相关的任何信息。这样的用户交互的信息内容和量不意图在任何方式上限制本发明实施例的范围。进一步地,虽然作为单个和独立的部件而示出,数据存储设备335实际上可以是多个数据库,例如数据库集群,其部分可驻留在客户端设备310、网络服务器350、移动设备370、其他外部计算设备(未显示)和/或它们任何的组合上。
这个分布式计算环境300只是可实现来执行本发明的方面的合适环境的一个实例,而并不意图暗示关于本发明的使用或功能范围的任何限制。示出的分布式计算环境300也不应解释为具有涉及所示的设备310、350和370、数据存储设备335和部件351-354中的任何一个或者组合的任何依赖或要求。在一些实施例中,部件351-354的一个或多个可作为独立设备而实现。在其他实施例中,部件351-354的一个或多个可直接集成至网络服务器350中,或集成到互相连接以形成网络服务器350的分布式节点上。要领会和理解的是,部件351-354(图3所示)本质上和数量上是示例性的而不应解释为限制。
因此,可以采用任何数量的部件来实现在本发明的实施例范围中的想要的功能。虽然为了清晰起见而利用线示出了图3的各种部件,然后划分各个部件并不如此清晰,而且象征性地,这些线条更准确地会是灰色的或模糊的。进一步地,虽然图3的一些部件描绘成单个块,这些描述在本质上和数量上是示例性的而不被解释为限制(如,虽然只显示了一个呈现设备315,但是可以有更多的设备通信地耦接至客户端设备310)。
进一步地,示例系统系统结构中的设备可由相关领域已知的任何方法相互连接。例如,用户设备310、网络服务器350和移动设备370可通过包括多个通过一个或多个网络(未显示)彼此耦接的计算设备的分布式计算环境而操作地耦接。在实施例中,该网络可包括(但不限于)一个或多个局域网(LAN)和/或广域网(WAN)。这种联网环境常见于办公室、企业范围的计算机网络、企业内部网和互联网。因此,在此不再进一步描述该网络。
在操作中,部件351-354被设计成执行以下处理,该处理至少包括逐个地自动确定搜索结果的绝对量度(高质量或低质量),且采取合适的校正动作。应注意的是,将共同参照图3和4,描述搜索引擎345的操作。
首先,搜索引擎345包括查询接收部件351,其被配置为接收由用户发布的搜索查询375,并返回部分基于该搜索查询375而产生的搜索结果集325。以这种方式,查询接收部件351充当图4中与用户410接口的前端体验420,而顶级聚集器440提供后端体验。在实施例中,该后端体验涉及顶级聚集器440将已处理的查询411发布至网络索引450并从中检索搜索结果325。
继续参考图4,将应答顶级聚集器430配置为通过将搜索查询375发送至组合的修改服务/拼写器435来处理搜索查询375。在应答顶级聚集器430接收已处理的查询411时(如使拼写错误得到修正及附加了其他同义词/逻辑修改),已处理的查询411用于产生搜索结果325。在接收搜索结果325时,顶级聚集器440执行图2中的分类处理220,以产生回传至应答顶级聚集器430的输出416(如图2中的绝对量度240)。
现在转向在图3的计算环境300内的系统体系结构,提供类似图4的顶级聚集器440的分类部件352或者由顶级聚集器440提供分类部件352。也就是说,分类部件352被配置为实现自动地确定搜索结果集325中的一个或多个搜索结果的质量度量的分类处理。如上面参考图2详细描述的那样,采用分类处理来自动地确定就绝对意义来说搜索结果325是否是可接受的(即,满足搜索查询375的用户意图)。典型地,该分类处理包括评价由搜索结果(多个)325呈现的各种特征来确定整体质量水平、并且根据为每个搜索结果(多个)325确定的整体质量水平导出绝对度量的步骤。通常,绝对度量以互相排斥的方式将搜索结果(多个)325分别标识为要么高质量要么低质量。
在示例实施例中,分配部件353被配置为基于分类处理的结果将每个搜索结果(多个)325标记为“高质量”或者“低质量”。将这些被标记的搜索结果传递到应用部件354,其在当一个或多个搜索结果(例如,X数目个最高排名的搜索结果或者在SERP上的大多数搜索结果)被标记为"低质量"时,激活适当的校正动作。
在示例实施例中,作为置信度级别的函数来选择适当的校正动作。作为此处的使用,“置信度级别”不意指在定义上的限制,而是涵盖涉及下述可能性的任何度量,该可能性为由应用部件354提供的重写搜索查询内的任何替换用语会产生相对于当前“低质量”搜索结果325有改进的新的搜索结果。简明而言,在实施例中,置信度级别指示搜索引擎编写的搜索查询将产生提高的搜索结果的可能性。在应用中,置信度级别用于选择一个或多个校正动作,诸如呈现重新编制用户接口(UI)340、经由通知消息警告用户搜索结果(多个)325被标记为“低质量”、避免向用户呈现低质量搜索结果、或者自动地重写该搜索查询375以产生搜索结果的更新集。
在示例实施例中,在计算到由应用部件354建议的替换用语的高置信度级别时,自动地重写和自动地发布搜索查询375。相反,在计算到由应用部件354建议的替换用语的低置信度级别时,呈现重新编制UI 340。在一种情况下,重新编制UI 340请求和接受用户发起的交互385(诸如鼠标点击选择),以便引导改变搜索查询内的关键用语。举例来说,改变关键用语可能涉及替代或者删除搜索查询375内的一个或多个关键用语。
虽然已经描述了在确定一个或多个搜索结果被标记为“低质量”时增强搜索结果325的各种不同的方法,但是应当理解和领会的是,可以使用其它类型的适当方法和接口用于选择和实现校正动作,而且本发明的实施例不局限于上述校正动作。例如,附加校正动作可涉及给予第三方机构使用该第三方机构的经验和资源来重新编制搜索查询375的机会。
现在转到图5,示出了描述根据本发明的实施例、采用搜索结果集的质量水平来激活一个或多个校正动作的示例方法500的流程图。首先,要领会和理解的是,除非且除了个别步骤顺序被明确描述时之外,否则虽然在此可能使用词条“步骤”和/或“框”以暗示采用的不同方法单元,但这些术语不应解释为暗示在此公开的各个步骤之中或之间的任何特定顺序。
在示例实施例中,方法500涉及访问搜索结果集(见框502)并通过向其应用多个分类标准而单独地确定该搜索结果集的质量水平(见框504)。如上文更充分的描述,该分类标准包括评价由该搜索结果单独表达的排名特征、质量级别特征、标题级别特征、会话级别特征或聚集特征中的至少一个。如框506所示,该方法可通过为该搜索结果集中的至少一个结果分配在绝对标度中的分数而继续。该分数典型地基于确定的质量水平。如框508所示,该分数可与在绝对标度中的阈值进行比较。因此,可基于该比较的结果选择并执行一个或多个校正动作。这如框510所示
参考图6,示出了描述根据本发明的实施例的将搜索结果分类为高质量或低质量的示例方法600的流程图。首先,提供方法600,它可代表由搜索引擎(在处理器上运行的)执行的用于将搜索结果分类为高质量或低质量的计算机化的方法。在实施例中,如框602所示,方法600可涉及提供响应于由用户撰写并发布的搜索查询而返回的搜索结果集的步骤。如框604所示,该搜索结果集可相对于彼此排名。在一个示例中,作为每个搜索结果与发布的搜索查询的相关性的函数来计算该排名。如框606所示,搜索引擎随后可选择一个或多个被排名为与发布的搜索查询高度相关的搜索结果用于评价。
如框608所示,可通过采用分类处理来确定每个选择的搜索结果的质量水平。在示例实施例中,该分类处理包括一个或多个以下步骤:确定由待评价的、选定搜索结果展示的目标特征(见框610);评价该目标特征来为每个选择的搜索结果单独产生质量水平的分数(见框612);将该分数与预先定义的阈值进行(见框614);以及,基于该比较为每个选择的搜索结果分配绝对量度(见框616)。在示例中,当该分数比阈值高时,绝对量度指示高质量。否则,该绝对量度指示所选择的搜索结果为低质量。如框618所示,在识别出所选择的搜索结果被分配了指示低质量的绝对量度后,在识别后自动执行重新编制所发布的搜索查询的校正动作。
如上所述,该校正动作可涉及(如当自动撰写的搜索查询中的置信度高时)搜索引擎隐含地重写搜索查询。或者该校正动作可涉及在重新编制UI中明确地为用户提供预置的建议,其征求用户修改搜索查询的关键用语的反馈(如当自动撰写的搜索查询中的置信度低时)。要领会和理解的是,可实现其他校正动作以辅助用户有效地到达与他或她的用户意图相关的搜索结果。
已经说明性而不是限制性地描述了本发明的各种实施例。时不时地,替换实施例会变得明显而不脱离本发明实施例。要理解的是,某些特征和子组合很实用,并且可以被采用而不用参考其他特征和子组合。这是本权利要求所预期的且在本权利要求的范围内。

Claims (11)

1.一种采用搜索结果集的质量水平来激活一个或多个校正动作的方法,该方法包括:
访问(502)该搜索结果集;
通过向其应用多个分类标准而单独地确定(504)该搜索结果集的质量水平,所述多个分类标准包括至少一个排名特征,它单独度量该搜索查询内的关键用语和该搜索结果集的内容之间的关系,以及至少一个标题级别特征,其列举该搜索查询内的关键用语和搜索引擎预备的、搜索结果集的概要之间的匹配数;
基于所确定的质量水平,为该搜索结果集中至少一个结果分配(506)在绝对标度中的分数;
确定该分数低于在绝对标度中的阈值(508);
计算搜索引擎撰写的搜索查询将提供改进的搜索结果的置信度级别;以及
激活一个或多个与该计算的置信度级别相关联的校正动作。
2.如权利要求1所述的方法,其中该方法进一步包括:
接收用户发布的搜索查询;以及
返回基于该搜索查询内的至少一个用语而产生的搜索结果集。
3.如权利要求2所述的方法,其中该方法进一步包括:
部分地基于与该搜索查询中隐含的用户意图的相关性,将该搜索结果集中的搜索结果相对彼此排名;以及
以在排名中高排名的搜索结果为目标,来启动确定该搜索结果集的质量水平。
4.如权利要求1所述的方法,其中该方法进一步包括,在比较揭示分数高于阈值时,将至少一个搜索结果分类为高质量。
5.如权利要求1所述的方法,其中该方法进一步包括,在比较揭示该分数低于阈值时,将至少一个搜索结果分类为低质量。
6.如权利要求2所述的方法,其中多个分类标准包括一个或多个质量级别特征,其单独量化该搜索结果集的整体质量而独立于搜索查询,其中整体质量是该搜索结果集的内容或集成到该搜索结果集的域名中的至少一个的函数。
7.如权利要求2所述的方法,其中多个分类标准进一步包括一个或多个会话级别特征,其基于在在线会话过程期间用户发起的、对搜索结果的改进,将该搜索结果集中的搜索结果标记为相关或不相关。
8.如权利要求2所述的方法,其中多个分类标准进一步包括一个或多个聚集特征,其考虑该搜索结果集的内容、在搜索结果页面中发布的广告或包括由搜索引擎与该搜索结果集一起提供的相关搜索的用语中的至少一个之间的变化。
9.如权利要求1所述的方法,其中作为比较的函数来激活一个或多个校正动作包括:
当根据比较分数少于阈值而置信度级别高时,自动重写搜索查询;以及
发布重写的搜索查询以产生新的搜索结果集。
10.如权利要求1所述的方法,其中作为比较的函数来激活一个或多个校正动作包括:
当根据比较分数少于阈值且置信度级别低时,呈现重新编制用户界面UI;以及
在该重新编制用户界面UI处接收替代或移除搜索查询中的一个或多个关键用语的、用户发起的选择。
11.一种用于将搜索结果分类为高质量或低质量的方法,该方法包括:
提供(602)响应于用户撰写和发布的搜索查询而返回的搜索结果集;
作为与发布的搜索查询的相关性的函数确定该搜索结果集相对彼此的排名(604);
基于排名,从返回的被排名为与发布的搜索查询高度相关的搜索结果集中选择(606)一个或多个搜索结果来评价;
 通过采用分类处理,独立于搜索查询用语,为从返回的搜索结果集中选择的一个或多个搜索结果中的每一个确定(608)质量水平,其中该分类处理包括:
(a)确定(610)由一个或多个要评价的选定搜索结果展示的目标特征;
(b)评价(612)目标特征来为一个或多个选定搜索结果中的每一个产生质量水平分数;
(c)将该分数相对于预先定义的阈值进行比较;以及
(d)基于该比较,为一个或多个选定搜索结果中的每一个分配绝对量度,其中当分数高于阈值时,该绝对量度表明高质量,其中当分数少于阈值时,该绝对量度表明低质量;
计算搜索引擎撰写的搜索查询将提供改进的搜索结果的置信度级别;以及
响应于该计算的置信度级别,在识别出一个或多个选定搜索结果被分配了表明低质量的绝对量度时,用自动生成并自动重新编制的搜索查询自动进行搜索。
CN201110420064.3A 2010-12-15 2011-12-15 分类搜索查询的结果 Expired - Fee Related CN102542012B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/969,140 US9251185B2 (en) 2010-12-15 2010-12-15 Classifying results of search queries
US12/969140 2010-12-15

Publications (2)

Publication Number Publication Date
CN102542012A CN102542012A (zh) 2012-07-04
CN102542012B true CN102542012B (zh) 2015-10-28

Family

ID=46235745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110420064.3A Expired - Fee Related CN102542012B (zh) 2010-12-15 2011-12-15 分类搜索查询的结果

Country Status (2)

Country Link
US (1) US9251185B2 (zh)
CN (1) CN102542012B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411803B2 (en) * 2012-09-28 2016-08-09 Hewlett Packard Enterprise Development Lp Responding to natural language queries
CN102982173B (zh) 2012-12-17 2016-10-12 北京奇虎科技有限公司 一种网页搜索方法以及装置
CN103970786A (zh) * 2013-01-31 2014-08-06 百度在线网络技术(北京)有限公司 基于lbs的信息获取方法及设备
CN104077555B (zh) * 2013-03-29 2019-01-15 百度在线网络技术(北京)有限公司 一种识别图片搜索中坏例的方法和装置
US9721020B2 (en) * 2013-07-31 2017-08-01 International Business Machines Corporation Search query obfuscation via broadened subqueries and recombining
CN103544314B (zh) * 2013-11-04 2017-12-12 北京中搜云商网络技术有限公司 一种搜索数据质量统计方法
CN104714954A (zh) * 2013-12-13 2015-06-17 中国电信股份有限公司 基于上下文理解的信息搜索方法和系统
US9495405B2 (en) 2014-04-28 2016-11-15 International Business Machines Corporation Big data analytics brokerage
RU2629449C2 (ru) * 2014-05-07 2017-08-29 Общество С Ограниченной Ответственностью "Яндекс" Устройство, а также способ выбора и размещения целевых сообщений на странице результатов поиска
US20150347508A1 (en) * 2014-06-02 2015-12-03 Microsoft Corporation Partial result classification
US9754207B2 (en) 2014-07-28 2017-09-05 International Business Machines Corporation Corpus quality analysis
US9547690B2 (en) * 2014-09-15 2017-01-17 Google Inc. Query rewriting using session information
US10970795B2 (en) * 2014-09-30 2021-04-06 International Business Machines Corporation Answer support systems for hybrid networks
US9838348B2 (en) * 2014-12-31 2017-12-05 Yahoo Holdings, Inc. Electronic message search system and method
US11675795B2 (en) * 2015-05-15 2023-06-13 Yahoo Assets Llc Method and system for ranking search content
US20170024657A1 (en) * 2015-07-21 2017-01-26 Yp Llc Fuzzy autosuggestion for query processing services
CN105183913B (zh) * 2015-10-12 2019-02-15 广州神马移动信息科技有限公司 一种查询处理方法、装置及设备
US10891549B2 (en) * 2015-12-02 2021-01-12 Gluru Limited System and method for intelligent resource ranking and retrieval
US11087087B1 (en) * 2017-02-15 2021-08-10 Robert Mayer Comparative expression processing
JP6871799B2 (ja) * 2017-04-28 2021-05-12 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
NZ762459A (en) * 2017-08-11 2020-03-27 Ancestry Com Operations Inc Diversity evaluation in genealogy search
US20190129958A1 (en) * 2017-10-30 2019-05-02 Facebook, Inc. Optimizing the Mapping of Qualitative Labels to Scores for Calculating Gain in Search Results
US11568003B2 (en) * 2017-12-15 2023-01-31 Google Llc Refined search with machine learning
US10783013B2 (en) 2017-12-15 2020-09-22 Google Llc Task-related sorting, application discovery, and unified bookmarking for application managers
US10846109B2 (en) 2017-12-20 2020-11-24 Google Llc Suggesting actions based on machine learning
US20200042643A1 (en) * 2018-08-06 2020-02-06 International Business Machines Corporation Heuristic q&a system
CN111061942B (zh) * 2018-10-17 2023-04-18 阿里巴巴集团控股有限公司 搜索排序监控方法和系统
WO2020157728A1 (en) 2019-02-01 2020-08-06 Ancestry.Com Operations Inc. Search and ranking of records across different databases
US11176429B2 (en) * 2019-05-13 2021-11-16 International Business Machines Corporation Counter rare training date for artificial intelligence
CN113535958B (zh) * 2021-07-28 2023-08-08 北京百度网讯科技有限公司 生产线索聚合方法、装置及系统、电子设备和介质
CN116187299B (zh) * 2023-03-07 2024-03-15 广东省技术经济研究发展中心 一种科技项目文本数据检定评价方法、系统及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169797A (zh) * 2007-11-30 2008-04-30 朱廷劭 一种对搜索结果优化的方法
CN101339564A (zh) * 2007-07-02 2009-01-07 索尼株式会社 信息处理设备以及用于搜索内容的评价的方法和系统
WO2010022655A1 (zh) * 2008-08-26 2010-03-04 华为技术有限公司 一种搜索方法和系统
CN101681352A (zh) * 2007-04-03 2010-03-24 谷歌公司 识别不充分的搜索内容

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963867B2 (en) 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
DE60017727T2 (de) 2000-08-18 2005-12-29 Exalead Suchwerkzeug und Prozess zum Suchen unter Benutzung von Kategorien und Schlüsselwörtern
US20020078045A1 (en) * 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US20030229624A1 (en) * 2002-06-05 2003-12-11 Petrisor Greg C. Search system
US6983280B2 (en) 2002-09-13 2006-01-03 Overture Services Inc. Automated processing of appropriateness determination of content for search listings in wide area network searches
US6947930B2 (en) 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US8589373B2 (en) * 2003-09-14 2013-11-19 Yaron Mayer System and method for improved searching on the internet or similar networks and especially improved MetaNews and/or improved automatically generated newspapers
US7814085B1 (en) 2004-02-26 2010-10-12 Google Inc. System and method for determining a composite score for categorized search results
US7801899B1 (en) 2004-10-01 2010-09-21 Google Inc. Mixing items, such as ad targeting keyword suggestions, from heterogeneous sources
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20060167842A1 (en) 2005-01-25 2006-07-27 Microsoft Corporation System and method for query refinement
US7480669B2 (en) 2005-02-15 2009-01-20 Infomato Crosslink data structure, crosslink database, and system and method of organizing and retrieving information
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US8019749B2 (en) 2005-03-17 2011-09-13 Roy Leban System, method, and user interface for organizing and searching information
US7870147B2 (en) 2005-03-29 2011-01-11 Google Inc. Query revision using known highly-ranked queries
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7756855B2 (en) 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7925649B2 (en) * 2005-12-30 2011-04-12 Google Inc. Method, system, and graphical user interface for alerting a computer user to new results for a prior search
US8694530B2 (en) 2006-01-03 2014-04-08 Textdigger, Inc. Search system with query refinement and search method
US7747598B2 (en) * 2006-01-27 2010-06-29 Google Inc. Geographic coding for location search queries
US7676460B2 (en) 2006-03-03 2010-03-09 International Business Machines Corporation Techniques for providing suggestions for creating a search query
US7752237B2 (en) 2006-03-15 2010-07-06 Microsoft Corporation User interface having a search preview
US7752243B2 (en) 2006-06-06 2010-07-06 University Of Regina Method and apparatus for construction and use of concept knowledge base
US7792821B2 (en) 2006-06-29 2010-09-07 Microsoft Corporation Presentation of structured search results
US9002869B2 (en) 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion
US8126863B2 (en) 2007-10-25 2012-02-28 Apple Inc. Search control combining classification and text-based searching techniques
US20090144262A1 (en) 2007-12-04 2009-06-04 Microsoft Corporation Search query transformation using direct manipulation
US7984004B2 (en) 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US20090281994A1 (en) 2008-05-09 2009-11-12 Byron Robert V Interactive Search Result System, and Method Therefor
US20100146012A1 (en) 2008-12-04 2010-06-10 Microsoft Corporation Previewing search results for suggested refinement terms and vertical searches
US20100185644A1 (en) 2009-01-21 2010-07-22 Microsoft Corporatoin Automatic search suggestions from client-side, browser, history cache
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
US9405841B2 (en) 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion
US20120078941A1 (en) 2010-09-27 2012-03-29 Teradata Us, Inc. Query enhancement apparatus, methods, and systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681352A (zh) * 2007-04-03 2010-03-24 谷歌公司 识别不充分的搜索内容
CN101339564A (zh) * 2007-07-02 2009-01-07 索尼株式会社 信息处理设备以及用于搜索内容的评价的方法和系统
CN101169797A (zh) * 2007-11-30 2008-04-30 朱廷劭 一种对搜索结果优化的方法
WO2010022655A1 (zh) * 2008-08-26 2010-03-04 华为技术有限公司 一种搜索方法和系统

Also Published As

Publication number Publication date
US9251185B2 (en) 2016-02-02
US20120158702A1 (en) 2012-06-21
CN102542012A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102542012B (zh) 分类搜索查询的结果
US10713317B2 (en) Conversational agent for search
US9589277B2 (en) Search service advertisement selection
US11204972B2 (en) Comprehensive search engine scoring and modeling of user relevance
CN102567475B (zh) 用于交互式查询重构的用户接口
US20220114199A1 (en) System and method for information recommendation
US20190349320A1 (en) System and method for automatically responding to user requests
KR102472572B1 (ko) 사용자 의도 프로파일링 방법 및 이를 위한 장치
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
US20080005103A1 (en) Intellectual property search, marketing and licensing connection system and method
CA2923600A1 (en) Review sentiment analysis
CA3070612A1 (en) Click rate estimation
CN105247507A (zh) 品牌的影响力得分
WO2019196261A1 (zh) 一种协议文件的推送方法及终端设备
CN1981286A (zh) 确定搜索中的关键字值的方法和数据库搜索系统
US20120197732A1 (en) Action-aware intent-based behavior targeting
WO2008144444A1 (en) Ranking online advertisements using product and seller reputation
WO2009155375A2 (en) System and method for aggregating and summarizing product/topic sentiment
US10042895B1 (en) Product information integration
CN111737418A (zh) 搜索词和商品的相关性预测方法、设备和存储介质
US11698904B2 (en) Query rewrite for low performing queries based on customer behavior
CN106447419A (zh) 基于特征选择的拜访者标识
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
Anoop et al. Cloud based collaborative filtering algorithm for library book recommendation system
US10394804B1 (en) Method and system for increasing internet traffic to a question and answer customer support system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150617

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150617

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151028

Termination date: 20191215