CN102236710A - 一种用于在查询结果中展现新闻信息的方法与设备 - Google Patents
一种用于在查询结果中展现新闻信息的方法与设备 Download PDFInfo
- Publication number
- CN102236710A CN102236710A CN 201110183562 CN201110183562A CN102236710A CN 102236710 A CN102236710 A CN 102236710A CN 201110183562 CN201110183562 CN 201110183562 CN 201110183562 A CN201110183562 A CN 201110183562A CN 102236710 A CN102236710 A CN 102236710A
- Authority
- CN
- China
- Prior art keywords
- news
- news information
- user
- search sequence
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明的目的是提供一种用于在查询结果中展现新闻信息的方法与设备,网络设备获取与用户的查询序列相匹配的查询结果;根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。与现有技术相比,本发明通过根据用户的查询序列匹配相应的新闻信息记录,提高了用户获取新闻信息的效率,提升了用户的使用体验。
Description
技术领域
本发明涉及网络搜索技术领域,尤其涉及一种用于在查询结果中展现新闻信息的技术。
背景技术
随着搜索技术的突飞猛进,用户对搜索结果的要求也呈现出多样化的趋势,对于同一个查询序列,用户可能需要的是相关的视频信息,也可能是相关的图片信息,或者是相关的新闻信息。现有技术中,针对用户输入的查询序列,只是根据网页打分给出普通的查询结果,当用户需要检索新闻信息时,还要通过在查询序列中加入“新闻”的输入片段,或者通过特定的服务进行检索,复杂了用户得到新闻信息的过程。
因此,如何更加主动、及时地为用户提供相关新闻信息,提高用户获取新闻信息的效率,从而提升用户的使用体验,成为本领域技术人员亟需解决的问题之一。
发明内容
本发明的目的是提供一种用于在查询结果中展现新闻信息的方法与设备。
根据本发明的一个方面,提供了一种计算机实现的用于在查询结果中提供新闻信息的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相匹配的查询结果;
b根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;
c将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
根据本发明的另一方面,还提供了一种用于在查询结果中提供新闻信息的网络设备,其中,该设备包括:
获取装置,用于获取与用户的查询序列相匹配的查询结果;
查询装置,用于根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;
提供装置,用于将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
与现有技术相比,本发明通过根据用户的查询序列匹配相应的新闻信息记录,提高了用户获取新闻信息的效率,提升了用户的使用体验,
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于在查询结果中展现新闻信息的系统拓扑图;
图2示出根据本发明一个方面的用于在查询结果中展现新闻信息的设备示意图;
图3示出根据本发明一个优选实施例的用于在查询结果中展现新闻信息的设备示意图;
图4示出根据本发明另一个方面的用于在查询结果中展现新闻信息的方法流程图;
图5示出根据本发明一个优选实施例的用于在查询结果中展现新闻信息的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于在查询结果中展现新闻信息的系统拓扑图,其中包括网络设备1、与网络设备1经由网络相连接的多个中间设备3以及多个与上述网络设备1或中间设备3经由网络相连接的用户设备2。其中,网络设备1获取与用户设备2或中间设备3提供的用户的查询序列相匹配的查询结果;根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。在此,网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
另外,网络设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。中间设备3同样包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。而用户设备2包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或IPTV等。网络设备1与各中间设备3之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。网络设备1与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。中间设备3与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。
本领域技术人员应能理解上述网络设备1、用户设备2、中间设备3以及连接其间的网络、通信方式仅为举例,其他现有的或今后可能出现的网络设备、用户设备、中间设备、网络或通信方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员还应能理解,图1中仅为简明起见而示出的各类网络元素的数量可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充分的公开为前提的。
为简明起见,下面以一个用户设备2为例进行描述。本领域技术人员应能理解,网络设备1可以同时与多个用户设备2或中间设备3交互,并获取与不同的用户设备2或中间设备3提供的用户的查询序列相匹配的查询结果;根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;将所述一个或多个新闻信息记录与所述查询结果提供给相应的用户设备2或中间设备3。
图2示出根据本发明一个方面的用于在查询结果中展现新闻信息的设备示意图,其中,网络设备1包括获取装置11、查询装置12和提供装置13。
其中,获取装置11获取与用户的查询序列相匹配的查询结果。具体地,获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备2输入的查询序列相匹配的查询结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备2输入的查询序列,并通过网页数据库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的查询结果;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备2获取用户通过该用户设备2输入的查询序列,并通过网页数据库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的查询结果。例如,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、手写设备或语音输入设备,在浏览器软件、应用程序或客户端软件等的输入框中输入查询序列;搜索引擎通过JSP等页面技术获取到用户输入的查询序列,基于用户输入的查询序列进行匹配查询,获得与所述查询序列相匹配的查询结果;获取装置11通过调用该搜索引擎所提供的应用程序接口,从该搜索引擎中获取到所述查询结果。例如,当用户通过与用户设备2的交互,输入查询序列“日本”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“日本”的查询结果“日本百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等;获取装置11通过与该搜索引擎的交互,获取上述查询结果“日本百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等。本领域技术人员应能理解上述获取查询结果的方式仅为举例,其他现有的或今后可能出现的获取查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
查询装置12根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录。具体地,查询装置12根据获取装置11所提供的用户的查询序列,通过在新闻数据库中匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录。接上例,查询装置12根据获取装置11通过诸如与用户设备2的交互获取到的查询序列“日本”,通过在新闻数据库中匹配查询或实时在线搜索等方式,获取到多个新闻信息记录“日本面临历史上最大危机”、“救灾神话彻底破灭日本政府光环剥落”、“日本震后29国向日本运送救灾物资中国批次最多”等。本领域技术人员应能理解上述获取新闻信息记录的方式仅为举例,其他现有的或今后可能出现的获取新闻信息记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
提供装置13将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。具体地,提供装置13根据查询装置12查询获得的一个或多个新闻信息记录及获取装置11所获取的查询结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个新闻信息记录与查询结果提供给所述用户。以屏幕显示为例,提供装置13将查询装置12查询获得的一个或多个新闻信息记录及获取装置11所获取的查询结果,利用页面技术,如ASP、JSP或PHP等,随机或按一定顺序和格式,例如URL+摘要的形式提供给用户设备2,供用户进行浏览。接上例,当用户通过与用户设备2的交互,输入查询序列“日本”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“日本”的查询结果“日本百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等,获取装置11基于与搜索引擎的交互,获取上述查询结果“日本百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等;查询装置12根据与用户设备2的交互,获取查询序列“日本”,再通过新闻数据库匹配查询或实时在线搜索等方式,获取到多个新闻信息记录“日本面临历史上最大危机”、“救灾神话彻底破灭日本政府光环剥落”、“日本震后29国向日本运送救灾物资中国批次最多”等;随后,提供装置13利用页面技术,如ASP、JSP或PHP等,将上述多个查询结果与新闻信息记录提供给用户设备2,供用户进行浏览。优选地,所述一个或多个新闻信息记录可以独立于所述查询结果进行展现,例如通过区别于查询结果的形式,以悬浮框、新打开的标签页或网页等方式进行展现,也可以与所述查询结果混合展现。当所述一个或多个新闻信息记录独立于所述查询结果展现,网络设备1对所述一个或多个新闻信息记录进行排序,如按照网页打分的高低进行排序,提供装置13根据排序结果,将所述一个或多个新闻信息提供给所述用户。当所述一个或多个新闻信息记录与所述查询结果混合展现,网络设备1对所述一个或多个新闻信息记录与所述查询结果进行排序,如按照网页打分的高低进行排序,提供装置13根据排序结果,将所述一个或多个新闻信息与所述查询结果提供给用户。更优选地,网络设备1对所述一个或多个新闻信息记录与第一页的查询结果进行排序,提供装置13再根据上述排序结果,将所述一个或多个新闻信息与所述查询结果提供给用户,以使新闻信息记录显示在第一页中,便于用户浏览。本领域技术人员应能理解上述提供新闻信息记录的方式仅为举例,其他现有的或今后可能出现的提供新闻信息记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,网络设备1的各个装置之间是持续不断工作的。具体地,获取装置11获取与用户的查询序列相匹配的查询结果;查询装置12根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;提供装置13将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。在此,本领域技术人员应理解“持续”是指网络设备1的各装置分别按照设定的或实时调整的工作模式要求进行查询序列与查询结果的获取、新闻信息记录的获取、新闻信息记录与查询结果的提供,直至获取装置11在较长时间内停止获取与用户的查询序列相匹配的查询结果。
图3示出根据本发明一个优选实施例的用于在查询结果中展现新闻信息的设备示意图,其中,网络设备1还包括检测装置14’。其中,获取装置11’、查询装置12’和提供装置13’分别与图2所示对应装置11-13相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
检测装置14’检测是否满足为所述用户提供新闻信息的新闻触发条件;其中,当满足所述新闻触发条件时,所述查询装置12’根据所述查询序列,并结合所述新闻触发条件,获取所述一个或多个新闻信息记录。具体地,检测装置14’根据获取装置11’所提供的查询序列,通过诸如语义分析、分词技术或库匹配查询等方式,检测是否满足为所述用户提供新闻信息的新闻触发条件,如通过与搜索引擎等第三方设备的交互,检测所述查询序列的即时搜索频度是否超过预置的新闻搜索热度阈值,或者根据分词技术、库匹配查询等,检测所述查询序列是否包含新闻需求库中的新闻特征词;当满足所述新闻触发条件时,查询装置12’根据所述查询序列,并结合所述新闻触发条件,如该查询序列中包含的新闻特征词,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录满足所述新闻触发条件所对应的要求。例如,检测装置14’通过与搜索引擎等第三方设备的交互,获取用户的查询序列的即时搜索频度,如单位时间内用户以所述查询序列进行信息搜索的累计搜索次数,当所述即时搜索频度超过预置的新闻搜索热度阈值时,即认为满足新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即所述即时搜索频度超过预置的新闻搜索热度阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻搜索热度阈值的要求。本领域技术人员应能理解,通过对新闻触发条件的检测,并且当满足该新闻触发条件时,获取并提供与所述查询序列与该新闻触发条件相对应的新闻信息记录,使得更有针对性地为用户提供其感兴趣的新闻信息,进一步满足了用户对特定新闻的需求,并改善了用户的使用体验。本领域技术人员还应能理解上述检测新闻触发条件的方式仅为举例,其他现有的或今后可能出现的检测新闻触发条件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述新闻触发条件包括以下至少任一项:
-所述查询序列包含新闻需求库中的新闻特征词;
-所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值;
-与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值;
-所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值;
-所述用户对新闻信息的累计点击数超过新闻点击阈值。
具体地,当新闻触发条件包括所述查询序列包含新闻需求库中的新闻特征词,检测装置14’根据获取装置11’所提供的查询序列,通过在新闻需求库中进行匹配查询,或者先对该查询序列进行分词处理得到分词处理后的查询片段,在根据这些查询片段在新闻需求库中进行匹配查询,当在该新闻需求库中匹配成功时,即所述查询序列包含新闻需求库中的新闻特征词,则认为满足为所述用户提供新闻信息的新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即所述查询序列包含新闻需求库中的新闻特征词,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还与所述查询序列所包含的新闻需求库中的新闻特征词相匹配。。在此,所述新闻需求库可以在网络设备端,也可以在与网络设备1经由网络相连接的其他产品或第三方设备端,通过与网络设备1的交互,进行库匹配查询。在所述新闻需求库中存储了大量的新闻特征词,如新闻、热点、进展或其他关于新闻内容的关键词;可以根据关于新闻页面的大量用户网络操作所获取的候选新闻特征词,建立或更新该新闻需求库。当新闻触发条件包括所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值,检测装置14’通过与搜索引擎等第三方设备的交互,获取所述查询序列的即时搜索频度,如单位时间内用户以所述查询序列进行信息搜索的累计搜索次数,当所述即时搜索频度超过预置的新闻搜索热度阈值时,即认为满足新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即所述即时搜索频度超过预置的新闻搜索热度阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻搜索热度阈值的要求。当新闻触发条件包括与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值,检测装置14’通过与搜索引擎等第三方设备的交互,获取与所述查询序列相关的新闻信息在单位时间内的新增数量,如在搜索引擎端的新闻数据库中爬虫在单位时间内新抓取的所述新闻信息的数量,当与该查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值时,即认为满足新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述第一新闻增量阈值的要求。当新闻触发条件包括所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值,检测装置14’通过与搜索引擎等第三方设备的交互,获得与该查询序列相对应的查询结果,并通过提取页面生成时间、页面来源等方式,获得相应的新闻信息及其生成时间,当满足时效阈值(如生成时间距当前时间不超过一个小时、一天、一周等)的新闻信息的数量超过第二新闻增量阈值,即认为满足新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述第二新闻增量阈值的要求。当新闻触发条件包括所述用户对新闻信息的累计点击数超过新闻点击阈值,检测装置14’通过与搜索引擎等第三方设备的交互,或者通过页面分析等方式,获取用户对新闻信息的累计点击数,当该累计点击数超过新闻点击阈值,即认为满足新闻触发条件;随后,查询装置12’根据该查询序列,并结合所述新闻触发条件,即所述用户对新闻信息的累计点击数超过新闻点击阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻点击阈值的要求。优选地,本实施例还可以将上述新闻触发条件任意组合成新的新闻触发条件,并根据此新获取的触发条件,检测是满足为所述用户提供新闻的该触发条件,当满足该触发条件时,获取并提供与所述查询序列与该触发条件相对应的新闻信息记录。本领域技术人员应能理解上述新闻触发条件仅为举例,其他现有的或今后可能出现的新闻触发条件如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,网络设备1还包括更新装置(未示出)。所述更新装置根据关于新闻页面的大量用户网络操作,获取候选新闻特征词;根据所述候选新闻特征词,建立或更新所述新闻需求库。具体地,普通用户在搜索或浏览新闻页面时,通过与用户设备2的交互,在新闻页面上进行点击、选中等用户网络操作;该更新装置通过诸如与搜索引擎等第三方设备的交互,例如调用第三方设备所提供的应用程序接口(API),获取关于新闻页面的大量用户网络操作,并通过页面分析等方式获取候选新闻特征词,例如获取满足预置访问频度的新闻页面所对应的页面关键词,并将其作为候选新闻特征词;随后,更新装置再根据上述候选新闻特征词,通过数据库更新等方式,建立或更新所述新闻需求库。例如,更新装置根据关于新闻页面的大量用户网络操作,从满足预置访问频度的新闻页面中获取“福岛”与“核电站”等页面关键词作为候选新闻特征词,并将“福岛”与“核电站”等候选新闻特征词写入所述新闻需求库,以更新所述新闻需求库。本领域技术人员应能理解上述更新新闻需求库的方式仅为举例,其他现有的或今后可能出现的更新新闻需求库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参见图2),网络设备1还包括预处理装置(未示出)。所述预处理装置对所述查询序列进行预处理,以获得预处理后的所述查询序列;其中,所述查询装置12根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录。以下参照图2对该另一优选实施例进行详细描述,其中,获取装置11获取与用户的查询序列相匹配的查询结果,所述预处理装置对所述查询序列进行预处理,以获得预处理后的所述查询序列,所述查询装置12根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录,提供装置13将所述一个或多个新闻信息记录与所述查询结果提供给所述用户,其具体过程与前述参照图2所描述的实施例中获取装置11和提供装置13所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,预处理装置根据获取装置11所提供的查询序列,通过诸如语义分析等方式,并通过对所述查询序列进行去除色情词、无意义的词,或进行同义或近义替换等方式,对用户的查询序列进行预处理,以获得预处理后的查询序列;随后,查询装置12再根据预处理后的查询序列,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录。例如,假设获取装置11通过与用户设备2的交互,获得用户的查询序列“日本的地震”;预处理装置对该查询序列进行预处理,将“的”去除,获得预处理后的查询序列“日本地震”;随后,查询装置12根据该预处理后的查询序列“日本地震”,获取与之相匹配的一个或多个新闻信息记录“日本地震3月31日综述(0时-24时)关键词:新高”、“日本大地震确认已造成11532人遇难”、“日本大地震中的‘中国援助’”等。本领域技术人员应能理解上述对查询序列进行预处理的方式仅为举例,其他现有的或今后可能出现的对查询序列进行预处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一个优选实施例中(参见图2),所述查询装置12根据所述查询序列,并结合所述用户的用户相关信息,获取所述一个或多个新闻信息记录。以下参照图2对该另一优选实施例进行详细描述,其中,获取装置11获取与用户的查询序列相匹配的查询结果,查询装置12根据用户的查询序列,并结合所述用户的用户相关信息,获取与所述查询序列相匹配的一个或多个新闻信息记录,提供装置13将所述一个或多个新闻信息记录与所述查询结果提供给所述用户,其具体过程与前述参照图2所描述的实施例中获取装置11和提供装置13所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,查询装置12根据获取装置11所提供的查询序列,并结合该用户的用户相关信息,例如用户的个人属性、偏好设置、历史访问操作记录等,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如,当用户设置其更偏好军事方面的新闻信息时,查询装置12通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。在此,所述用户相关信息既可以是网络设备1独立获取的,也可以是接受来自用户设备2记录的,或者接受来自其他产品或第三方设备所获取的用户相关信息。本领域技术人员应能理解上述获取用户相关信息的方式仅为举例,其他现有的或今后可能出现的获取用户相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述用户相关信息包括以下至少任一项:
-所述用户的个人属性;
-所述用户的偏好设置;
-所述用户的历史访问操作记录。
具体地,当用户相关信息包括所述用户的个人属性,查询装置12根据用户的查询序列,并结合该用户的个人属性,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。在此,个人属性包括但不限于用户的年龄、性别、职业等。例如当用户为男性时,提供更多关于体育、军事等方面的新闻信息,当用户为女性时,提供更多关于美容、服饰等方面的新闻信息。当用户相关信息包括所述用户的偏好设置,查询装置12根据用户的偏好设置,并结合该用户的偏好设置,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如当用户设置其更偏好军事方面的新闻信息时,查询装置12通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。当用户相关信息包括所述用户的历史访问操作记录,查询装置12根据用户的查询序列,并结合该用户的历史访问操作记录,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如当用户历史多次访问军事方面的新闻信息,则查询装置12根据该用户的查询序列,并结合该用户历史多次访问军事方面的新闻信息的历史访问操作记录,通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。优选地,本发明还可以将上述用户相关信息任意组成得到新的用户相关信息,据此新的用户相关信息,查询装置12根据所述查询序列,并结合该新的用户相关信息,获取所述一个或多个新闻信息记录。本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在另一优选实施例中(参见图2),网络设备1还包括优先级确定装置(未示出)。所述优先级确定装置根据预置权重规则,确定所述一个或多个新闻信息记录的优先级;其中,所述提供装置13根据所述优先级,将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。以下参照图2对该另一优选实施例进行详细描述,其中,获取装置11获取与用户的查询序列相匹配的查询结果,查询装置12根据用户的查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录,其具体过程与前述参照图2所描述的实施例中获取装置11和查询装置12所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,优先级确定装置根据查询装置12所提供的一个或多个新闻信息记录,根据预置权重规则,例如根据所述新闻信息记录的时效性、查询频率、热门度、来源的可信度、与所述查询序列的匹配度等,通过诸如为所述新闻信息记录在上述各方面进行打分并分配一定的权重,根据综合的打分结果,确定所述一个或多个新闻信息记录的优先级;随后,提供装置13根据优先级确定装置所确定的优先级,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个新闻信息记录与所述查询结果提供给用户设备2,以供用户进行浏览。本领域技术人员应能理解上述确定优先级的方式仅为举例,其他现有的或今后可能出现的确定优先级的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述预置权重规则包括基于以下至少任一项来确定所述一个或多个新闻信息记录的优先级:
-所述新闻信息记录与所述查询序列的匹配度;
-所述新闻信息记录的时效性;
-所述新闻信息记录的查询频率;
-所述新闻信息记录的热门度;
-所述新闻信息记录的来源的可信度。
具体地,当预置权重规则包括基于所述新闻信息记录与所述查询序列的匹配度来确定所述一个或多个新闻信息记录的优先级,优先级确定装置例如通过页面分析器等方式,获取所述新闻信息记录与所述查询序列的匹配度,并根据所述匹配度,确定所述一个或多个新闻信息记录的优先级,如匹配度越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的时效性来确定所述一个或多个新闻信息记录的优先级,优先级确定装置例如通过与搜索引擎等第三方设备的交互,或者通过页面分析器等方式提取页面生成时间,以获得相应的新闻信息记录的生成时间,并据此获得所述新闻信息记录的时效性,例如生成时间距当前时间越近的时效性越强,再根据所述时效性,确定所述一个或多个新闻信息记录的优先级,如时效性越强的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的查询频率来确定所述一个或多个新闻信息记录的优先级,优先级确定装置例如通过与搜索引擎等第三方设备的交互,获得所述新闻信息记录的查询频率,并根据所述查询频率,确定所述一个或多个新闻信息记录的优先级,如查询频率越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的热门度来确定所述一个或多个新闻信息记录的优先级,优先级确定装置例如通过与搜索引擎等第三方设备的交互,获得所述新闻信息记录的热门度,如通过该新闻信息记录的转载数、转载速度(转载数除以时间)等确定其热门度,并根据所述热门度,确定所述一个或多个新闻信息记录的优先级,如热门度越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的来源的可信度来确定所述一个或多个新闻信息记录的优先级,优先级确定装置例如通过与搜索引擎等第三方设备的交互,获取用户的反馈信息或者根据网站的权威度来确定所述新闻信息记录的来源的可信度,并根据所述来源的可信度,确定所述一个或多个新闻信息记录的优先级,如来源的可信度越高的新闻信息记录的优先级越高。优选地,优先级确定装置根据基于上述任意多种因素的预置权重规则,来确定所述一个或多个新闻信息记录的优先级,例如通过为所述新闻信息记录在上述各方面进行打分并分配一定的权重,根据综合的打分结果,确定所述一个或多个新闻信息记录的优先级。本领域技术人员应能理解上述预置权重规则仅为举例,其他现有的或今后可能出现的预置权重规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一优选实施例中(参见图2),网络设备1还包括摘要处理装置(未示出)。所述摘要处理装置对所述一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;其中,所述提供装置13将所述新闻搜索结果与所述查询结果提供给所述用户。以下参照图2对该又一优选实施例进行详细描述,其中,获取装置11获取与用户的查询序列相匹配的查询结果,查询装置12根据用户的查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录,其具体过程与前述参照图2所描述的实施例中获取装置11和查询装置12所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,摘要处理装置根据查询装置12所提供的一个或多个新闻信息记录,例如通过对该一个或多个新闻信息记录所对应的网页进行页面分析并采取关键词提取、段落提取等方式,对该一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;随后,提供装置13采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述新闻搜索结果与所述查询结果提供给所述用户。在此,摘要处理装置既可以对所述一个或多个新闻信息记录全部进行摘要处理,也可只对其中的部分新闻信息记录进行摘要处理,如只对排序在第一位的新闻信息记录进行摘要处理,其余的新闻信息记录则以标题+URL的形式进行展现。本领域技术人员应能理解上述对新闻信息记录进行摘要处理的方式仅为举例,其他现有的或今后可能出现的对新闻信息记录进行摘要处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述新闻搜索结果可以独立于所述查询结果进行展现,例如通过区别于查询结果的形式,以悬浮框、新打开的标签页或网页等方式进行展现,也可以与所述查询结果混合展现。当所述新闻搜索结果独立于所述查询结果展现,网络设备1对所述新闻搜索结果进行排序,如按照网页打分的高低进行排序,提供装置13根据排序结果,将所述新闻搜索结果提供给所述用户。当所述新闻搜索结果与所述查询结果混合展现,网络设备1对所述新闻搜索结果与所述查询结果进行排序,如按照网页打分的高低进行排序,提供装置13根据排序结果,将所述新闻搜索结果与所述查询结果提供给用户。更优选地,网络设备1对所述新闻搜索结果与第一页的查询结果进行排序,提供装置13再根据上述排序结果,将所述新闻搜索结果与所述查询结果提供给用户,以使新闻搜索结果显示在第一页中,便于用户浏览。本领域技术人员应能理解上述提供新闻搜索结果与查询结果的方式仅为举例,其他现有的或今后可能出现的提供新闻搜索结果与查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述摘要处理装置对所述一个或多个新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;对所述一个或多个新闻聚类中至少一个进行摘要处理,以获得所述新闻搜索结果。具体地,摘要处理装置根据查询装置12查询获得的一个或多个新闻信息记录,例如通过对该一个或多个新闻信息记录所对应的网页进行页面分析,通过划分法(PartitioningMethods)、层次法(Hierarchical Methods)、基于密度的方法(density-basedmethods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based MethodsK-MEANS算法等,将相似或相同主题的新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;随后,摘要处理装置再根据所述新闻聚类中所对应的新闻信息记录,通过对其所对应的网页进行页面分析并采取关键词提取、段落提取等方式,对该新闻聚类进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果。例如,假设获取装置11通过与用户设备2的交互,获得的用户的查询序列为“日本”,查询装置12根据该查询序列进行匹配查询,获得的一个或多个新闻信息记录包括有关日本地震的新闻信息记录、有关日本的核辐射的新闻信息记录、有关日本海啸的新闻信息记录等;随后,摘要处理装置根据对上述多个新闻信息记录所对应的网页进行页面分析,对其进行聚类处理,分别得到有关地震的新闻聚类、有关核辐射的新闻聚类以及有关海啸的新闻聚类;随后,摘要处理装置再对上述至少一个新闻聚类进行摘要处理,例如对有关日本地震的新闻聚类进行摘要处理,假设该有关日本地震的新闻聚类包括三条新闻记录,“2011年4月1日...日本地震3月31日综述(0时-24时)关键词:新高,日本 福岛 放射性碘”、“日本大地震确认已造成11532人遇难”和“日本大地震中的‘中国援助’”,例如将排序在第一位的新闻信息记录“日本地震3月31日综述(0时-24时)关键词:新高”进行摘要处理,得到摘要“2011年4月1日...日本地震3月31日综述(0时-24时)关键词:新高,日本 福岛 放射性碘”,并将另两个关于日本地震的新闻信息记录“日本大地震确认已造成11532人遇难”、“日本大地震中的‘中国援助’”放在该新闻信息记录之后,以“日本的最新相关信息”作为标题,作为与该有关日本地震的新闻聚类相对应的新闻搜索结果。接着,提供装置13再将上述经聚类及摘要处理后的新闻搜索结果与获取装置11查询得到的查询结果“日本百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等,一起提供给用户设备2,供用户进行浏览。本领域技术人员应能理解上述对新闻信息记录进行聚类处理的方式仅为举例,其他现有的或今后可能出现的对新闻信息记录进行聚类处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图4示出根据本发明另一个方面的用于在查询结果中展现新闻信息的方法流程图。
在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果。具体地,在步骤S1中,网络设备1例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备2输入的查询序列相匹配的查询结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备2输入的查询序列,并通过网页数据库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的查询结果;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备2获取用户通过该用户设备2输入的查询序列,并通过网页数据库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的查询结果。例如,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、手写设备或语音输入设备,在浏览器软件、应用程序或客户端软件等的输入框中输入查询序列;搜索引擎通过JSP等页面技术获取到用户输入的查询序列,基于用户输入的查询序列进行匹配查询,获得与所述查询序列相匹配的查询结果;在步骤S1中,网络设备1通过调用该搜索引擎所提供的应用程序接口,从该搜索引擎中获取到所述查询结果。例如,当用户通过与用户设备2的交互,输入查询序列“日本”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“日本”的查询结果“日本 百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等;在步骤S1中,网络设备1通过与该搜索引擎的交互,获取上述查询结果“日本 百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等。本领域技术人员应能理解上述获取查询结果的方式仅为举例,其他现有的或今后可能出现的获取查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S2中,网络设备1根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录。具体地,在步骤S2中,网络设备1根据在步骤S1中所提供的用户的查询序列,通过在新闻数据库中匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录。接上例,在步骤S2中,网络设备1根据在步骤S1中通过诸如与用户设备2的交互获取到的查询序列“日本”,通过在新闻数据库中匹配查询或实时在线搜索等方式,获取到多个新闻信息记录“日本面临历史上最大危机”、“救灾神话彻底破灭日本政府光环剥落”、“日本震后29国向日本运送救灾物资中国批次最多”等。本领域技术人员应能理解上述获取新闻信息记录的方式仅为举例,其他现有的或今后可能出现的获取新闻信息记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S3中,网络设备1将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。具体地,在步骤S3中,网络设备1根据在步骤S2中查询获得的一个或多个新闻信息记录及在步骤S1中所获取的查询结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个新闻信息记录与查询结果提供给所述用户。以屏幕显示为例,在步骤S3中,网络设备1将在步骤S2中查询获得的一个或多个新闻信息记录及在步骤S1中所获取的查询结果,利用页面技术,如ASP、JSP或PHP等,随机或按一定顺序和格式,例如URL+摘要的形式提供给用户设备2,供用户进行浏览。接上例,当用户通过与用户设备2的交互,输入查询序列“日本”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“日本”的查询结果“日本 百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等,在步骤S1中,网络设备1基于与搜索引擎的交互,获取上述查询结果“日本 百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等;在步骤S2中,网络设备1根据与用户设备2的交互,获取查询序列“日本”,再通过新闻数据库匹配查询或实时在线搜索等方式,获取到多个新闻信息记录“日本面临历史上最大危机”、“救灾神话彻底破灭日本政府光环剥落”、“日本震后29国向日本运送救灾物资 中国批次最多”等;随后,在步骤S3中,网络设备1利用页面技术,如ASP、JSP或PHP等,将上述多个查询结果与新闻信息记录提供给用户设备2,供用户进行浏览。优选地,所述一个或多个新闻信息记录可以独立于所述查询结果进行展现,例如通过区别于查询结果的形式,以悬浮框、新打开的标签页或网页等方式进行展现,也可以与所述查询结果混合展现。当所述一个或多个新闻信息记录独立于所述查询结果展现,网络设备1对所述一个或多个新闻信息记录进行排序,如按照网页打分的高低进行排序,在步骤S3中,网络设备1根据排序结果,将所述一个或多个新闻信息提供给所述用户。当所述一个或多个新闻信息记录与所述查询结果混合展现,网络设备1对所述一个或多个新闻信息记录与所述查询结果进行排序,如按照网页打分的高低进行排序,在步骤S3中,网络设备1根据排序结果,将所述一个或多个新闻信息与所述查询结果提供给用户。更优选地,网络设备1对所述一个或多个新闻信息记录与第一页的查询结果进行排序,在步骤S3中,网络设备1再根据上述排序结果,将所述一个或多个新闻信息与所述查询结果提供给用户,以使新闻信息记录显示在第一页中,便于用户浏览。本领域技术人员应能理解上述提供新闻信息记录的方式仅为举例,其他现有的或今后可能出现的提供新闻信息记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,网络设备1的各个步骤之间是持续不断工作的。具体地,在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果;在步骤S2中,网络设备1根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;在步骤S3中,网络设备1将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。在此,本领域技术人员应理解“持续”是指网络设备1的各步骤分别按照设定的或实时调整的工作模式要求进行查询序列与查询结果的获取、新闻信息记录的获取、新闻信息记录与查询结果的提供,直至网络设备1在较长时间内停止获取与用户的查询序列相匹配的查询结果。
图5示出根据本发明一个优选实施例的用于在查询结果中展现新闻信息的方法流程图;其中,步骤S1’-S3’分别与图4所示对应步骤S1-S3相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
在步骤S4’中,网络设备1检测是否满足为所述用户提供新闻信息的新闻触发条件;其中,当满足所述新闻触发条件时,在步骤S2’中,网络设备1根据所述查询序列,并结合所述新闻触发条件,获取所述一个或多个新闻信息记录。具体地,在步骤S4’中,网络设备1根据在步骤S1’中所提供的查询序列,通过诸如语义分析、分词技术或库匹配查询等方式,检测是否满足为所述用户提供新闻信息的新闻触发条件,如通过与搜索引擎等第三方设备的交互,检测所述查询序列的即时搜索频度是否超过预置的新闻搜索热度阈值,或者根据分词技术、库匹配查询等,检测所述查询序列是否包含新闻需求库中的新闻特征词;当满足所述新闻触发条件时,在步骤S2’中,网络设备1根据所述查询序列,并结合所述新闻触发条件,如该查询序列中包含的新闻特征词,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录满足所述新闻触发条件所对应的要求。例如,在步骤S4’中,网络设备1通过与搜索引擎等第三方设备的交互,获取用户的查询序列的即时搜索频度,如单位时间内用户以所述查询序列进行信息搜索的累计搜索次数,当所述即时搜索频度超过预置的新闻搜索热度阈值时,即认为满足新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即所述即时搜索频度超过预置的新闻搜索热度阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻搜索热度阈值的要求。本领域技术人员应能理解,通过对新闻触发条件的检测,并且当满足该新闻触发条件时,获取并提供与所述查询序列与该新闻触发条件相对应的新闻信息记录,使得更有针对性地为用户提供其感兴趣的新闻信息,进一步满足了用户对特定新闻的需求,并改善了用户的使用体验。本领域技术人员还应能理解上述检测新闻触发条件的方式仅为举例,其他现有的或今后可能出现的检测新闻触发条件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述新闻触发条件包括以下至少任一项:
-所述查询序列包含新闻需求库中的新闻特征词;
-所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值;
-与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值;
-所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值;
-所述用户对新闻信息的累计点击数超过新闻点击阈值。
具体地,当新闻触发条件包括所述查询序列包含新闻需求库中的新闻特征词,在步骤S4’中,网络设备1根据在步骤S1’中所提供的查询序列,通过在新闻需求库中进行匹配查询,或者先对该查询序列进行分词处理得到分词处理后的查询片段,在根据这些查询片段在新闻需求库中进行匹配查询,当在该新闻需求库中匹配成功时,即所述查询序列包含新闻需求库中的新闻特征词,则认为满足为所述用户提供新闻信息的新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即所述查询序列包含新闻需求库中的新闻特征词,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还与所述查询序列所包含的新闻需求库中的新闻特征词相匹配。。在此,所述新闻需求库可以在网络设备端,也可以在与网络设备1经由网络相连接的其他产品或第三方设备端,通过与网络设备1的交互,进行库匹配查询。在所述新闻需求库中存储了大量的新闻特征词,如新闻、热点、进展或其他关于新闻内容的关键词;可以根据关于新闻页面的大量用户网络操作所获取的候选新闻特征词,建立或更新该新闻需求库。当新闻触发条件包括所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值,在步骤S4’中,网络设备1通过与搜索引擎等第三方设备的交互,获取所述查询序列的即时搜索频度,如单位时间内用户以所述查询序列进行信息搜索的累计搜索次数,当所述即时搜索频度超过预置的新闻搜索热度阈值时,即认为满足新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即所述即时搜索频度超过预置的新闻搜索热度阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻搜索热度阈值的要求。当新闻触发条件包括与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值,在步骤S4’中,网络设备1通过与搜索引擎等第三方设备的交互,获取与所述查询序列相关的新闻信息在单位时间内的新增数量,如在搜索引擎端的新闻数据库中爬虫在单位时间内新抓取的所述新闻信息的数量,当与该查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值时,即认为满足新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述第一新闻增量阈值的要求。当新闻触发条件包括所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值,在步骤S4’中,网络设备1通过与搜索引擎等第三方设备的交互,获得与该查询序列相对应的查询结果,并通过提取页面生成时间、页面来源等方式,获得相应的新闻信息及其生成时间,当满足时效阈值(如生成时间距当前时间不超过一个小时、一天、一周等)的新闻信息的数量超过第二新闻增量阈值,即认为满足新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述第二新闻增量阈值的要求。当新闻触发条件包括所述用户对新闻信息的累计点击数超过新闻点击阈值,在步骤S4’中,网络设备1通过与搜索引擎等第三方设备的交互,或者通过页面分析等方式,获取用户对新闻信息的累计点击数,当该累计点击数超过新闻点击阈值,即认为满足新闻触发条件;随后,在步骤S2’中,网络设备1根据该查询序列,并结合所述新闻触发条件,即所述用户对新闻信息的累计点击数超过新闻点击阈值,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录,其中,所述一个或多个新闻信息记录还满足所述新闻点击阈值的要求。优选地,本实施例还可以将上述新闻触发条件任意组合成新的新闻触发条件,并根据此新获取的触发条件,检测是满足为所述用户提供新闻的该触发条件,当满足该触发条件时,获取并提供与所述查询序列与该触发条件相对应的新闻信息记录。本领域技术人员应能理解上述新闻触发条件仅为举例,其他现有的或今后可能出现的新闻触发条件如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,在步骤S5’(未示出)中,网络设备1根据关于新闻页面的大量用户网络操作,获取候选新闻特征词;根据所述候选新闻特征词,建立或更新所述新闻需求库。具体地,普通用户在搜索或浏览新闻页面时,通过与用户设备2的交互,在新闻页面上进行点击、选中等用户网络操作;在步骤S5’中,网络设备1通过诸如与搜索引擎等第三方设备的交互,例如调用第三方设备所提供的应用程序接口(API),获取关于新闻页面的大量用户网络操作,并通过页面分析等方式获取候选新闻特征词,例如获取满足预置访问频度的新闻页面所对应的页面关键词,并将其作为候选新闻特征词;随后,网络设备1再根据上述候选新闻特征词,通过数据库更新等方式,建立或更新所述新闻需求库。例如,在步骤S5’中,网络设备1根据关于新闻页面的大量用户网络操作,从满足预置访问频度的新闻页面中获取“福岛”与“核电站”等页面关键词作为候选新闻特征词,并将“福岛”与“核电站”等候选新闻特征词写入所述新闻需求库,以更新所述新闻需求库。本领域技术人员应能理解上述更新新闻需求库的方式仅为举例,其他现有的或今后可能出现的更新新闻需求库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参见图4),在步骤S6(未示出)中,网络设备1对所述查询序列进行预处理,以获得预处理后的所述查询序列;其中,在步骤S2中,网络设备1根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录。以下参照图4对该另一优选实施例进行详细描述,其中,在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果,在步骤S6中,网络设备1对所述查询序列进行预处理,以获得预处理后的所述查询序列,在步骤S2中,网络设备1根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录,在步骤S3中,网络设备1将所述一个或多个新闻信息记录与所述查询结果提供给所述用户,其具体过程与前述参照图4所描述的实施例中在步骤S 1中和在步骤S3中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S6中,网络设备1根据在步骤S1中所提供的查询序列,通过诸如语义分析等方式,并通过对所述查询序列进行去除色情词、无意义的词,或进行同义或近义替换等方式,对用户的查询序列进行预处理,以获得预处理后的查询序列;随后,在步骤S2中,网络设备1再根据预处理后的查询序列,通过新闻数据库匹配查询或实时在线搜索等方式,获取与该查询序列相匹配的一个或多个新闻信息记录。例如,假设在步骤S1中,网络设备1通过与用户设备2的交互,获得用户的查询序列“日本的地震”;在步骤S6中,网络设备1对该查询序列进行预处理,将“的”去除,获得预处理后的查询序列“日本地震”;随后,在步骤S2中,网络设备1根据该预处理后的查询序列“日本地震”,获取与之相匹配的一个或多个新闻信息记录“日本地震3月31日综述(0时-24时)关键词:新高”、“日本大地震确认已造成11532人遇难”、“日本大地震中的‘中国援助’”等。本领域技术人员应能理解上述对查询序列进行预处理的方式仅为举例,其他现有的或今后可能出现的对查询序列进行预处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一个优选实施例中(参见图4),在步骤S2中,网络设备1根据所述查询序列,并结合所述用户的用户相关信息,获取所述一个或多个新闻信息记录。以下参照图4对该另一优选实施例进行详细描述,其中,在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果,在步骤S2中,网络设备1根据用户的查询序列,并结合所述用户的用户相关信息,获取与所述查询序列相匹配的一个或多个新闻信息记录,在步骤S3中,网络设备1将所述一个或多个新闻信息记录与所述查询结果提供给所述用户,其具体过程与前述参照图4所描述的实施例中在步骤S1中和在步骤S3中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S2中,网络设备1根据在步骤S1中所提供的查询序列,并结合该用户的用户相关信息,例如用户的个人属性、偏好设置、历史访问操作记录等,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如,当用户设置其更偏好军事方面的新闻信息时,在步骤S2中,网络设备1通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。在此,所述用户相关信息既可以是网络设备1独立获取的,也可以是接受来自用户设备2记录的,或者接受来自其他产品或第三方设备所获取的用户相关信息。本领域技术人员应能理解上述获取用户相关信息的方式仅为举例,其他现有的或今后可能出现的获取用户相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述用户相关信息包括以下至少任一项:
-所述用户的个人属性;
-所述用户的偏好设置;
-所述用户的历史访问操作记录。
具体地,当用户相关信息包括所述用户的个人属性,在步骤S2中,网络设备1根据用户的查询序列,并结合该用户的个人属性,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。在此,个人属性包括但不限于用户的年龄、性别、职业等。例如当用户为男性时,提供更多关于体育、军事等方面的新闻信息,当用户为女性时,提供更多关于美容、服饰等方面的新闻信息。当用户相关信息包括所述用户的偏好设置,在步骤S2中,网络设备1根据用户的偏好设置,并结合该用户的偏好设置,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如当用户设置其更偏好军事方面的新闻信息时,在步骤S2中,网络设备1通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。当用户相关信息包括所述用户的历史访问操作记录,在步骤S2中,网络设备1根据用户的查询序列,并结合该用户的历史访问操作记录,通过新闻数据库匹配查询或实时在线搜索等方式,获取与用户的查询序列相匹配的一个或多个新闻信息记录。例如当用户历史多次访问军事方面的新闻信息,则在步骤S2中,网络设备1根据该用户的查询序列,并结合该用户历史多次访问军事方面的新闻信息的历史访问操作记录,通过新闻数据库匹配查询或实时在线搜索等方式,获取更多与该用户的查询序列相匹配的军事新闻信息记录。优选地,本发明还可以将上述用户相关信息任意组成得到新的用户相关信息,据此新的用户相关信息,在步骤S2中,网络设备1根据所述查询序列,并结合该新的用户相关信息,获取所述一个或多个新闻信息记录。本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在另一优选实施例中(参见图4),在步骤S7(未示出)中,网络设备1根据预置权重规则,确定所述一个或多个新闻信息记录的优先级;其中,在步骤S3中,网络设备1根据所述优先级,将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。以下参照图4对该另一优选实施例进行详细描述,其中,在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果,在步骤S2中,网络设备1根据用户的查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录,其具体过程与前述参照图4所描述的实施例中在步骤S1中和在步骤S2中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S7中,网络设备1根据在步骤S2中所提供的一个或多个新闻信息记录,根据预置权重规则,例如根据所述新闻信息记录的时效性、查询频率、热门度、来源的可信度、与所述查询序列的匹配度等,通过诸如为所述新闻信息记录在上述各方面进行打分并分配一定的权重,根据综合的打分结果,确定所述一个或多个新闻信息记录的优先级;随后,在步骤S3中,网络设备1根据在步骤S7中所确定的优先级,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个新闻信息记录与所述查询结果提供给用户设备2,以供用户进行浏览。本领域技术人员应能理解上述确定优先级的方式仅为举例,其他现有的或今后可能出现的确定优先级的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述预置权重规则包括基于以下至少任一项来确定所述一个或多个新闻信息记录的优先级:
-所述新闻信息记录与所述查询序列的匹配度;
-所述新闻信息记录的时效性;
-所述新闻信息记录的查询频率;
-所述新闻信息记录的热门度;
-所述新闻信息记录的来源的可信度。
具体地,当预置权重规则包括基于所述新闻信息记录与所述查询序列的匹配度来确定所述一个或多个新闻信息记录的优先级,在步骤S7中,网络设备1例如通过页面分析器等方式,获取所述新闻信息记录与所述查询序列的匹配度,并根据所述匹配度,确定所述一个或多个新闻信息记录的优先级,如匹配度越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的时效性来确定所述一个或多个新闻信息记录的优先级,在步骤S7中,网络设备1例如通过与搜索引擎等第三方设备的交互,或者通过页面分析器等方式提取页面生成时间,以获得相应的新闻信息记录的生成时间,并据此获得所述新闻信息记录的时效性,例如生成时间距当前时间越近的时效性越强,再根据所述时效性,确定所述一个或多个新闻信息记录的优先级,如时效性越强的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的查询频率来确定所述一个或多个新闻信息记录的优先级,在步骤S7中,网络设备1例如通过与搜索引擎等第三方设备的交互,获得所述新闻信息记录的查询频率,并根据所述查询频率,确定所述一个或多个新闻信息记录的优先级,如查询频率越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的热门度来确定所述一个或多个新闻信息记录的优先级,在步骤S7中,网络设备1例如通过与搜索引擎等第三方设备的交互,获得所述新闻信息记录的热门度,如通过该新闻信息记录的转载数、转载速度(转载数除以时间)等确定其热门度,并根据所述热门度,确定所述一个或多个新闻信息记录的优先级,如热门度越高的新闻信息记录的优先级越高。当预置权重规则包括基于所述新闻信息记录的来源的可信度来确定所述一个或多个新闻信息记录的优先级,在步骤S7中,网络设备1例如通过与搜索引擎等第三方设备的交互,获取用户的反馈信息或者根据网站的权威度来确定所述新闻信息记录的来源的可信度,并根据所述来源的可信度,确定所述一个或多个新闻信息记录的优先级,如来源的可信度越高的新闻信息记录的优先级越高。优选地,在步骤S7中,网络设备1根据基于上述任意多种因素的预置权重规则,来确定所述一个或多个新闻信息记录的优先级,例如通过为所述新闻信息记录在上述各方面进行打分并分配一定的权重,根据综合的打分结果,确定所述一个或多个新闻信息记录的优先级。本领域技术人员应能理解上述预置权重规则仅为举例,其他现有的或今后可能出现的预置权重规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一优选实施例中(参见图4),在步骤S8(未示出)中,网络设备1对所述一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;其中,在步骤S3中,网络设备1将所述新闻搜索结果与所述查询结果提供给所述用户。以下参照图4对该又一优选实施例进行详细描述,其中,在步骤S1中,网络设备1获取与用户的查询序列相匹配的查询结果,在步骤S2中,网络设备1根据用户的查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录,其具体过程与前述参照图4所描述的实施例中在步骤S1中和在步骤S2中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S8中,网络设备1根据在步骤S2中所提供的一个或多个新闻信息记录,例如通过对该一个或多个新闻信息记录所对应的网页进行页面分析并采取关键词提取、段落提取等方式,对该一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;随后,在步骤S3中,网络设备1采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述新闻搜索结果与所述查询结果提供给所述用户。在此,在步骤S8中,网络设备1既可以对所述一个或多个新闻信息记录全部进行摘要处理,也可只对其中的部分新闻信息记录进行摘要处理,如只对排序在第一位的新闻信息记录进行摘要处理,其余的新闻信息记录则以标题+URL的形式进行展现。本领域技术人员应能理解上述对新闻信息记录进行摘要处理的方式仅为举例,其他现有的或今后可能出现的对新闻信息记录进行摘要处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述新闻搜索结果可以独立于所述查询结果进行展现,例如通过区别于查询结果的形式,以悬浮框、新打开的标签页或网页等方式进行展现,也可以与所述查询结果混合展现。当所述新闻搜索结果独立于所述查询结果展现,网络设备1对所述新闻搜索结果进行排序,如按照网页打分的高低进行排序,在步骤S3中,网络设备1根据排序结果,将所述新闻搜索结果提供给所述用户。当所述新闻搜索结果与所述查询结果混合展现,网络设备1对所述新闻搜索结果与所述查询结果进行排序,如按照网页打分的高低进行排序,在步骤S3中,网络设备1根据排序结果,将所述新闻搜索结果与所述查询结果提供给用户。更优选地,网络设备1对所述新闻搜索结果与第一页的查询结果进行排序,在步骤S3中,网络设备1再根据上述排序结果,将所述新闻搜索结果与所述查询结果提供给用户,以使新闻搜索结果显示在第一页中,便于用户浏览。本领域技术人员应能理解上述提供新闻搜索结果与查询结果的方式仅为举例,其他现有的或今后可能出现的提供新闻搜索结果与查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤S8中,网络设备1对所述一个或多个新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;对所述一个或多个新闻聚类中至少一个进行摘要处理,以获得所述新闻搜索结果。具体地,在步骤S8中,网络设备1根据在步骤S2中查询获得的一个或多个新闻信息记录,例如通过对该一个或多个新闻信息记录所对应的网页进行页面分析,通过划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-basedmethods)、基于模型的方法(Model-Based MethodsK-MEANS算法等,将相似或相同主题的新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;随后,在步骤S8中,网络设备1再根据所述新闻聚类中所对应的新闻信息记录,通过对其所对应的网页进行页面分析并采取关键词提取、段落提取等方式,对该新闻聚类进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果。例如,假设在步骤S1中,网络设备1通过与用户设备2的交互,获得的用户的查询序列为“日本”,在步骤S2中,网络设备1根据该查询序列进行匹配查询,获得的一个或多个新闻信息记录包括有关日本地震的新闻信息记录、有关日本的核辐射的新闻信息记录、有关日本海啸的新闻信息记录等;随后,在步骤S8中,网络设备1根据对上述多个新闻信息记录所对应的网页进行页面分析,对其进行聚类处理,分别得到有关地震的新闻聚类、有关核辐射的新闻聚类以及有关海啸的新闻聚类;随后,在步骤S8中,网络设备1再对上述至少一个新闻聚类进行摘要处理,例如对有关日本地震的新闻聚类进行摘要处理,假设该有关日本地震的新闻聚类包括三条新闻记录,“2011年4月1日...日本地震3月31日综述(0时-24时)关键词:新高,日本 福岛 放射性碘”、“日本大地震确认已造成11532人遇难”和“日本大地震中的‘中国援助’”,例如将排序在第一位的新闻信息记录“日本地震3月31日综述(0时-24时)关键词:新高”进行摘要处理,得到摘要“2011年4月1日...日本地震3月31日综述(0时-24时)关键词:新高,日本 福岛 放射性碘”,并将另两个关于日本地震的新闻信息记录“日本大地震确认已造成11532人遇难”、“日本大地震中的‘中国援助’”放在该新闻信息记录之后,以“日本的最新相关信息”作为标题,作为与该有关日本地震的新闻聚类相对应的新闻搜索结果。接着,在步骤S3中,网络设备1再将上述经聚类及摘要处理后的新闻搜索结果与在步骤S1中查询得到的查询结果“日本 百度百科”、“日本概况”、“日本震后潜在需求支撑农产品坚挺”等,一起提供给用户设备2,供用户进行浏览。本领域技术人员应能理解上述对新闻信息记录进行聚类处理的方式仅为举例,其他现有的或今后可能出现的对新闻信息记录进行聚类处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (22)
1.一种计算机实现的用于在查询结果中提供新闻信息的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相匹配的查询结果;
b根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;
c将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
2.根据权利要求1所述的方法,其中,该方法还包括:
Z检测是否满足为所述用户提供新闻信息的新闻触发条件;
其中,所述步骤b还包括:
-当满足所述新闻触发条件时,根据所述查询序列,并结合所述新闻触发条件,获取所述一个或多个新闻信息记录。
3.根据权利要求2所述的方法,其中,所述新闻触发条件包括以下至少任一项:
-所述查询序列包含新闻需求库中的新闻特征词;
-所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值;
-与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值;
-所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值;
-所述用户对新闻信息的累计点击数超过新闻点击阈值。
4.根据权利要求3所述的方法,其中,该方法还包括:
-根据关于新闻页面的大量用户网络操作,获取候选新闻特征词;
-根据所述候选新闻特征词,建立或更新所述新闻需求库。
5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括:
-对所述查询序列进行预处理,以获得预处理后的所述查询序列;
其中,所述步骤b还包括:
-根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤b还包括:
-根据所述查询序列,并结合所述用户的用户相关信息,获取所述一个或多个新闻信息记录。
7.根据权利要求6所述的方法,其中,所述用户相关信息包括以下至少任一项:
-所述用户的个人属性;
-所述用户的偏好设置;
-所述用户的历史访问操作记录。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:
-根据预置权重规则,确定所述一个或多个新闻信息记录的优先级;
其中,所述步骤c还包括:
-根据所述优先级,将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
9.根据权利要求8所述的方法,其中,所述预置权重规则包括基于以下至少任一项来确定所述一个或多个新闻信息记录的优先级:
-所述新闻信息记录与所述查询序列的匹配度;
-所述新闻信息记录的时效性;
-所述新闻信息记录的查询频率;
-所述新闻信息记录的热门度;
-所述新闻信息记录的来源的可信度。
10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括:
r对所述一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;
其中,所述步骤c还包括:
-将所述新闻搜索结果与所述查询结果提供给所述用户。
11.根据权利要求10所述的方法,其中,所述步骤r还包括:
-对所述一个或多个新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;
-对所述一个或多个新闻聚类中至少一个进行摘要处理,以获得所述新闻搜索结果。
12.一种用于在查询结果中提供新闻信息的网络设备,其中,该设备包括:
获取装置,用于获取与用户的查询序列相匹配的查询结果;
查询装置,用于根据所述查询序列,获取与所述查询序列相匹配的一个或多个新闻信息记录;
提供装置,用于将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
13.根据权利要求12所述的网络设备,其中,该设备还包括:
检测装置,用于检测是否满足为所述用户提供新闻信息的新闻触发条件;
其中,所述查询装置还用于:
-当满足所述新闻触发条件时,根据所述查询序列,并结合所述新闻触发条件,获取所述一个或多个新闻信息记录。
14.根据权利要求13所述的网络设备,其中,所述新闻触发条件包括以下至少任一项:
-所述查询序列包含新闻需求库中的新闻特征词;
-所述查询序列的即时搜索频度超过预置的新闻搜索热度阈值;
-与所述查询序列相关的新闻信息在单位时间内的新增数量超过第一新闻增量阈值;
-所述查询结果中满足时效阈值的新闻信息的数量超过第二新闻增量阈值;
-所述用户对新闻信息的累计点击数超过新闻点击阈值。
15.根据权利要求14所述的网络设备,其中,该设备还包括更新装置,用于:
-根据关于新闻页面的大量用户网络操作,获取候选新闻特征词;
-根据所述候选新闻特征词,建立或更新所述新闻需求库。
16.根据权利要求12至15中任一项所述的网络设备,其中,该设备还包括:
预处理装置,用于对所述查询序列进行预处理,以获得预处理后的所述查询序列;
其中,所述查询装置还用于:
-根据所述预处理后的查询序列,获取与所述预处理后的查询序列相匹配的一个或多个新闻信息记录。
17.根据权利要求12至16中任一项所述的网络设备,其中,所述查询装置还用于:
-根据所述查询序列,并结合所述用户的用户相关信息,获取所述一个或多个新闻信息记录。
18.根据权利要求17所述的网络设备,其中,所述用户相关信息包括以下至少任一项:
-所述用户的个人属性;
-所述用户的偏好设置;
-所述用户的历史访问操作记录。
19.根据权利要求12至18中任一项所述的网络设备,其中,该设备还包括:
优先级确定装置,用于根据预置权重规则,确定所述一个或多个新闻信息记录的优先级;
其中,所述提供装置还用于:
-根据所述优先级,将所述一个或多个新闻信息记录与所述查询结果提供给所述用户。
20.根据权利要求19所述的网络设备,其中,所述预置权重规则包括基于以下至少任一项来确定所述一个或多个新闻信息记录的优先级:
-所述新闻信息记录与所述查询序列的匹配度;
-所述新闻信息记录的时效性;
-所述新闻信息记录的查询频率;
-所述新闻信息记录的热门度;
-所述新闻信息记录的来源的可信度。
21.根据权利要求12至20中任一项所述的网络设备,其中,该设备还包括:
摘要处理装置,用于对所述一个或多个新闻信息记录进行摘要处理,以获得与所述一个或多个新闻信息记录相对应的新闻搜索结果;
其中,所述提供装置还用于:
-将所述新闻搜索结果与所述查询结果提供给所述用户。
22.根据权利要求21所述的网络设备,其中,所述摘要处理装置还用于:
-对所述一个或多个新闻信息记录进行聚类处理,以获得一个或多个新闻聚类,其中,所述新闻聚类包括一个或多个所述新闻信息记录;
-对所述一个或多个新闻聚类中至少一个进行摘要处理,以获得所述新闻搜索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110183562 CN102236710A (zh) | 2011-06-30 | 2011-06-30 | 一种用于在查询结果中展现新闻信息的方法与设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110183562 CN102236710A (zh) | 2011-06-30 | 2011-06-30 | 一种用于在查询结果中展现新闻信息的方法与设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102236710A true CN102236710A (zh) | 2011-11-09 |
Family
ID=44887356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110183562 Pending CN102236710A (zh) | 2011-06-30 | 2011-06-30 | 一种用于在查询结果中展现新闻信息的方法与设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102236710A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663054A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种确定网站权重的方法及装置 |
CN102831192A (zh) * | 2012-08-03 | 2012-12-19 | 人民搜索网络股份公司 | 基于话题的新闻检索装置及方法 |
CN103077217A (zh) * | 2012-12-28 | 2013-05-01 | 北京百度网讯科技有限公司 | 用于提供与查询序列相匹配的结果附加信息的方法、装置与设备 |
CN103365858A (zh) * | 2012-03-28 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 基于一查询序列由多个源设备获取搜索结果的方法与设备 |
CN103475676A (zh) * | 2012-06-06 | 2013-12-25 | 百度在线网络技术(北京)有限公司 | 一种用于提供页面主体信息的方法、装置、设备和系统 |
CN104361109A (zh) * | 2014-11-27 | 2015-02-18 | 北京奇虎科技有限公司 | 确定图片筛选结果的方法和装置 |
CN104462259A (zh) * | 2014-11-21 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 一种用于提供时效性图片搜索结果的方法与设备 |
CN104462282A (zh) * | 2014-11-26 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 信息搜索方法和装置 |
CN104572977A (zh) * | 2014-12-31 | 2015-04-29 | 北京农业信息技术研究中心 | 一种农产品质量安全事件在线检测方法 |
CN104899201A (zh) * | 2014-03-04 | 2015-09-09 | 腾讯科技(北京)有限公司 | 文本提取方法、敏感词判定方法、装置和服务器 |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
CN107408122A (zh) * | 2015-02-25 | 2017-11-28 | 微软技术许可有限责任公司 | 新鲜因特网内容的有效检索 |
CN109697258A (zh) * | 2018-12-27 | 2019-04-30 | 丹翰智能科技(上海)有限公司 | 一种用于确定目标用户的定制财经信息的方法与设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1918568A (zh) * | 2003-12-31 | 2007-02-21 | Google公司 | 通用搜索引擎接口 |
CN101241512A (zh) * | 2008-03-10 | 2008-08-13 | 北京搜狗科技发展有限公司 | 一种重新定义查询词的搜索方法及装置 |
CN101246498A (zh) * | 2008-03-27 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 一种新闻网页的搜索方法 |
CN101446959A (zh) * | 2008-12-30 | 2009-06-03 | 深圳市迅雷网络技术有限公司 | 一种基于互联网的新闻推荐方法和系统 |
US20100293178A1 (en) * | 2009-05-14 | 2010-11-18 | Microsoft Corporation | Providing tools for navigational search query results |
-
2011
- 2011-06-30 CN CN 201110183562 patent/CN102236710A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1918568A (zh) * | 2003-12-31 | 2007-02-21 | Google公司 | 通用搜索引擎接口 |
CN101241512A (zh) * | 2008-03-10 | 2008-08-13 | 北京搜狗科技发展有限公司 | 一种重新定义查询词的搜索方法及装置 |
CN101246498A (zh) * | 2008-03-27 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 一种新闻网页的搜索方法 |
CN101446959A (zh) * | 2008-12-30 | 2009-06-03 | 深圳市迅雷网络技术有限公司 | 一种基于互联网的新闻推荐方法和系统 |
US20100293178A1 (en) * | 2009-05-14 | 2010-11-18 | Microsoft Corporation | Providing tools for navigational search query results |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365858B (zh) * | 2012-03-28 | 2017-11-03 | 百度在线网络技术(北京)有限公司 | 基于一查询序列由多个源设备获取搜索结果的方法与设备 |
CN103365858A (zh) * | 2012-03-28 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 基于一查询序列由多个源设备获取搜索结果的方法与设备 |
CN102663054B (zh) * | 2012-03-29 | 2015-08-12 | 天津奇思科技有限公司 | 一种确定网站权重的方法及装置 |
CN102663054A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种确定网站权重的方法及装置 |
CN103475676A (zh) * | 2012-06-06 | 2013-12-25 | 百度在线网络技术(北京)有限公司 | 一种用于提供页面主体信息的方法、装置、设备和系统 |
CN103475676B (zh) * | 2012-06-06 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 一种用于提供页面主体信息的方法、装置、设备和系统 |
CN102831192A (zh) * | 2012-08-03 | 2012-12-19 | 人民搜索网络股份公司 | 基于话题的新闻检索装置及方法 |
CN103077217A (zh) * | 2012-12-28 | 2013-05-01 | 北京百度网讯科技有限公司 | 用于提供与查询序列相匹配的结果附加信息的方法、装置与设备 |
CN104899201B (zh) * | 2014-03-04 | 2019-05-14 | 腾讯科技(北京)有限公司 | 文本提取方法、敏感词判定方法、装置和服务器 |
CN104899201A (zh) * | 2014-03-04 | 2015-09-09 | 腾讯科技(北京)有限公司 | 文本提取方法、敏感词判定方法、装置和服务器 |
CN104462259A (zh) * | 2014-11-21 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 一种用于提供时效性图片搜索结果的方法与设备 |
CN104462259B (zh) * | 2014-11-21 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 一种用于提供时效性图片搜索结果的方法与设备 |
CN104462282B (zh) * | 2014-11-26 | 2018-05-08 | 百度在线网络技术(北京)有限公司 | 信息搜索方法和装置 |
CN104462282A (zh) * | 2014-11-26 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 信息搜索方法和装置 |
CN104361109A (zh) * | 2014-11-27 | 2015-02-18 | 北京奇虎科技有限公司 | 确定图片筛选结果的方法和装置 |
CN104572977B (zh) * | 2014-12-31 | 2017-09-29 | 北京农业信息技术研究中心 | 一种农产品质量安全事件在线检测方法 |
CN104572977A (zh) * | 2014-12-31 | 2015-04-29 | 北京农业信息技术研究中心 | 一种农产品质量安全事件在线检测方法 |
CN107408122A (zh) * | 2015-02-25 | 2017-11-28 | 微软技术许可有限责任公司 | 新鲜因特网内容的有效检索 |
CN107408122B (zh) * | 2015-02-25 | 2021-05-14 | 微软技术许可有限责任公司 | 用于新鲜因特网内容的有效检索的介质和方法 |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
CN109697258A (zh) * | 2018-12-27 | 2019-04-30 | 丹翰智能科技(上海)有限公司 | 一种用于确定目标用户的定制财经信息的方法与设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102236710A (zh) | 一种用于在查询结果中展现新闻信息的方法与设备 | |
CN101957834B (zh) | 一种基于用户特征进行内容推荐的方法与设备 | |
CN107145496B (zh) | 基于关键词将图像与内容项目匹配的方法 | |
CA2871125C (en) | Social media profiling | |
CN102169503B (zh) | 一种获取与用户查询序列相对应的搜索结果的方法与设备 | |
CN101984420B (zh) | 一种基于拆词处理进行图片搜索的方法与设备 | |
CN102346778B (zh) | 一种用于提供搜索结果的方法与设备 | |
CN101986306B (zh) | 一种用于基于查询序列获取黄页信息的方法与设备 | |
US10402479B2 (en) | Method, server, browser, and system for recommending text information | |
CN103440286A (zh) | 一种基于搜索结果来提供推荐信息的方法及装置 | |
CN103631794A (zh) | 一种用于对搜索结果进行排序的方法、装置与设备 | |
CN102855261A (zh) | 一种用于确定视频权威值的方法与设备 | |
CN102184185A (zh) | 一种用于多媒体资源搜索的方法与设备 | |
CN102663088A (zh) | 一种用于提供搜索结果的方法与设备 | |
CN102708174A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN102004772A (zh) | 一种用于根据检索词进行搜索结果排序的方法及设备 | |
CN106980651B (zh) | 一种基于知识图谱的爬取种子列表更新方法及装置 | |
CN107463592B (zh) | 用于将内容项目与图像匹配的方法、设备和数据处理系统 | |
CN101963979A (zh) | 一种用于基于云计算提供搜索建议的方法与设备 | |
CN102420813A (zh) | 一种根据用户设备的终端属性提供目标信息的方法与设备 | |
WO2016078533A1 (zh) | 搜索方法、装置、设备及非易失性计算机存储介质 | |
CN103064842B (zh) | 信息订阅处理装置和信息订阅处理方法 | |
CN102063468B (zh) | 一种用于确定查询序列的查询类别的设备及其方法 | |
US20130212105A1 (en) | Information processing apparatus, information processing method, and program | |
US10127322B2 (en) | Efficient retrieval of fresh internet content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20111109 |