CN1647073B - 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法 - Google Patents

信息搜索系统、信息处理设备和方法、及信息搜索设备和方法 Download PDF

Info

Publication number
CN1647073B
CN1647073B CN038075075A CN03807507A CN1647073B CN 1647073 B CN1647073 B CN 1647073B CN 038075075 A CN038075075 A CN 038075075A CN 03807507 A CN03807507 A CN 03807507A CN 1647073 B CN1647073 B CN 1647073B
Authority
CN
China
Prior art keywords
information
literal
program
interest
programme information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN038075075A
Other languages
English (en)
Other versions
CN1647073A (zh
Inventor
山本则行
斋藤真里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1647073A publication Critical patent/CN1647073A/zh
Application granted granted Critical
Publication of CN1647073B publication Critical patent/CN1647073B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4143Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a Personal Computer [PC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/165Centralised control of user terminal ; Registering at central
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Abstract

用于推荐与用户兴趣相对应的节目信息的信息搜索系统、信息处理设备和方法、及信息搜索设备和方法。PC从用户发送/接收的邮件文档中提取与用户兴趣相对应的文字并记录兴趣数据。在S121和S122中,当用户进行登录时,HDD记录器请求获取兴趣数据,并根据这个请求,PC发送与登录用户相对应的兴趣数据。在S123和S124中,HDD记录器将接收的兴趣数据发送到服务器。在S131中,服务器搜索和发送与接收的兴趣数据匹配的节目信息。在S125中,HDD记录器根据包含在搜索结果中的节目信息来设置节目定时记录。本发明可应用于安装在个人计算机中的程序。

Description

信息搜索系统、信息处理设备和方法、及信息搜索设备和方法
技术领域
本发明总体上涉及信息搜索系统、信息处理设备和方法、及信息搜索设备和方法,更具体地说,涉及从诸如电子邮件之类的文档中获取用户感兴趣文字并推荐与这些文字相关联的节目信息的信息搜索系统、信息处理设备和方法、及信息搜索设备和方法。
背景技术
已知推荐电视节目和无线电节目的方法有,例如,最初兴趣登记、观看日志使用、和强调过滤。
在这些方法的每一种中,源数据是EPG(电子节目指南)信息或在例如万维网上的节目信息(节目元数据)。将方法分类成如上所述的三种取决于如何获得将与这些信息段相匹配的用户喜好数据的方法。
在最初兴趣登记方法中,用户在开始使用推荐服务的时候登记,例如,用户喜欢类别(像,例如,戏剧和杂艺之类)、喜欢类型名(像,例如,戏剧和音乐之类)、和喜欢艺人名。随后,通过将登记的信息用作关键字来与节目元数据进行匹配,从而获取要推荐的节目名。
在观看日志使用方法中,每当用户观看节目时,积累有关每个观看节目的节目元数据,并且,当观看日志(或节目元数据)积累到预定数量时,对积累的观看日志加以分析,以获取要推荐的节目名。对于将视频记录到,例如,该设备的硬盘驱动器上的设备,可以使用,例如由用户进行的、像定时视频记录和启动视频记录之类的操作日志,取代如上所述的观看日志。在这种情况下,可以获得高度反映用户兴趣的信息,而不是模糊的节目信息。
在强调过滤方法中,将一个用户的观看(或操作)日志与其他用户的观看日志相匹配,以获取与有关该用户的观看日志相似的其他用户的观看日志。然后,从在观看日志方面与有关该用户的观看相似(即,在喜好上相似)的其他用户观看的节目当中,获取有关该用户还没有观看过的那些节目名加以推荐。
上述已知节目推荐方法的使用使每个用户似乎感兴趣的节目得到推荐。
但是,上述已知推荐方法的每一种总归要从节目元数据中提取用户的兴趣(即,导致电视节目中侧重兴趣的获取)。并且,在节目元数据的结构中,这些方法的每一种一般使用易懂节目名,从而出现听起来相似的节目被推荐的问题。
也就是说,上述已知推荐方法的每一种不能反映用户每天对节目的兴趣,从而未能推荐适时和有用的节目。
同时,这些方法的每一种还出现了当推荐特定节目时,用户不能明白推荐理由的问题。
发明内容
因此,本发明的目的是分析每个用户日常使用的电子邮件,提取与用户兴趣相对应的文字,搜索与所提取文字相匹配的节目名,推荐匹配节目,和展示推荐理由。
根据本发明的第一信息搜索系统的特征在于,它包括含有如下装置的信息处理设备:提取装置,用于分析预定信息,以提取用于获取有关节目的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置来接收来自信息搜索设备的节目信息;和含有如下装置的信息搜索设备:积累装置,用于积累节目信息;搜索装置,用于根据从信息处理设备发送的搜索请求,从积累装置中搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和发送装置,用于将搜索装置检索的节目信息发送到信息处理设备。
信息处理设备的提取装置可以包括形态分析装置,用于对预定信息进行形态分析,以便将预定信息分解成兴趣文字。
信息处理设备还可以包括数据库构造装置,用于生成提取装置提取的兴趣文字的数据库。
信息处理设备还可以包括记录控制装置,用于根据接收装置接收的节目信息控制节目的记录。
信息处理设备还可以包括显示控制装置,用于控制接收装置接收的节目信息的显示。
信息搜索设备的积累装置可以包括数据库构造装置,用于通过将节目信息与节目相关联来构成数据库。
预定信息可以包括文档信息、与节目相关联的喜好信息、和节目的观看日志中的至少一个。
文档信息可以是电子邮件。
节目信息可以包括记录节目的记录开始时间、记录结束时间、和信道信息。
信息处理设备可以从另一个信息处理设备中获取预定信息。
根据本发明的第一信息处理设备的特征在于,它包括:提取装置,用于分析预定信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置来接收来自信息搜索设备的节目信息。
提取装置可以包括形态分析装置,用于对预定信息进行形态分析,以便将预定信息分解成兴趣文字。
信息处理设备还可以包括数据库构造装置,用于生成提取装置提取的兴趣文字的数据库。
信息处理设备还可以包括记录控制装置,用于根据接收装置接收的节目信息控制节目的记录。
信息处理设备还可以包括显示控制装置,用于控制接收装置接收的节目信息的显示。
预定信息可以包括文档信息、与节目相关联的喜好信息、和节目的观看日志中的至少一个。
文档信息可以是电子邮件。
节目信息可以包括记录节目的记录开始时间、记录结束时间、和信道信息。
预定信息可以从另一个信息处理设备中获取。
根据本发明的第一信息处理方法的特征在于,它包括:提取步骤,用于分析预定信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第一记录媒体的特征在于,它记录包括如下步骤的程序:提取步骤,用于分析预定信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第一程序使计算机执行:提取步骤,用于分析预定信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第一信息搜索设备的特征在于,它包括:积累装置,用于积累与节目相关联的节目信息;接收装置,用于接收用于获取节目信息的兴趣文字,即,从信息处理设备发送的兴趣文字;搜索装置,用于从积累装置中搜索与接收装置接收的兴趣文字相关联的节目信息;和发送装置,用于将搜索装置检索的节目信息发送到信息处理设备。
兴趣文字可以是通过在信息处理设备上对预定信息进行形态分析而获得的文字。
节目信息可以包含记录节目的记录开始时间、记录结束时间、和信息信息。
第一信息搜索设备还可以包括:分析装置,用于分析节目信息;词典生成装置,用于根据分析装置的分析结果来生成用于将节目信息的类型与关键字相关联的词典数据;和数据库生成装置,用于根据词典生成装置生成的词典数据来将类型指定给节目信息并存储带有类型的节目信息。
信息搜索设备还可以包括关键字搜索装置,用于从兴趣文字中提取关键字,通过根据关键字来搜索词典数据以获取与关键字相对应的类型,和根据类型搜索节目信息。
词典生成装置可以含有关键字检测装置,用于从包括在元数据中的文字中检测同现在特定类型的元数据中频次高的文字,作为该类型的关键字。
词典生成装置可以通过与关键字一起存储检测到该关键字的频次来生成词典数据。
数据库生成装置可以根据包含在节目信息中的组成成份来补充未包括在节目信息中的组成成份。
根据本发明的第一信息搜索方法的特征在于,它包括:积累控制步骤,用于控制与节目相关联的节目信息的积累;接收控制步骤,用于控制用于获取节目信息的兴趣文字的接收,即,从信息处理设备发送的兴趣文字的接收;搜索步骤,用于搜索与接收控制步骤接收的兴趣文字相关联的节目信息;和发送控制步骤,用于控制发送搜索步骤检索的节目信息到信息处理设备。
根据本发明的第二记录媒体的特征在于,它记录包括如下步骤的程序:积累控制步骤,用于控制与节目相关联的节目信息的积累;接收控制步骤,用于控制用于获取节目信息的兴趣文字的接收,即,从信息处理设备发送的兴趣文字的接收;搜索步骤,用于搜索与接收控制步骤接收的兴趣文字相关联的节目信息;和发送控制步骤,用于控制发送搜索步骤检索的节目信息到信息处理设备。
根据本发明的第二程序使计算机执行:积累控制步骤,用于控制与节目相关联的节目信息的积累;接收控制步骤,用于控制用于获取节目信息的兴趣文字的接收,即,从信息处理设备发送的兴趣文字的接收;搜索步骤,用于搜索与接收控制步骤接收的兴趣文字相关联的节目信息;和发送控制步骤,用于控制发送搜索步骤检索的节目信息到信息处理设备。
根据本发明的第二信息搜索系统的特征在于,它包括含有如下装置的移动终端设备:生成装置,用于生成定时记录节目的定时记录信息;和第一发送装置,用于将生成装置生成的定时记录信息发送到信息处理设备;含有如下装置的信息处理设备:提取装置,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置来接收来自信息搜索设备的节目信息;和含有如下装置的信息搜索设备:积累装置,用于积累节目信息;搜索装置,用于根据从信息处理设备发送的搜索请求,从积累装置中搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和第二发送装置,用于将搜索装置检索的节目信息发送到信息处理设备。
提取装置可以包括形态分析装置,用于对预定信息进行形态分析,以便将预定信息分解成兴趣文字。
信息处理设备还可以包括记录控制装置,用于根据接收装置接收的节目信息来控制节目的记录。
信息搜索设备的积累装置可以包括数据库构造装置,用于通过将节目信息与节目相关联来生成数据库。
定时记录信息可以包括节目名、类型名、和演员名中的至少一个。
定时记录信息可以是电子邮件。
节目信息可以包含记录节目的记录开始时间、记录结束时间、和信道信息。
根据本发明的第二信息处理设备的特征在于,它包括:提取装置,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置来接收来自信息搜索设备的节目信息。
提取装置可以包括形态分析装置,用于对预定信息进行形态分析,以便将预定信息分解成兴趣文字。
信息处理设备还可以包括记录控制装置,用于根据接收装置接收的节目信息来控制节目的记录。
定时记录信息可以包括节目名、类型名、和演员名中的至少一个。
定时记录信息可以是电子邮件。
节目信息可以包含记录节目的记录开始时间、记录结束时间、和信道信息。
根据本发明的第二信息处理方法的特征在于,它包括:提取步骤,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第三记录媒体的特征在于,它记录包括如下步骤的程序:提取步骤,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第三程序使计算机执行:提取步骤,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤来控制来自信息搜索设备的节目信息的接收。
根据本发明的第三信息搜索系统的特征在于,它包括含有如下装置的信息处理设备:提取装置,用于分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置的搜索请求来接收来自信息搜索设备的节目信息;和含有如下装置的信息搜索设备:积累装置,用于积累节目信息;搜索装置,用于根据从信息处理设备发送的搜索请求,从积累装置中搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和发送装置,用于将搜索装置检索的节目信息发送到信息处理设备。
根据本发明的第三信息处理设备的特征在于,它包括:提取装置,用于分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求装置,用于将提取装置提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收装置,用于根据搜索请求装置的搜索请求来接收来自信息搜索设备的节目信息。
根据本发明的第三信息处理方法的特征在于,它包括:提取步骤,用于分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据通过搜索请求步骤的搜索请求来控制来自信息搜索设备的节目信息的接收。
根据本发明的第四记录媒体的特征在于,它记录包括如下步骤的程序:提取步骤,用于分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤的搜索请求来控制来自信息搜索设备的节目信息的接收。
根据本发明的第四程序使计算机执行:提取步骤,用于分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;搜索请求步骤,用于将提取步骤提取的兴趣文字发送到信息搜索设备,以请求搜索与兴趣文字相对应的节目信息;和接收控制步骤,用于根据搜索请求步骤的搜索请求来控制来自信息搜索设备的节目信息的接收。
在根据本发明的第一信息搜索系统中,信息处理设备分析预定信息,以提取用于获取有关节目的节目信息的兴趣文字;请求搜索与提取的兴趣文字相对应的节目信息;和根据搜索请求来接收来自信息搜索设备的节目信息;信息搜索设备根据从信息处理设备发送的搜索请求,搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和将检索的节目信息发送到信息处理设备。
在根据本发明的第一信息处理设备和方法,以及程序中,分析预定信息并提取兴趣文字以获取与节目相关联的节目信息;请求与提取的兴趣文字相对应的节目信息的搜索;根据搜索请求接收来自信息搜索设备的节目信息。
在根据本发明的信息搜索设备和方法、以及第二程序中,接收用于获取已经从信息处理设备发送的节目信息的兴趣文字;搜索与兴趣文字相关联的接收的节目信息;将检索的节目信息发送到信息处理设备。
在根据本发明的第二信息搜索系统中,移动终端设备生成定时记录节目的定时记录信息;和将定时记录信息发送到信息处理设备;信息处理设备分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字;请求搜索与兴趣文字相对应的节目信息;和根据搜索请求来接收来自信息搜索设备的节目信息;信息搜索设备根据从信息处理设备发送的搜索请求,搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和将检索的节目信息发送到信息处理设备。
在根据本发明的第二信息处理设备和方法、以及第三程序中,分析从移动终端设备发送的定时记录信息并提取兴趣文字以获取与节目相关联的节目信息;请求搜索与提取的兴趣文字相对应的节目信息;和根据搜索请求来接收来自信息搜索设备的节目信息。
在根据本发明的第三信息搜索系统中,信息处理设备分析电子邮件,以提取用于获取与节目相关联的节目信息的兴趣文字;请求搜索与兴趣文字相对应的节目信息;和根据搜索请求来接收来自信息搜索设备的节目信息;信息搜索设备根据从信息处理设备发送的搜索请求,搜索与包含在搜索请求中的兴趣文字相关联的节目信息;和将检索的节目信息发送到信息处理设备。
在根据本发明的第三信息处理设备和方法、以及第四程序中,分析电子邮件并提取兴趣文字以获取与节目相关联的节目信息;请求搜索与提取的兴趣文字相对应的节目信息;和根据搜索请求来接收来自信息搜索设备的节目信息。
附图说明
图1是例示应用本发明的节目搜索系统的示例性配置的示意图;
图2是例示在如图1所示的个人计算机上运行的代理器程序的功能的方块图;
图3是例示安装和执行上述代理器程序的个人计算机的示例性配置的方块图;
图4是例示HDD(硬盘驱动器)记录器的示例性配置的方块图;
图5是例示如图1所示的服务器的服务器程序的功能的方块图;
图6是例示安装和执行服务器程序的服务器的示例性配置的方块图;
图7是指示代理器程序进行的数据库生成处理的流程图;
图8是指示如图7所示的步骤S1的处理的流程图;
图9是指示如图8所示的步骤S22的处理的流程图;
图10是例示论题文件的一个例子的示意图;
图11是例示包括在构成文字矢量的数个文字中的元素的示意图;
图12是指示如图7所示的步骤S3的处理的流程图;
图13是指示如图7所示的步骤S4的处理的流程图;
图14是例示论题文字表的示例性配置的示意图;
图15是例示文字索引表的示例性配置的示意图;
图16是例示论题评估值表的示例性配置的示意图;
图17是指示如图7所示的步骤S5的处理的流程图;
图18是指示如图7所示的步骤S9的处理的流程图;
图19是指示如图7所示的步骤S10的处理的流程图;
图20是例示兴趣数据的一个例子的示意图;
图21是指示数据库更新处理的流程图;
图22示出了通过其输入数据库更新条件的用户界面的示例性显示;
图23是指示服务器程序进行的数据库生成处理的流程图;
图24是例示节目元数据的一个例子的示意图;
图25是指示节目信息搜索处理的流程图;
图26是指示节目推荐理由展示处理的流程图;
图27示出了推荐理由的示例性显示;
图28示出了另一个推荐理由的示例性显示;
图29是指示节目信息搜索处理的流程图;
图30是指示节目定时记录处理的流程图;
图31示出了有关定时记录的邮件的一个例子;
图32示出了指示定时记录设置已完成的邮件的一个例子;
图33是例示喜好数据的一个例子的示意图;
图34是例示应用本发明的节目搜索系统的示例性配置的示意图;
图35是指示喜好数据获取处理的流程图;
图36是指示节目信息搜索处理的流程图;
图37是例示喜好数据的一个例子的示意图;
图38是指示如图36所示的步骤S324的处理的流程图;
图39是指示词典生成处理的流程图;
图40是例示如图5所示的数据内容处理模块的示例性功能配置的示意图;
图41是指示如图39所示的步骤S362的处理的流程图;
图42示出了分解成组成成份的元数据的示例性配置;
图43示出了按类型收集的元数据的示例性配置;
图44是指示如图39所示的步骤S363的处理的流程图;
图45示出了词典数据的示例性配置;
图46是指示数据库生成处理的流程图;
图47是指示如图46所示的步骤S429的处理的流程图;
优选实施方式
下面将参照附图,通过例子更详细地说明本发明。
图1示出了应用本发明的节目搜索系统的示例性配置。在这个节目搜索系统中,诸如个人计算机1、硬盘驱动器(HDD)记录器2、和数字移动电话4之类的用户终端与诸如因特网之类的网络5相连接,用于搜索要推荐的节目信息(或节目元数据)的服务器6也与这个网络5相连接。个人计算机1通过例如以太网(商标)与HDD记录器2相连接。HDD记录器2与电视接收器3相连接。也就是说,个人计算机1、HDD记录器2、和电视接收器3由一个用户(或一个家庭)拥有,每一个被放置在另一个的附近。
个人计算机1是可以执行各种应用程序的信息处理设备,例如,进行电子邮件的发送和接收、网页的浏览、和文档的生成。另外,个人计算机1从通过电子邮件的发送/接收获取的文档中提取与用户兴趣相对应的文字(下文适当地称为兴趣文字),以生成兴趣数据的数据库,后文将参照如图23所示的流程图对此加以描述。
HDD记录器2将电视节目记录到大容量存储硬盘驱动器中,并且,根据用户指令,将记录的电视节目输出到电视接收器3,以便再现它们。另外,HDD记录器2从个人计算机1中获取兴趣数据并通过网络5将兴趣数据发送到服务器6,以获取对与兴趣数据匹配的节目的推荐,后文将参照如图25所示的流程图对此加以描述。
数字移动电话4生成定时记录节目的电子邮件消息并通过网络5将生成的电子邮件消息发送到个人计算机1或HDD记录器2,以便使它定时记录节目,后文将参照如图30所示的流程图对此加以描述。
与有线还是无线无关,网络5可以是公用线网络、移动无线通信网络、局域网、诸如因特网之类的网络、和数字卫星广播网络的任何一种。
在如图1所示的节目搜索系统的例子中,只示出了作为用户终端与系统相连接的一个单元的个人计算机1、一个单元的HDD记录器2、一个单元的电视接收器3、和一个单元的数字移动电话4。但是,显而易见,作为每个用户终端,可以有多于一个的单元与系统相连接。
图2例示了用于在桌面上显示桌面吉祥物(mascot)(下文称为代理器)的应用程序(下文称为代理器程序)11、用于发送和接收电子邮件的应用程序(下文称为邮寄器(mailer))12、和用于生成和编辑文档的文字处理器程序13之间的关系,这些程序被安装在个人计算机1上并在个人计算机1上执行它们。
代理器程序11由积累模块21、展示模块22和代理器控制模块23组成,积累模块21通过从要处理的文档中提取与用户兴趣相对应的文字并存储用来进行节目搜索的兴趣数据及要处理的文档的相关信息来建立数据库,展示模块22向用户展示与要处理的文档相对应的推荐的信息,代理器控制模块23控制代理器231的显示等(参照图28)。
应该注意到,可以将积累模块21和展示模块22安装在因特网上的任何服务器上。
积累模块21的文档获取模块31从发送到邮寄器12或从邮寄器12接收、或经过文字处理器程序13编辑的文档当中获取还未经它处理的文档,并且将获得的文档供应给文档属性处理模块32和文档内容处理模块33。此外,文档获取模块31获取用户最初利用HDD记录器2登记的喜好信息(譬如用户喜好的类型的名称和演员的姓名之类)或观看日志,并且将获得的信息和日志供应给文档内容处理模块33。
应该注意到,在下文中,作为例子,主要将发送到邮寄器12或从邮寄器12接收的电子邮件文档的处理用作处理的主题。
文档属性处理模块32提取从文档获取模块31供应的文档的属性信息,并且,根据提取的属性信息,对文档分组,并将分组的文档供应给文档内容处理模块33和文档特征数据库生成模块34。在电子邮件的情况中,属性信息包括:诸如用于标识正被讨论的电子邮件消息的消息ID(识别符)、供参考(“References(参考)”和“In-Reply-To(答复)”)的电子邮件消息的消息ID、目的地(“To(发送至)”、“Cc(抄送)”和“Bcc(隐蔽性抄送)”)、发送源(“From(来自)”)、日期和主题(subject)之类,在每个文档的起首中描述的信息。根据提取的属性信息,对一个或多个文档分组。在下文中,将根据属性信息而形成的每个文档组(或电子邮件组)称为一个“论题”。
这里统称的论题也表示对于通过文字处理器程序、编辑器、调度器、及其它工具和应用软件程序生成的所有文档,按照某种关系相互关联的一系列文档。
文档内容处理模块33提取由文档属性处理模块32分组的每个文档(论题)的主体,对提取的主体进行形态分析,并且将经分析的主体分类成文字(或特征文字)。并且,文档内容处理模块33对从文档获取模块31供应的观看日志的喜好信息进行形态分析并将它们分类成文字(或兴趣文字)。
将这些文字分类成各种词类(即,名词、形容词、动词、副词、连词、感叹词、后置虚词、和助动词)。但是,分布在大范围上的文字,像,例如,“hello(你好)”、“thank you(谢谢)”、和“please(请)”那样,似乎包括在大多数文档中的那些文字,即,除了名词之外的各种词类不能提供通过其对相关信息进行搜索的关键字(下文也称为搜索字)。因此,从关键字中删除这些文字,将它们作为无用文字。
在删除了无用文字之后,文档内容处理模块33获取每个文字的出现频次和它在两个或多个文档上的分布,从而为每个分组文档(或论题)计算出每个文字的权重(指示与文档主旨的相关度的值,下文称为评估值)。
并且,文档内容处理模块33为每个论题确定其元素是每个文字的评估值的特征矢量。例如,设包括在每个论题中的总文字(或特征文字)数是n,那么,每个论题的特征矢量通过如下公式表示成n维矢量:
特征矢量=(文字1的评估值w1,文字2的评估值w2,...,文字n的评估值wn)                       ...(1)
对于评估值的计算,例如,文件(Salton,G.:Automatic Text Processing:The Transformation,Analysis,and Retrieval of Information by Computer,Addison-Wesley,1989(萨尔顿,G.:自动文本处理:计算机进行的信息变换、分析和检索,阿狄森-卫斯理,1989))公开了tf·idf(term frequency.inverse document frequency,词语频次.逆文档频次)技术。根据tf·idf技术,在与论题A相对应的n维特征矢量当中,计算除了0之外的值,作为与包括在论题A中的文字相对应的元素的评估值,并计算0,作为与不包括在论题A中的文字(其频次为0)相对应的元素的评估值。
应该注意到,评估值按照电子邮件消息的发送/接收频次和计数、包括在电子邮件消息中的每个文字的词类的类型(例如,指示特定地点或名称的适当名词)、和电子邮件消息的发送/接收伙伴来修改。
在本实施例中,在计算每个论题的特征矢量的假设下作出描述。但是,计算不局限于这种配置。例如,可以对每个文档或按其它单位(例如,在诸如每个星期之类的预定时间间隔积累的每个文档组)计算特征矢量。
文档特征数据库生成模块34按时间相关(time-dependent)方式来构造文档属性处理模块32分组的文档的每个文档的属性信息的数据库和文档内容处理模块33计算的每个论题的特征矢量(即,包括在论题中的文字的评估值)的数据库。同时,文档特征数据库生成模块34从文档内容处理模块33计算的喜好信息或观看日志中生成兴趣数据(如后所述),构造所生成的兴趣数据的数据库,并将这些数据库存储在由,例如,硬盘驱动器构成的存储模块59中。
此外,通过参考文字评估值,文档特征数据库生成模块34选择满足预定条件的文字并将所选文字记录成用于搜索相关信息和节目信息的搜索关键字(或搜索字或兴趣文字)。并且,文档特征数据库生成模块34将搜索字供应给相关信息搜索模块35,并且通过将供应的相关信息与搜索字相关联来记录从相关信息搜索模块35供应的相关信息。
相关信息搜索模块35搜索与从文档特征数据库生成模块34供应的搜索字相对应的相关信息,并且将通过搜索操作获得的索引供应给文档特征数据库生成模块34。关于搜索与每个搜索字相对应的相关信息的方法,例如,使用因特网上的搜索引擎的方法是可用的。如果应用这种方法,将作为搜索结果获得的网页的URL(统一资源定位符)和标题作为相关信息供应给文档特征数据库生成模块34。
展示模块22的事件管理模块41检测邮寄器12的启动、邮寄器12发送/接收电子邮件的完成、和输入的文档的文本数据量超过预定阈值,并且将检测的信息发送到数据库查询模块42。在下文中,将邮寄器12发送/接收电子邮件的完成或输入的文档的文本数据量超过预定阈值描述成事件发生。
通过参考内置定时器41A,事件管理模块41监视经过的时间,并且,每当从预定时刻开始经过了预定时间时,将预定经过时间通知数据库查询模块42。
响应来自事件管理模块41的事件发生的通知,数据库查询模块42获取与事件发生相对应的文档(例如,接收的电子邮件消息);与文档内容处理模块33进行的处理一样,对获得的文档进行形态分析;进行文字提取;删除无用文字;和计算余下的每个文字的评估值。因此,计算出与事件发生相对应的文档的特征矢量。
另外,数据库查询模块42搜索文档特征数据库生成模块34生成的数据库,并计算与事件发生相对应的文档的计算的特征矢量与记录到数据库的每个论题的特征矢量的内积,作为这两个特征矢量的相似度。并且,数据库查询模块42确定对与事件发生相对应的文档相似度最高的论题,从包括在所确定论题中的文字当中选择其评估值满足预定条件(其细节如后所述)的文字,并通过事件管理模块41或直接将有关所选文字(重要文字)的相关信息(或推荐信息)供应给相关信息展示模块43。
除此之外,数据库查询模块42从数据库中读取与登录在HDD记录器2上的用户相对应的兴趣数据并将读取的兴趣数据发送到HDD记录器2,或者,从数据库中读取响应事件发生而从喜好信息或观看日志中生成的兴趣数据并通过网络5将读取的兴趣数据发送到服务器6,从而请求搜索与这些兴趣数据相匹配的节目信息。
相关信息展示模块43在显示模块58(或桌面)上显示从数据库查询模块42经由事件管理模块41或直接供应的相关信息(或推荐信息)。也就是说,每当事件管理模块41检测到事件发生时,更新展示模块22对相关信息的展示。
应该注意到,积累模块21进行的数据库更新是以预定时序关系进行的。数据库更新处理将在后面参照如图21所示的流程图加以描述。当积累模块21进行数据库更新时,按照电子邮件发送/接收的频次和计数、包括在电子邮件中的每个文字的词类的类型(例如,指示特定地点或名称的适当名词)修改存储在存储模块59中的特征矢量。
安装在HDD记录器2中并在HDD记录器2上执行的未示出的代理器程序基本上具有与如图2所示的上述代理器程序11相同的功能。应该注意到,HDD记录器2可以使用(或共享)个人计算机1的积累模块21,从而省去HDD记录器2的代理器程序的安装和执行。
图3示出了安装和执行代理器程序11到文字处理器程序13的个人计算机1的示例性配置。显然,本发明不仅可实际应用在个人计算机中,而且可实际应用在家用服务器系统、游戏机、汽车导航系统、PDA(个人数字助理)、和其它信息电子设备中。
个人计算机1内含CPU(中央处理单元)51。CPU 51通过总线54与输入/输出接口55连接。输入/输出接口55连接到由诸如键盘和鼠标之类的输入设备构成的输入模块56、用于输出例如作为处理结果而获得的音频信号的输出模块57、由用于显示作为处理结果而获得的图像的显示设备构成的显示模块58、由例如用于存储程序和结构(structured)数据库的硬盘驱动器构成的存储模块59、由例如用于通过以因特网为代表的网络来通信数据的LAN(局域网)卡构成的通信模块60、和将数据写入诸如磁盘62、光盘63、磁光盘64、或半导体存储器65之类的记录媒体中或从这些记录媒体中读取数据的驱动器61。总线54与ROM(只读存储器)52和RAM(随机访问存储器)53相连接。
将根据本发明的代理器程序11提供给个人计算机1,代理器程序11存储在记录媒体,即,磁盘62到半导体存储器65中,由驱动器61从中读取它们,或者,由通信模块60通过网络获取它们,将它们安装在内置在存储模块59中的硬盘驱动器中。通过CPU 51响应用户通过输入模块56输入的命令而发出的指令,将存储在存储模块59中的代理器程序11从存储模块59装载到RAM 53中,以便加以执行。应该注意到,可以将系统设置成一旦个人计算机1被启动就自动执行代理器程序11。
除了代理器程序11之外,存储模块59的硬盘驱动器还存储邮寄器12、文字处理器程序13、和包括WWW(万维网)浏览器在内的其它应用程序。与代理器程序11一样,通过CPU 51响应用户通过输入模块56输入的命令而发出的指令,将这些应用程序从存储模块59装载到RAM 53中,以便加以执行。
图4是例示HDD记录器2的示例性配置的方块图。这个HDD记录器2可以将大量图像存储在大容量(mass)存储硬盘驱动器(HDD)78中,并且通过适当地理解用户意图来反映所记录图像的管理(例如,观看日志和操作日志)。应该注意到,可以将HDD记录器2安装成,例如,像机顶盒(STB)那样的与电视接收器一起被使用的AV(音频视频)设备。
CPU 71,是用于全面地控制HDD记录器2的主控制器,根据从输入模块76供应的输入信号,来控制调谐器79、解调器80、解码器81、和HDD 78,从而记录和再现广播节目。
RAM 73是将CPU 71的执行程序装载到其中和将这些执行程序的操作数据写入其中的可写易失性存储器。ROM 72是其中存储一旦对HDD记录器2加电序列(sequence)就执行的自诊断和初始化程序和用于硬盘操作的控制代码的只读存储器。
由例如远程命令器、按钮、开关、和键盘构成的输入模块76通过输入/输出接口75和总线74将与所完成的操作相对应的输入信号输出到CPU 71。
通信模块77通过网络5与服务器6通信以接收所推荐节目元数据,并与个人计算机1通信以发送/接收预定数据(例如,兴趣数据)。在通信模块77中输入的数据不时地通过输入/输出接口75被记录到HDD 78上。
HDD 78是能够以预定文件格式存储程序和数据并具有大容量存储能力的随机访问存储单元。HDD 78通过输入/输出接口75与总线74相连接,从而从解码器81或通信模块77接收广播节目和诸如EPG(电子节目指南)数据之类的广播数据,以便记录接收的节目和数据,同时,按需要输出记录的数据。
将在未示出的天线上接收的广播电波供应给调谐器79。广播电波基于预定格式,它可以包括,例如,EPG数据。广播电波可以是卫星广播电波、地面电波、有线电波、无线电波的任何一种。
调谐器79在CPU 71的控制下被调谐到预定信道的广播电波并将接收的数据输出到解调器80。应该注意到,取决于接收的广播电波是模拟的还是数字的,可以对调谐器79的配置作适当改变或扩展。解调器80解调数字调制的所接收数据并将解调的数据输出到解码器81。
在数字卫星广播的情况下,由调谐器79接收并由解调器80解调的数字数据是其中多路复用通过MPEG2(运动图像专家组2)压缩的AV数据和用于数据广播的数据的传输流。AV数据由构成广播节目主体的视频数据和音频数据组成,用于数据广播的数据包括伴随着这个广播节目主体的数据(例如,EPG数据)。
解码器81将解调器80供应的传输流分离成MPEG压缩的AV数据和用于数据广播的数据(例如,EPG数据)。通过总线74和输入/输出接口75将作为所得结果的用于数据广播的数据供应给HDD 78,以便记录在其中。
如果给出指令按原样输出所接收节目,解码器81将AV数据进一步分离成压缩视频数据和压缩音频数据。解码所得的音频数据,以便通过混合器83输出到电视接收器3的扬声器。解压缩所得的视频数据,以便通过合成器82输出到电视接收器3的监视器。
如果给出将记录的节目记录到HDD 78上的指令,解码器81通过总线74和输入/输出接口75将分离前的AV数据输出到HDD 78。如果给出再现存储在HDD 78中的节目的指令,解码器81通过输入/输出接口75和总线74从HDD 78接收AV数据的输入,并将接收的AV数据分离成压缩视频数据和压缩音频数据,分别将它们输出到合成器82和混合器83。
合成器82按需要合成从解码器81输入的视频数据和GUI(图形用户界面),将所得数据输出到电视接收器3的监视器。
图5示出了安装在服务器6上并在服务器6上执行的服务器程序101的功能。
服务器程序101由积累模块111和搜索模块112组成,积累模块111分析诸如要受到处理的EPG数据之类的节目元数据并根据分析结果建立所推荐节目的数据库,搜索模块112从存储在积累模块111中的所推荐节目数据库中搜索与用户兴趣数据匹配的节目信息。
积累模块111的节目元数据获取模块121从诸如来自未示出的EPG数据提供设备的EPG数据之类的节目元数据当中获取还未经它处理的节目元数据,并且将获取的节目元数据供应给数据内容处理模块122。
数据内容处理模块122对从节目元数据获取模块121接收的节目元数据进行形态分析,以提取节目信息(例如,节目名、类型名、广播电台、时段、演员、和关键字)。将提取的节目信息供应给数据库生成模块123。
数据库生成模块123为每个节目构造由数据内容处理模块122提取的节目信息的数据库,并且将生成的数据库记录到包括硬盘驱动器在内的存储模块147(图6)中。
搜索模块112的事件管理模块131检测兴趣数据通过网络5从用户终端(个人计算机1或HDD记录器2)的输入,并且将其通知数据库查询模块132。在下文中,兴趣数据的输入检测将被称为搜索请求。同时,事件管理模块131通过参考内置定时器131A监视经过的时间,并且,每当从预定时刻开始经过了预定时间时,将预定经过时间通知数据库查询模块132。
根据来自事件管理模块131的搜索请求,数据库查询模块132获取与搜索请求相对应的兴趣数据。利用搜索引擎,数据库查询模块132从数据库生成模块123生成的推荐节目数据库中搜索与所获兴趣数据匹配的节目信息,并且将它选为推荐节目。
此外,数据库查询模块132获取最初通过用户终端设备登记的喜好信息(诸如喜好类型的名称和演员的姓名之类)或观看日志,以与数据内容处理模块122进行的处理相同的方式对获得的喜好信息或观看日志进行形态分析,以提取兴趣数据,从数据库生成模块123的推荐节目数据库中搜索与所提取兴趣数据匹配的节目信息,并且将它选为推荐节目。
通过事件管理模块131或直接将如上所述选择的推荐节目供应给节目信息输出模块133。
节目信息输出模块133通过网络5将通过事件管理模块131或直接从数据库查询模块132供应的推荐节目(或推荐节目信息)输出到用户终端设备(个人计算机1或HDD记录器2)。
应该注意到,每当更新EPG数据时或每隔预定时间进行积累模块111对推荐节目数据库的更新。
图6示出了安装和执行服务器程序101的服务器6的示例性配置。如图所示的各个组件,CPU 141到半导体存储器153,基本上具有与如图3所示的个人计算机1的CPU 51到输入模块56相同的配置,因此跳过对它们的描述。
下面参照如图7所示的流程图描述个人计算机1的代理器程序11进行的数据库生成处理。这个数据库生成处理是代理器程序11执行的处理操作之一,并且在已经启动的代理器程序11没有生成数据库的时候启动。
在步骤S1中,文档获取模块31从存储模块59的硬盘驱动器中有选择地获取为了生成数据库而将要被分析的文档(例如,在执行代理器程序11之前发送/接收的电子邮件,下文称之为要经受分析的电子邮件),并且将获得的文档供应给文档属性处理模块32和文档内容处理模块33。
下文参照图8描述步骤S1的处理细节,即,要经受分析的电子邮件的选择。
在步骤S21中,文档获取模块31参考其中存储用户发送的电子邮件的发送文件夹,以确定在最近预定时间段内(例如,在最后一个星期内)发送的电子邮件消息的数量是否大于等于预定数量(例如,100个消息)。如果发现在最近预定时间段内发送的电子邮件消息的数量大于等于预定数量,那么,进程转到步骤S22。在步骤S22中,文档获取模块31设置日期/时间条件和地址属性条件。
下面参照图9,描述步骤S22的处理细节,即,日期/时间条件和地址属性条件的设置。在步骤S31中,文档获取模块31确定发送文件夹中电子邮件消息的数量是否大于等于预定数量(例如,10,000个)。
如果在步骤S31中,发现发送文件夹中电子邮件消息的数量大于等于预定数量,那么,进程转到步骤S32。在步骤S32中,文档获取模块31将用于选择要经受分析的电子邮件的日期/时间条件设置成“删除一年或多年前的电子邮件”。在步骤S33中,文档获取模块31将用于选择要经受分析的电子邮件的地址属性条件设置成“删除除了‘To’之外的部分”。同时,文档获取模块31将提取地址条件(或地址列表)的对象设置成发送文件夹。
相反,如果在步骤S31中发现发送文件夹中电子邮件消息的数量少于预定数量,那么,进程转到步骤S34。在步骤S34中,文档获取模块31将日期/时间条件设置成“删除三年或更多年前接收的电子邮件”。在步骤S35中,文档获取模块31将地址属性条件设置成“删除除了‘To,Cc’之外的电子邮件”。同时,文档获取模块31将提取地址条件的对象设置成发送文件夹和接收文件夹。
在按照所发送电子邮件消息的数量设置了要经受分析的电子邮件的日期/时间条件和地址属性条件之后,上述日期/时间条件和地址属性条件的设置使进程返回到步骤S23。
应该注意到,在日期/时间条件和地址属性条件的设置中,可以按照发送文件夹中电子邮件消息的数量提供几个部分,并可以按照这些部分通过给定的年数划分日期/时间条件。并且,除了上述两种类型的选择之外,对于一个接收邮件登记簿,可以将“From(来自)”和“Reply to(回复)”加入地址属性条件中。
在步骤S23中,文档获取模块31根据在步骤S22中设置的日期/时间条件和地址属性条件,过滤发送文件夹(或接收文件夹)中的电子邮件消息,从而缩小电子邮件消息的数量。在步骤S24中,文档获取模块31建立通过步骤S23的过滤获得的电子邮件消息的目的地地址(或源地址)的列表,计数每个地址出现的频次,确定出现频次多的前n个地址,并且将地址条件设置成“提取利用前n个地址发送/接收的电子邮件消息”。
在步骤S25中,文档获取模块31根据在步骤S22中设置的日期/时间条件和在步骤S24中设置的地址条件,过滤所有电子邮件消息,即,存在于发送文件夹、接收文件夹、和其它文件夹之中的那些,从而选择要经受分析的电子邮件。
应该注意到,如果在步骤S21中,通过参考其中存储用户发送的电子邮件消息的发送文件夹,发现在最近预定时间段内发送的电子邮件消息的数量少于预定数量,那么,进程转到步骤S26。在步骤S26中,文档获取模块31参考其中存储用户接收的电子邮件消息的接收文件夹,以确定在最近预定时间段内(例如,在最后一个星期内)接收的电子邮件消息的数量是否大于等于预定数量(例如,100个)。如果发现在最近预定时间段内接收的电子邮件消息的数量大于等于预定数量,那么,进程转到步骤S22,重复从此开始的上述处理。
相反,如果发现在最近预定时间段内接收的电子邮件消息的数量少于预定数量,那么,在这一时刻结束数据库生成处理。
当按如上所述已经选择了要经受分析的电子邮件时,进程返回到如图7所示的步骤S2。
在步骤S2中,文档属性处理模块32从在步骤S1的处理中文档获取模块31供应的要经受分析的电子邮件中提取属性信息(例如,像消息ID之类的起首信息),并且,根据提取的属性信息,按论题分类接收的要经受分析的电子邮件(或按论题将接收的要经受分析的电子邮件划分成组),从而为每个论题生成论题文件,然后将其供应给文档内容处理模块33和文档特征数据库生成模块34。
图10示出了在步骤S2中生成的论题文件161的一个例子。论题文件161由标识每个论题文件的论题ID 162、指示属于那个论题的最早电子邮件消息的通信时间的日期/时间信息163、指示最早电子邮件消息的标题的主题信息164、由属于那个论题的电子邮件消息的发送器或接收器的电子邮件地址组成的成员信息165、用于标识属于那个论题的每个电子邮件消息的邮件消息ID166、由包括在属于那个论题的电子邮件消息的主体中的文字组成的文字矢量167、链接属于那个论题的电子邮件消息的主体的链接主体168、和由包括在每个论题中的所有文字的评估值组成的特征矢量169构成。
对于论题ID 162,例如,可以使用属于那个论题的最早电子邮件消息的通信时间。
应该注意到,链接主体168是通过链接属于那个论题的电子邮件消息当中的、发送文件夹中的电子邮件消息的主体,然后,插入预定字符串(例如,“soshinshuryo”)以链接接收文件夹和其它文件夹中的电子邮件消息的主体而获得的。
图11示出了包括在构成文字矢量167的数个文字170中的元素。更具体地说,文字170具有用于记录那个文字本身的字符串171、那个文字的词类(或名词类型)172、那个论题中那个文字的频次173、和那个论题中那个文字的评估值174的配置。应该注意到,文字170的每个元素的内容不是在步骤S2中生成的,而是在随后的处理中生成的。
特征矢量169也不是在步骤S2中生成的,而是在随后的处理中生成的。
再次参照图7,在步骤S3中,文档属性处理模块32选择在步骤S2中生成的论题。下面参照如图12所示的流程图,描述步骤S3的处理,即,主要论题选择处理。
在步骤S41中,文档属性处理模块32确定在步骤S2中生成的论题的数量是否大于等于预定数量。如果发现生成论题的数量大于等于预定数量,进程转到步骤S42。在步骤S42中,文档属性处理模块32将用于选择生成论题的组成邮件计数条件设置成“删除少于等于计数“a”(例如,4)的电子邮件消息”。
如果在步骤S41中发现生成论题的数量少于预定数量,那么,进程转到步骤S43。在步骤S43中,文档属性处理模块32将用于选择生成论题的组成邮件计数条件设置成“删除少于等于计数“b”(例如,2)的电子邮件消息”。
在步骤S44中,根据在步骤S42或S43中设置的组成邮件计数条件,文档属性处理模块32过滤在步骤S2中生成的论题。更具体地说,如果组成邮件计数条件被设置成“删除少于等于计数“a”(例如,4)的电子邮件消息”,则删除由4个电子邮件消息或更少电子邮件消息构成的任何论题,从而只选择每一个由5个或更多个电子邮件消息构成的论题。
除此之外,可以删除不包括在最近预定时间段内(例如,在最近一个星期内)通信的那些电子邮件消息的任何论题。
当像上述那样完成了主要论题选择处理时,进程返回到如图7所示的步骤S4。
应该注意到,用在主要论题选择处理中的组成邮件计数条件的设置不局限于上述两种类型的选择。例如,可以按照论题数量安排几部分,以便对这些部分的每一个设置组成邮件计数条件。
在步骤S4中,文档内容处理模块33对与每个所选论题相对应的论题文件161的链接主体168进行形态分析。下面参照如图13所示的流程图,描述步骤S4的形态分析处理的细节。
在步骤S51中,文档内容处理模块33确定是否存在还没有经过形态分析的所选论题。如果发现存在,进程转到步骤S52。在步骤S52中,文档内容处理模块33选择还没有经过形态分析的论题之一,读取相应论题文件161的链接主体168,并对它进行形态分析,从而提取包括在链接主体168中的文字。
因此,与对构成论题文件161的每个电子邮件消息的每个主体进行形态分析的处理相比,尽管要处理的每个文本变长了,但对论题文件161的链接主体168进行形态分析的处理可以通过单个会话(session)来完成,从而防止形态分析处理所需的资源浪费掉。
在步骤S53中,文档内容处理模块33从在步骤S52中提取的文字中提取其词类是名词的那些文字(包括普通名词、连接名词、地名、人名、和感兴趣的术语)。在步骤S54中,文档内容处理模块33安排本身是名词的提取文字,以生成与正被讨论的论题相对应的文字矢量167。
在步骤S55中,文档内容处理模块33将与在步骤S54中生成的文字矢量167相对应的记录加入论题文字表181(参照图14)中,并将构成在步骤S54中生成的文字矢量167的文字的记录加入包括论题评估值表193的文字索引表191(参见图15)中。应该注意到,论题文字表181、文字索引表191、和论题评估值表193每一个都是散列(hash)表。
图14示出了论题文字表181的示例性配置。论题文字表181列出标识每个论题的论题ID 162和与论题相对应的文字矢量167。当输入论题ID 162时,输出相应文字矢量167。
图15示出了文字索引表191的示例性配置。文字索引表191列出构成每个文字矢量167的数对文字名192和相应论题评估值表193。当输入文字名192时,输出论题评估值表193。
图16示出了论题评估值表193的示例性配置。论题评估值表193列出每一个用于标识包括与文字名192相对应的文字在内的论题的论题ID 201和每一个对于正被讨论的论题中的正被讨论的文字的评估值202。当输入论题ID201时,输出正被讨论的论题中的正被讨论的文字的评估值202。
生成具有上述配置的论题文字表181、文字索引表191和论题评估值表193有助于通过输入它们中任意一个来搜索论题ID 162和文字名192之一。
然后,进程返回到步骤S51,重复从此开始的上述处理。在步骤S51中,如果发现再也没有还没有经过形态分析的所选论题,那么,形态分析处理即告结束,据此进程返回到如图7所示的步骤S5。
在步骤S5中,为了减轻随后要执行的处理的负担,文档内容处理模块33从在到此为止执行的处理中提取的文字中,即,包括在与每个主题相对应的文字矢量中的文字中,删除那些被认为与论题内容关系不大的文字和诸如问候词之类的日常文字(下文称为无用文字)。
下面参照如图17所示的流程图,描述步骤S5的无用文字删除处理。在步骤S61中,文档内容处理模块33删除文字矢量小的任何论题,即,其中构成相应文字矢量的文字的数量少于等于预定数量(例如,5个)的任何论题。
在步骤S62中,文档内容处理模块33确定:在记录到在步骤S4中生成的文字索引表191中的文字中,是否存在还未经受随后处理的任何文字。如果发现还未经受随后处理的任何文字,进程转到步骤S63。在步骤S63中,文档内容处理模块33选择未经受随后处理并记录到文字索引表191中的文字之一,作为要处理的文字。
在步骤S64中,通过参考文字索引表191,以及输入上述要处理的文字,文档内容处理模块33获取相应论题评估值表193,并且,通过计数记录到获取的论题评估值表193中的论题ID 201的数量,来获取包括要处理的文字在内的论题的数量。
在步骤S65中,文档内容处理模块33确定包括要经受处理的文字的论题的数量是否大于等于预定数量。如果发现包括要经受处理的文字的论题的数量大于等于预定数量,进程转到步骤S66。在步骤S66中,文档内容处理模块33将要经受处理的文字加入无用文字矢量(由无用文字构成)中。因此,诸如日常问候词之类,认为通常被包括在许多论题中的文字被加入无用文字矢量中。
在步骤S67中,为了删除与成为无用文字的要经受处理的文字相对应的记录,文档内容处理模块33更新与每个论题相对应的论题文件161、论题文字表181、文字索引表191、和论题评估值表193。然后,进程返回到步骤S62,重复从此开始的上述处理。
应该注意到,如果在步骤S65中发现包括要经受处理的文字的论题的数量少于预定数量,则跳过步骤S66和步骤S67,进程返回到步骤S62。
然后,在步骤S62中,如果在记录到在步骤S4中生成的文字索引表191中的文字当中,发现再也没有要经受处理的文字,则进程转到步骤S68。在步骤S68中,与步骤S61的处理一样,文档内容处理模块33删除文字矢量小,即,构成相应文字矢量167的文字的数量少于预定数量(例如,5个),的任何论题。因此,认为只由日常文字构成的论题被删除。在这个时刻,每个论题用由不同文字构成的文字矢量167表示。进程返回到如图7所示的步骤S6。
在步骤S6中,文档内容处理模块33获取构成无用文字已删除的每个文字矢量67的所有文字的出现频次和这些文字在两个或更多个文档中的分布,从而计算每个论题中的评估值。关于评估值的计算,例如,使用tf·idf技术。在步骤S7中,文档特征数据库生成模块34在如下所示的条件下,校正在步骤S6中计算的每个文字的评估值。
例如,文档特征数据库生成模块34校正包括在发送的电子邮件中的文字的评估值,以便使该值更大。为了识别包括在发送的电子邮件消息中的文字,可以检测插在与在步骤S2中生成的每个论题相对应的论题文件161的链接主体168中的预定字符串(例如,“soshinshuryo”),以便把在这个预定字符串之前的文字识别成包括在发送的电子邮件消息中的文字。
此外,文档特征数据库生成模块34校正包括在许多电子邮件消息所属的论题中的文字的评估值,以便使这个评估值与,例如,这些电子邮件消息的数量相对应地增加。例如,设这些电子邮件消息的数量是m,并将校正之前的评估值乘以像线性函数值a·m(a是常数)或对数函数值log(m)那样的单调函数值。作出这种校正是考虑到,在诸如电子邮件之类的短暂连续通信中,出现在较早文档中的文字往往被较后文档中的指示代词所取代,使得随着属于论题的电子邮件消息的数量增加,文字评估值相对变小。
另外,文档特征数据库生成模块34校正包括在与通信频次高的伙伴通信的电子邮件消息中的文字和专有名词(例如,定义的感兴趣文字、一般名称、地名、和机构名)的评估值,以便使它们变得更大。应该注意到,关于校正专有名词的评估值的方法,可以应用日本专利申请第2001-379511号公开的技术。
在步骤S8中,文档特征数据库生成模块34将在步骤S6中计算和在步骤S7中校正的每个文字的评估值记录到论题文件161、论题文字表181的文字矢量167、和文字索引表191的论题评估值表193中。因此,构成每个文字矢量167的文字170的所有元素被建立起来。同时,文档特征数据库生成模块134建立与每个论题相对应的特征矢量169并记录建立的特征矢量169。并且,文档特征数据库生成模块34按这些文字评估值的降序重新排列构成每个文字矢量167的文字。
在步骤S9中,文档特征数据库生成模块34进一步选择在这个时刻还剩下的论题。下面参照如图18所示的流程图,描述步骤S9的处理,即,次要论题选择处理。应该注意到,对每个论题执行这个次要论题选择处理。
在步骤S71中,文档特征数据库生成模块34检测评估值最大、构成与每个论题相对应的文字矢量167的一个文字(或评估值最大的两个或三个文字)。在步骤S72中,文档特征数据库生成模块34确定在步骤S71中检测的文字的评估值是否大于等于预定值。如果发现检测的文字具有大于等于预定值的评估值,进程转到步骤S73。
在步骤S73中,文档特征数据库生成模块34将评估值大于等于预定值的文字加入推荐论题候选矢量中。如果在步骤S72中发现在步骤S71中检测的文字的评估值小于预定值,那么,进程转到步骤S74,在步骤S74中,文档特征数据库生成模块34删除正被讨论的论题。也就是说,将评估值小于预定值的任何文字确定为较小兴趣的,因此,从搜索对象中删除它。
在步骤S73或步骤S74的处理之后,即,在对正被讨论的论题进行的次要论题选择处理完成之后,开始对下一个论题进行次要论题选择处理。当对所有论题进行的次要论题选择处理都完成时,进程返回到如图7所示的步骤S10。
在步骤S10中,根据在步骤S9加入推荐论题候选矢量中的论题,文档特征数据库生成模块34建立推荐论题。下面参照如图19所示的流程图,描述步骤S10中的推荐论题建立处理。
在步骤S81中,根据在步骤S9加入推荐论题候选矢量中的元素(或文字矢量167),文档特征数据库生成模块34关注构成文字的评估值当中的最大值,并以评估值的最大值的降序检测预定个数(例如,200个)的文字矢量167,从而在预定数量下获取每个相应论题。
在步骤S82中,文档特征数据库生成模块34确定在步骤S81中获得的论题是否与搜索条件匹配。如果发现该论题与搜索条件匹配,那么,进程转到步骤S83。这里的搜索条件表示正被讨论的论题是否是特定时段的、与特定通信伙伴交换的、包括从观看日志提取的特定文字(例如,节目名、类型名、或演员名)的、或包括最初登记的喜好信息(例如,喜欢类型名或演员名)的。
在步骤S83中,文档特征数据库生成模块34将发现与搜索条件匹配的论题加入推荐论题矢量中。如果在步骤S82中发现获得的论题与搜索条件不匹配,那么,跳过步骤S83的处理。然后,进程返回到如图7所示的步骤S11。
在步骤S11中,文档特征数据库生成模块34根据在步骤S10中建立的推荐论题矢量来生成数据库。
更具体地说,文档特征数据库生成模块34过滤加入到推荐论题矢量中的论题文件161(参照图10),以提取在如后所述的节目信息搜索处理中所需的论题ID 162、日期/时间信息163、主题信息164、成员信息165、和文字矢量167(或兴趣文字矢量212)。根据提取的信息,文档特征数据库生成模块34生成如图20所示的兴趣数据211。然后,文档特征数据库生成模块34生成具有与正被讨论的用户的用户ID、邮件帐号、登录帐号、或密码相关联的兴趣数据211的数据库,并且将生成的数据库存储到存储模块59中。应该注意到,步骤S11的处理是连续地执行直到步骤S10的一系列处理操作、或者不连续地以预定时间间隔执行。
应该注意到,由于兴趣数据211提供了搜索节目信息的关键字,文字矢量167被重新定义为兴趣文字矢量212。或者,在构成文字矢量167的文字(或兴趣文字)当中,只有评估值最大的文字(或值最大的两个或三个文字)可以用作兴趣文字矢量212。并且,兴趣数据211可以包括这样一个文档,该文档包括正被讨论的论题的电子邮件的重要文字。
还应该注意到,诸如“音乐”和“新闻”之类,经常用在电视节目的EPG数据中的文字,和包括,例如,演员艺名、异体字、缩写词的未定义文字被事先定义成,例如,与普通名词不同的“名词性电视文字(noun-televisionword)”。然后,作为形态分析的结果,像在如图7所示的步骤S6中对评估值的计算那样,以预定方式加权分类成“名词性电视文字”的每个文字,从而作出使“名词性电视文字”的文字的评估值变得更大的校正。因此,在包括在电子邮件中的文字当中,“名词性电视文字”的文字包括在构成兴趣文字矢量212的文字中(即,“名词性电视文字”的文字变成兴趣文字)的概率变得更大。
并且,如果两个或更多个用户共享一个邮寄器12,对每个邮件帐号的电子邮件进行形态分析,并为每个用户生成兴趣数据211。数据库通过作为密钥匙的每个邮件帐号为每个用户记录兴趣数据211。
上述数据库生成处理的执行使得在数据库中积累了由从发送和接收的电子邮件文档中提取的兴趣文字构成的兴趣数据211。
此外,为了使用户能够强制中止数据库生成处理,在要求中止时,可以在中止的时候记录已处理文档,在要求重新开始时,继续对未处理文档的处理。
应该注意到,在上述根据本发明的配置中,数据库生成处理是在执行代理器程序11的时候开始的。或者,也可以每隔预定时间开始数据库生成处理。并且,当预定条件得到满足时,更新如上所述生成的每个数据库。
下面描述积累模块21更新数据库的时序。每个数据库都是通过上述数据库生成处理生成的,并且,如果遇到如下第1、第2、和第3种状况,就更新它。
在第1种状况下,自从数据库生成或更新以来已经经过了预定时间段,因此,在信息过时之前更新存储在数据库中的相关信息。
在第2种状况下,存储在数据库中的相关信息的预定部分已经展示过,因此,由于同一相关信息可能被重复展示或要展示的相关信息不足,所以更新存储在数据库中的相关信息。
在第3种状况下,如果用于特征提取的文档是电子邮件,则重复发送/接收电子邮件会改变那个文档的内容,由此,更新数据库。
应该注意到,如果数据库更新是必不可少的(例如,像事件管理模块41监视的定时器41A所指的那样,已经经过了预定时间段),则可以向用户发出一个指令,以便更新数据库,或者,可以不用发出这样的指令而自动更新数据库。显然,也可以每隔用户定义的预定时间来更新数据库。
下面参照如图21所示的流程图,描述考虑到第1、第2、和第3种状况的数据库更新处理。这个数据库更新处理是代理器程序11执行的处理操作之一,并且在启动代理器程序11的时候开始,重复执行直到代理器程序11退出为止。假设在开始数据库更新处理之前已经执行了上述数据库生成处理,因此,数据库已存在。
在步骤S91中,代理器程序11的积累模块21确定是否有必要更新生成的数据库,并且一直等待直到确定为有必要为止。这个确定的标准由用户通过利用例如图22所示的用户界面屏幕而事先设置。在图22的例子中,展示了四个条件。如果用户检验显示在每个条件左侧的检验框,那么,检验条件得到设置。应该注意到,在第1条件下,可以设置计数。在第3条件下,可以设置天数。
如果在步骤S91中发现数据库更新是必不可少的,进程转到步骤S92。在步骤S92中,积累模块21确定更新是否是自动的。如果更新不是自动的,那么,进程转到步骤S93。如果更新是自动的,跳过步骤S93。
在步骤S93中,代理器程序11的展示模块22通知用户必须更新数据库,并且确定用户是否作出响应,而发出更新的指令。如果发现这样的指令已发出,进程转到步骤S94。如果发现这样的指令还没有发出,进程返回到步骤S91,重复从此开始的上述处理。
在步骤S94中,代理器程序11的积累模块21更新数据库。更具体地说,文档获取模块31、文档属性处理模块32、和文档内容处理模块33检测电子邮件的电子邮箱文件(往往后缀以特定扩展名,例如,mbx),获取它的更新日期,并将获得的日期/时间与以前获得的更新日期/时间相比较。如果发现电子邮箱文件与以前获得的更新日期/时间的那些具有不同的日期/时间和不同的文件大小,那么,该文件被确定为已经得到更新,并且加入或更新部分被提取。在这种情况下,在文件中进行电子邮件消息的分组、起首的分析、形态分析、特征矢量的计算、和其它分析,并且将作为这些操作的结果而获得的重要文字供应给相关信息搜索模块35。
但是,如果邮件组(或论题)保持不变(即,没有新的邮件被加入特定论题中),并且如果作为分析结果,更新之前的重要文字(或搜索关键字)与更新之后的重要文字相同,则可以只改变诸如评估值之类的计算值,从而使相关信息搜索模块35不进行对相关信息的搜索。
或者,如果所有电子邮件组保持不变地经过了某个时间段,则在最后搜索中,可以利用这些组的特征矢量当中,例如,取代作为具有第1和第2评估值的文字的搜索文字的作为具有第3和第4评估值的文字的搜索文字,来进行搜索,从而获得搜索结果。
如上所述,在数据库更新处理中,只更新加入或改变的文档,从而,与重复进行数据库生成处理相比,可以缩短处理时间。
下面参照如图23所示的流程图,描述服务器6的服务器程序101进行的数据库生成处理。这个数据库生成处理是服务器程序101执行的处理操作之一,并且在服务器程序101已启动,但还没有生成数据库的时候开始。
在步骤S101中,节目元数据获取模块121获取作为数据库生成的基础而加以分析的诸如EPG数据之类的节目信息(或节目元数据),并且将获得的节目信息供应给数据内容处理模块122。
图24示出了在步骤S101中获得的节目元数据220的一个例子。节目元数据220由指示正被讨论的节目的名称的标题221、指示正被讨论的节目的分类的类型222(例如,戏剧、电影、新闻、体育、或音乐)、指示正被讨论的节目被广播的时段的时段信息223(例如,早晨、中午、傍晚、黄金时段、或夜间)、指示正被讨论的节目被广播的信道的广播电台224(例如,NHKGeneral、Nihon TV、或TBS(每一个都是商标)、指示正被讨论的节目的演员的演员信息225、指示正被讨论的节目的脚本、原创、和导演的脚本、原创、和导演信息226、和指示正被讨论的节目的故事和重要部分的内容(或关键字)信息227构成。
再次参照图23,在步骤S102中,数据内容处理模块122对在步骤S101中获得的节目元数据220进行形态分析,以提取节目信息(节目名、类型名、广播电台名、时段信息、演员名、和关键字)。在步骤S103中,数据库生成模块123为每个节目构造由数据内容处理模块122提取的节目信息的数据库,并且将生成的数据库存储到存储模块147中。
当上述数据库生成处理已经得到执行时,从节目元数据220中提取的节目信息被存储在推荐节目数据库中。此外,为了使用户可以强制中止数据库生成处理,如果作出中止请求,则可以在中止的时候记录已处理文档,以便在作出重新开始请求时,继续对未处理文档的处理。
应该注意到,在上述根据本发明的配置中,数据库生成处理是在执行服务器程序101的时候开始的。或者,也可以在任何其它时间开始并每隔预定时间更新数据库生成处理(例如,每当更新EPG数据时)。
下面参照如图25所示的流程图,描述从通过如图23所示的处理而生成的服务器6中的推荐节目数据库中搜索与通过图7的处理而记录到个人计算机1的数据库中的兴趣数据211匹配的节目信息的处理。
在步骤S121中,HDD记录器2的CPU 71确定为了登录操作用户是否已经操作了输入模块76,并且一直等待直到已经进行了登录操作为止。如果在步骤S121中发现HDD记录器2已经被用户登录,那么,进程转到步骤S122,在步骤S122中,CPU 71通过通信模块77将用于获取兴趣数据的命令和用户登录信息发送到个人计算机1。
在步骤S111中,个人计算机1的数据库查询模块42接收来自HDD记录器2的兴趣数据获取命令,并且,从文档特征数据库生成模块34生成的数据库中搜索与登录信息(登录帐号和密码)相对应的兴趣数据211(图20),并且通过通信模块60将检索的兴趣数据211发送到HDD记录器2。
在步骤S123中,HDD记录器2的CPU 71从个人计算机1接收与登录用户相对应的兴趣数据211,并且将接收的兴趣数据211记录到RAM 73中。在步骤S124中,CPU 71通过通信模块77和网络5将接收的兴趣数据211发送到服务器6,从而请求搜索与兴趣数据211匹配的节目信息。
在步骤S131中,服务器6的事件管理模块131通过网络5接收从HDD记录器2发送的兴趣数据211。然后,事件管理模块131将兴趣数据211供应给数据库查询模块132,并通知搜索请求。在步骤S132,响应来自事件管理模块131的搜索请求的通知,数据库查询模块132从数据库生成模块123生成的推荐节目数据库中搜索与包括在搜索请求中的兴趣数据211匹配的节目信息,将检索的节目信息选为推荐节目。
应该注意到,构成兴趣数据211的兴趣文字矢量212可以包括:例如,像演员艺名、异体字、缩写词那样的未定义文字,或相互稍有不同的文字。因此,为了能够搜索与这些文字匹配的节目信息,最好让服务器6具有存储这些文字的词典。
在步骤S133中,节目信息输出模块133通过通信模块148和网络5将数据库查询模块132选择的推荐节目(或节目信息)发送到HDD记录器2,作为搜索结果。
在步骤S125中,HDD记录器2的CPU 71根据包括在通过网络5从服务器6接收的节目信息中的记录开始时间、记录结束时间、和信道,向RAM 73设置节目的定时记录,同时,控制调谐器79、解调器80、解码器81、和HDD78。因此,当已到定时记录开始时间时,从RAM 73中读取节目信息并进行定时记录。
因此,与用户兴趣匹配的节目信息得到检索并且定时记录被自动设置到HDD记录器2上。也就是说,根据从用户交换的电子邮件中提取的兴趣文字,检索节目信息,从而可以作出反映用户每天兴趣的适时节目推荐。
在步骤S111的处理中的从数据库读取兴趣数据211和发送兴趣数据211中,关注包括在兴趣数据211的兴趣文字矢量212中的满足预定条件的文字(或重要文字)当中的评估值的随时间变化并只选择满足预定条件的文字也是行得通的。预定条件可以是,例如,(1)“在当前时刻之前的预定时间段Y(例如,五个星期)内,正被讨论的文字的评估值在两个或更多个不同论题中应该大于等于阈值B”或(2)“在条件(1)下的两个或更多个不同论题当中,最早论题和最近论题应该彼此相隔长于预定时间段Z”。
这些条件的使用使与用户高度感兴趣的那些文字(即,重要文字),或当前时刻出乎用户意料之外的那些文字匹配的节目信息得到推荐。
应该注意到,在上述根据本发明的配置中,电子邮件的形态分析和从分析结果中提取的兴趣数据211的生成是由个人计算机1执行的,并且,只有兴趣数据211被发送到HDD记录器2。将在功能上与个人计算机1的代理器程序11相似的程序安装在HDD记录器2上,从而让HDD记录器2执行电子邮件的形态分析和兴趣数据211的生成也是行得通的。
可以像如下那样分配处理:个人计算机1对电子邮件进行形态分析并根据分析结果生成兴趣数据211;HDD记录器2获取个人计算机1生成的兴趣数据211,将获得的兴趣数据211发送到服务器6,并接收与兴趣数据211匹配的节目信息的推荐;服务器6搜索与兴趣数据211匹配的节目信息,并将搜索结果发送到HDD记录器2。
但是,本发明不局限于上述配置。例如,可以将服务器6生成的推荐节目数据库中的节目信息一次全部地提供给个人计算机1,以便进行节目信息搜索。在这种情况下,HDD记录器2获取包括在从个人计算机1供应的节目信息中的定时记录开始时间、定时记录结束时间、和信道,从而进行定时记录。
并且,如果服务器6是因特网服务提供者,进行分配例如上述的推荐节目和电子邮件的服务,那么,服务器6可以直接访问用户的邮件服务器,以便对电子邮件进行形态分析并根据分析结果生成兴趣数据211。
应该注意到,在上述处理中,无需用户意识到就可以检索与他/她的兴趣匹配的节目,并且自动进行这些节目的定时记录。因此,在例如对HDD记录器2加电、确认定时记录、或再现每个定时记录节目的时候,向用户展示要定时记录的每个节目的推荐理由。下面参照如图26所示的流程图描述这种理由的展示的处理。
在步骤S141中,HDD记录器2的CPU 71确定展示条件是否得到满足,并且一直等待直到发现展示条件得到满足为止。这里的展示条件表示:例如,对HDD记录器2设置节目的定时记录和对电视接收器3加电,或者,对HDD记录器2设置节目的定时记录和HDD记录器2的GUI屏幕处在显示使能状态下。
如果在步骤S141中发现展示条件得到满足,那么,进程转到步骤S142,在步骤S142中,CPU 71根据包括在如图25所示的步骤S123中记录到RAM 73的兴趣数据211中的信息,即论题ID 162到成员信息165(参照图20),将推荐理由(或背景信息)输出到电视接收器3。
图27示出了推荐理由的示例性显示。如图所示,代理器231正出现在屏幕上,伴随着包括代理器231的台词的框232和用户可以操作的输入窗233。在框232内部,显示,例如,台词“你在2001年4月9日向Taro发去电子邮件‘谢谢您的美酒’,是吗?你想原封不动地记录它吗?”。
与框232的显示同步,未示出的语音合成器可以将框232中的台词转换成语音信号,以便用所需语言(例如,日语或英语)讲出来。应该注意到,框232的显示和语音输出可以由代理器程序11不时地设置或由用户在需要的时候设置。
输入窗233显示操作它可以定时记录节目的“记录”按钮和操作它可以取消定时记录的“取消”按钮。
从包含在框232中的台词中的与“Taro”交换的电子邮件的内容(在本例中,“谢谢您的美酒”)中,用户知道服务器6推荐的节目“XXX访问酿酒厂”并且它的定时记录被设置到HDD记录器2上。如果用户想记录节目,他/她就点击“记录”按钮。如果他/她想取消记录,他/她就点击“取消”按钮。假设还没有操作这些按钮的任何一个,用作触发信号的超时信号可以自动选择其中之一。
再次参照图26,在步骤S143中,CPU 71确定是否对输入模块76选择了“取消”按钮。如果发现选择了“取消”按钮,那么,进程转到步骤S144,在步骤S144中,CPU 71取消设置到RAM 73上的定时记录。
如果在步骤S143中发现没有选择“取消”按钮,或者,发现选择了“记录”按钮,跳过步骤S144的处理。
因此,可以显示自动设置成定时记录的每个节目的推荐理由,且用户可以作出是否记录节目的决定。
在上述根据本发明的配置中,HDD记录器2将推荐理由显示到电视接收器3上。或者,当服务器6在如图25所示的步骤S133中将搜索结果发送到HDD记录器2时,也可以将搜索结果发送到个人计算机1,从而,当对个人计算机1加电或启动代理器程序11时,显示推荐理由。图28示出了在这种情况下显示推荐理由的示例性显示。
在图28的例子中,在框232中显示台词“响应你在2001年4月9日发给Taro的电子邮件‘谢谢您的美酒’,推荐标题为“XXX访问酿酒厂”的节目。你想记录这个节目吗?”。
因此,通过显示在框232中的台词,用户从与“Taro”交换的电子邮件的内容(在本例中,“谢谢您的美酒”)中知道服务器6已经推荐了节目“XXX访问酿酒厂”并且这个节目的定时记录被设置到HDD记录器2上。然后,为了开始这样的记录,用户点击“记录”按钮,或者,为了取消记录,点击“取消”按钮。如果选择“取消”按钮,个人计算机1的CPU 41将清除定时记录的设置的命令发送到HDD记录器2,使HDD记录器2取消定时记录。
因此,通过HDD记录器2或个人计算机1,可以将已经自动设置成定时记录的每个节目的推荐理由显示到电视接收器3上。由于推荐理由包括,例如,经交换的电子邮件的论题、日期/时间、伙伴、和主题,根据本发明的推荐理由比诸如“已经推荐了节目XX”之类的简单推荐理由更吸引人。
在上述根据本发明的配置中,与包括在用户交换的电子邮件或用户生成的文档中的文字(或兴趣文字)匹配的节目信息得到检索,以便作出推荐。但是,节目的推荐不局限于这种配置。例如,可以分析用户最初登记的喜好信息(例如,喜好类型名和演员名)或用户观看过的节目的观看日志,以便根据分析结果提取感兴趣文字,从而搜索匹配节目信息。下面参照如图29所示的流程图,描述这种情况的处理。
在步骤S151中,个人计算机1的事件管理模块41通过参考内置定时器41A来监视经过的时间以确定是否已经经过了预定时间段,并且一直等待直到经过预定时间段为止。如果发现经过了预定时间段,事件管理模块41将事件的发生通知数据库查询模块42,据此进程转到步骤S152。
在步骤S152中,数据库查询模块42从文档特征数据库生成模块34生成的数据库中读取最初登记的喜好信息或对观看日志进行形态分析获得的兴趣数据211,并且通过网络5将喜好信息或兴趣数据211发送到服务器6。
在步骤S171中,服务器6的事件管理模块131通过网络5接收来自个人计算机1的兴趣数据211。然后,事件管理模块131将兴趣数据211供应给数据库查询模块132,将搜索请求通知它。在步骤S172中,响应来自事件管理模块131的搜索请求的通知,数据库查询模块132搜索由数据库生成模块123生成的推荐节目数据库,并且选择与包括在搜索请求中的兴趣数据匹配的节目信息作为推荐节目。
在步骤S173中,节目信息输出模块133通过通信模块148和网络5将数据库查询模块132选择的推荐节目(或节目信息)发送到个人计算机1和HDD记录器2,作为搜索结果。
在步骤S161中,HDD记录器2的CPU 71根据包括在通过网络5从服务器6接收的节目信息中的记录开始时间、记录结束时间、和信道,向RAM 73设置节目的定时记录,并且,控制调谐器79、解调器80、解码器81、和HDD78。因此,当已到定时记录的开始时间时,从RAM 73中读取节目信息以进行定时记录。
在步骤S153中,事件管理模块41接收搜索结果,并且将事件的发生通知数据库查询模块42。响应这个来自事件管理模块41的通知,数据库查询模块42获取与事件的发生相对应的搜索结果(或节目信息),对获得的搜索结果进行形态分析以提取文字(或特征文字),并计算每个文字的评估值。因此,计算出搜索结果(或节目信息)的特征矢量。
在步骤S154中,数据库查询模块42搜索文档特征数据库生成模块34生成的数据库,计算在步骤S153中获得的特征矢量和记录到数据库中的每个论题的特征矢量之间的内积,并提取满足预定条件的论题(例如,相似度最大或大于等于预定阈值的论题)。
此刻,可以事先选择具有特定类型名(用户最初登记的节目的类型名)的论题,以便有效地提取相似论题。或者,可以事先选择具有一般节目的类型名的论题,以便有效地提取相似论题。
在步骤S155中,数据库查询模块42从构成在步骤S154中提取的论题的文档当中选择最近文档,并且通过事件管理模块41或直接将所选文档供应给相关信息展示模块43。在步骤S156中,代理器控制模块23在桌面上显示在步骤S155中选择的文档的属性信息,作为选择(或推荐)理由(参照图28)。
在步骤S157中,代理器程序11确定是否通过输入模块56操作了“取消”按钮。如果发现点击了“取消”按钮,那么,进程转到步骤S158,并且将定时记录取消命令发送到HDD记录器2。如果发现未选择“取消”按钮,或者在步骤S157中发现选择了“记录”按钮,那么,跳过步骤S158的处理。
HDD记录器2的CPU 71在步骤S162中接收来自个人计算机1的定时记录取消命令,并在步骤S163中取消设置到RAM 73中的定时记录。
因此,通过对用户最初登记的喜好信息、观看日志、和其它信息进行形态分析生成了重要兴趣数据211,从而可以推荐与兴趣数据211匹配并且对于用户不可预料性高的节目信息。另外,通过反过来参考与来自文档特征数据库生成模块34生成的数据库的推荐节目相似的论题(或文档),可以获得与推荐节目相关联的推荐理由。因此,这种配置使用户感到好像根据他/她的个人联想将节目推荐给他/她。
在上述根据本发明的配置中,从用户交换的电子邮件、用户生成的文档、或用户喜好信息和观看日志中生成兴趣数据211,检索与兴趣数据211匹配的节目信息,由此作出推荐。也就是说,个人计算机1或HDD记录器2从数据库中读取事先生成的兴趣数据211并通过网络5将检索的兴趣数据211发送到服务器6,从而接收与兴趣数据211匹配的节目的推荐。因此,在这种新的配置中,那些看起来用户感兴趣的节目得到自动检索,从而与用户意图无关地推荐节目。
显然,节目的定时记录可以按照用户的意图来完成。下面参照如图30所示的流程图,描述例如由离家很远的用户利用他/她的数字移动电话4进行节目定时记录的处理。
用户操作数字移动电话4,以便准备如图31所示的有关节目的定时记录的电子邮件消息(下文称为定时记录邮件)241。如图所示,定时记录邮件241的主体含有,例如,像“今天记录音乐节目。尤其是古典音乐。如果有爵士音乐节目,也记录它。最后,记录世界杯信息”那样的消息。
也就是说,在准备定时记录邮件241的过程中,用户无需知道描述格式,因此,可以随心所欲地写。用户可以只把要定时记录的节目名、一部分演员名、或类型名写入定时记录邮件241中。为了使定时记录邮件241的接收方能够识别这个电子邮件是有关节目的定时记录的(即,定时记录邮件241),将诸如“定时记录邮件”或“定时记录”(在图31的例子中,“定时记录邮件”)之类的格式化文本写入“主题”(邮件的标题)中。
用户操作数字移动电话4,以便将准备好的定时记录邮件(图31)发送到家里的个人计算机1。因此,在步骤S181中,数字移动电话4接收与用户完成的操作相对应的输入信号,并且通过网络5将准备好的定时记录邮件241发送到个人计算机1。
在步骤S191中,个人计算机1的事件管理模块41检测定时记录邮件241通过网络5的接收,并且将其通知数据库查询模块42。在步骤S192中,数据库查询模块42从事件管理模块41获取与事件的发生相对应的定时记录邮件241。此刻,由于“定时记录邮件”被写入定时记录邮件241的“主题”中,数据库查询模块42识别出这是有关定时记录节目的电子邮件。然后,数据库查询模块42对接收的定时记录邮件241进行形态分析以提取文字,并且从它们中删除无用文字以生成(或计算)兴趣文字矢量(或特征矢量)。
在本例中,从消息“今天记录音乐节目。尤其是古典音乐。如果有爵士乐节目,也记录它。最后,记录世界杯信息”中,通过形态分析提取“今天、音乐、古典音乐、爵士音乐、世界杯”,作为兴趣文字。将“今天”转换成此刻的日期信息(例如,2001年4月9日)。
应该注意到,为各个类别定义树结构会提高形态分析的精确度。例如,对于音乐类别,可以事先定义“古典音乐、爵士音乐、流行音乐、摇滚音乐、日本民谣、...”,以便将这个定义应用于通过形态分析提取的兴趣文字矢量。然后,兴趣文字矢量由三个文字(或三个兴趣文字)“古典音乐、爵士音乐、世界杯”构成。
在步骤S193中,数据库查询模块42通过网络5将在步骤S193中生成的兴趣文字矢量发送到服务器6。
在步骤S211中,服务器6的事件管理模块131通过网络5从个人计算机1接收兴趣文字矢量。然后,事件管理模块131将接收的兴趣文字矢量供应给数据库查询模块132,以便将搜索请求通知它。在步骤S212中,响应来自事件管理模块131的搜索请求的通知,数据库查询模块132从数据库生成模块123生成的推荐节目数据库中搜索与包括在搜索请求中的兴趣文字矢量匹配的节目信息,将检索的节目信息选为要定时记录的节目。
在步骤S213中,节目信息输出模块133通过网络5将数据库查询模块132选择的要定时记录的节目发送到HDD记录器2,作为搜索结果。
在步骤S201中,HDD记录器2的CPU 71根据包括在通过网络5从服务器6发送的节目信息中的记录开始时间、记录结束时间、和信道,向RAM 73设置节目的定时记录,同时,控制调谐器79、解调器80、解码器81、和HDD78。因此,当已到定时记录的开始时间时,从RAM 73中读取节目信息以进行定时记录。
在步骤S202中,当定时记录的设置已经完成时,CPU 71准备如图32所示用于告知节目定时记录的设置已完成的电子邮件消息(下文称为定时记录设置完成邮件)251。如图所示,定时记录设置完成邮件251的主体携带如下消息:“如下节目已得到记录:”;第1条:19:00-20:00在第4信道播放的“世界杯集锦”;和第2条:21:00-21:54在第3信道播放的“XXX古典音乐”。
然后。通过网络5将准备好的定时记录设置完成邮件251发送到数字移动电话4。
在步骤S182中,数字移动电话4通过网络5接收来自HDD记录器2的定时记录设置完成邮件251。然后,当用户操作数字移动电话4以便显示接收的电子邮件时,数字移动电话4在步骤S183中,根据与用户操作相对应的输入信号,将定时记录设置完成邮件251显示到它的显示设备上。
因此,个人计算机1的代理器程序11对接收的定时记录邮件241进行形态分析并生成兴趣文字矢量(或定时记录所需的信息),将它发送到服务器6。服务器6搜索与从个人计算机1接收的兴趣文字矢量匹配的预定节目信息并将检索的节目信息发送到HDD记录器2。因此,节目的定时记录被自动设置到HDD记录器2上。
因此,当用户离家很远时,通过简单地将以自由文本形式准备的定时记录邮件241发送到家里的个人计算机1,他/她就可以容易地知道定时记录的设置已经完成且容易地定时记录节目。
在到目前为止所述的配置中,通过对用户交换的电子邮件的内容、用户最初登记的喜好信息、和用户的观看日志进行形态分析来准备兴趣数据211,并且作出与兴趣数据211匹配的节目信息的推荐,或者,通过对用户准备的定时记录邮件241(有关定时记录节目的电子邮件)进行形态分析来生成兴趣文字矢量,并且记录与这个兴趣文字矢量匹配的节目信息。因此,将像日常感兴趣的节目或潜在感兴趣的节目那样适合于各种情形和各种目的的各种节目推荐提供给用户。
此外,服务器6可以利用强调过滤,根据其它用户的兴趣数据211推荐节目。在这种情况下,个人计算机1或HDD记录器2将包括在兴趣数据211中的信息过滤成不会出现任何隐私问题的数据(例如,只选择类型名,而不是选择节目名),并且将所得数据发送到服务器6。这种过滤的级别可以由用户按需要设置。
并且,正如参照图27所述的那样,为了使用户确定是否在展示推荐理由的时候定时记录推荐节目,HDD记录器2可以通过将推荐节目分类成已经进行了定时记录的节目和已经取消定时记录的节目,存储他们的访问日志。因此,HDD记录器2可以通过计数定时记录推荐节目的频次或通过对访问日志进行形态分析以提取新的兴趣,来生成如图33所示的喜好数据260。
在图33的例子中,喜好数据260由指示推荐节目的分类的类型261(例如,戏剧、电影、新闻、体育、或音乐)、指示正被讨论的推荐节目的名称的标题262、指示正被讨论的推荐节目的广播时段的时段信息263(例如,早晨、中午、傍晚、黄金时段、或夜间)、指示在正被讨论的推荐节目中表演的人员的演员信息264、指示正被讨论的推荐节目的故事或重要部分的内容(或关键字)信息265、和与同正被讨论的用户一起观看正被讨论的推荐节目的用户相关联的参与者(attendant)信息266。
应该注意到,参与者信息266可以由用户通过输出模块57输入,可以由CPU 41检测总是来源于用户数字移动电话或时钟的设备ID并根据所检测的设备ID识别用户来输入,或者,可以通过辨别每个用户的会话语音并根据这个辨别来识别用户输入。
将如此生成的喜好数据260过滤成没有任何隐私问题的数据,并且将所得喜好数据发送到服务器6。当接收到喜好数据260时,服务器6可以搜索与喜好数据260匹配的节目信息并推荐用户新感兴趣的节目。
应该注意到,通过定义预定模式和用,例如,可扩展XML(可扩展标记语言)描述如图20所示的兴趣数据211和如图33所示的喜好数据260,并利用HTTP(超文本传输协议),也可以容易地从任何地方和任何设备访问这些数据。
在上述根据本发明的配置中,个人计算机1和HDD记录器2通过以太网(商标)发送/接收数据。或者,个人计算机1和HDD记录器2可以通过诸如i.Link(商标)、IEEE(电气和电子工程师协会)802.11a、IEEE802.11b、和蓝牙(Bluetooth)(商标)之类的任何一种无线LAN(局域网)发送/接收数据。除此之外,个人计算机1和HDD记录器2可以利用诸如磁盘、光盘、磁光盘、和半导体存储器之类的任何一种可移动的媒体来移动数据。
在本实施例中,与从电子邮件中提取的兴趣数据匹配的那些节目得到推荐。显然,推荐无线电节目或因特网上的网站信息也是行得通的。
并且,根据本发明,代理器231在推荐节目时展示出推荐理由,因此,使用户感到代理器231的可靠和亲密。
代理器231的显示、框232中台词的显示、和代表显示台词的语音信号的输出不仅可应用于本发明的代理器程序11,而且可应用于像,例如,游戏和文字处理器程序帮助屏幕那样的其它应用程序。另外,这些显示和输出显然可应用于显示在,例如,视频摄像机和汽车导航系统的显示设备上的字符。
在当前使用设备上利用在与当前使用设备不同的设备上积累的喜好数据260来获取节目的推荐也是行得通的。例如,如图34所示,如果电视接收器3-1与连接到网络5上的HDD记录器2-1连接,电视接收器3-2与连接到网络5上的HDD记录器2-2连接,用户可以根据在HDD记录器2-2上积累的喜好数据260,在HDD记录器2-1上获取节目的推荐。
下面参照如图35所示的流程图,描述在HDD记录器2-1上获取喜好数据的处理。在步骤S301中,HDD记录器2-1确定用于数据获取的指令是否已经发出,并且一直等待直到发出该指令为止。该指令由用户利用显示在,例如,电视接收器3的监视器上的GUI屏幕,通过输入模块76发出。
在步骤S302中,HDD记录器2-1接收所获取设备的指定输入。此刻,用来识别,例如,HDD记录器2-2的设备ID由用户输入。在步骤S303中,HDD记录器2-1获取所指定设备的喜好数据。此刻,HDD记录器2-1通过网络5访问HDD记录器2-2,以便获取在HDD记录器2-2上积累的喜好数据260。
在步骤S304中,HDD记录器2-1将在步骤S303中获得的喜好数据260发送到服务器6。
因此,获得的另一个设备的喜好数据被发送到服务器6。
下面参照如图36所示的流程图,描述在服务器6中根据在步骤S304中供应的喜好数据来搜索节目信息的处理。在步骤S321中,服务器6的事件管理模块131接收通过网络5供应的喜好数据260。然后,事件管理模块131将接收的喜好数据260发送到数据库查询模块132。
在步骤S322中,数据库查询模块132检验喜好数据260的格式。此刻,数据库查询模块132从喜好数据中检验节目信息搜索所需的任何信息(例如,类型)。
在步骤S323中,数据库查询模块132确定是否必须校正数据。如果喜好数据包含节目信息搜索所需的信息,那么,确定不需要校正数据,据此进程转到步骤S325。另一方面,如果不包含节目信息搜索所需的信息,那么,确定必须校正数据。然后,进程转到步骤S324,在步骤S324中,数据库查询模块132参照如图38所示的流程图,以便进行如后所述的数据校正处理。因此,节目信息搜索所需的信息被加入,以校正喜好数据。
在步骤S325中,数据库查询模块132从推荐节目数据库中搜索与喜好数据260匹配的节目信息。在步骤S326中,节目信息输出模块133将检索的节目信息发送到HDD记录器2-1。
因此,根据与正被讨论的用户当前使用的设备(HDD记录器2-1)不同的设备(在这种情况下,HDD记录器2-2)的喜好数据,进行节目的推荐。这种配置使用户拓宽了他/她的感兴趣范围。
应该注意到,上述喜好数据不局限于在HDD记录器2-1或HDD记录器2-2上积累的喜好数据;例如,也可以使用在个人计算机1上积累的喜好数据。图37示出了在个人计算机1上积累的喜好数据280的示例性配置。与喜好数据260不同,喜好数据280不包含诸如类型261、标题262、广播时段263、和演员信息264之类的信息(参照图33),且只由关键字281构成。
由于喜好数据280不包含节目信息搜索所需的信息(例如,类型),在步骤S323中确定需要数据校正处理。在步骤S324中,进行数据校正处理。下面参照如图38所示的流程图,描述图36的步骤S324中的这个数据校正处理。
在步骤S341中,数据库查询模块132从喜好数据280中提取关键字。在步骤S342中,数据库查询模块132从词典中搜索关键字。这个词典是,例如,将关键字和类型关联在一起的数据库,并且通过后面参照图39所述的词典生成处理事先存储在服务器6的存储模块59中。
在步骤S343中,数据库查询模块132确定关键字之间是否匹配。如果发现匹配,那么,数据库查询模块132在步骤S344中获取与关键字相对应的类型。在步骤S345中,数据库查询模块132将获得的类型加入喜好数据280中,从而校正数据。
如果在步骤S343中关键字之间不匹配,那么,进程转到步骤S346,在步骤S346中,发送出错信息。因此,通知HDD记录器2-1根据正被讨论的喜好数据进行的搜索失败了。
这种设置使得可以根据不包含节目信息搜索所需的信息的喜好数据来推荐节目。尤其是,根据在,例如,一般说来不在其上面观看节目的个人计算机和移动终端上积累的喜好数据来推荐节目变得可行了,从而拓宽了用户的兴趣。
下面参照如图39所示的流程图描述词典生成处理。在步骤S361中,节目元数据获取模块121获取元数据。此刻,要获取的元数据可以是诸如EPG数据之类的节目信息或通过网络5获取的内容的元数据。获取的元数据被发送到数据内容处理模块122或从数据内容处理模块122接收获取的元数据。图40示出了数据内容处理模块122的示例性功能配置。在本例中,安排了用于分析元数据的元数据分析模块301和用于根据元数据分析模块301的分析结果生成词典数据的词典数据生成模块302。
在步骤S362中,参照如图41所示的流程图,元数据分析模块301进行如后所述的元数据分析处理。因此,提取出元数据的组成成份并将其与元数据的类型相关联,将相关联数据存储起来。在步骤S363中,参照如图44所示的流程图,词典数据生成模块302进行如后所述的词典数据生成处理。因此,生成描述关键字和它们的类型的词典数据。
下面参照如图41所示的流程图,描述如图40所示的步骤S362的元数据分析处理。在步骤S381中,元数据分析模块301将获得的元数据分解成组成成份。元数据被分解成如图42所示那样。
图42示出了分解的元数据的例子。在本例中,元数据被分解成组成成份“类型”、“广播电台”、“广播时段”、“演员”、和“关键字”。组成成份“类型”指示与元数据相对应的内容的类型。组成成份“广播电台”指示广播与元数据相对应的内容的广播电台。组成成份“广播时段”指示广播与元数据相对应的内容的时段。组成成份“演员”指示出现在与元数据相对应的内容中的主要演员。组成成份“关键字”指示从,例如,介绍与元数据相对应的内容的字符信息中提取的预定文字(例如,名词)。
第1元数据组成成份“类型”被描述成“烹饪(cooking)”。第1元数据组成成份“广播电台”被描述成“TAS”。第1元数据组成成份“广播时段”被描述成“中午(noon)”。第1元数据组成成份“演员”被描述成“AAA”。第1元数据组成成份“关键字”被描述成“食谱(recipe)、配料(ingredients)、步骤(steps)、文字电视广播(teletext broadcast)、立体声(stereo)、...”。
第2元数据组成成份“类型”被描述成“日常生活信息(daily lifeinformation)”。第2元数据组成成份“广播电台”被描述成“MHK”。第2元数据组成成份“广播时段”被描述成“夜间(night)”。第2元数据组成成份“演员”被描述成“BBB”。第2元数据组成成份“关键字”被描述成“休闲(leisure)、娱乐地(resort)、儿童(children)、文字电视广播、立体声、...”。
第3元数据组成成份“类型”被描述成“儿童”。第3元数据组成成份“广播电台”被描述成“MHK”。第3元数据组成成份“广播时段”被描述成“早晨(morning)”。第3元数据组成成份“演员”被描述成“CCC”。第3元数据组成成份“关键字”被描述成“休闲、儿童、文字电视广播、立体声、...”。
因此,元数据被分解成它的组成成份。
在步骤S382中,元数据分析模块301检测元数据类型。在步骤S383,元数据分析模块301将检测的类型与每个组成成份相关联,并将结果存储到诸如RAM 73之类的临时存储单元中。此刻,元数据是针对每个类型收集的,并且在存储之前被排列成如图43所示那样。图43示出了此刻要存储的数据的例子。在本例中,在组成成份“类型”中描述为“烹饪”的元数据得到收集,它被分解成如上所述的组成成份“类型”、“广播电台”、“广播时段”、“演员”、和“关键字”。同样,在“类型”中描述为“日常生活(daily life)”的元数据和在“类型”中描述为“儿童”的元数据得到收集和存储。
因此,针对每个元数据类型收集和存储了元数据的组成成份。
下面参照如图44所示的流程图,描述如图39所示的步骤S363的词典数据生成处理。在步骤S401中,词典数据生成模块302从在步骤S383中存储的元数据中检测包含在每个广播电台的每个时段中的关键字。例如,在每个广播电台的每个时段中检测包含在图42中的组成成份“关键字”中的“文字电视广播”和“立体声”。这些文字(或关键字)被认为是在理解内容时不重要的文字,即,这些文字被认为是噪声。因此,在步骤S402中,词典数据生成模块302删除这些噪声文字。
在步骤S403中,词典数据生成模块302为每种类型检测同现频次高的关键字。例如,包含在如图43所示的组成成份“关键字”中的“食谱”、“配料”、和“步骤”共同包括在将“类型”分类成“烹饪”的第1、第2、和第3元数据中。这些文字(或关键字)被检测成在将“类型”分类成“烹饪”的元数据中同现频次高的关键字。
在步骤S404中,词典数据生成模块302将类型与关键字相关联,并且将它们存储成词典数据。图45示出了此刻要存储的词典数据的例子。在本例中,词典数据由“关键字”、“频次/月”、“类型”、和“其它组成成份”构成。“关键字”包含在步骤S403中检测的同现频次高的关键字。在本例中,描述了“食谱”、“配料”、和“步骤”等。“频次/月”包含在一个月内检测到每个关键字的频次。在“频次/月”中具有较大值的关键字被认为是当前流行的。
“类型”包括三个关键字所属的类型。例如,对于第1关键字“食谱”、第2关键字“配料”、和第3关键字“步骤”的每一个,“类型”被描述成“烹饪”。例如,对于第5关键字“娱乐地”,“类型”被描述成“日常生活信息”。对于第4关键字“休闲”和第6关键字“儿童”的每一个,“类型”被描述成“日常生活信息,儿童”。这表明,对于将它们的类型分类成“日常生活信息”的元数据,关键字“休闲”(或“儿童”)的同现频次是高的,对于将它们的类型分类成“儿童”的元数据,关键字“休闲”(或“儿童”)的同现频次也是高的。
“其它组成成份”包含在它们的类型以及它们的关键字方面被确定为同现频次高的那些组成成份。
因此,词典数据被生成,形成数据库,并且存储成词典。如上所述生成的词典的使用使得可以根据如上所述不包含节目信息搜索所需的信息的喜好数据来推荐节目。此外,在生成诸如节目信息之类的元数据的数据库地过程中,参考词典使得可以将类型指定给未指定类型的元数据,从而生成节目信息,以及生成有关当前流行节目的节目信息。
下面描述利用上述词典来生成元数据数据库的数据库生成处理。在步骤S421中,节目元数据获取模块121获取发送/接收的元数据。然后,将获得的元数据发送到数据内容处理模块122或从数据内容处理模块122接收获得的元数据。
在步骤S422中,数据内容处理模块122确定是否已经将类型指定给获得的元数据。如果没有指定类型,那么,进程转到步骤423,以便检测元数据的关键字。在步骤S424中,数据内容处理模块122确定是否存在关键字(或发现获取了关键字)。如果找到关键字,那么,进程转到步骤S425,以便通过获得的关键字搜索词典数据。
在步骤S426中,数据内容处理模块122确定在词典数据中是否找到匹配关键字。如果没有找到匹配关键字,那么,进程转到步骤S428,以便检测另一个关键字,据此进程返回到步骤S4224。
如果在步骤S424中没有找到(或获得)关键字,那么,进程即告结束。
如果在步骤S426中找到匹配关键字,那么,进程转到步骤S427,在步骤S427中,数据内容处理模块122获取与所检测关键字相对应的类型。例如,如果在步骤S423或步骤S428中找到关键字“食谱”,那么,参照图45确定与这个关键字相对应的类型是如上所述的“烹饪”,从而获取“烹饪”作为与这些元数据相对应的类型。
在步骤S429中,数据内容处理模块122参照图47,进行如后所述的数据描述处理。因此,节目信息(或元数据)的数据库得到存储。
另一方面,如果在步骤S422中发现已将类型指定给正被讨论的元数据,那么,进程转到步骤S430,在步骤S430中,数据内容处理模块122获取那种类型。然后,进程转到步骤S429,以便进行数据描述处理。
因此,根据获得的元数据,生成节目信息(或元数据)的数据库。将它的类型也指定给不含类型的元数据,并且将所得元数据存储在数据库中。
下面参照如图47所示的流程图,描述如图46所示的步骤S429的数据描述处理。在步骤S451中,数据内容处理模块122补充元数据组成成份。
例如,如果存在两个或更多个元数据组成成份,提取特定组成成份之间的相关性极高且其它组成成份之间的相关性极低的组成成份组合。利用这种组合,可以补充部分缺失的组成成份。例如,假设存在作为元数据组成成份的A、B、C、D、...X且有关组成成份A的属性值是A1、A2、和A3,有关组成成份B的那些属性值是B1、B2、B3、和B4,有关组成成份C的那些属性值是C1和C2,有关组成成份D的那些属性值是D1、D2、和D3,等等。
对于已经获得的元数据,可以通过参考如图45所示的词典数据中的“其它组成成份”来检验组成成份之间的相关性。根据这种检验,假设只在组成成份A1和B3之间及组成成份C2和D2之间存在强相关性,且在其它之间不存在相关性。此刻,如果获得某段新内容的元数据,这些元数据的组成成份A和D没有被指定,以及组成成份B是B3且组成成份C是C2,那么,可以可能性很高地预测构成这些元数据的组成成份是A1、B3、C2、和D2。因此,可以将还没有被指定的组成成份A和D指定给元数据,从而补充元数据组成成份。
在步骤S452中,数据内容处理模块122确定在步骤S423或步骤S428中检测的正被讨论的关键字是否是频次高的。此刻,从词典数据中检测与正被讨论的关键字相对应的“频次/月”的值。如果检测的值高于预定值(例如,10),那么,正被讨论的关键字被确定为频次高的。
在步骤S452中,如果发现正被讨论的关键字是频次高的,那么,进程转到步骤S453,在步骤S453中,将正被讨论的元数据的流行类别设置成流行的。因此,为元数据配备它们的流行类别并将所得元数据存储成相关信息可以利用这个相关信息向用户推荐流行内容。
另一方面,如果在步骤S452中,发现正被讨论的关键字不是频次高的,那么,跳过步骤S453的处理。
在步骤S454中,数据内容处理模块122将正被讨论的元数据与类型相关联,并且将结果存储成数据库。
因此,构成元数据的组成成份得到补充且流行类别被设置到被描述到数据库的元数据中。
执行上述一系列处理操作的代理器程序11或服务器程序101被事先安装在个人计算机中,或者以后从记录媒体安装在个人计算机上。
上述一系列处理操作也可以由硬件来执行;但是,一般说来,由软件来执行它们。当上述一系列处理操作由软件来执行时,将构成这个软件的代理器程序1从记录媒体安装到每一个组装在专用硬件设备中的计算机中,或者,例如,通过安装各种软件程序可以执行各种功能的通用个人计算机中。
用来存储安装在计算机中以便得到执行的软件程序的记录媒体可以是基于磁盘(包括软盘)62和150、光盘(包括CD-ROM(只读光盘存储器)和DVD(数字多功能盘))63和151、磁光盘(包括MD(小型盘))64和152、或半导体存储器65和153的插件式(package)媒体,或基于临时或永久地存储程序的ROM 52和142或存储模块59和147的硬件。将程序记录到上述记录媒体的任何一种上可以按需要,通过诸如路由器和调制解调器之类的接口,利用诸如公用线网络、局域网、因特网、和数字卫星广播之类的有线或无线通信媒体来执行。
这里应该注意到,描述记录在记录媒体中的每个程序的步骤不仅包括以时间相关方式依次执行的处理操作,而且包括同时地或分离地执行的处理操作。
这里所使用的术语“系统”表示由数个组件单元组成的整个设备。
工业实用性
如上所述和根据本发明的第1方面,可以推荐电视节目。
也就是说,根据本发明的第1方面,从他/她发送和接收的电子邮件中提取每个用户的兴趣,并推荐与提取的兴趣匹配的电视节目。
根据本发明的第2方面,可以轻而易举地请求搜索电视节目。
也就是说,根据本发明的第2方面,从他/她发送和接收的电子邮件中提取每个用户的兴趣,并可以请求搜索与提取的兴趣匹配的电视节目。
根据本发明的第3方面,可以从节目信息数据库中搜索电视节目。
也就是说,根据本发明的第3方面,根据从他/她发送和接收的电子邮件中提取的每个用户的兴趣,从数据库中搜索与用户的兴趣匹配的电视节目并向用户推荐检索的电视节目。
根据本发明的第4方面,在离家很远的地方也可以容易地设置电视节目的定时记录。
也就是说,根据本发明的第4方面,用户在离家很远的地方生成用来设置电视节目的定时记录的电子邮件消息,并将这个电子邮件消息发送到安装在家里的记录设备。记录设备接收电子邮件消息,提取有关定时记录的信息,并从服务器中获取与定时记录信息匹配的电视节目,从而定时记录匹配电视节目。
根据本发明的第5方面,可以轻而易举地定时记录电视节目。
也就是说,根据本发明的第5方面,接收用于定时记录电视节目的电子邮件消息,从接收的电子邮件消息中提取定时记录信息,并从服务器中获取有关与定时记录信息匹配的电视节目的节目信息,从而定时记录匹配电视节目。
根据本发明的第6方面,从用户发送和接收的电子邮件中提取用户的兴趣,并向用户推荐与提取的兴趣匹配的电视节目。
根据本发明的第7方面,可以容易地从用户发送和接收的电子邮件中提取用户的兴趣,从而请求搜索与提取的兴趣匹配的电视节目。

Claims (25)

1.一种含有信息处理设备和由所述信息处理设备通过网络访问的信息搜索设备的信息搜索系统,
所述信息处理设备包括:
提取装置,用于分析要被处理的文档,以提取用于获取有关节目的节目信息的兴趣文字,所述提取装置包括文档获取装置,用来从另一个应用程序中获得要被处理的文档;以及形态分析装置,用来对所述要被处理的文档进行形态分析,以便将所述要被处理的文档分解为所述兴趣文字;
搜索请求装置,用于将所述提取装置提取的所述兴趣文字发送到所述信息搜索设备,以请求搜索与所述兴趣文字相对应的所述节目信息;
接收装置,用于根据所述搜索请求装置接收来自所述信息搜索设备的所述节目信息;和
记录控制装置,用于根据所述接收装置接收的所述节目信息控制所述节目的记录;
所述信息搜索设备包括:
积累装置,用于积累所述节目信息;
搜索装置,用于根据从所述信息处理设备发送的所述搜索请求,从所述积累装置中搜索与包含在所述搜索请求中的所述兴趣文字相关联的所述节目信息;和
发送装置,用于将所述搜索装置检索的所述节目信息发送到所述信息处理设备。
2.根据权利要求1所述的信息搜索系统,其中,所述信息处理设备还包括数据库构造装置,用于生成所述提取装置提取的所述兴趣文字的数据库。
3.根据权利要求1所述的信息搜索系统,其中,所述信息处理设备还包括显示控制装置,用于控制所述接收装置接收的所述节目信息的显示。
4.根据权利要求1所述的信息搜索系统,其中,所述信息搜索设备的所述积累装置包括数据库构造装置,用于通过将所述节目信息与所述节目相关联而构成数据库。
5.根据权利要求1所述的信息搜索系统,其中,所述要被处理文档包括文档信息、与所述节目相关联的喜好信息、和所述节目的观看日志中的至少一个。
6.根据权利要求7所述的信息搜索系统,其中,所述文档信息是电子邮件,所述另一个应用程序是电子邮件应用程序。
7.根据权利要求1所述的信息搜索系统,其中,所述节目信息包括记录所述节目的记录开始时间、记录结束时间、和信道信息。
8.根据权利要求1所述的信息搜索系统,其中,所述信息处理设备从另外的信息处理设备中获取所述要被处理的文档。
9.一种信息处理设备,包括:
提取装置,用于分析要被处理的文档,以提取用于获取与节目有关的节目信息的兴趣文字,所述提取装置包括文档获取装置,用来从另一个应用程序中获得要被处理的文档;以及形态分析装置,用来对所述被处理文档进行形态分析,以便将所述要被处理的文档分解为所述兴趣文字;
搜索请求装置,用于将所述提取装置提取的所述兴趣文字发送到信息搜索设备,以请求搜索与所述兴趣文字相对应的所述节目信息;
接收装置,用于根据所述搜索请求装置接收来自所述信息搜索设备的所述节目信息;和
记录控制装置,用于根据所述接收装置接收的所述节目信息控制所述节目的记录。
10.根据权利要求9所述的信息处理设备,还包括数据库构造装置,用于生成所述提取装置提取的所述兴趣文字的数据库。
11.根据权利要求9所述的信息处理设备,还包括显示控制装置,用于控制所述接收装置接收的所述节目信息的显示。
12.根据权利要求9所述的信息处理设备,其中,所述预定信息包括文档信息、与所述节目相关联的喜好信息、和所述节目的观看日志中的至少一个。
13.根据权利要求12所述的信息处理设备,其中,所述文档信息是电子邮件。
14.根据权利要求9所述的信息处理设备,其中,所述节目信息包括记录所述节目的记录开始时间、记录结束时间、和信道信息。
15.根据权利要求9所述的信息处理设备,其中,所述预定信息是从另外的信息处理设备中获取的。
16.一种含有移动终端设备、通过网络与所述移动终端设备连接的信息处理设备、和由所述信息处理设备通过所述网络访问的信息搜索设备的信息搜索系统,
所述移动终端设备包括:
生成装置,用于生成用于定时记录节目的定时记录信息;和
第一发送装置,用于将所述生成装置生成的所述定时记录信息发送到所述信息处理设备;
所述信息处理设备包括:
提取装置,用于分析从所述移动终端设备发送的所述定时记录信息,以提取用于获取与所述节目相关联的节目信息的兴趣文字,所述提取装置包括形态分析装置,用来对所述定时记录信息进行形态分析,以便将所述定时记录信息分解为所述兴趣文字;
搜索请求装置,用于将所述提取装置提取的所述兴趣文字发送到所述信息搜索设备,以请求搜索与所述兴趣文字相对应的所述节目信息;
接收装置,用于根据所述搜索请求装置接收来自所述信息搜索设备的所述节目信息;和
记录控制装置,用于根据所述接收装置接收的所述节目信息控制所述节目的记录从而根据所述定时记录信息进行记录;
所述信息搜索设备包括:
积累装置,用于积累所述节目信息;
搜索装置,用于根据从所述信息处理设备发送的所述搜索请求,从所述积累装置中搜索与包含在所述搜索请求中的所述兴趣文字相关联的所述节目信息;和
第二发送装置,用于将所述搜索装置检索的所述节目信息发送到所述信息处理设备。
17.根据权利要求16所述的信息搜索系统,其中,所述信息搜索设备的所述积累装置包括数据库构造装置,用于通过将所述节目信息与所述节目相关联生成数据库。
18.根据权利要求16所述的信息搜索系统,其中,所述定时记录信息包括节目名、类型名、和演员名中的至少一个。
19.根据权利要求16所述的信息搜索系统,其中,所述定时记录信息是电子邮件。
20.根据权利要求16所述的信息搜索系统,其中,所述节目信息包含记录所述节目的记录开始时间、记录结束时间、和信道信息。
21.一种信息处理设备,包括:
提取装置,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字,所述提取装置包括形态分析装置,用来对所述定时记录信息进行形态分析,以便将所述定时记录信息分解为所述兴趣文字;
搜索请求装置,用于将所述提取装置提取的所述兴趣文字发送到信息搜索设备,以请求搜索与所述兴趣文字相对应的所述节目信息;
接收装置,用于根据所述搜索请求装置接收来自所述信息搜索设备的所述节目信息;和
记录控制装置,用于根据所述接收装置接收的所述节目信息控制所述节目的记录从而根据所述定时记录信息进行记录。
22.根据权利要求21所述的信息处理设备,其中,所述定时记录信息包括节目名、类型名、和演员名中的至少一个。
23.根据权利要求21所述的信息处理设备,其中,所述定时记录信息是电子邮件。
24.根据权利要求21所述的信息处理设备,其中,所述节目信息包含记录所述节目的记录开始时间、记录结束时间、和信道信息。
25.一种用于信息处理设备的信息处理方法,所述信息处理设备含有用于控制节目的记录的记录控制装置,所述信息处理方法包括:
提取步骤,用于分析从移动终端设备发送的定时记录信息,以提取用于获取与节目相关联的节目信息的兴趣文字,所述提取步骤包括对所述定时记录信息进行形态分析,以便将所述定时记录信息分解为所述兴趣文字;
搜索请求步骤,用于将所述提取步骤提取的所述兴趣文字发送到信息搜索设备,以请求搜索与所述兴趣文字相对应的所述节目信息;
接收控制步骤,用于根据所述搜索请求步骤控制来自所述信息搜索设备的所述节目信息的接收;和
记录控制步骤,用于根据所述接收装置接收的所述节目信息控制所述节目的记录从而根据所述定时记录信息进行记录。
CN038075075A 2002-03-29 2003-03-27 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法 Expired - Fee Related CN1647073B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP95414/2002 2002-03-29
JP2002095414 2002-03-29
PCT/JP2003/003795 WO2003083723A1 (fr) 2002-03-29 2003-03-27 Systeme de recherche d'informations, dispositif et procede de traitement d'informations et dispositif et procede de recherche d'informations

Publications (2)

Publication Number Publication Date
CN1647073A CN1647073A (zh) 2005-07-27
CN1647073B true CN1647073B (zh) 2010-05-26

Family

ID=28671807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038075075A Expired - Fee Related CN1647073B (zh) 2002-03-29 2003-03-27 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法

Country Status (6)

Country Link
US (2) US7725467B2 (zh)
EP (1) EP1492020A4 (zh)
JP (1) JP4433280B2 (zh)
KR (1) KR100988153B1 (zh)
CN (1) CN1647073B (zh)
WO (1) WO2003083723A1 (zh)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6769128B1 (en) 1995-06-07 2004-07-27 United Video Properties, Inc. Electronic television program guide schedule system and method with data feed access
BRPI9812104B1 (pt) 1997-07-21 2016-12-27 Guide E Inc método para navegar por um guia de programa interativo
US6898762B2 (en) 1998-08-21 2005-05-24 United Video Properties, Inc. Client-server electronic program guide
EP1265172A3 (en) * 2001-05-18 2004-05-12 Kabushiki Kaisha Square Enix (also trading as Square Enix Co., Ltd.) Terminal device, information viewing method, information viewing method of information server system, and recording medium
US20060059260A1 (en) * 2002-05-21 2006-03-16 Koninklijke Philips Electrics N.V. Recommendation of media content on a media system
US7539725B2 (en) 2003-04-03 2009-05-26 Zix Corporation Auditor system
JP4362311B2 (ja) * 2003-04-30 2009-11-11 富士通株式会社 電子メール装置および情報付加プログラム
JP4378131B2 (ja) * 2003-08-12 2009-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム
JP4544847B2 (ja) * 2003-11-20 2010-09-15 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 電子機器及びシステム
CN1922605A (zh) * 2003-12-26 2007-02-28 松下电器产业株式会社 辞典制作装置以及辞典制作方法
JP2006011550A (ja) 2004-06-22 2006-01-12 Sony Corp 協調フィルタリングによる情報伝送システム、これに用いる情報処理装置及び情報処理装置に用いるプログラム
JP2006099740A (ja) * 2004-09-02 2006-04-13 Olympus Corp 情報提供装置、端末装置、情報提供システム及び情報提供方法
JP2006129122A (ja) * 2004-10-29 2006-05-18 Sharp Corp 放送受信装置、放送受信方法、放送受信プログラム及びプログラム記録媒体
US9110985B2 (en) * 2005-05-10 2015-08-18 Neetseer, Inc. Generating a conceptual association graph from large-scale loosely-grouped content
US7958120B2 (en) * 2005-05-10 2011-06-07 Netseer, Inc. Method and apparatus for distributed community finding
JP2007094738A (ja) * 2005-09-28 2007-04-12 Sony Corp 嗜好情報処理システム、記録装置及び情報処理装置、並びに通信方法
US7743396B2 (en) * 2005-10-25 2010-06-22 Palm, Inc. Media streaming enhancements
JP2007158998A (ja) * 2005-12-08 2007-06-21 Hitachi Ltd 放送受信装置及びその録画番組選択支援方法
US8825657B2 (en) 2006-01-19 2014-09-02 Netseer, Inc. Systems and methods for creating, navigating, and searching informational web neighborhoods
WO2007100923A2 (en) * 2006-02-28 2007-09-07 Ilial, Inc. Methods and apparatus for visualizing, managing, monetizing and personalizing knowledge search results on a user interface
US7774341B2 (en) 2006-03-06 2010-08-10 Veveo, Inc. Methods and systems for selecting and presenting content based on dynamically identifying microgenres associated with the content
US8316394B2 (en) 2006-03-24 2012-11-20 United Video Properties, Inc. Interactive media guidance application with intelligent navigation and display features
KR100754768B1 (ko) * 2006-04-06 2007-09-03 엔에이치엔(주) 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체
US7577718B2 (en) * 2006-07-31 2009-08-18 Microsoft Corporation Adaptive dissemination of personalized and contextually relevant information
US7849079B2 (en) 2006-07-31 2010-12-07 Microsoft Corporation Temporal ranking of search results
US7685199B2 (en) * 2006-07-31 2010-03-23 Microsoft Corporation Presenting information related to topics extracted from event classes
JP5002223B2 (ja) * 2006-09-13 2012-08-15 株式会社東芝 情報提供システム、情報提供装置、情報提供プログラム及び情報収集方法
JP4240096B2 (ja) * 2006-09-21 2009-03-18 ソニー株式会社 情報処理装置および方法、プログラム並びに記録媒体
US9817902B2 (en) * 2006-10-27 2017-11-14 Netseer Acquisition, Inc. Methods and apparatus for matching relevant content to user intention
JP2008118232A (ja) * 2006-11-01 2008-05-22 Hitachi Ltd 映像再生装置
JP4423568B2 (ja) * 2006-12-08 2010-03-03 ソニー株式会社 表示制御処理装置および方法並びにプログラム
KR101183358B1 (ko) * 2007-01-19 2012-09-14 가부시키가이샤 코나미 데지타루 엔타테인멘토 게임 단말, 게임 시스템 및 컴퓨터 판독 가능한 기록 매체
WO2008088004A1 (ja) * 2007-01-19 2008-07-24 Konami Digital Entertainment Co., Ltd. ゲームシステム、サーバ装置、プログラムおよびコンピュータ読み取り可能な記録媒体
US20080208847A1 (en) * 2007-02-26 2008-08-28 Fabian Moerchen Relevance ranking for document retrieval
US7801888B2 (en) * 2007-03-09 2010-09-21 Microsoft Corporation Media content search results ranked by popularity
JP2008257655A (ja) * 2007-04-09 2008-10-23 Sony Corp 情報処理装置及び方法、並びにプログラム
WO2009019858A1 (ja) * 2007-08-08 2009-02-12 Panasonic Corporation 番組検索支援装置およびその方法
JP2009140051A (ja) * 2007-12-04 2009-06-25 Sony Corp 情報処理装置、情報処理システム、推薦装置、情報処理方法および記憶媒体
CN101227433B (zh) * 2008-02-04 2014-07-30 华为软件技术有限公司 在网络电视业务系统中实现信息共享的方法和终端
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
CN101252750A (zh) * 2008-04-11 2008-08-27 华为技术有限公司 一种移动搜索的方法、系统和设备
US10387892B2 (en) 2008-05-06 2019-08-20 Netseer, Inc. Discovering relevant concept and context for content node
US20090300009A1 (en) * 2008-05-30 2009-12-03 Netseer, Inc. Behavioral Targeting For Tracking, Aggregating, And Predicting Online Behavior
JP4760864B2 (ja) * 2008-06-25 2011-08-31 ソニー株式会社 情報処理装置、情報処理方法、プログラム、及び、情報処理システム
US9269090B2 (en) 2008-08-18 2016-02-23 Nokia Technologies Oy Method, apparatus and computer program product for providing indications regarding recommended content
JP2010074660A (ja) * 2008-09-19 2010-04-02 Toshiba Corp 番組自動選択装置、番組自動選択方法及びプログラム
US8407236B2 (en) * 2008-10-03 2013-03-26 Microsoft Corp. Mining new words from a query log for input method editors
JP2010154397A (ja) * 2008-12-26 2010-07-08 Sony Corp データ処理装置、データ処理方法、及び、プログラム
US8938467B2 (en) 2009-03-25 2015-01-20 Eloy Technology, Llc System and method for intelligent storage of time shifted content
JP2010245853A (ja) * 2009-04-07 2010-10-28 Hitachi Ltd 動画インデクシング方法及び動画再生装置
US20110010742A1 (en) * 2009-07-10 2011-01-13 At&T Intellectual Property I, L.P. Enhanced network search
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
JP5503933B2 (ja) * 2009-09-28 2014-05-28 Kddi株式会社 携帯無線通信端末、コンテンツ視聴システム、携帯無線通信端末の制御方法、携帯無線通信端末の制御プログラム
JP5657259B2 (ja) * 2010-02-26 2015-01-21 レノボ・イノベーションズ・リミテッド(香港) 情報処理装置、通信端末、興味情報提供方法および興味情報提供プログラム
JP5081949B2 (ja) * 2010-05-24 2012-11-28 ソニーモバイルコミュニケーションズ株式会社 電子機器、システム、および電子機器制御方法
US8312055B2 (en) * 2010-06-11 2012-11-13 Sony Corporation Content alert upon availability for internet-enabled TV
US8725807B2 (en) * 2010-08-04 2014-05-13 International Business Machines Corporation Decentralized data casting in an interest aware peer network
WO2012094564A1 (en) 2011-01-06 2012-07-12 Veveo, Inc. Methods of and systems for content search based on environment sampling
US8880406B2 (en) * 2011-03-28 2014-11-04 Epic Systems Corporation Automatic determination of and response to a topic of a conversation
US8566336B2 (en) 2011-03-30 2013-10-22 Splunk Inc. File identification management and tracking
US8548961B2 (en) * 2011-03-30 2013-10-01 Splunk Inc. System and method for fast file tracking and change monitoring
US20130007137A1 (en) * 2011-06-28 2013-01-03 Microsoft Corporation Electronic Conversation Topic Detection
US9116984B2 (en) 2011-06-28 2015-08-25 Microsoft Technology Licensing, Llc Summarization of conversation threads
KR20130065802A (ko) * 2011-11-30 2013-06-20 삼성전자주식회사 키워드를 이용한 애플리케이션 추천 시스템 및 방법
JP5853653B2 (ja) * 2011-12-01 2016-02-09 ソニー株式会社 サーバ装置、情報端末及びプログラム
US8943004B2 (en) 2012-02-08 2015-01-27 Adam Treiser Tools and methods for determining relationship values
US8478702B1 (en) * 2012-02-08 2013-07-02 Adam Treiser Tools and methods for determining semantic relationship indexes
US11100523B2 (en) 2012-02-08 2021-08-24 Gatsby Technologies, LLC Determining relationship values
US8688602B1 (en) * 2012-02-21 2014-04-01 Google Inc. Metadata generation based upon extraction of information from full text of books
US10311085B2 (en) 2012-08-31 2019-06-04 Netseer, Inc. Concept-level user intent profile extraction and applications
US8965867B2 (en) * 2012-11-30 2015-02-24 International Business Machines Corporation Measuring and altering topic influence on edited and unedited media
US9282066B2 (en) 2013-07-18 2016-03-08 International Business Machines Corporation Targeted message response
US10417338B2 (en) * 2014-09-02 2019-09-17 Hewlett-Packard Development Company, L.P. External resource identification
KR20160051983A (ko) * 2014-10-30 2016-05-12 현대자동차주식회사 차량의 음악 추천 시스템 및 그 방법
CN105187882B (zh) * 2015-09-09 2018-05-15 无锡天脉聚源传媒科技有限公司 一种视频相关信息的同步处理方法及装置
JP6844545B2 (ja) * 2015-11-30 2021-03-17 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
KR20190099582A (ko) * 2018-02-19 2019-08-28 현대자동차주식회사 차량의 기능 추천 장치 및 방법
JP7386501B2 (ja) * 2019-05-22 2023-11-27 株式会社LegalOn Technologies 文書処理プログラム及び情報処理装置
JP2023020177A (ja) * 2021-07-30 2023-02-09 コニカミノルタ株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619247A (en) * 1995-02-24 1997-04-08 Smart Vcr Limited Partnership Stored program pay-per-play
CN1227457A (zh) * 1997-12-19 1999-09-01 松下电器产业株式会社 产生节目信息的方法和装置以及处理节目信息的接收装置

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208805B1 (en) 1992-02-07 2001-03-27 Max Abecassis Inhibiting a control function from interfering with a playing of a video
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
JP3351058B2 (ja) * 1993-11-09 2002-11-25 松下電器産業株式会社 映像機器における録画および選局方法
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
EP2282540A3 (en) 1995-10-02 2013-05-15 Starsight Telecast, Inc. Systems and methods for providing television schedule information
US6216264B1 (en) * 1995-11-17 2001-04-10 Thomson Licensing S.A. Scheduler apparatus employing a gopher agent
US6591245B1 (en) * 1996-02-02 2003-07-08 John R. Klug Media content notification via communications network
US5794249A (en) * 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US5732216A (en) * 1996-10-02 1998-03-24 Internet Angles, Inc. Audio message exchange system
US6199076B1 (en) * 1996-10-02 2001-03-06 James Logan Audio program player including a dynamic program selection controller
JPH10257405A (ja) * 1997-03-11 1998-09-25 Mitsubishi Electric Corp 番組選択装置及び映像受信機
JPH117453A (ja) * 1997-04-22 1999-01-12 Mitsubishi Electric Corp メディア情報推薦装置
US6360234B2 (en) * 1997-08-14 2002-03-19 Virage, Inc. Video cataloger system with synchronized encoders
US8352984B2 (en) * 1998-06-12 2013-01-08 Thomson Licensing System and method for generating and managing user preference information for scheduled and stored television programs
JP4465560B2 (ja) 1998-11-20 2010-05-19 ソニー株式会社 情報表示制御装置及び情報表示制御装置の情報表示制御方法
US6424997B1 (en) * 1999-01-27 2002-07-23 International Business Machines Corporation Machine learning based electronic messaging system
JP3606764B2 (ja) 1999-04-20 2005-01-05 シャープ株式会社 ファイルオブジェクト閲覧と関連して提示されたテレビ番組表から、録画予約、または録画済の番組再生を行うシステム
JP2000341599A (ja) * 1999-05-28 2000-12-08 Matsushita Electric Ind Co Ltd 番組受信装置
WO2000076154A1 (fr) * 1999-06-02 2000-12-14 Fujitsu Limited Systeme de construction d'espace de communication virtuel correspondant a de l'information de detection du monde reel
KR20010008962A (ko) * 1999-07-06 2001-02-05 정선종 개념분류망을 이용한 정보 검색 장치 및 그 방법
JP4224744B2 (ja) * 1999-08-17 2009-02-18 ソニー株式会社 放送システム、情報提供装置及び放送通信装置
US7188355B1 (en) * 1999-09-30 2007-03-06 Canon Kabushiki Kaisha Television program recommendation system
WO2001047273A1 (en) * 1999-12-21 2001-06-28 Tivo, Inc. Intelligent system and methods of recommending media content items based on user preferences
JP4608740B2 (ja) 2000-02-21 2011-01-12 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
JP4605415B2 (ja) * 2000-02-21 2011-01-05 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP3307625B2 (ja) * 2000-02-25 2002-07-24 株式会社ガーラ 電子掲示板システムおよびメールサーバー
JP2001275048A (ja) * 2000-03-24 2001-10-05 Victor Co Of Japan Ltd 番組推薦装置
JP2001282830A (ja) * 2000-03-28 2001-10-12 Sony Corp 情報処理装置および方法、情報処理システム、並びにプログラム格納媒体
JP2001282831A (ja) 2000-03-28 2001-10-12 Sony Corp 情報処理装置および方法、情報処理システム、並びにプログラム格納媒体
JP4513159B2 (ja) * 2000-03-28 2010-07-28 ソニー株式会社 情報処理装置および方法、並びに記録媒体
AR028003A1 (es) * 2000-04-10 2003-04-23 United Video Properties Inc Guia de programacion interactiva con interfaz de guia de medios
US20020087577A1 (en) * 2000-05-31 2002-07-04 Manjunath Bangalore S. Database building method for multimedia contents
EP1307048A4 (en) * 2000-07-03 2005-04-20 Fujitsu Ltd APPARATUS FOR DIGITAL VIDEO INFORMATION
JP4403643B2 (ja) * 2000-08-04 2010-01-27 ソニー株式会社 番組視聴サービスシステム
AU8845301A (en) * 2000-08-25 2002-03-04 Intellocity Usa Inc Personalized remote control
JP2002077755A (ja) 2000-08-29 2002-03-15 Sharp Corp エージェントインタフェース装置
US20020065857A1 (en) * 2000-10-04 2002-05-30 Zbigniew Michalewicz System and method for analysis and clustering of documents for search engine
US7007294B1 (en) * 2000-10-30 2006-02-28 Koninklijke Philips Electronics N.V. Method and apparatus for automatic generation of query search terms for a program recommender
US7315881B2 (en) * 2000-12-27 2008-01-01 Thomson Licensing Scheduler apparatus employing a gopher agent that sends e-mail messages for use in a television receiver
ATE321422T1 (de) * 2001-01-09 2006-04-15 Metabyte Networks Inc System, verfahren und software für die bereitstellung einer gezielten werbung durch benutzerprofildatenstruktur basierend auf benutzerpräferenzen
US6859803B2 (en) * 2001-11-13 2005-02-22 Koninklijke Philips Electronics N.V. Apparatus and method for program selection utilizing exclusive and inclusive metadata searches
US7020654B1 (en) * 2001-12-05 2006-03-28 Sun Microsystems, Inc. Methods and apparatus for indexing content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619247A (en) * 1995-02-24 1997-04-08 Smart Vcr Limited Partnership Stored program pay-per-play
CN1227457A (zh) * 1997-12-19 1999-09-01 松下电器产业株式会社 产生节目信息的方法和装置以及处理节目信息的接收装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开平11-7453A 1999.01.12
说明书第27栏第24-25、28-39行,第28栏第7-10行,图3.

Also Published As

Publication number Publication date
KR20040101356A (ko) 2004-12-02
CN1647073A (zh) 2005-07-27
US8112420B2 (en) 2012-02-07
KR100988153B1 (ko) 2010-10-18
US7725467B2 (en) 2010-05-25
US20050165739A1 (en) 2005-07-28
WO2003083723A1 (fr) 2003-10-09
EP1492020A1 (en) 2004-12-29
US20100211595A1 (en) 2010-08-19
JP4433280B2 (ja) 2010-03-17
JPWO2003083723A1 (ja) 2005-08-04
EP1492020A4 (en) 2005-09-21

Similar Documents

Publication Publication Date Title
CN1647073B (zh) 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法
JP6235556B2 (ja) コンテンツ提示方法、コンテンツ提示装置及びプログラム
US9396258B2 (en) Recommending video programs
JP5254508B2 (ja) 放送に対する視聴者フィードバックを収集し、かつ提供するための方法および装置
CN102103634B (zh) 信息处理设备和方法
CN1268128C (zh) 组合几个epg源成为一个可靠的epg的系统和方法
CN100372372C (zh) 电子节目指南数据的自由文本和属性搜索
CN102265276B (zh) 基于上下文的推荐系统
JP2007274604A (ja) 電子装置、その情報閲覧方法及び情報閲覧プログラム
JP2007274605A (ja) 電子装置、放送番組情報の収集方法、その収集プログラム及びその収集システム
CN102073671B (zh) 话题识别系统、装置和方法、客户终端和信息处理方法
US8478759B2 (en) Information presentation apparatus and mobile terminal
CN103299648A (zh) 接收增强服务的方法及其显示装置
JP4370850B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN101595481A (zh) 用于在电子装置上促进信息搜索的方法和系统
US8875186B2 (en) Apparatus and method of providing a recommended broadcast program
CN1326075C (zh) 自动视频检索器精灵
CN101888527A (zh) 推荐本地和远程内容的方法
WO2004045221A1 (ja) 視聴履歴記録方法および視聴履歴利用方法
JP2006524009A (ja) 視聴者分析結果の生成
JP2002531895A (ja) 習慣、統計的推論、及び心理人口統計学的プロファイリングに基づいたスマート・エージェント
CN105230035A (zh) 用于选择的时移多媒体内容的社交媒体的处理
CN101616292A (zh) 信息处理设备、信息处理方法、程序和信息处理系统
CN102084645A (zh) 关联场景赋予装置以及关联场景赋予方法
JP2006311010A (ja) 情報システム、情報提供システム及び情報提供プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100526

Termination date: 20210327

CF01 Termination of patent right due to non-payment of annual fee