CN106021444A - 用于分析和合成复杂知识表示的系统和方法 - Google Patents

用于分析和合成复杂知识表示的系统和方法 Download PDF

Info

Publication number
CN106021444A
CN106021444A CN201610323839.8A CN201610323839A CN106021444A CN 106021444 A CN106021444 A CN 106021444A CN 201610323839 A CN201610323839 A CN 201610323839A CN 106021444 A CN106021444 A CN 106021444A
Authority
CN
China
Prior art keywords
concept
knowledge
relation
complex
represent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610323839.8A
Other languages
English (en)
Other versions
CN106021444B (zh
Inventor
I·F·伊尔亚斯
P·J·斯威尼
A·J·亨特
A·D·布莱克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primal Fusion Inc
Original Assignee
Primal Fusion Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primal Fusion Inc filed Critical Primal Fusion Inc
Publication of CN106021444A publication Critical patent/CN106021444A/zh
Application granted granted Critical
Publication of CN106021444B publication Critical patent/CN106021444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Abstract

本申请的各实施例涉及用于分析和合成复杂知识表示的系统和方法。用于分析和合成复杂知识表示(KR)的技术可以利用被存储为机器可读数据和/或编程指令的、包括基本数据结构和知识处理规则二者的原子知识表示模型。可以应用知识处理规则中的一个或者多个知识处理规则以分析输入复杂KR以将它的复杂概念和/或概念关系解构成将在基本数据结构中包括的基本概念和/或概念关系。可以应用知识处理规则中的一个或者多个知识处理规则以根据输入上下文从存储的基本数据结构合成输出复杂KR。可以分析和解构各种类型的多个输入复杂KR以填充基本数据结构,并且可以通过基本数据结构变换输入复杂KR以输出不同类型的复杂KR,从而向不同类型的KR和/或KR模型提供语义互操作性。

Description

用于分析和合成复杂知识表示的系统和方法
分案申请说明
本申请是国际申请日为2011年6月22日、于2012年12月21日进入中国国家阶段、申请号为201180031005.5、名称为“用于分析和合成复杂知识表示的系统和方法”的中国发明专利申请的分案申请。
相关申请的交叉引用
本申请要求对通过引用而完全结合于此、于2010年6月22日提交、标题为"Systems and Methods for Analyzing and SynthesizingComplex Knowledge Representations"的第61/357,266号的美国临时申请的优先权。这一申请也构建于在由相同申请人和/或受让人提交的多份在先申请中公开的概念上,这些在先申请包括阅读者除了参考下文讨论的背景之外也作为背景而参考的以下申请:于2011年6月15日提交、标题为"Systems and Methods for Analyzing andSynthesizing Complex Knowledge Representations"的第13/161,165号美国专利申请;于2009年6月4日提交、标题为"System,Method andComputer Program for Transforming an Existing Complex DataStructure to Another Complex Data Structure"的第12/477,977号美国专利申请;于2006年8月31日提交、标题为"Complex-AdaptiveSystem for Providing a Faceted Classification"、现为第7,596,574号美国专利的第11/469,258号美国专利申请;以及于2006年3月30日提交、标题为"System,Method,and Computer Program for Constructingand Managing Dimensional Information Structures"的第11/392,937号美国专利申请。
背景技术
广而言之。知识表示是如下活动,该活动使抽象知识作为具体数据结构而明确以支持基于机器的存储、管理和推理系统。存在用于利用根据各种类型的知识表示模型构造的知识表示(KR)的常规方法和系统,这些KR包括:结构化受控词汇表,比如分类法、辞典和按面分类;形式规范,比如语义网络和本体论;以及非结构化形式,比如基于自然语言的文档。
分类法是如下KR结构,该KR结构将类别组织成分级树并且关联类别与相关对象(比如物理项(item)、文档或者其它数字内容。通常在也被称为父类型-子类型关系、广义性-专门性关系或者父-子关系的继承关系方面组织分类法中的类别或者概念。在这样的关系中,子类别或者概念具有与它的父代相同的性质、行为和约束以及一个或者多个附加性质、行为或者约束。例如,知识语句“狗是哺乳动物”可以在分类法中由通过父-子分级关系链接的、被标注为“哺乳动物”和“狗”的概念/类别编码。这样的表示对狗(子概念)是哺乳动物(父概念)类型、但是并非每个哺乳动物必然是狗这样的概念编码。
辞典是表示术语(比如用于信息检索的搜索关键词)的KR,这些术语经常编码为单字词名词概念。在辞典中的术语/概念之间的链接通常被划分成以下三个类型的关系:分级关系、等价关系和关联关系。分级关系用来链接在范围上比彼此更窄和更宽的术语,这与在分类法中的概念之间的关系相似。沿用前例,“狗”和“哺乳动物”是由分级关系链接的术语。等价关系链接可以作为搜索术语而相互代替的术语,比如同义词或者近义词。例如,可以在一些上下文中通过等价关系链接术语“狗”和“犬科”。关联关系链接如下有关术语,这些术语的关系既不是分级也不是等价。例如,搜索术语“狗”的用户也可能想要看见从“饲养员”的搜索中返回的项,并且可以针对该对术语在辞典数据结构中对关联关系进行编码。
按面分类基于信息具有多维质量并且可以按照许多不同方式来编码这样的原理。信息领域的主题被细分成用于表示这一维度性的面(或者更简称为类别)。领域的属性在面分级中有关。继而基于这些属性对领域内的对象进行描述和分类。例如,可以使用颜色面、材料面、款式面等对物理或者基于web的服装店中提供销售的衣物汇集进行分类,其中每个面具有表示不同类型的颜色、材料、款式等的多个分级属性。按面分类经常在按面搜索系统中例如用来允许用户按照任何希望的面排序(比如按照先颜色后款式、按照先款式后颜色、按照先材料后颜色后款式或者按照任何其它希望的面优先顺序搜索衣物汇集。这样的按面分类与通过分类法的分类对照,在后者中,类别分级是固定的。
语义网络是表示在概念之间的各种类型的语义关系的网络结果或者对网络结构进行编码或者实例化的数据结构。语义网络通常被表示为由表示概念的顶点和用链接概念对的关系类型标注的边构成的有向或者无向图。语义网络的示例是WordNet,这是英语语言的词汇数据库。在WordNet中定义的一些常见类型的语义关系是整体-部分关系(A是B的部分)、上下位关系(A是B的一种)、同义词(A与B同义)和反义词(A与B反义)。
本体论是对概念和在那些概念之间的关系进行编码的KR结构,该KR结构限于它用来建模的现实或者虚拟世界的特定领域。在本体论中包括的概念通常表示术语在它们应用于被建模或者分类的领域时的特定含义,并且包括的概念关系通常表示那些概念在领域内被相关的方式。例如,与字词“卡”对应的概念可以在关于纸牌游戏领域的本体论和关于计算机硬件领域的本体论中具有不同含义。
一般而言,所有上文讨论的KR类型以及其它常规示例是用于在抽象概念和在那些概念之间的关系方面对人类知识进行建模并且用于使该知识可由机器(比如计算机)访问以用于执行各种需要知识的任务的工具。这样,人类用户和软件开发者常规地使用他们的人类知识来构造KR数据结构,并且将完成的KR数据结构人工编码成机器可读形式作为将存储于机器存储器中并且由各种机器执行的功能访问的数据结构。
发明内容
一个实施例涉及一种用于生成复杂知识表示的方法,该方法包括:接收指示请求上下文的输入;用处理器将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。
另一实施例涉及一种用于生成复杂知识表示的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:接收指示请求上下文的输入;将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。
另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于生成复杂知识表示,其中指令在被执行时,执行:接收指示请求上下文的输入;将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。
另一实施例涉及一种用于解构原有知识表示的方法,该方法包括:接收与原有知识表示对应的输入;用处理器应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及一种用于解构原有知识表示的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:接收与原有知识表示对应的输入;应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于解构原有知识表示,其中指令在被执行时,执行:接收与原有知识表示对应的输入;应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及一种用于支持在知识表示之间的语义互操作性的方法,该方法包括:对于多个输入知识表示中的每个输入知识表示,用处理器应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且用处理器在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及一种用于支持在知识表示之间的语义互操作的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:对于多个输入知识表示中的每个输入知识表示,应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于支持在知识表示之间的语义互操作性,其中指令在被执行时,执行:对于多个输入知识表示中的每个输入知识表示,应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。
另一实施例涉及一种用于合成复杂指示表示的计算机实施的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
其中,在所述方法中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
其中,在所述方法中,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。
另一实施例涉及至少一个非瞬态计算机可读存储介质,所述至少一个非瞬态计算机可读存储介质存储计算机可执行指令,所述计算机可执行指令在被执行时执行用于合成复杂知识表示的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
其中,在所述至少一个非瞬态计算机可读存储介质中,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。
另一实施例涉及一种装置,包括:至少一个处理器;以及至少一个存储介质,所述至少一个存储介质存储处理器可执行指令,所述处理器可执行指令在由所述至少一个处理器执行时执行用于合成复杂知识表示的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
其中,在所述装置中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
前文是由所附权利要求限定的本发明的非限制性发明内容。
附图说明
附图并非旨在于按比例绘制。在附图中,在各图中图示的每个相同或者接近相同的部件。出于清楚的目的,可以不在每幅图中标注每个部件。在附图中:
图1是图示了根据本发明的一些实施例的用于实施原子知识表示模型的示例性系统的框图;
图2A图示了根据本发明的一些实施例的示例性复杂知识表示;
图2B图示了根据本发明的一些实施例的原子知识表示模型的示例性基本数据结构;
图3图示了根据本发明的一些实施例的示例性数据规划;
图4图示了根据本发明的一些实施例的用于分析复杂知识表示的示例性方法;
图5是图示了根据本发明的一些实施例的用于实施分析和合成复杂知识表示的示例性分布式系统的框图;
图6是图示了根据本发明的一些实施例的用于分析复杂知识表示以生成基本数据结构的示例性方法的流程图;
图7是图示了根据本发明的一些实施例的用于从基本数据结构合成复杂知识表示的示例性方法;
图8是图示了根据本发明的一些实施例的示例性知识处理规则集的表;
图9图示了可以从示例性自然语言文本推导的知识表示的示例;
图10图示了可以从示例性辞典分析的基本数据结构的示例;并且
图11是图示了用于在实现本发明的一些实施例时使用的示例性计算系统的框图。
具体实施方式
如上文讨论的那样,通过常规方法创建的知识表示(KR)数据结构对针对特定领域或者上下文建模的特定人类知识集进行编码和表示。由于KR通常由人类开发者构造并且以完整形式编程到机器存储器中,所以常规KR仅包含人类用户原先用来对它编程的人类知识子集。
例如,KR可以对知识语句“狗是哺乳动物”编码,并且它也可以表达关于作为哺乳动物的动物的语句或者断言,比如“哺乳动物产生乳汁以喂养它们的幼崽”。发明人已经认识到这样的事实组合在与适当逻辑和语义规则组合时可以支持广泛人类推理从而使起初在KR内未作为事实而播种的显式推论(比如“狗产生乳汁用于喂养它们的幼崽”)成为显式。发明人已经领会到通过这样的推断扩展KR数据结构可以用来支持各种基于知识的活动和任务,比如推断/推理(如上文所示)、信息检索、数据挖掘和其它形式的分析。
然而,如上文讨论的那样,用于对KR进行构造和编码的方法已经常规上限于人工输入完整KR结构以用于由机器(比如计算机)访问和使用。沿用上例,虽然充当KR设计者的人类个人可以隐式理解为什么“狗产生乳汁用于喂养它们的幼崽”这一事实成立,但是为了使它成立而必须保持的性质(在这一情况下为比如传递性和继承性这样的性质)并不常规地是KR的显式部分。换言之,可以指导创建新知识的任何根本规则集并未常规地编码为KR的部分,而是实际上由人类设计者在构造KR时从系统以外应用。
常规方式的先前未认识到的结果是可以在KR中表达知识以用于由机器使用,但是KR本身不能由机器创建。人类被迫对知识领域建模以用于由机器消耗。遗憾的是,由于人类知识如此极为广泛并且在许多情况下是主观的,所以对所有知识领域建模在技术上不可行。
另外,由于如此多的知识必须被显式编码为数据,所以所得数据结构随着知识领域增长而快速变得无比庞大。由于常规KR并未用它们的用于知识创建的根本理论或者实践来编码为组成知识表示模型的数据的部分,所以它们的所得数据结构可能变得很复杂和不实用。换言之,由于知识表示无法由机器创建,所以它常规地必须被提供为显式数据或者以别的方式通过逻辑或者统计手段来演绎或者归纳。
因此,常规KR方式导致多个问题:
大而复杂的数据结构:常规地对知识表示进行编码的数据结构构建和维护起来复杂。甚至相对简单的机器可读知识领域(比如关于狗和哺乳动物的简单语句)也可能生成数量级比它的自然语言对应数据更大的数据量。
依赖于领域专家:指引KR的实践的根本理论必须在KR数据结构的常规创建中由人类表达。这是在产生这些至关重要的数据资产时排除多数人和所有机器的耗时活动。作为结果,迄今为止的大多数人类知识已经保持隐式并且在计算范畴以外。
在使用之前创建数据:知识常规地在它被调用以用于特定使用时这样的时间之前被建模为数据,如果无需该知识,则这存在高成本并且潜在地存在浪费。因而,发明人已经认识到如果知识可以仅随需由机器创建,则可以大量减少数据产生和存储要求。
大规模数据和处理成本:常规KR系统必须在创建新事实或者答复查询的服务中在很大数据结构内推理。这一规模负担表示常规KR系统中的重大挑战,这是可以通过更多使用一种用于创建根本数据结构的及时方法而不是常规的在使用之前的数据方法来减少的负担。
集成和互操作性挑战:语义互操作性(两个不同KR共享知识的能力)是在不同模型之下创建并且按照不同方式表达各种KR时的大规模困难挑战,该挑战经常应对主观和含糊主题。精确度和准确推理的能力经常跨越多个不同KR而丢失。就这一点而言,发明人已经领会到如果包括用于如何创建知识的根本理论作为KR的部分,则跨越不同KR的知识协调可能变成棘手问题。
因而,根据本公开内容的一些实施例提供一种对知识创建规则进行编码以使创建知识表示的过程自动化的系统。一些实施例组合新的知识表示综合方式与用于创建和管理从这样的方式推导的所得数据结构的计算系统。
一些实施例组合更压缩的(原子)数据集与对根本知识创建进行编码的生成规则集而不是将领域中的所有知识建模为显式数据。这样的规则可以在一些实施例中在需要或者希望创建新知识并且显式表达它为数据时由系统应用。从上文讨论中应当领会到,这样的技术的益处可以在至少一些情形中是明显减少系统中的数据量以及提供用于基于机器的新知识创建(合成)的新能力和应用。然而,应当领会到并非根据本发明的每个实施例可以解决常规方式的每个标识出的问题,并且一些实施例可以不解决这些问题中的任何问题。一些实施例也可以解决除了这里叙述的问题之外的问题。另外,并非每个实施例可以提供这里讨论的益处中的所有或者任何益处,并且一些实施例可以提供未叙述的其它益处。
一些实施例也提供用于复杂知识表示,比如分类法、本体论和按面分类,以不仅在数据级而且在语义级互操作(含义互操作性)的技术。
可以在一些实施例中赋予的并且可以跨越许多新的和现有应用领域而应用的其它益处包括:由更简单和更经济的数据结构所赋予的知识表示的产生和应用二者中的成本更低;用于新知识创建的可能性;由及时随需知识所赋予的更可缩放的系统;以及支持来自用户和数据消耗者的“上下文”作为输入变量。在及时基础上应用合成和分析知识处理规则以创建知识表示数据结构的、根据本公开内容的一些实施例的动态性质可以提供可以提供比预先对整个知识领域进行分析和建模的常规方法更经济的益处。
通过在KR内并入根本知识创建规则集,可以减少系统中的数据量,从而提供更经济的数据管理系统并且提供用于知识管理的全新应用。因此,在一些实施例中,可以通过减少数据可伸缩性的负担而除非需要数据则才创建它来降低KR系统的产生和维护成本。一旦被创建,对复杂知识建模的数据结构在一些实施例中比在常规系统中相较而言更小,因为它们仅包含与手头的任务相关的数据。这转而可以减少下游应用(比如在这些知识模型之上工作的推论引擎或者数据挖掘工具)的成本。
根据本公开内容的一些实施例的综合计算的方式也支持知识表示和数据管理中的全新能力。一些实施例可以提供改进的对“可能性”(即从现有数据之中创建全新知识的表示)的支持。例如,这样的可能性的能力可以对于创造活动(比如教育、新闻和艺术)有用。
图1图示了根据本发明的一些实施例的示例性系统100,可以在一些实施例中运用该系统以用于实施在复杂知识表示(KR)的分析和合成中涉及到的原子知识表示模型(AKRM)。在示例性系统100中,AKRM可以被编码为计算机可读数据并且存储于一个或者多个有形非瞬态计算机可读存储介质上。例如,AKRM可以用如下数据规划存储于非易失性计算机存储器中的数据集110中,下文给出该数据集的一些示例,该数据规划被设计成支持基本和复杂知识表示数据结构。
在一些实施例中,AKRM可以包括一个或者多个基本数据结构120和一个或者多个知识处理规则130。在一些实施例中,规则130可以由系统100用来解构(分析)一个或者多个复杂KR以生成基本数据结构120。例如,系统100可以包括一个或者多个计算机处理器和一个或者多个计算机存储器硬件部件,并且可以用计算机可执行指令对存储器编码,这些计算机可执行指令在由一个或者多个处理器执行时,使系统100的一个或者多个处理器在分析一个或者多个复杂KR时使用规则130以生成AKRM的基本数据结构120。也可以用如下指令对存储器编码,这些指令对一个或者多个处理器编程以使用规则130以从基本数据结构120合成新复杂KR。在一些实施例中,计算机存储器可以被实施为用计算机可执行指令编码的一个或者多个有形非瞬态计算机可读存储介质,这些计算机可执行指令在被执行时使一个或者多个处理器执行这里描述的功能中的任何功能。
不同于先前知识表示系统,根据本发明的一些实施例的系统(比如系统100)可以组合数据结构和知识处理规则以创建被编码为数据的知识表示模型。在一些实施例中,规则可以未被编码为知识(例如,作为规则或者公理,这些规则或者公理描述特定领域内的知识边界或者约束),而实际上被编码为用于创建表示新知识的数据结构的构造和解构规则。除了用于生成如下隐式事实的“推论规则”之外(这些隐式事实是由原有KR给定的显式概念的逻辑结果),在一些实施例中还可以用“知识处理规则”对知识表示模型进行编码,可以应用这些“知识处理规则”以从原有KR数据结构创建可以并非隐式的新知识。
例如,始于两个显式知识语句“玛丽是人”和“所有人是人类”,可以应用推论规则以确定显式知识语句“玛丽是人类”,这是先前两个语句的逻辑结果。在根据本发明的一些实施例的不同示例中,始于两个显式知识语句“玛丽是鲍勃的好友”和“鲍勃是查理的好友”,可以应用对好友关系的含义建模的示例性知识处理规则以确定新知识语句“玛丽是查理的好友”。显然,这样的知识处理规则的应用可以产生新知识,该新知识未必是在原有输入KR中给定的显式知识的逻辑结果。如上文描述的那样,根据本发明的一些实施例的知识表示模型(包括与对概念和概念关系进行编码的数据结构相关联地存储的知识处理规则(如有别于或者补充逻辑推理规则的))可以对如何可以创建和/或分解新的和潜在非隐式知识的框架建模。
这样聚焦于知识的合成可以将系统(比如系统100)带入新应用领域中。尽管现有系统聚焦于演绎推理(即其中通过精确演绎现有事实和论证(argument)来收集见解),但是根据本发明的一些实施例的系统可以支持归纳推理以及其它类型的理论构建(即其中现有事实可以用来支持新知识的概率预测)。
在根据本发明的一些实施例中,系统(比如系统100)可以宽松地基于基于概念语义的框架,从而对语义原语(例如“原子”或者“基本”概念)和规则(原则)进行编码,这些规则指导如何可以组合这样的原子结构以创建更复杂的知识。然而,应当领会到,根据本发明的实施例的系统可以在许多这样的框架内工作,因为本发明的方面不限于知识表示的任何特定理论、模型或者实践。在一些实施例中,系统(比如系统100)可以被设计成与对这些框架建模的广泛方法和技术(例如,实施为软件应用或者部件)对接。例如,对接分析部件(比如分析引擎150)可以将输入复杂KR 160解构成基本数据结构120。合成部件(比如合成引擎170)可以使用基本数据结构120来构造新输出复杂KR 190。
在一些实施例中,分析引擎150可以例如通过由系统100的一个或者多个处理器执行适当计算机可读指令、通过应用知识处理规则130中的一个或者多个知识处理规则以将输入KR 160的数据结构解构成更基本构造来分析输入复杂KR 160。在一些实施例中,在AKRM 110的基本数据结构120内包括的最基本构造可以表示信息和信息关系的基础构建块的最小集合,这些信息和信息关系聚合地提供用来对输入数据结构进行分类的信息携带能力。可以从任何适当来源(包括来自与系统100交互的用户或者软件应用的直接输入)获得输入KR 160。在一些实施例中,可以通过与各种数据库技术(比如关系数据库系统或者基于图形的数据库系统)对接获得输入KR160。应当领会到,可以按照任何适当形式以任何适当方式获得输入KR 160,因为本发明的方面就这一点而言不受限制。
例如,图2A图示了例如使用系统100的用户或者软件应用可以向分析引擎150输入的小型复杂KR 200(在这一示例中为分类法)。复杂KR 200包括由各种分级关系链接的概念集。例如,被标注为“动物”的概念210在父-子关系中链接到被标注为“宠物”的概念220和被标注为“山居动物”的概念230。在分级的每级,概念实体表示含义单位,该含义单位可以被组合以创建更复杂语义或者可能被解构成更基本语义。例如,“山居动物”的复杂含义可以包括概念“山居”和“动物”。
在一些实施例中,系统100可以例如通过分析引擎150解构复杂KR(比如复杂KR 200)以发现基本概念,这些基本概念包括复杂KR的复杂概念。例如,图2B图示了可以从复杂KR 200的分析和解构中产生的基本数据结构300。在基本数据结构300中,已经发现了被标注为“山居动物”的复杂概念230包括被标注为“山居”的更基本概念235和被标注为“动物”的更基本概念240。在这一示例中,“山居”和“动物”表示比被标注为“山居动物”的更复杂概念更基本的概念,因为可以组合概念“山居”和“动物”以创建被标注为“山居动物”的概念。类似地,已经发现了被标注为“家养狗”的复杂概念250包括被标注为“家养”的更基本概念255和被标注为“狗”的更基本概念260,并且已经发现了被标注为“暹罗族猫”的复杂概念270包括被标注为“暹罗族”的更基本概念275和被标注为“猫”的更基本概念280。此外,每个新发现的基本概念已经从包括它的复杂概念继承了概念关系。因此,“家养”、“狗”、“暹罗族”和“猫”是“宠物”的子代;“山居”和“动物”(概念240)是“动物”(概念210)的子代;并且“山居”和“动物”(概念240)均为被标注为“狮子”的概念290和被标注为“山羊”的概念295二者的父代。
注意,虽然标签“动物”归于基本数据结构300中的概念210和概念240二者,但是两个概念仍然可以表示在知识表示分级内作用不同的不同抽象含义。在一些实施例中,“标签”或者“符号”可以被接合成抽象概念以提供用于概念和关系的人类和/或机器可读术语或者标签以及提供用于各种基于符号的处理方法(比如文字分析)的基础。标签可以提供人类和/或机器可辨别的知识表示实体并且可以从源领域的唯一词汇表中推导。因此,由于可以从在领域中呈现的语言和术语抽取向每个概念元素分配的标签,标签本身可能并未完全描述它们用来命名的抽象概念和概念关系,因为在人类知识中理解那些抽象实体。
类似地,在一些实施例中,应当领会到在知识表示模型中的抽象概念与那些概念可以用来描述或者分类的对象之间的差异。对象可以是现实物理或者虚拟世界中的可以由概念描述的任何项(例如,对象的示例是文档、网页、人物等)。例如,现实世界中的个人可以由被标注为“鲍勃”的概念抽象表示。待描述、分类或者分析的领域中的信息可以涉及虚拟或者物理对象、过程和在这样的信息之间的关系。在一些示例性实施例中,可以在对驻留于网页内的内容分类时使用如这里描述的复杂KR。其它类型的领域在一些实施例中可以包括文档贮存库、用于音乐的推荐系统、软件代码贮存库、工作流程和业务过程的模型等。
在一些实施例中,待分类的领域的对象可以被称为内容节点。内容节点可以包括使用知识表示模型负责于分类、描述、分析等的任何对象。例如,内容节点可以是文件、文档、文档的组块(比如注解)、图像或者存储的字符串。内容节点可以引用物理对象或者虚拟对象。在一些实施例中,内容节点可以被包含于内容容器中,这些内容容器提供可以通过其取回内容节点的可寻址(或者可定位)信息。例如,通过URL可寻址的网页的内容容器可以包含形式为文本和图像的内容节点。内容可以与内容节点相关联以提炼一些含义(比如内容节点的描述、目的、用法或者意图)。例如,现实世界中的内容节点的方面可以由抽象知识表示中的概念描述。
在复合提炼水平方面通过概念与其它实体的关系并且在结构上在其它更基础知识表示实体(例如,关键词和词素)方面定义概念。这样的结构在这里被称为概念定义。在一些实施例中,可以通过如下两个基础类型的概念关系使概念相关:内在类型,该类型指代用于创建更复杂概念的在基本概念之间的接合(例如,在基本数据结构300中的“山居”、“动物”和“山居动物”之间的关系);以及外在类型,该类型指代在复杂关系之间的接合。外在关系可以描述在概念对之间的特征,比如等价、分级(例如,在“动物”与“宠物”之间的关系)和关联。另外,在一些实施例中,外在和内在概念关系本身也可以被描述为概念类型,并且它们可以被归类成更复杂关系。例如,关联关系“与……结婚”可以包括关系概念“结婚”和“与”。
在一些实施例中,被存储为系统100中的基本数据结构120的AKRM数据模型的总体组织可以被编码为按面数据结构,其中概念实体是在分级(外在关系)中显式相关以及在集合中接合成创建复杂概念(内在关系)。另外,如上文讨论的那样,可以使用概念对这些外在和内在关系本身归类。然而,应当领会到,可以在表示AKRM时利用任何适当类型的知识表示模型或者理论构造(包括任何适当类型的概念关系),因为本发明的方面就这一点而言不受限制。
作为示例,图3提供根据本发明的一些实施例的可以在系统100的数据集110中运用的示例性数据规划350。这样的数据规划可以被设计成能够对复杂知识表示数据结构(复杂KR)(比如本体论和分类法)以及将复杂KR分解成的原子知识表示数据结构(例如,基本数据结构120)进行编码。在规划350中,可以接合概念以使用多对多关系来组成更复杂类型(具有类型)。以这一方式,模型中的核心概念实体可以根据由数据建模的复杂知识表示的性质来表示广泛多样化简单性或者复杂性。通过使用多对多关系将符号、规则和对象接合到这些概念,这样的规划可以管理用于对广泛知识表示建模的数据。
在如图3中所示的规划350中,矩形框表示实体集,(例如,可以被编码为数据库中的主要对象的现实世界对象)以及抽象概念、引用概念的抽象人类和/或机器可读符号以及应用于知识表示中的概念的规则。每个实线连接符表示具有如由菱形表示的关系类型的、在两个实体集之间的关系。“N”表示关系的参与基数;在这里,关系为多对多,这指示每个实体集的许多实体可以参与与参与关系的其它实体集的实体的关系并且反之亦然。对照而言,在菱形的两侧上被标注为“1”的关系将表示一对一关系;在一侧上被标注为“1”而在另一侧上被标注为“N”的关系将表示一对多关系,其中第一类型的一个实体可以参与与第二类型的许多实体的关系,而第二类型的每个实体可以参与与第一类型的仅一个实体的该关系;等等。
在一些实施例中,可以使用任何适当数据库和/或其它数据编码技术在一个或者多个数据库表中根据规划350对知识表示的数据结构进行编码。例如,在一些实施例中,用于KR数据结构的数据集可以被构造为表的计算机可读表示,其中每行表示在一对概念之间的关系。例如,数据表的一个示例可以具有四个属性列,这些属性列包括“概念1”属性、“概念2”属性、“关系”属性和“类型”属性,从而将用于表的每行的三向关系建模为:“概念1通过类型(例如,外在或者内在)的关系概念来与概念2相关。例如,具有属性(列实体){概念1:“锤子”;概念2:“钉子”;关系“工具”;类型:“外在”}的这样的表的行可以表示关系:“锤子”作为“工具”与“钉子”相关,并且关系是“外在”。在许多示例性数据结构中,每个概念可以出现于数据库表的一行或者多行中,例如出现于多行中以表示与多个其它概念的关系。此外,例如如果特定一对概念通过多个类型的关系来相关,则该对概念可以出现于多行中。然而,应当领会到,前文描述仅为举例并且可以用任何适当方式实施和/或编码和存储数据结构,因为本发明的方面就这一点而言不受限制。
在一些实施例中,各种元数据可以与AKRM内的每个实体(例如,概念和概念关系)相关联以支持基于规则的编程。例如,由于许多规则将需要经排序概念集,所以可以向这一规划添加概念关系(内在或者外在)内的概念的优先级。这里省略这些细节仅为了简化数据模型的呈现。
虽然图3的示例性数据规划可以相对简单,但是当它与用于构造和解构知识表示的处理规则联姻时,它可以变成能够管理很广范围的复杂知识(如在下文各种示例中描述的那样)。益处可以包括用于提高数据经济并且减少对向大型知识表示数据结构中构建复杂性的需要的实时知识工程。另外,由于减少了知识表示数据结构的范围,所以它也可以对集成知识工程过程(比如推理、分析、数据挖掘和搜索)具有有益影响。
回顾图1,在一些实施例中,知识处理规则130可以被编码和持续于系统100中(例如在数据集110中),并且可以被接合到输入KR 160和/或基本数据结构120内的概念。规则可以被接合到概念,从而使得在具体概念给定时可以通过由系统100的一个或者多个处理器执行编程代码来应用规则以从基本数据结构120生成新语义实体(概念和关系)和/或将输入KR 160解构成将在基本数据结构120中包括的基本实体。下文更详细地描述这样的规则的示例。
例如,系统100的开发者和/或系统100的终端用户可以根据他们的个别知识处理需要或者偏好向数据集110引入规则130作为输入规则140。应当领会到,可以在任何适当时间从任何适当来源获得输入规则140,并且任何适当用户可以在操作系统100之前或者期间在任何适当时间更新和/或改变作为AKRM的部分而被存储的规则130,并且可以针对与系统100交互的不同用户或者应用来维护不同的存储的规则130,因为本发明的方面就这一点而言不受限制。此外,在一些实施例中,存储的规则130的不同子集可以被应用于分析输入KR 160而不是合成输出KR 190,而在其它实施例中,可以在分析操作和合成操作二者中应用相同规则130,并且存储的规则130的不同子集可以被应用于不同类型的知识表示。
规则130在被应用于KR的分析和合成中的概念时可以提供用于系统(比如系统100)的构造和解构逻辑。可以在规则集130中对如何创建(合成)或者解构(分析)知识的方法进行编码。规则130可以被设计成系统地(单规则在分析和合成二者中操作)或者不对称地(其中单规则被设计成仅在合成或者分析中工作)工作。在一些实施例中,规则130可以未被编码为知识模型的概念数据结构内的实体,而是为知识表示模型内的在生成能力中对概念数据结构操作的规则。在一些实施例中,规则130可以在包括规则的AKRM的机器可读编码中被编码为数据并且与知识表示数据结构(比如基本数据结构120)一起存储。可以使用规则引擎软件部件来应用规则130,该规则引擎软件部件例如由在系统100中包括的或者可由系统100访问的一个或者多个有形非瞬态计算机可读存储介质中编码的程序指令实施,这些编程指令由系统100的一个或者多个处理器执行以提供规则引擎。
在系统(比如根据本发明的一些实施例的系统100)的概率性质给定时,可以执行用于针对从规则130的应用中产生的知识表示数据结构校验语义一致性的方法。在一些实施例中,系统100可以被编程为收集关于所得数据结构是否存在于现有知识模型中的证据。这些现有知识模型可以在系统内部(作为复杂知识表示数据结构)或者外部(比如在语义网上编码的知识模型)。在一些实施例中,搜索引擎可以用来调查与所得数据结构的概念相关联的术语(符号或者标签)是否存在于外部知识表示(比如文档)中。术语-文档频率(例如,搜索引擎命中次数)可以提供用于所得知识表示数据结构的语义一致性的一个示例性度量。然而,应当领会到,可以使用用于这样的数据结构的语义一致性的任何适当度量,因为本发明的方面就这一点而言不受限制。
分析引擎150和合成引擎170可以使用各种语义分析和合成方法中的任何方法以支持构造和解构知识表示数据结构,因为本发明的方面就这一点而言不受限制。可以由分析引擎150在解构输入复杂KR 160时与规则130的应用一起使用的分析方法的示例包括文本分析、实体和信息提取、信息检索、数据挖掘、分类、统计聚类、语言分析、面分析、自然语言处理和语义知识库(例如,词典、本体论等)。可以由合成引擎170在构造复杂KR 190时与规则130的应用一起使用的合成方法的示例包括形式概念分析、按面分类合成、语义合成和动态分类法。
应当领会到,复杂KR的示例性分析和合成方法可以由个别和/或与可以与分析引擎150和合成引擎170和/或系统100对接的任何适当外部软件应用结合操作的分析引擎150和合成引擎170执行。这样的外部软件应用可以实施于与系统100的其它部件相同的物理设备或者设备集内或者可以用与其它单独设备通信的分布式方式实施这样的软件应用的部分或者全部,因为本发明的方面就这一点而言不受限制。
图4图示了可以由分析引擎150在解构输入复杂KR 160时使用的语义分析的一个示例性方法400。应当领会到,图4中所示方法仅为一个示例并且如上文讨论的那样,许多其它分析方法是可能的,因为本发明的方面就这一点而言不受限制。示例性方法400始于提取具有在源数据结构中显式呈现的文本概念标签的源概念410。可以从源数据结构将多个源概念410与可以在源数据结构中显式存在的在源概念410之间的源概念关系一起提取。
可以在用于源概念410的概念标签中标识一系列关键词界定符(delineator)。可以基于关键词的常见结构文本界定符(比如括号、引号和逗号)从概念标签解析初步关键词范围。继而可以再次使用常见字词界定符(比如空格和语法符号)从初步关键词范围解析完整字词。继而可以执行针对单字词独立性的校验以保证解析的候选关键词有效。在一些实施例中,针对字词独立性的校验可以基于下文被称为“词干化”的词干(或者词根)匹配的方法。一旦生效,如果字词存在于具有其它字词的一个概念标签中并且存在于没有那些其它字词的有关概念标签中,则该字词可以界定关键词。
一旦这样生成了初步关键词标签集,则可以聚合地检查所有初步关键词标签以标识在单概念标签内的多个有效关键词标签内存在的复合关键词。在一些实施例中,递归可以用来将复合关键词集穷尽地拆分成由源数据支持的最基本关键词集。可以重复候选关键词提炼、生效和拆分的过程直至无法找到更原子的关键词。
在一些实施例中,最后一轮合并方法可以用来跨越整个领域将关键词标签去歧义。这样的去歧义可以用来消解在实体共享相同标签时出现的歧义。在一些实施例中,可以通过将关键词合并成共享相同标签的单个结构实体来提供去歧义。结果可以是关键词概念集,每个关键词概念包含于从其中推导它的源概念中。例如,源概念410可以被解构成从它的概念标签解析的关键词420、440和460,并且关键词420、440和460可以组成用于源概念410的概念定义。例如,在图2B的示例基本数据结构300中,可以从被标注为“家养狗”的更复杂概念250解构被标注为“家养”的更基本概念255作为从概念标签解析的关键词。
在一些实施例中,可以通过进一步解构来扩展包括关键词概念的概念定义以在它们的结构中包括词素概念实体作为更深入和更基础的提炼级。在一些实施例中,词素可以表示更复杂概念及其关系的基本不可缩减属性。在词素提炼级,许多属性将不可被人类分类者识别为概念。然而,当跨越整个领域被组合成关系数据结构时,词素可以在一些实施例中能够使用更少信息来携带更复杂概念的意义含义。
在一些实施例中,词素提取方法可以具有与上文讨论的关键词提取方法共同的要素。可以定义模式以用作为用于标识词素候选的标准。这些模式可以建立用于词干化的参数并且可以包括用于完整字词的模式以及部分字词匹配。与关键词提取一样,源概念关系集可以提供用于词素模式匹配的上下文。可以比对关键词出现于其中的源概念关系集内的关键词池应用模式。可以标识基于词干化模式的共享词根集。共享词根集可以包括用于每个关键词的候选词素词根集。
在一些实施例中,可以比较用于每个关键词的候选词素词根集以保证它们相互一致。可以假设在相同关键词的上下文内驻留的词根和关键词出现于其中的源概念关系集具有重叠词根。另外,可以假设从那些重叠词根的交集推导的基本词根将保留于用来标识有效词素的参数内。这样的生效可以约束过量词素拆分并且提供上下文有意义而又基本的提炼级。在一些实施例中,可以从关键词集去除任何不一致候选词素词根。可以重复用于标识词素候选的模式匹配过程直至去除了所有不一致候选。
在一些实施例中,通过检查潜在词根组,可以针对每个关键词标识一个或者多个词素界定符。可以基于界定符在每个关键词标签内的位置提取词素。继而可以通过将提取的词素相关(或映射)到从其中推导它们的关键词来构造关键词概念定义。例如,可以在用于关键词概念420的概念定义中包括词素概念425和430,可以在用于关键词概念440的概念定义中包括词素概念445和450,并且可以在用于关键词概念460的概念定义中包括词素概念465和470。因此可以通过语义分析将原有源概念410解构成关键词概念级并且进一步解构成用于在AKRM的基本数据结构中包括的最基本词素概念级。
然而,应当领会到,可以在生成基本数据结构时运用任何适当抽象级,并且可以使用任何适当分析方法(包括未以关键词或者词素为中心的方法),因为本发明的方面就这一点而言不受限制。在一些实施例中,在用于在分析和/或合成更复杂KR时使用的AKRM中包括的基本数据结构可以包括和编码比在解构成填充基本数据结构的和/或从基本数据结构合成的复杂KR中包括的概念和关系更基本的概念和关系。例如,可以通过组合在AKRM的基本数据结构中编码的基本概念的抽象含义来形成在复杂KR中编码的复杂概念的抽象含义。
在一些实施例中,可能已经从更复杂概念将作为集中式AKRM的部分而存储于基本数据结构中的概念解构成单个完整字词(比如关键词)这一级。图2B的示例图示了对单个完整字词编码的这样的基本数据结构。在一些实施例中,可能已经将基本数据结构中的概念解构成表示字词的部分的更基本级。在一些实施例中,可能已经将基本数据结构中的概念解构成由词素表示的更基本语义级,这些词素是仍然可以携带语义含义的最小语言单位。例如,可以解构完整字词概念“暹罗族”以创建两个词素概念“暹罗”和“族”而“暹罗”表示自由词素并且“族”表示词缀。在一些实施例中,AKRM的基本数据结构可以仅包括在指定基本性级的概念;例如,基本数据结构可以在一些实施例中完全由词素形成或者完全由单字词概念形成。在其它实施例中,基本数据结构可以包括在各种不同基本性级的概念(例如,包括词素概念、关键词概念和/或在其它基本性级的其它概念),而基本数据结构中的概念中的至少一些概念比从其中解构它们的输入KR中的复杂概念和/或它们与其它基本概念组合创建的输出KR中的复杂概念更基本。应当领会到,可以利用用于将复杂KR解构成更基本数据结构的任何适当基础(包括与除了语言和语义之外的范式连结的基础),因为本发明的方面就这一点而言不受限制。
回顾图1,数据消耗者195可以表示系统100的一个或者多个人类用户和/或与系统100交互的一个或者多个机器实施的软件应用。在一些实施例中,数据消费者195可以进行请求和/或通过各种数据形式从系统100接收输出。例如,数据消费者195可以向系统100输入复杂160以解构成基本概念和概念关系以生成和/或更新基本数据结构120。数据消费者195(相同或者不同数据消费者)也可以从系统100接收通过将知识处理规则130中的一个或者多个知识处理规则应用于基本数据结构120的部分或者全部而合成的输出复杂KR 190。
在一些实施例中,数据消费者195也可以提供用于指引合成和分析操作的上下文180。例如,通过将特定上下文180与针对输出KR的请求一起输入,数据消费者195可以指引系统100以生成针对所需信息或者由数据消费者执行的当前任务而具有适当特性的输出KR 190。例如,数据消费者195可以输入特定上下文180作为可映射到如下特定概念的搜索术语,消费者195需要关于该特定概念的或者想要接收关于该特定概念的有关信息。合成引擎170可以例如将规则130仅应用于基本数据结构120的与对应于上下文180的概念在概念上有关(即在数据结构中连接)的那些部分。在另一示例中,输入上下文180可以指示数据消费者195想要输出KR 190符合的特定类型的知识表示模型,比如分类法。因而,合成引擎170可以仅应用规则集130的适合于从基本数据结构120合成分类法的那些规则。
应当领会到,输入上下文180可以包括应用于合成输出KR 190的任何数目的请求和/或限制,并且输入上下文180的组成可以是在任何适当形式的数据或者编程语言中编码的任何适当类型,因为本发明的方面就这一点而言不受限制。适当输入上下文的示例包括但不限于例如由自然语言处理(NLP)技术调解的自由文本查询和提交以及结构输入(比如与各种Web 2.0系统一致的术语或者标记集。在一些实施例中,根据特定上下文180生成输出KR 190可以实现与数据消费者的更流畅和动态的知识交换。然而,应当领会到,输入上下文180并非必需,并且系统100可以在一些实施例中产生输出KR 190而无需输入上下文,因为本发明的方面就这一点而言不受限制。
数据消费者195也可以使用任何适当数据编码和/或编程语言以任何适当形式向系统100提供任何适当类型的输入KR 160,因为本发明的方面就这一点而言不受限制。适当形式的输入KR的示例包括但不限于同样与各种形式的NLP和文本分析一起使用的半结构化或者非结构化文档以及结构化知识表示(比如分类法、受控词汇表、按面分类和本体论)。
在根据本公开内容的一些实施例中,用于使用AKRM来分析和合成复杂KR的系统(比如系统100)可以实施于与一个或者多个客户端设备、机器和/或计算机存在网络通信的分布式计算系统的服务器侧上。图5图示了这样的分布式计算环境500,其中系统100可以作为用于KR数据结构的服务器侧变换引擎来操作。变换引擎可以取得由客户端510例如通过客户端510的人类用户或者软件应用的动作从一个或者多个领域提供的一个或者多个源复杂KR数据结构520作为输入。在一些实施例中,可以将输入复杂KR 520编码成可以通过网络(比如因特网550)经由web服务(或者API或者其它分布渠道)向系统100实施于其上的计算系统分布的一个或者多个XML文件530。类似地,系统100可以通过网络向各种客户端510返回请求的输出KR作为XML文件540。然而,应当领会到,可以用任何适当方式并且以任何适当形式在服务器系统100与客户端系统510之间传达数据,因为本发明的方面就这一点而言不受限制。
通过这一和/或其它分布和分散模式,在一些实施例中,广泛开发者和/或发布者可以使用分析引擎150和合成引擎170以解构和创建复杂KR数据结构。示例性应用包括但不限于网站、知识库、电子商务店、搜索服务、客户端软件、管理信息系统、分析等。
在一些实施例中,这样的分布式系统的优点可以是清晰分离由系统用来处理领域的私有领域数据和共享数据。数据分离可以有助于托管的处理模型(比如软件作为服务(SaaS)模型),借此第三方可以向领域所有者赋予变换引擎服务。领域所有者的领域专属数据可以由SaaS安全托管,因为它可与其它领域所有者的共享数据(例如,AKRM数据集110)和私有数据分离。备选地,领域专属数据可以由领域所有者托管、在物理上被从共享数据去除。在一些实施例中,领域所有者可以在整个用户团体的共享知识(例如,AKRM)上构建而无需损害它们的唯一知识。
如应当从前文讨论中领会到的那样,根据本公开内容的一些实施例涉及分析原有复杂知识表示以解构复杂KR并且生成或者更新原子知识表示模型的基本数据结构的技术。图6图示了一种这样的技术作为示例性过程600。过程600始于动作610,其中例如分析/合成系统(比如系统100)可以从数据消费者接收输入复杂KR。
在动作620,可以应用作为AKRM的部分而在系统100中编码的一个或者多个知识处理规则以将输入复杂KR解构成一个或者多个基本概念和/或一个或者多个基本概念关系。下文提供可适用于各种类型的输入KR的知识处理规则的示例。然而,应当领会到,本发明的方面不限于知识处理规则的任何特定示例,并且可以利用与原子知识表示模型相关联地编码的任何适当规则。如上文讨论的那样,这样的规则可以在任何适当时间由分析系统的开发者和/或由分析系统的一个或者多个终端用户提供。
在动作630,可以在作为系统的AKRM的部分而编码和存储的基本数据结构中包括在动作620中发现和/或推导的基本概念和/或基本概念关系中的一个或者多个基本概念和/或基本概念关系。在一些实施例中,从单个输入复杂KR推导的基本概念和关系中的一些或者所有基本概念和关系可以用来填充AKRM的新基本数据结构。在一些实施例中,当已经填充了存储的基本数据结构时,可以在存储的基本数据结构中包括从后续输入KR发现的新基本概念和/或关系以更新和/或扩展集中式AKRM。在一些实施例中,过程600可以继续循环回到开始以在新输入KR变得可用时进一步更新存储的基本数据结构和/或生成新基本数据结构。在其它实施例中,过程600可以在一次通过或者另一预定次数通过过程之后、在存储的基本数据结构已经达到预定大小或者复杂性之后或者在满足任何其它适当停止标准之后结束。
如应当从前文讨论中领会到的那样,根据本公开内容的另一些实施例涉及用于使用原子知识表示模型生成(合成)复杂知识表示的技术。图7图示了这样的技术作为示例性过程700。过程700始于动作710,其中可以例如从数据消费者(比如人类用户或者软件应用)接收输入上下文。如上文讨论的那样,这样的上下文可以包括文本查询或者请求、一个或者多个搜索术语、一个或者多个种子概念的标识等。此外,上下文可以指示针对特定形式的复杂KR的请求。然而,在一些实施例中,可以接收针对复杂KR的请求而没有进一步上下文以用于限制将在复杂KR中包括的概念和/或概念关系,因为本发明的方面就这一点而言不受限制。另外,在一些实施例中,可以将接收上下文解释为针对复杂KR的请求而无需显式请求来伴随上下文。
在动作720,响应于输入请求和/或上下文,可以将AKRM中编码的一个或者多个适当知识处理规则应用于AKRM的基本数据结构以合成未在基本数据结构中显式编码的一个或者多个附加概念和/或概念关系。下文提供可适用于合成各种类型的输出KR的知识处理规则的示例。如上文讨论的那样,在一些实施例中,可以双向应用规则以使用相同知识处理规则来实现复杂KR的分析和合成二者,而在其它实施例中,一个规则集可以应用于分析并且不同规则集可以应用于合成。然而,应当领会到,本发明的方面不限于知识处理规则的任何特定示例,并且可以利用与原子知识表示模型相关联地编码的任何适当规则。如上文讨论的那样,这样的规则可以在任何适当时间由分析系统的开发者和/或由分析系统的一个或者多个终端用户提供。
在一些实施例中,适当规则可以根据接收的输入请求和/或上下文来应用于基本数据结构的适当部分。例如,如果输入请求指定将输出的特定类型的复杂KR,则在一些实施例中,在AKRM中编码的应用于合成该类型的复杂KR的仅那些规则可以应用于基本数据结构。在一些实施例中,如果未指定特定类型的复杂KR,则可以合成默认类型的复杂KR(比如分类法)或者可以选择随机类型的复杂KR等。例如,如果输入上下文指定感兴趣的一个或者多个特定种子概念,则仅可以选择基本数据结构的与那些种子概念有关(即通过概念关系连接)的那些部分并且将规则应用于它们以合成新复杂KR。在一些实施例中,例如合成系统的开发者或者终端用户可以设置对输出复杂KR的大小和/或复杂性的某一预定限制,例如以包括的概念数目、在种子概念与基本数据结构中的所选有关概念之间的分级距离、所得输出复杂KR的编码数据大小、处理要求等为条件。
在动作730,可以从在动作720中合成的附加概念和关系以及基本数据结构的所选适当部分合成并且根据在接收的输入中指示的任何指定类型的KR编码新复杂KR。在动作740,可以向从其接收请求的数据消费者提供所得合成的复杂KR。如上文讨论的那样,这可以例如是软件应用或者可以通过软件用户接口查看和/或利用提供的复杂KR的人类用户。过程700继而可以提供对新知识进行编码的新合成的复杂KR作为结束。
以下伪码段可以用作上文描述的方法的进一步举例说明。
知识创建(KRin,RULESin,CONTEXT,ANALYSIS,SYNTHESIS)
输入:
-CONTEXT:用户/应用上下文(例如,请求、种子概念、领域约束)
-KRin:知识表示(例如,分类法)
-RULES:相关知识处理规则
-ANALYSIS:用于启用分析事件的标志
-SYNTHESIS:用于启用合成事件的标志
输出:
-将存储于AKRM中的概念和关系
-用于向用户/应用呈现的复杂KRout
过程:
如应当从前文讨论中领会到的那样,根据本公开内容的一些实施例涉及用于使用原子知识表示模型来支持在知识表示之间的语义互操作性的技术。如上文讨论的那样,维护具有存储的基本数据结构的共享集中式AKRM在一些实施例中可以允许将多个不同输入复杂KR(在不同类型的知识表示模型的一些情况下)解构成在生成和/或更新在语义上与所有类型的复杂KR兼容的单个共享基本数据结构时使用的基本概念和/或概念关系。此外,通过解构成基本数据结构和后续合成为新复杂KR,可以在一些实施例中将一个类型的输入KR变换成基于相同源数据的不同类型的输出KR。
以下伪码可以用作在这里描述的AKRM之下集成多个不同KR的方法的进一步举例说明以提供语义互操作性的益处。
输入:
-KR1,KR2,…,KRn:/*n个可能的不同KR*/
-RULES1,RULES2,…,RULESn/*相关知识处理规则*/
-用户/应用上下文
输出:
-将存储于AKRM中的概念和关系
-用于向用户/应用呈现的复杂KR
过程:
图8提供如下表,该表图示了可以在根据本公开内容的一些实施例中在分析和/或合成五个示例性类型的复杂知识表示(即分类法、同义词环、辞典、按面分类和本体论)时使用的六个示例性知识处理规则。然而,如上文讨论的那样,应当领会到,提供这些示例仅为了举例说明,并且本发明的方面不限于任何特定规则或者KR类型或者模型集。此外,在一些实施例中,例如系统的开发者可以用初始知识处理规则集播种分析/合成系统,该初始知识处理规则集可以例如由系统的终端用户用附加规则来扩展和/或在以后时间用改变和/或删除的规则来更新。可应用于不同类型的KR的不同规则集也可以针对不同终端用户或者应用而例如存储于用户账户中。另外,在一些实施例中,可以按照新颖方式重用和组合知识处理规则以解决针对具体KR的要求。
下文参照涉及到在附图中提供的示例性KR类型的具体示例来讨论图8中呈现的示例性规则。应当领会到,上文描述的广义方法中的任何方法可以应用于下例中的任何示例而涉及到不同输入、输出和知识处理规则。也应当领会到,虽然可以通过这里讨论的示例性规则对知识创建理论的许多不同方面建模,但是各种其它类型的规则是可能的。下例主要由知识表示数据结构的拓扑驱动。用于规则的其它基础可以包括语义词态和语法、语音体系、隐喻、象征和感官知觉以及其它基础。
在一些实施例中,对原子知识表示模型内的知识处理规则集(比如图8中给出的示例性规则)进行编码可以允许分析和/或合成支持的KR类型集(比如图8中表示的那些KR类型集)内的任何复杂KR。在图8的示例中,“X”号表明六个规则的示例性集的哪些规则应用于五个KR类型的示例性集的哪些KR类型。在这些示例中,可以在分析或者合成每个规则应用于的类型的复杂KR时双向应用该规则。例如,在输入辞典KR给定时,图8表明规则1、2、3和4可以应用于输入辞典以将它解构成将在基本数据结构中包括的基本概念和概念关系。在另一示例中,将规则1、2和3应用于基本数据结构造成输出同义词环KR。下文参照示例描述使用这些示例性规则中的每个规则以执行适当复杂KR的分析和/或合成。
分类法规则
以下输出/输出和知识处理规则提供分类法的特征作为概念的分级分类。
输入/输出
概念集C
分级关系集(非循环)
R={r(ci,cj):ci,cj∈C and ci Is-a cj}
定义1(一致概念):如果根据某一距离度量M,M(ci,cj)<T,则两个概念ci、cj被视为一致,其中T是预选阈值。可能的度量包括:输入语料库中的两个概念的同现频率,或者对分类法分级应用的树距离函数。
规则1(一致概念合成):创建新概念c={ci,cj}。如果并且仅如 ci和cj关于定义1为一致,则c被视为包括ci和cj
规则2(一只概念合成):令c1={c11,c22,...c1n}为包括n个概念c11至c1n的概念。类似地,令c2={c21,c22,..c2m}为包括m个概念c21至c2m的概念。如果并且仅如果对于每个c1i存在用于某一概念c2j的关系r(c1i,c2j),则创建新分级关系r(c1,c2)。
注意,每个示例性规则(例如,规则1和规则2)的如果-并且-仅-如果部分反应规则的双向分析/合成性质。例如,分析将实行“如果”部分(强制在AKRM中呈现显式分级关系以满足条件)。另一方面,合成将发现“仅如果”部分(如果条件适用则发现分级关系)。
已经在图2A和2B中给出了将这些示例性规则应用于将输入分类法200分析和解构为更基本数据结构300的示例。在该示例中,解构复杂概念230、250和270以通过应用规则1生成新的更基本概念235、240、255、260、275和280并且通过应用规则2生成它们的关系。此外,还通过(例如)使用外部语料库作为证据、通过应用规则1来合成新复杂概念:{家养,狮子}、{山居,狗}、{山居,猫}、{家养,山羊}、{家养,宠物}、{家养,猫}。在合成中应用规则2可以生成新概念关系;例如,由于分级关系存在于“动物”与“狗”之间和“动物”与“山居”之间,所以可以合成在“动物”与“山居狗”之间的新分级关系。
同义词环规则
以下输入/输出和知识处理规则提供如由跨越术语或者概念的含义邻近度或者在逻辑上为保留真值的术语的内部可代替性所限定的同义词环的特征。
输入/输出:
概念集C(可能具有“包括”关系)
同义词列表:同义词(ci,cj)
定义2(语义相似度):令c1={c11,c22,...c1n}为包括n个概念c11至c1n的概念。类似地,令c2={c21,c22,...c2m}。相似度函数S,S(c1,c2)描述在两个概念之间的语义相似性。示例函数如下:
S ( c 1 , c 2 ) = Σ i , j S ( c 1 , c 2 | c i , c j )
(if:如果;Synonym:同义词;otherwise:否则)
定义3(概念交集):令c1={c11,c22,...c1n}为包括n个概念c11至c1n的概念。类似地,令c2={c21,c22,..c2m}。
(if:如果)
定义3(同义词概念合成):令c1={c11,c22,...c1n}和c2={c21,c22,...c2m}是根据定义2的两个同义词概念。如果并且仅如果S(c1,c2)>Tsynonym(T同义词),则概念c3=c1∩c2以及分级关系r(c1,c3)和r(c2,c3)存在,其中T同义词是使断言“同义词”成立的语义相似度的阈值:
Synonym::=c3=c1∩c2≠φ∧r(c1,c3)∧r(c2,c3)
S(c1,c2)>Tsynonym
(Synonym:同义词;Tsynonym:T同义词)
同义词环的示例如下:
宠物:家养动物:家居野兽:猫
根据规则3的分析可以推导分级关系,通过这些分级关系,所有四个概念是“家居动物”的子代。根据规则1的分析可以推导以下新概念:
住宅、家养、家居、动物、野兽、哺乳动物
根据规则2的分析可以发现如下分级,在这些分级中,“家养”和“家居”是“住宅”的子代,并且“宠物”、“哺乳动物”、“野兽”和“猫”是“动物”的子代。可以基于在从其中提取更简单概念的复杂概念之间的关系创建这些分级关系。因而,可以通过应用规则3合成以下新同义词环:
猫:宠物:哺乳动物:野兽
家养:家居
辞典规则
以下输入/输出和知识处理规则提供辞典的特征(包括上文描述的KR的特征)以及关联关系(有关术语)
输入/输出:
概念集C(可能具有“包括关系”)
关联关系列表,例如同义词(ci,cj)、有关术语(ci,cj)。
分级关系集(非循环)R={r(ci,cj):ci,cj∈C并且and ci NT cj}
规则1(一致概念合成)应用于辞典。
规则2(分级概念合成)应用于辞典。
规则4(关联关系合成):令c1={c11,c22,...c1n和c2={c21,c22,...c2m}是根据某一关联关系AR的两个有关概念。如果并且仅如果S(c1,c2)>TAR,则概念c3=c1∩c2,c4={AR}以及三个分级关系r(c1,c3)、r(c2,c3)和r(c4,c3)存在,其中TAR是使在两个概念之间的“AR”关系的断言成立的语义相似度的阈值:
关联关系
注意,如果没有要求语义相似度并且经由c3的关联足以捕获关系则TAR可以被设置成零。
示例辞典可以包括关联关系:{猫,食谱}与{鱼,食物}相关联。根据规则1的分析可以推导以下新概念:
猫,食谱,鱼,食物
在呈现的分级关系中的适当模式给定时,可以通过应用规则4来合成新关联关系,例如,“猫”与“鱼”相关联并且“食谱”与“食物”相关联。同样,可以基于在从其中提取更简单概念的复杂概念之间的关系创建关联关系。
按面分类规则
以下输入/输出和知识处理规则提供按面分类的特征(包括作为概念的面和面属性)以及作为在类分级中组织的概念类别的面。此外,下例添加互斥面分级(被约束为严格/单一分级、单继承性的面属性)的特征以及向将被分类为概念集的对象(或者节点)分配面属性。另外,在拓扑上标识面作为面分级中的根节点。
输入/输出:
面分级(用于每个根面的价值节点的分级)
关于面值的标注的术语/概念
定义4(互斥面分级):可以通过从每个面分级挑选一个并且仅一个节点标签/价值/属性对任何概念分类。也就是说,表示任何面分级中的节点的概念的语义不重叠
规则1、2和4应用于面分类。
规则5(面属性分配):面分级中的每个节点/值/属性对应于概念c。如果并且仅如果ci表现为某一面分级中的仅一个父代cj的子代,并且如果对于面分级中的任何两个概念c1、c2而言c1∩c2={},则关系r(ci,cj)存在。
规则6(标注的概念分配):按面分类中的每个标注的术语对应于概念ci={ci1,ci2,...cin},其中cij是根据规则5的标签概念。
示例输入按面分配如下:
具有面属性/节点/价值分配的对象
“家养狗”{北美,驯养的,狗}
“山居狮子”{美洲,野生,猫,山居}
“暹罗族猫”{世界,驯养的,猫}
“狮子”{非洲,野生,狮子,草原}
如上例中所示,根据规则2和5的分析可以用来将输入按面分类分解成更广义面分级(例如,使用面分析或者统计聚类方法)。
面:“宠物”/*合成标签*/
-“常见宠物”/*从聚类{驯养的,动物}推导*/
-“稀有宠物”/*从聚类{野生,动物}推导*/
由于“狗”和“猫”均为“动物”(从面分级“动物”推导),所以可以发现新概念“驯养,动物”如在“驯养的,狗”、“驯养的,猫”等集合中明显一致。
类似地,可以根据规则1和6创建具有面属性/节点/价值分配的新对象。例如,使用上文描述的用于概念合成的规则,也可以合成新概念,比如“狮子宠物”{人造,狮子,驯养的}。虽然这可能在现实生活中不存在,但是在输入KR中的证据给定时可以证实它为有可能的新知识并且以后(例如)通过用户与数据的交互来评价它
本体论规则
规则1、2、4、5和6应用于提供拓扑的特征(包括作为概念的面和面属性)以及作为在类分级中组织的概念类别的面。
考虑示例复杂关系同居(COH):
野生猫←COH→狮子
家养狗←COH→家养猫
分析COH关系可以将它们分解成更原子关系和概念。以下原子构造是可能性:
野生猫,狮子,家养狗,家养猫,同居
上述用于知识创建的规则可以用复杂方式可应用于表示更丰富关系(例如c1关系c2),其中关系是一般关联关系。对于作为关联关系(双向)的复杂关系,可以利用在关系中配对的概念之间的含义的交集性质。对于作为分级(单向)的关系,可以利用在关系中配对的概念之间的含义的包容性质。针对合成的复杂关系而推导的标签可以符合常规呈现,例如“C1和C2有关,因为它们共同具有C3”。
应用规则1(一致概念合成)和规则4(关联关系合成)可以产生以下更原子概念:
野生,猫,狗,家养,栖息地,野生栖息地,家养栖息地,“野生栖息地”属于栖息地,“家养栖息地”属于栖息地
如果发现一致,则合成可以构造以下概念和关系:
“野生狗”包括{野生,狗,野生栖息地}
因此,可以演绎以下更高阶关系:
野生狗←COH→狮子
野生狗←COH→野生猫
因此,“野生狗”以及具有“狮子”和“野生猫”的关系二者是新合成的构造。
自由文本(自然语言)示例
以下是可以使用比如自然语言处理、实体提取和统计聚类这样的方式来变换成结构化语义表示的自然语言文本的示例。一旦被变换,可以应用上文描述的示例性规则以处理数据。
猫(Felis silvestris catus)(也被称为家养猫或者家猫以区分它与其它猫科和猫科动物)是由于其友谊及其猎捕寄生虫和家居害虫的能力而为人类所珍爱的小型食肉哺乳动物。猫已经与人类相关联了至少9,500年并且当前是世界上的最流行的宠物。猫由于它们与人类的密切关联而现在几乎在地球上无处不在。
可以从这一自然语言文本推导如图9中所示的结构化知识表示。可以使用在每个例示性知识表示类型之下描述的规则处理这一知识表示如下:
分类法:C1属于C5(分级)
同义词环:C1:C2:C3
辞典:C1与C7相关联。
本体论:C1猎捕C6;在C7上发现C1
将合成应用于这一示例,可以推导附加结构化数据。例如,应用规则1(一致概念合成),可以推导附加概念:
C8:家养
C9:住宅
继而,可以例如通过应用规则3(同义词概念合成)来合成新关系:
C8::C9(“家养”是“住宅”的同义词)
语义互操作性示例
下例举例说明语义互操作性,其中可以将一个KR中的输入变换成不同KR作为输出。可以例如根据上文针对语义互操作性处理而呈现的伪码的一般数据流来实施下文描述的示例性处理。
输入(输入KR是辞典;::表示……的同义词;|-表示更狭义。)
在图10中图示了可以从上述输入KR分析的基本数据结构。在该图中,实线箭头表示“属于”关系,并且虚线箭头表示“包括”关系。
输出(输出KR是概念“红头啄木鸟”的面分级。)
标注
“红头啄木鸟”是{鸟类:啄木鸟,着色:红色,同名解剖体:头部}
注意,在上例中,AKRM表示中的原子语义可以用来探索跨越每个KR的含义交集(语义互操作性)。例如,原子概念“冠部”和“头部”可以提供跨越形式上不相交概念“麻雀”和“啄木鸟”的含义的连接。
从前文讨论和示例中应当领会到,本发明的方面可以涉及知识表示中的一些最紧迫和有挑战性的应用,包括用于头脑风暴和认知扩充、支持动态和新兴知识以及通过在各种复杂知识表示之间转换成共同语义词汇表来提供语义互操作性的工具。
这里描述的各种发明方面可以与一个或者多个计算机和/或设备中的任何计算机和/或设备一起使用,每个计算机和/或设备具有一个或者多个处理器,该处理器可以被编程为执行上文描述的用于在分析和合成复杂知识表示时使用原子知识表示模型的动作中的任何动作。例如,服务器和客户端计算系统二者可以如上文描述的那样被实施为一个或者多个计算机。图11示意性地示出了本公开内容的各种发明方面可以实施于其上的例示性计算机1100。计算机1100包括处理器或者处理单元1101和存储器1102,该存储器可以包括易失性和/或非易失性存储器。计算机1100除了系统存储器1102之外也可以包括储存器1105(例如,一个或者多个盘驱动)。
存储器1102和/或储存器1105可以存储用于将处理单元1101编程为执行这里描述的功能中的任何功能的一个或者多个计算机可执行指令。储存器1105可以可选地也随需存储一个或者多个数据集。例如,用来实施服务器系统100的计算机可以在一些实施例中在储存器1105中存储AKRM数据集110。备选地,可以与用来实施服务器系统100的计算机分离地实施这样的数据集。
这里对计算机的引用可以包括任何具有编程的处理器的设备,包括架装型计算机、台式计算机、膝上型计算机、平板计算机或者可以一般不被视为计算机的包括编程的处理器的许多设备(例如,PDA、MP3播放器、移动电话、无线耳机)中的任何设备。
示例性计算机1100可以具有一个或者多个输入设备和/或输出设备,比如图11中所示的设备1106和1107。这些设备可以用来呈现用户接口以及其它功能。可以用来提供用户接口的输出设备的示例包括用于可视呈现输出的打印机或者显示屏和用于可听呈现输出的扬声器或者其它声音生成设备。可以用于用户接口的输入设备的示例包括键盘和指点设备,比如鼠标、触摸板和数字面板。作为另一示例,计算机可以通过话音识别或者以其它可听格式接收输入信息。
如图11中所示,计算机1100也可以包括用于经由各种网络(例如,网络1120)实现通信的一个或者多个网络接口(例如,网络接口1110)。网络的示例包括局域网或者广域网,比如企业网或者因特网。这样的网络可以基于任何适当技术并且可以根据任何适当协议来操作而且可以包括无线网络、有线网络或者光纤网络。
已经这样描述了本发明的至少一个实施例的若干方面,将领会到,各种变更、修改和改进将容易为本领域技术人员所想到。因此,前文描述和附图仅为举例。
可以按照许多方式中的任何方式实施本发明的上文描述的实施例。例如,实施例可以使用硬件、软件或者其组合来实施。当用软件实施时,可以在任何适当处理器上或者在无论是在单个计算机中提供的还是分布于多个处理器之中的处理器汇集上执行软件代码。这样的处理器可以被实施为集成电路,其中一个或者多个处理器在集成电路部件中。然而,可以使用任何适当格式的电路来实施处理器。
另外,应当领会到,可以按照多个形式(比如架装型计算机、台式计算机、膝上型计算机或者平板计算机)中的任何形式实现计算机。此外,计算机可以嵌入于一般不被视为计算机、但是具有适当处理能力的设备(包括个人数字助理(PDA)、智能电话或者任何其它适当便携或者固定电子设备)中。
计算机也可以具有一个或者多个输入和输出设备。这些设备可以用来呈现用户接口以及其它功能。可以用来提供用户接口的输出设备的示例包括用于可视呈现输出的打印机或者显示屏和用于可听呈现输出的扬声器或者其它声音生成设备。可以用于用户接口的输入设备的示例包括键盘和指点设备,比如鼠标、触摸板和数字面板。作为另一示例,计算机可以通过话音识别或者以其它可听格式接收输入信息。
这样的计算机可以按照任何适当形式由一个或者多个网络(包括作为局域网或者广域网,比如企业网或者因特网)互连。这样的网络可以基于任何适当技术并且可以根据任何适当协议来操作而且可以包括无线网络、有线网络或者光纤网络。
也可以将这里概括的各种方法或者过程编码为在运用多种操作系统或者平台中的任何操作系统或者平台的一个或者多个处理器上可执行的软件。此外,可以使用多个适当编程语言和/或编程或者脚本编写工具中的任何语言和/或工具来编写这样的软件,并且也可以将这样的软件编译为在框架或者虚拟机上执行的可执行机器语言代码或者中间代码。
就这一点而言,可以将本发明实现为用一个或者多个如下程序编码的一种有形非瞬态计算机可读存储介质(或者多个计算机可读介质)(例如,计算机存储器、一个或者多个软盘、紧致盘(CD)、光盘、数字万用盘(DVD)、磁带、闪存、在现场可编程门阵列或者其它半导体器件中的电路配置或者其它非瞬态有形计算机可读存储介质),该程序当在一个或者多个计算机或者其它处理器上被执行时执行如下方法,这些方法实施上文讨论的本发明的各种实施例。一个或者多个计算机可读介质可以是可移植的,从而使得存储于其上的一个或者多个程序可以被加载到一个或者多个不同计算机或者其它处理器上以实施如上文讨论的本发明的各种方面。如这里所用,术语“非瞬态计算机可读存储介质”仅涵盖可以被视为制造品(即制造产品)或者机器的计算机可读介质
术语“程序”或者“软件”这里在通用意义上用来指代可以用来将计算机或者其它处理器编程为实施如上文讨论的本发明的各种方面的、任何类型的计算机代码或者计算机可执行指令集。此外,应当领会到,根据本发明的一个方面,在被执行时执行本发明方法的一个或者多个计算机程序无需驻留于单个计算机或者处理器上,而是可以用模块化方式分布于多个不同计算机或者处理器之中以实施本发明的各种方面。
计算机可执行指令可以是以由一个或者多个计算机或者其它设备执行的许多形式,比如程序模块。一般而言,程序模块包括执行特定任务或者实施特定抽象数据类型的例程、程序、对象、部件、数据结构等。通常在各种实施例中可以如希望的那样组合或者分布程序模块的功能。
数据结构也可以按照任何适当形式存储于计算机可读介质中。为了简化说明,可以将数据结构示出为具有通过在数据结构中的位置来相关的字段。通过在传送字段之间关系的计算机可读介质中向用于字段的储存器分配位置来类似地实现这样的关系。然而,任何适当机制可以用来建立在数据结构的字段中的信息之间的关系,包括通过使用指针、标记或者在数据元之间建立关系的其它机制。
可以单独、在组合中或者在前文中描述的实施例中未具体讨论的多种布置中使用本发明的各种方面,因此本发明在它的应用上不限于在前文描述中阐述的或者在附图中图示的部件细节和布置。例如,在一个实施例中描述的方面可以按照任何方式与在其它实施例中描述的方面组合。
也可以江本发明实现为已经提供其示例的方法。可以按照任何适当方式对作为方法的部分而执行的动作排序。因而,可以构造如下实施例,在这些实施例中以与所示顺序不同的如下顺序执行动作,该顺序可以包括同时执行即使在示例实施例中作为依序动作而示出的一些动作。
在权利要求中使用诸如“第一”、“第二”、“第三”等顺序术语以修饰权利要求要素并非本身意味着一个权利要求要素较另一权利要求要素而言的任何优先、居先或者顺序或者意味着执行方法的动作的时间顺序、而是仅用作使具有某一名称的一个权利要求要素区别于具有相同名称的另一权利要求要素的标签(而是用于顺序术语)以区分权利要求要素。
如这里定义和使用的所有定义应当被理解为支配字典定义、在通过引用而结合的文献中的定义和/或定义的术语的普通含义。
不定冠词“一个”和“一种”如这里所用除非另有相反明示则应当理解为意味着“至少一个”。
如这里所用,短语“至少一个”在引用一个或者多个要素的列表时应当理解为意味着从要素列表中的要素中的任何一个或者多个要素中选择的至少一个要素、但是未必包括在要素列表内具体列举的每一个要素中的至少一个要素、并且未排除要素列表中的要素的任何组合。这一定义也允许可以可选地存在除了在短语“至少一个”引用的要素列表内具体标识的要素之外的、无论是与具体标识的那些要素有关还是无关的要素。因此,作为非限制性的示例,“A和B中的至少一个”(或者等效为“A或者B中的至少一个”或者等效为“A和/或B中的至少一个”)可以在一个实施例中指代至少一个A、可选地包括多个A而没有B存在(并且可选地包括除了B之外的要素);在另一实施例中指代至少一个B、可选地包括多个B而无A存在(并且可选地包括除了A之外的要素);在又一实施例中指代至少一个A、可选地包括多个A和至少一个B、可选地包括多个B(并且可选地包括其它要素);等等。
短语“和/或”如这里所用应当理解为意味着这样联合的要素中的“任一个或者二者”、即在一些情况下相与存在而在其它情况下相或存在的要素。应当以相同方式理解用“和/或”列举的多个要素、即这样联合的元素中的“一个或者多个”。可以可选地存在除了由“和/或”分句具体标识的要素之外的、无论是与具体标识的那些要素有关还是无关的其它要素。因此作为非限制性的示例,对“A和/或B”的引用在与开放式语言、比如“包括”结合使用时可以在一个实施例中仅指代A(可选地包括除了B之外的要素);在另一实施例中仅指代B(可选地包括除了A之外的要素);在又一实施例中指代A和B(可选地包括其它要素);等等。
如这里所用,“或者”应当被理解为具有与如上文定义的“和/或”相同的含义。例如,当在列表中隔开项目时,“或者”或者“和/或”应当被解释为包含意义,即包括多个要素或者要素列表中的至少一个、也包括多个并且可选地包括附加的未列举项目。
这里所用短语和术语也是为了描述而不应被视为限制。这里使用“包括”或者“具有”、“包含”、“涉及到”及其变化意味着包括其后列举的项目及其等效项目以及附加项目。
已经具体描述了本发明的若干实施例,各种修改和改进将容易为本领域技术人员所想到。因此,前文描述仅为举例而并非旨在于作为限制。

Claims (20)

1.一种用于合成复杂指示表示的计算机实施的方法,所述方法包括:
从数据消耗者接收上下文;
根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及
通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,
其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,
其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
2.根据权利要求1所述的计算机实施的方法,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
3.根据权利要求2所述的计算机实施的方法,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
4.根据权利要求3所述的计算机实施的方法,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
5.根据权利要求3所述的计算机实施的方法,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
6.根据权利要求5所述的计算机实施的方法,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
7.根据权利要求6所述的计算机实施的方法,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。
8.至少一个非瞬态计算机可读存储介质,所述至少一个非瞬态计算机可读存储介质存储计算机可执行指令,所述计算机可执行指令在被执行时执行用于合成复杂知识表示的方法,所述方法包括:
从数据消耗者接收上下文;
根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及
通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,
其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,
其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
9.根据权利要求8所述的至少一个非瞬态计算机可读存储介质,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
10.根据权利要求9所述的至少一个非瞬态计算机可读存储介质,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
11.根据权利要求10所述的至少一个非瞬态计算机可读存储介质,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
12.根据权利要求10所述的至少一个非瞬态计算机可读存储介质,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
13.根据权利要求12所述的至少一个非瞬态计算机可读存储介质,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
14.根据权利要求13所述的至少一个非瞬态计算机可读存储介质,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。
15.一种装置,包括:
至少一个处理器;以及
至少一个存储介质,所述至少一个存储介质存储处理器可执行指令,所述处理器可执行指令在由所述至少一个处理器执行时执行用于合成复杂知识表示的方法,所述方法包括:
从数据消耗者接收上下文;
根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及
通过向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,
其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,
其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。
16.根据权利要求15所述的装置,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。
17.根据权利要求16所述的装置,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。
18.根据权利要求17所述的装置,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。
19.根据权利要求17所述的装置,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。
20.根据权利要求19所述的装置,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。
CN201610323839.8A 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法 Active CN106021444B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35726610P 2010-06-22 2010-06-22
US61/357,266 2010-06-22
CN201180031005.5A CN102947842B (zh) 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201180031005.5A Division CN102947842B (zh) 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法

Publications (2)

Publication Number Publication Date
CN106021444A true CN106021444A (zh) 2016-10-12
CN106021444B CN106021444B (zh) 2021-06-04

Family

ID=45370786

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610323839.8A Active CN106021444B (zh) 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法
CN201180031005.5A Active CN102947842B (zh) 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201180031005.5A Active CN102947842B (zh) 2010-06-22 2011-06-22 用于分析和合成复杂知识表示的系统和方法

Country Status (8)

Country Link
US (2) US9104779B2 (zh)
JP (2) JP5798624B2 (zh)
CN (2) CN106021444B (zh)
AU (2) AU2011269685B2 (zh)
CA (1) CA2802905C (zh)
HK (1) HK1181895A1 (zh)
IL (1) IL223541A (zh)
WO (1) WO2011160214A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897437A (zh) * 2017-02-28 2017-06-27 北明智通(北京)科技有限公司 一种知识系统的高阶规则多分类方法及其系统
CN112231422A (zh) * 2020-12-16 2021-01-15 中国人民解放军国防科技大学 一种图数据合成方法、装置、计算机设备和存储介质

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US9104779B2 (en) 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US9177248B2 (en) 2005-03-30 2015-11-03 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
WO2009148473A1 (en) * 2007-12-12 2009-12-10 21Ct, Inc. Method and system for abstracting information for use in link analysis
US9361365B2 (en) 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
CN106845645B (zh) 2008-05-01 2020-08-04 启创互联公司 用于产生语义网络和用于媒体合成的方法及系统
EP2329406A1 (en) 2008-08-29 2011-06-08 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US9235806B2 (en) 2010-06-22 2016-01-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US10474647B2 (en) 2010-06-22 2019-11-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
AU2012203964A1 (en) * 2010-12-30 2013-07-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9092516B2 (en) 2011-06-20 2015-07-28 Primal Fusion Inc. Identifying information of interest based on user preferences
US11294977B2 (en) 2011-06-20 2022-04-05 Primal Fusion Inc. Techniques for presenting content to a user based on the user's preferences
US20120226681A1 (en) * 2011-03-01 2012-09-06 Microsoft Corporation Facet determination using query logs
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US9460069B2 (en) * 2012-10-19 2016-10-04 International Business Machines Corporation Generation of test data using text analytics
FI20126105L (fi) * 2012-10-25 2014-04-26 Tellabs Oy Menetelmä ja ohjauslaite ohjelmallisesti määriteltävän verkon konfiguroimiseksi
CA2897886C (en) * 2013-01-11 2021-11-09 Primal Fusion Inc. Methods and apparatus for identifying concepts corresponding to input information
US10157175B2 (en) 2013-03-15 2018-12-18 International Business Machines Corporation Business intelligence data models with concept identification using language-specific clues
IN2013MU03243A (zh) 2013-10-15 2015-07-17 Tata Consultancy Services Ltd
US10698924B2 (en) * 2014-05-22 2020-06-30 International Business Machines Corporation Generating partitioned hierarchical groups based on data sets for business intelligence data models
CN105138526B (zh) * 2014-05-30 2019-02-22 国际商业机器公司 用于为关系型数据库自动生成语义映射的方法和系统
US9886494B2 (en) * 2014-11-21 2018-02-06 International Business Machines Corporation Optimizing faceted classification through facet range identification
US10002179B2 (en) 2015-01-30 2018-06-19 International Business Machines Corporation Detection and creation of appropriate row concept during automated model generation
JP6092493B1 (ja) * 2015-08-26 2017-03-08 成仁 片山 データベース管理装置およびその方法
US9984116B2 (en) 2015-08-28 2018-05-29 International Business Machines Corporation Automated management of natural language queries in enterprise business intelligence analytics
US11514244B2 (en) * 2015-11-11 2022-11-29 Adobe Inc. Structured knowledge modeling and extraction from images
US10360501B2 (en) 2015-12-31 2019-07-23 International Business Machines Corporation Real-time capture and translation of human thoughts and ideas into structured patterns
CN109804371B (zh) * 2016-08-10 2023-05-23 瑞典爱立信有限公司 用于语义知识迁移的方法和装置
US9645988B1 (en) * 2016-08-25 2017-05-09 Kira Inc. System and method for identifying passages in electronic documents
US10671577B2 (en) * 2016-09-23 2020-06-02 International Business Machines Corporation Merging synonymous entities from multiple structured sources into a dataset
US10726338B2 (en) * 2016-11-11 2020-07-28 International Business Machines Corporation Modifying a set of instructions based on bootstrapped knowledge acquisition from a limited knowledge domain
JP6833999B2 (ja) * 2016-11-23 2021-02-24 プライマル フュージョン インコーポレイテッド 機械学習分類器とともに知識表現を使用するためのシステム及び方法
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
WO2018208813A1 (en) * 2017-05-09 2018-11-15 Sri International Deep adaptive semantic logic network
US10649982B2 (en) * 2017-11-09 2020-05-12 Fry Laboratories, LLC Automated database updating and curation
US11361227B2 (en) * 2017-11-21 2022-06-14 Google Llc Onboarding of entity data
US10664656B2 (en) * 2018-06-20 2020-05-26 Vade Secure Inc. Methods, devices and systems for data augmentation to improve fraud detection
WO2020051500A1 (en) 2018-09-06 2020-03-12 Coffing Daniel L System for providing dialogue guidance
EP3850781A4 (en) 2018-09-14 2022-05-04 Coffing, Daniel L. FACT MANAGEMENT SYSTEM
US20200211136A1 (en) * 2018-12-31 2020-07-02 3M Innovative Properties Company Concept molecule data structure generator
CN109829057B (zh) * 2019-01-11 2023-02-21 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN110765135A (zh) * 2019-10-28 2020-02-07 深圳市元征科技股份有限公司 汽修资料结构标准化方法、装置及电子设备和存储介质
US11514334B2 (en) 2020-02-07 2022-11-29 International Business Machines Corporation Maintaining a knowledge database based on user interactions with a user interface
US11934441B2 (en) 2020-04-29 2024-03-19 International Business Machines Corporation Generative ontology learning and natural language processing with predictive language models

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594837A (en) * 1993-01-29 1997-01-14 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US20050071150A1 (en) * 2002-05-28 2005-03-31 Nasypny Vladimir Vladimirovich Method for synthesizing a self-learning system for extraction of knowledge from textual documents for use in search
CN101051363A (zh) * 2006-04-03 2007-10-10 陈新康 一种基于知识网格的技术创新过程管理方法
CN101310274A (zh) * 2005-11-14 2008-11-19 马克森斯公司 知识相关性搜索引擎

Family Cites Families (260)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1407351A (en) 1973-02-06 1975-09-24 Standard Telephones Cables Ltd Injection lasers
US4532813A (en) 1984-01-03 1985-08-06 Alpha Gauge & Instrument Company Kinetic fluid sampler
US4972328A (en) 1988-12-16 1990-11-20 Bull Hn Information Systems Inc. Interactive knowledge base end user interface driven maintenance and acquisition system
US5369763A (en) 1989-02-01 1994-11-29 Kansas State University Research Foundation Data storage and retrieval system with improved data base structure
US5193185A (en) 1989-05-15 1993-03-09 David Lanter Method and means for lineage tracing of a spatial information processing and database system
US5056021A (en) 1989-06-08 1991-10-08 Carolyn Ausborn Method and apparatus for abstracting concepts from natural language
JPH05324713A (ja) * 1992-05-20 1993-12-07 Hitachi Ltd 自然語処理方法および自然語処理システム
JPH06168129A (ja) 1992-11-30 1994-06-14 Mitsubishi Electric Corp 知識抽出装置
US5379366A (en) * 1993-01-29 1995-01-03 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US5745910A (en) 1993-05-10 1998-04-28 Apple Computer, Inc. Frame structure which provides an interface between parts of a compound document
US5544352A (en) 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US7010144B1 (en) 1994-10-21 2006-03-07 Digimarc Corporation Associating data with images in imaging systems
US6167390A (en) 1993-12-08 2000-12-26 3M Innovative Properties Company Facet classification neural network
US5950173A (en) 1996-10-25 1999-09-07 Ipf, Inc. System and method for delivering consumer product related information to consumers within retail environments using internet-based information servers and sales agents
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP3578498B2 (ja) 1994-12-02 2004-10-20 株式会社ソニー・コンピュータエンタテインメント 画像情報処理装置
US5835758A (en) 1995-02-28 1998-11-10 Vidya Technologies, Inc. Method and system for respresenting and processing physical and conceptual entities
JP3777456B2 (ja) 1996-04-23 2006-05-24 日本電信電話株式会社 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置
JPH09297686A (ja) * 1996-05-07 1997-11-18 Mitsubishi Electric Corp データマイニング装置
JPH1011292A (ja) * 1996-06-25 1998-01-16 Fuji Xerox Co Ltd 知識発見システム
US5911145A (en) 1996-07-29 1999-06-08 Rae Technology, Inc. Hierarchical structure editor for web sites
US5937400A (en) 1997-03-19 1999-08-10 Au; Lawrence Method to quantify abstraction within semantic networks
US6006222A (en) 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US6233575B1 (en) 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US5924098A (en) 1997-06-30 1999-07-13 Sun Microsystems, Inc. Method and apparatus for managing a linked-list data structure
US6138085A (en) 1997-07-31 2000-10-24 Microsoft Corporation Inferring semantic relations
US6098033A (en) 1997-07-31 2000-08-01 Microsoft Corporation Determining similarity between words
US6078916A (en) 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6772136B2 (en) 1997-08-21 2004-08-03 Elaine Kant System and method for financial instrument modeling and using Monte Carlo simulation
US6173276B1 (en) 1997-08-21 2001-01-09 Scicomp, Inc. System and method for financial instrument modeling and valuation
US6295066B1 (en) 1997-09-12 2001-09-25 Hitachi, Ltd. Method for generating virtual three-dimensional space
US5953726A (en) 1997-11-24 1999-09-14 International Business Machines Corporation Method and apparatus for maintaining multiple inheritance concept hierarchies
US6349275B1 (en) 1997-11-24 2002-02-19 International Business Machines Corporation Multiple concurrent language support system for electronic catalogue using a concept based knowledge representation
US6396864B1 (en) 1998-03-13 2002-05-28 Jds Uniphase Corporation Thermally conductive coatings for light emitting devices
US7711672B2 (en) 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US7536374B2 (en) 1998-05-28 2009-05-19 Qps Tech. Limited Liability Company Method and system for using voice input for performing device functions
US8396824B2 (en) 1998-05-28 2013-03-12 Qps Tech. Limited Liability Company Automatic data categorization with optimally spaced semantic seed terms
EP0962873A1 (en) 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6334131B2 (en) 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6356899B1 (en) 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US6487547B1 (en) 1999-01-29 2002-11-26 Oracle Corporation Database appliance comprising hardware and software bundle configured for specific database applications
US6292792B1 (en) * 1999-03-26 2001-09-18 Intelligent Learning Systems, Inc. System and method for dynamic knowledge generation and distribution
JP2000285122A (ja) 1999-03-30 2000-10-13 Japan Research Institute Ltd シソーラス生成装置および方法,ならびにシソーラス生成プログラムを記録した記録媒体
DE19917592A1 (de) 1999-04-19 2000-10-26 Delphi 2 Creative Tech Gmbh Situationsabhängig operierendes semantisches Netz n-ter Ordnung
EP1185964A1 (en) 1999-05-05 2002-03-13 Accenture Properties (2) B.V. System, method and article of manufacture for creating collaborative simulations with multiple roles for a single student
US6401061B1 (en) 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
US6711585B1 (en) 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
AU763131B2 (en) 1999-07-09 2003-07-17 Acularo Pty Ltd Methods of organising information
US7200563B1 (en) 1999-08-20 2007-04-03 Acl International Inc. Ontology-driven information system
US6499024B1 (en) 1999-08-24 2002-12-24 Stream International, Inc. Method and system for development of a knowledge base system
WO2001014952A2 (en) 1999-08-26 2001-03-01 Memetrics Inc. On-line experimentation
US6539376B1 (en) 1999-11-15 2003-03-25 International Business Machines Corporation System and method for the automatic mining of new relationships
US6556983B1 (en) 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
WO2001055898A1 (en) 2000-01-14 2001-08-02 Synquiry Technologies, Ltd. Software composition using graph types, graphs, and agents
US6751621B1 (en) 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
US6868525B1 (en) 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
US6571240B1 (en) 2000-02-02 2003-05-27 Chi Fai Ho Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
JP3428554B2 (ja) 2000-02-29 2003-07-22 日本電気株式会社 意味ネットワーク自動作成装置及びコンピュータ可読記録媒体
AU2001255806A1 (en) 2000-03-14 2001-09-24 Sony Electronics Inc. A method and device for forming a semantic description
US6539395B1 (en) 2000-03-22 2003-03-25 Mood Logic, Inc. Method for creating a database for comparing music
US6654744B2 (en) 2000-04-17 2003-11-25 Fujitsu Limited Method and apparatus for categorizing information, and a computer product
US7062483B2 (en) 2000-05-18 2006-06-13 Endeca Technologies, Inc. Hierarchical data-driven search and navigation system and method for information retrieval
US7035864B1 (en) 2000-05-18 2006-04-25 Endeca Technologies, Inc. Hierarchical data-driven navigation system and method for information retrieval
US20020091736A1 (en) 2000-06-23 2002-07-11 Decis E-Direct, Inc. Component models
US6785683B1 (en) 2000-07-06 2004-08-31 International Business Machines Corporation Categorization and presentation tool for code resources
WO2002005088A1 (en) 2000-07-06 2002-01-17 British Telecommunications Public Limited Company Method and apparatus for extracting knowledge from software code or other structured data
US20050010428A1 (en) 2000-07-27 2005-01-13 Bergeron Heather Ellen Processing transactions using a semantic network
US7216179B2 (en) 2000-08-16 2007-05-08 Semandex Networks Inc. High-performance addressing and routing of data packets with semantically descriptive labels in a computer network
US7478089B2 (en) 2003-10-29 2009-01-13 Kontera Technologies, Inc. System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content
US6768982B1 (en) 2000-09-06 2004-07-27 Cellomics, Inc. Method and system for creating and using knowledge patterns
US20100198724A1 (en) 2004-08-02 2010-08-05 Consumer And Merchant Awareness Foundation Pay yourself first with community knowledge
US7062466B2 (en) 2000-12-06 2006-06-13 The Belo Company Method and system for operating online classified advertisements
US20100223295A1 (en) 2000-12-06 2010-09-02 Io Informatics, Inc. Applied Semantic Knowledgebases and Applications Thereof
KR20020049164A (ko) 2000-12-19 2002-06-26 오길록 유전자 알고리즘을 이용한 카테고리 학습과 단어클러스터에 의한 문서 자동 분류 시스템 및 그 방법
US20020087532A1 (en) 2000-12-29 2002-07-04 Steven Barritz Cooperative, interactive, heuristic system for the creation and ongoing modification of categorization systems
EP1225517B1 (en) 2001-01-17 2006-05-17 International Business Machines Corporation System and methods for computer based searching for relevant texts
US7089237B2 (en) 2001-01-26 2006-08-08 Google, Inc. Interface and system for providing persistent contextual relevance for commerce activities in a networked environment
WO2002071267A2 (en) 2001-03-08 2002-09-12 International Business Machines Corporation System and method for personalized presentation of web pages
US7120646B2 (en) 2001-04-09 2006-10-10 Health Language, Inc. Method and system for interfacing with a multi-level data structure
US7502770B2 (en) 2001-04-11 2009-03-10 Metaweb Technologies, Inc. Knowledge web
US20040015906A1 (en) 2001-04-30 2004-01-22 Goraya Tanvir Y. Adaptive dynamic personal modeling system and method
US20020194187A1 (en) 2001-05-16 2002-12-19 Mcneil John Multi-paradigm knowledge-bases
US6980984B1 (en) 2001-05-16 2005-12-27 Kanisa, Inc. Content provider systems and methods using structured data
EA008675B1 (ru) 2001-06-22 2007-06-29 Нервана, Инк. Система и способ поиска, управления, доставки и представления знаний
CN1395193A (zh) 2001-07-05 2003-02-05 英业达股份有限公司 在网页上生成动态可编辑表格的方法
US7007074B2 (en) 2001-09-10 2006-02-28 Yahoo! Inc. Targeted advertisements using time-dependent key search terms
US7181465B2 (en) 2001-10-29 2007-02-20 Gary Robin Maze System and method for the management of distributed personalized information
US20090198561A1 (en) 2001-11-14 2009-08-06 Retaildna, Llc Self learning method and system for managing agreements to purchase goods over time
US7283992B2 (en) 2001-11-30 2007-10-16 Microsoft Corporation Media agent to suggest contextually related media content
US7225183B2 (en) 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
US20050154708A1 (en) 2002-01-29 2005-07-14 Yao Sun Information exchange between heterogeneous databases through automated identification of concept equivalence
JP2003223465A (ja) 2002-01-31 2003-08-08 Ntt Data Technology Corp 特許文献検索方法
US7716207B2 (en) 2002-02-26 2010-05-11 Odom Paul S Search engine methods and systems for displaying relevant topics
AU2003210393A1 (en) 2002-02-27 2003-09-09 Michael Rik Frans Brands A data integration and knowledge management solution
WO2003075186A1 (en) 2002-03-01 2003-09-12 Paul Jeffrey Krupin A method and system for creating improved search queries
US20030196094A1 (en) 2002-04-10 2003-10-16 Hillis W. Daniel Method and apparatus for authenticating the content of a distributed database
US7085771B2 (en) 2002-05-17 2006-08-01 Verity, Inc System and method for automatically discovering a hierarchy of concepts from a corpus of documents
US7249117B2 (en) 2002-05-22 2007-07-24 Estes Timothy W Knowledge discovery agent system and method
US6946715B2 (en) 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
US7136807B2 (en) 2002-08-26 2006-11-14 International Business Machines Corporation Inferencing using disambiguated natural language rules
JP3891909B2 (ja) 2002-09-03 2007-03-14 日本アイ・ビー・エム株式会社 情報検索支援システム、アプリケーションサーバ、情報検索方法、およびプログラム
AU2003296860A1 (en) 2002-10-15 2004-05-04 Maria Athelogou Information extraction using an object based semantic network
US7584208B2 (en) * 2002-11-20 2009-09-01 Radar Networks, Inc. Methods and systems for managing offers and requests in a network
US7440940B2 (en) 2002-12-02 2008-10-21 Sap Ag Web service agent
US7447667B2 (en) 2002-12-11 2008-11-04 International Business Machines Corporation Method and knowledge structures for reasoning about concepts, relations, and rules
US7698316B2 (en) 2003-01-10 2010-04-13 Cohesive Knowledge Solutions, Inc. Universal knowledge information and data storage system
US20080294641A1 (en) 2003-01-17 2008-11-27 The Board Of Trustees Of The Leland Stanford Junior University Methods and apparatus for storing, organizing, and sharing multimedia objects and documents
US9818136B1 (en) 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
CN1853180A (zh) 2003-02-14 2006-10-25 尼维纳公司 语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法
US7051023B2 (en) 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
US7152065B2 (en) 2003-05-01 2006-12-19 Telcordia Technologies, Inc. Information retrieval and text mining using distributed latent semantic indexing
EP1623339A2 (en) 2003-05-01 2006-02-08 Axonwave Software Inc. A method and system for concept generation and management
US6999934B2 (en) 2003-05-22 2006-02-14 Holtran Technology Ltd. Method and system for processing, storing, retrieving and presenting information with an extendable interface for natural and artificial languages
US7298906B2 (en) 2003-07-08 2007-11-20 Computer Associates Think, Inc. Hierarchical determination of feature relevancy for mixed data types
US20050278362A1 (en) 2003-08-12 2005-12-15 Maren Alianna J Knowledge discovery system
US7401104B2 (en) 2003-08-21 2008-07-15 Microsoft Corporation Systems and methods for synchronizing computer systems through an intermediary file system share or device
US7590643B2 (en) 2003-08-21 2009-09-15 Microsoft Corporation Systems and methods for extensions and inheritance for units of information manageable by a hardware/software interface system
CN1871597B (zh) 2003-08-21 2010-04-14 伊迪利亚公司 利用一套消歧技术处理文本的系统和方法
EP1665093A4 (en) 2003-08-21 2006-12-06 Idilia Inc SYSTEM AND METHOD FOR ASSOCIATING DOCUMENTS WITH CONTEXTUAL ADVERTISEMENTS
US20050223109A1 (en) 2003-08-27 2005-10-06 Ascential Software Corporation Data integration through a services oriented architecture
US20050065955A1 (en) 2003-08-27 2005-03-24 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria
EP1510940A1 (en) 2003-08-29 2005-03-02 Sap Ag A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph
US7433885B2 (en) 2003-12-15 2008-10-07 Quantum Matrix Holdings, Llc System and method for multi-dimensional organization, management, and manipulation of data
US20050216320A1 (en) 2004-01-12 2005-09-29 Brian Hattaway Method of determining requirements for modification of a business operation
US7281002B2 (en) 2004-03-01 2007-10-09 International Business Machine Corporation Organizing related search results
US20050210008A1 (en) 2004-03-18 2005-09-22 Bao Tran Systems and methods for analyzing documents over a network
US20060069610A1 (en) 2004-03-19 2006-03-30 Pascal Rossini Browsing device and platform for management and distrubtion in server mode, in particular for the display of advertising links
US20050216335A1 (en) 2004-03-24 2005-09-29 Andrew Fikes System and method for providing on-line user-assisted Web-based advertising
US7716216B1 (en) 2004-03-31 2010-05-11 Google Inc. Document ranking based on semantic distance between terms in a document
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
WO2005124599A2 (en) * 2004-06-12 2005-12-29 Getty Images, Inc. Content search in complex language, such as japanese
WO2006002234A2 (en) 2004-06-22 2006-01-05 Coras, Inc. Systems and methods for software based on business concepts
EP1782285A1 (en) 2004-07-06 2007-05-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
WO2006011819A1 (en) 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine
US7496593B2 (en) 2004-09-03 2009-02-24 Biowisdom Limited Creating a multi-relational ontology having a predetermined structure
US20060053172A1 (en) 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and using multi-relational ontologies
US7590589B2 (en) 2004-09-10 2009-09-15 Hoffberg Steven M Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference
US20080004844A1 (en) 2004-09-27 2008-01-03 Mark Kefford Method and System for Estimating Project Costs
US20060074980A1 (en) 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US7302418B2 (en) 2004-10-15 2007-11-27 Microsoft Corporation Trade-off/semantic networks
US7475093B2 (en) 2004-10-15 2009-01-06 Microsoft Corporation Memory cache management in XML/relational data mapping
US7908240B1 (en) 2004-10-28 2011-03-15 Unisys Corporation Facilitated use of column and field data for field record universe in a knowledge store
JP2006133955A (ja) 2004-11-04 2006-05-25 Nec Corp 移動通信端末内データのバックアップシステム及び方法並びにそれに用いられる移動通信端末及びバックアップ装置
US7996814B1 (en) 2004-12-21 2011-08-09 Zenprise, Inc. Application model for automated management of software application deployments
FI20050017A0 (fi) 2005-01-07 2005-01-07 Nokia Corp Binääriluokkaan perustuva analysointi ja monitorointi
US7606168B2 (en) 2005-01-28 2009-10-20 Attenex Corporation Apparatus and method for message-centric analysis and multi-aspect viewing using social networks
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US20120166371A1 (en) 2005-03-30 2012-06-28 Primal Fusion Inc. Knowledge representation systems and methods incorporating data consumer models and preferences
US20130046723A1 (en) 2005-03-30 2013-02-21 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US7596574B2 (en) 2005-03-30 2009-09-29 Primal Fusion, Inc. Complex-adaptive system for providing a facted classification
US7606781B2 (en) 2005-03-30 2009-10-20 Primal Fusion Inc. System, method and computer program for facet analysis
US9104779B2 (en) 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US20130066823A1 (en) 2005-03-30 2013-03-14 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US7844565B2 (en) 2005-03-30 2010-11-30 Primal Fusion Inc. System, method and computer program for using a multi-tiered knowledge representation model
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US7502810B2 (en) 2005-05-24 2009-03-10 International Business Machines Corporation Tagging of facet elements in a facet tree
US20060271520A1 (en) 2005-05-27 2006-11-30 Ragan Gene Z Content-based implicit search query
US9286388B2 (en) 2005-08-04 2016-03-15 Time Warner Cable Enterprises Llc Method and apparatus for context-specific content delivery
US8027876B2 (en) 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US7719416B2 (en) 2005-09-09 2010-05-18 Microstrain, Inc. Energy harvesting, wireless structural health monitoring system
US20070061195A1 (en) 2005-09-13 2007-03-15 Yahoo! Inc. Framework for selecting and delivering advertisements over a network based on combined short-term and long-term user behavioral interests
US8472985B2 (en) 2005-09-21 2013-06-25 Buckyball Mobile, Inc Incentive marketing with a context-enriched message
US8023739B2 (en) 2005-09-27 2011-09-20 Battelle Memorial Institute Processes, data structures, and apparatuses for representing knowledge
US20070078889A1 (en) 2005-10-04 2007-04-05 Hoskinson Ronald A Method and system for automated knowledge extraction and organization
US7613690B2 (en) 2005-10-21 2009-11-03 Aol Llc Real time query trends with multi-document summarization
US8019752B2 (en) 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
US20070118394A1 (en) 2005-11-12 2007-05-24 Cahoon Kyle A Value synthesis infrastructure and ontological analysis system
US20100285818A1 (en) 2009-05-08 2010-11-11 Crawford C S Lee Location based service for directing ads to subscribers
US20070112819A1 (en) 2005-11-17 2007-05-17 International Business Machines Corporation Logic checker using semantic links
US20070143300A1 (en) 2005-12-20 2007-06-21 Ask Jeeves, Inc. System and method for monitoring evolution over time of temporal content
US7676485B2 (en) 2006-01-20 2010-03-09 Ixreveal, Inc. Method and computer program product for converting ontologies into concept semantic networks
US20070203865A1 (en) 2006-02-09 2007-08-30 Hirsch Martin C Apparatus and methods for an item retrieval system
US7580918B2 (en) 2006-03-03 2009-08-25 Adobe Systems Incorporated System and method of efficiently representing and searching directed acyclic graph structures in databases
US20070208764A1 (en) 2006-03-06 2007-09-06 John Edward Grisinger Universal information platform
WO2007106858A2 (en) 2006-03-15 2007-09-20 Araicom Research Llc System, method, and computer program product for data mining and automatically generating hypotheses from data repositories
US7624130B2 (en) 2006-03-30 2009-11-24 Microsoft Corporation System and method for exploring a semantic file network
US7849030B2 (en) 2006-05-31 2010-12-07 Hartford Fire Insurance Company Method and system for classifying documents
US8463810B1 (en) 2006-06-01 2013-06-11 Monster Worldwide, Inc. Scoring concepts for contextual personalized information retrieval
US8108204B2 (en) 2006-06-16 2012-01-31 Evgeniy Gabrilovich Text categorization using external knowledge
US20080001948A1 (en) 2006-06-30 2008-01-03 Martin Christian Hirsch Method and apparatus for the collaborative knowledge-based creation and extension of an information graph
US7774463B2 (en) 2006-07-25 2010-08-10 Sap Ag Unified meta-model for a service oriented architecture
US7707005B2 (en) 2006-09-02 2010-04-27 Microsoft Corporation Generating histograms of population data by scaling from sample data
US8166029B2 (en) 2006-09-07 2012-04-24 Yahoo! Inc. System and method for identifying media content items and related media content items
JP5076417B2 (ja) 2006-09-15 2012-11-21 富士ゼロックス株式会社 概念ネットワーク生成システム、概念ネットワーク生成方法及び概念ネットワーク生成プログラム
US7752534B2 (en) 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data
US20080086465A1 (en) 2006-10-09 2008-04-10 Fontenot Nathan D Establishing document relevance by semantic network density
US20080092044A1 (en) 2006-10-12 2008-04-17 International Business Machines Corporation Cascading clouds
US20080137668A1 (en) 2006-12-08 2008-06-12 The Regents Of The University Of California Social semantic networks for distributing contextualized information
WO2008076438A1 (en) 2006-12-18 2008-06-26 Mind Fund Llc Augmenting individual and collective human thinking and knowledge navigation and creation
US20080154906A1 (en) 2006-12-22 2008-06-26 International Business Machines Corporation Selecting information for ad hoc exchange
WO2008085857A2 (en) 2007-01-04 2008-07-17 Children's Hospital Medical Center Processing text with domain-specific spreading activation methods
US7945555B2 (en) 2007-02-01 2011-05-17 Yume, Inc. Method for categorizing content published on internet
US7437370B1 (en) 2007-02-19 2008-10-14 Quintura, Inc. Search engine graphical interface using maps and images
US7529743B1 (en) 2007-02-26 2009-05-05 Quintura, Inc. GUI for subject matter navigation using maps and search terms
US20080228568A1 (en) 2007-03-16 2008-09-18 Microsoft Corporation Delivery of coupons through advertisement
JP2008242626A (ja) 2007-03-26 2008-10-09 Mitsubishi Electric Corp 用語登録装置
US20080243480A1 (en) 2007-03-30 2008-10-02 Yahoo! Inc. System and method for determining semantically related terms
WO2008134588A1 (en) 2007-04-25 2008-11-06 Counsyl, Inc. Methods and systems of automatic ontology population
US7899666B2 (en) 2007-05-04 2011-03-01 Expert System S.P.A. Method and system for automatically extracting relations between concepts included in text
US8706704B2 (en) 2007-07-11 2014-04-22 International Business Machines Corporation Method and system for creating semantic relationships using hyperlinks
US20090024556A1 (en) 2007-07-16 2009-01-22 Semgine, Gmbh Semantic crawler
US20090024385A1 (en) 2007-07-16 2009-01-22 Semgine, Gmbh Semantic parser
US8688521B2 (en) 2007-07-20 2014-04-01 Yahoo! Inc. System and method to facilitate matching of content to advertising information in a network
US20090028164A1 (en) 2007-07-23 2009-01-29 Semgine, Gmbh Method and apparatus for semantic serializing
EP2179358A4 (en) 2007-08-20 2012-01-25 Facebook Inc TARGETED ADVERTISING IN A SOCIAL NETWORK
US8041697B2 (en) 2007-08-31 2011-10-18 Microsoft Corporation Semi-automatic example-based induction of semantic translation rules to support natural language search
US9268849B2 (en) 2007-09-07 2016-02-23 Alexander Siedlecki Apparatus and methods for web marketing tools for digital archives—web portal advertising arts
US20090083140A1 (en) 2007-09-25 2009-03-26 Yahoo! Inc. Non-intrusive, context-sensitive integration of advertisements within network-delivered media content
US8838659B2 (en) 2007-10-04 2014-09-16 Amazon Technologies, Inc. Enhanced knowledge repository
US8108392B2 (en) 2007-10-05 2012-01-31 Fujitsu Limited Identifying clusters of words according to word affinities
US7392250B1 (en) 2007-10-22 2008-06-24 International Business Machines Corporation Discovering interestingness in faceted search
US20100287011A1 (en) 2007-11-13 2010-11-11 Martec Corporation Method and System of Location-Based Game for Improving Mobile Operator's Profit
US8180637B2 (en) 2007-12-03 2012-05-15 Microsoft Corporation High performance HMM adaptation with joint compensation of additive and convolutive distortions
US20090150809A1 (en) 2007-12-05 2009-06-11 Semgine Gmbh Pinpoint browser
US20090157616A1 (en) 2007-12-12 2009-06-18 Richard Barber System and method for enabling a user to search and retrieve individual topics in a visual mapping system
US20090157442A1 (en) 2007-12-13 2009-06-18 Yahoo! Inc. System and Method for Improving the Performance of Digital Advertisements
JP2009146261A (ja) 2007-12-17 2009-07-02 Fujifilm Corp コンテンツ検索装置及び方法
US8402031B2 (en) 2008-01-11 2013-03-19 Microsoft Corporation Determining entity popularity using search queries
US20100100546A1 (en) 2008-02-08 2010-04-22 Steven Forrest Kohler Context-aware semantic virtual community for communication, information and knowledge management
US8280886B2 (en) 2008-02-13 2012-10-02 Fujitsu Limited Determining candidate terms related to terms of a query
US20110314382A1 (en) 2010-06-22 2011-12-22 Primal Fusion Inc. Systems of computerized agents and user-directed semantic networking
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9361365B2 (en) 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
CN106845645B (zh) 2008-05-01 2020-08-04 启创互联公司 用于产生语义网络和用于媒体合成的方法及系统
US8290946B2 (en) 2008-06-24 2012-10-16 Microsoft Corporation Consistent phrase relevance measures
US7865592B2 (en) 2008-06-26 2011-01-04 International Business Machines Corporation Using semantic networks to develop a social network
JP5311378B2 (ja) 2008-06-26 2013-10-09 国立大学法人京都大学 特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法
US8359191B2 (en) 2008-08-01 2013-01-22 International Business Machines Corporation Deriving ontology based on linguistics and community tag clouds
US8583574B2 (en) 2008-08-06 2013-11-12 Delfigo Corporation Method of and apparatus for combining artificial intelligence (AI) concepts with event-driven security architectures and ideas
US9317589B2 (en) 2008-08-07 2016-04-19 International Business Machines Corporation Semantic search by means of word sense disambiguation using a lexicon
US8385971B2 (en) 2008-08-19 2013-02-26 Digimarc Corporation Methods and systems for content processing
US8386506B2 (en) 2008-08-21 2013-02-26 Yahoo! Inc. System and method for context enhanced messaging
EP2329406A1 (en) 2008-08-29 2011-06-08 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
CA2738455A1 (en) 2008-09-26 2010-04-01 Brand Affinity Technologies, Inc. An advertising request and rules-based content provision engine, system and method
US9396455B2 (en) 2008-11-10 2016-07-19 Mindjet Llc System, method, and software application for enabling a user to view and interact with a visual map in an external application
US8352321B2 (en) 2008-12-12 2013-01-08 Microsoft Corporation In-text embedded advertising
US8335754B2 (en) 2009-03-06 2012-12-18 Tagged, Inc. Representing a document using a semantic structure
US20100250526A1 (en) 2009-03-27 2010-09-30 Prochazka Filip Search System that Uses Semantic Constructs Defined by Your Social Network
US20100257171A1 (en) 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US20100262456A1 (en) 2009-04-08 2010-10-14 Jun Feng System and Method for Deep Targeting Advertisement Based on Social Behaviors
US10628847B2 (en) 2009-04-15 2020-04-21 Fiver Llc Search-enhanced semantic advertising
US20100280860A1 (en) 2009-04-30 2010-11-04 Adaptiveblue Inc. Contextual social network based on the semantic web
FR2947358B1 (fr) 2009-06-26 2013-02-15 Alcatel Lucent Un assistant-conseiller utilisant l'analyse semantique des echanges communautaires
US8180768B2 (en) 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US20110060644A1 (en) 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
US20110060645A1 (en) 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
CA2985910C (en) 2009-09-08 2018-11-27 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US8281238B2 (en) 2009-11-10 2012-10-02 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US20110173176A1 (en) 2009-12-16 2011-07-14 International Business Machines Corporation Automatic Generation of an Interest Network and Tag Filter
US8505003B2 (en) 2010-04-28 2013-08-06 Novell, Inc. System and method for upgrading kernels in cloud computing environments
US9235806B2 (en) 2010-06-22 2016-01-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
WO2011160205A1 (en) 2010-06-22 2011-12-29 Primal Fusion Inc. Systems of computerized agents and user-directed semantic networking
AU2012203964A1 (en) 2010-12-30 2013-07-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
AU2011350049A1 (en) 2010-12-30 2013-07-18 Primal Fusion Inc. System and method for performing a semantic operation on a digital social network
JP5921570B2 (ja) 2010-12-30 2016-05-24 プライマル フュージョン インコーポレイテッド 環境入力に基づいて情報を提供するために、知識表現を使用するシステム及び方法
AU2012205031A1 (en) 2011-01-07 2013-07-18 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594837A (en) * 1993-01-29 1997-01-14 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US20050071150A1 (en) * 2002-05-28 2005-03-31 Nasypny Vladimir Vladimirovich Method for synthesizing a self-learning system for extraction of knowledge from textual documents for use in search
CN101310274A (zh) * 2005-11-14 2008-11-19 马克森斯公司 知识相关性搜索引擎
CN101051363A (zh) * 2006-04-03 2007-10-10 陈新康 一种基于知识网格的技术创新过程管理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897437A (zh) * 2017-02-28 2017-06-27 北明智通(北京)科技有限公司 一种知识系统的高阶规则多分类方法及其系统
CN106897437B (zh) * 2017-02-28 2020-04-03 北明智通(北京)科技有限公司 一种知识系统的高阶规则多分类方法及其系统
CN112231422A (zh) * 2020-12-16 2021-01-15 中国人民解放军国防科技大学 一种图数据合成方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
US9104779B2 (en) 2015-08-11
CN102947842A (zh) 2013-02-27
US9934465B2 (en) 2018-04-03
CA2802905C (en) 2018-05-22
HK1181895A1 (zh) 2013-11-15
CA2802905A1 (en) 2011-12-29
JP5798624B2 (ja) 2015-10-21
WO2011160214A1 (en) 2011-12-29
JP2016028324A (ja) 2016-02-25
US20150302299A1 (en) 2015-10-22
AU2011269685A1 (en) 2013-01-10
JP2013537655A (ja) 2013-10-03
AU2011269685B2 (en) 2015-10-01
IL223541A (en) 2017-03-30
US20110320396A1 (en) 2011-12-29
AU2015238791A1 (en) 2015-10-29
CN102947842B (zh) 2016-08-03
JP6105692B2 (ja) 2017-03-29
CN106021444B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN102947842B (zh) 用于分析和合成复杂知识表示的系统和方法
WO2021196520A1 (zh) 一种面向税务领域知识图谱的构建方法及系统
Alatrish Comparison some of ontology
JP5989665B2 (ja) 複合的知識表現の解析及び合成を行うシステム及び方法
US11474979B2 (en) Methods and devices for customizing knowledge representation systems
CA2802887C (en) Systems of computerized agents and user-directed semantic networking
US20150095312A1 (en) Extracting relational data from semi-structured spreadsheets
Nigro et al. Data mining with ontologies: Implementations, findings, and frameworks: Implementations, findings, and frameworks
Alatrish Comparison of ontology editors
Zhang et al. From vision to content: Construction of domain-specific multi-modal knowledge graph
Kaur et al. Evaluation of information retrieval based ontology development editors for semantic web
US11809388B2 (en) Methods and devices for customizing knowledge representation systems
Wachsmuth et al. Text analysis pipelines
AU2015268637B2 (en) Systems and methods for analyzing and synthesizing complex knowledge representations
Cellier et al. Machine Learning and Knowledge Discovery in Databases: International Workshops of ECML PKDD 2019, Würzburg, Germany, September 16–20, 2019, Proceedings, Part I
Mezhar et al. A novel approach for open domain event schema discovery from twitter
Quboa et al. Ontology-informed lattice reduction using the discrimination power index
Huang et al. Using knowledge graphs and deep learning algorithms to enhance digital cultural heritage management
Ferré Reconciling expressivity and usability in information access
Siricharoen Social networking ontology engineering walkthrough: practical approach for non-expert user learning
Thenmozhi et al. A framework to derive multidimensional schema for data warehouse using ontology
Carriero Empirical ontology design patterns
Alam Interactive Knowledge Discovery over Web of Data
Rouces A Frame-Based Approach for Integrating Heterogeneous Knowledge Sources
Gilson An ontological approach to information visualization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1230300

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant