CN1122231C - 为自然语言语句生成逻辑形式图的方法和系统 - Google Patents
为自然语言语句生成逻辑形式图的方法和系统 Download PDFInfo
- Publication number
- CN1122231C CN1122231C CN97196852A CN97196852A CN1122231C CN 1122231 C CN1122231 C CN 1122231C CN 97196852 A CN97196852 A CN 97196852A CN 97196852 A CN97196852 A CN 97196852A CN 1122231 C CN1122231 C CN 1122231C
- Authority
- CN
- China
- Prior art keywords
- sentence
- node
- parsing tree
- logical form
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Abstract
用于在语义上分析自然语言语句的方法和计算机系统。用于词态和句法分析的自然语言处理子系统将输入句转换为句法分析树。语义分析应用三组语义规则以自句法分析树中建立框架逻辑形式图。接着语义分析应用两组附加语义规则以便为逻辑形式图的链提供语义上有意义的标记,以便为省略成分建立附加的逻辑形式图节点及以便统一冗余成分。最终逻辑形式图表示输入句的完整语义分析。
Description
本发明涉及自然语言处理(“NLP”)领域更具体地涉及一种用地按句法树生成逻辑形式图的方法和系统。
自动处理自然语言的计算机系统使用不同子系统,大致对应于词态的、句法的和语义的分析的语言领域以分析输入的文本和达到机器理解自然语言的层次,在一定层次上理解输入的文本后,计算机系统可以例如建议对输入的文本实行语法和风格上的改变,回答在输入文本中提出的问题,或有效地存放由输入文本表示的信息。
词态分析辨别输入的词及为每个词提供信息,即自然语言的人类讲话者能使用词典来确定该词。这些信息能包括一个词能起的句法作用(例如名词或动词)及通过增加前缀或后缀以生成不同的相关词从需改变词的方法。例如,词典可在词“鱼”之外列举不同由词“鱼”派生的不同相关词,名括“鱼类”、“被钓”、“渔夫”、“渔民”、“可捕鱼的”、“可捕鱼性”、“鱼缸”、“渔民”、 “渔业”、“鱼网”和“像鱼的”。
作为起点,句法分析过程使用由输入词的词态分析所提供的信息和规定语言语法的一组句法规则来分析每个输入句,需句法规则规定了输入句用以书写的该种语言语法的。下面是句法规则举例:
句=名词词组+动词词组
名词词组=形容词+名词
动词词组=副词+动词句法分析试图找到一组句法规则的有序子集,应用于输入句的词,以便将词组合成词组,然后将词组组合为完整句子,例如,考虑输入的句子:“Big dogw firecely bite”。使用以上所列三条简单规则,句法分析能分别将词“Big”和“dogs”辨别为形容词和名词,并应用第二规则生成名词词组“Big dogs”、句法分析能分别将词“fiercely”和“bite”辨别为副词和动词,并应用第三规则生成动词词组“fiercely bite”。最后,句法分析应用第一规则由先前生成的名词词组和动词词组形成一个完整句子。通常句法分析结果由一棵无环向下分支树表示,其节点表示输入的词、标点符号、词组,其根节点表示完整句子,此结果称为语法分析。
然而某些句子能具有数个不同语法分析。一条多语法分析的例句是:“Time flies like an arrow”。至少有三种可能对应于该句的三种可能含意的语法分析。第一种语法分析中,“time”是句中主语,“flies”是动词及“like an arrow”是修饰动词“flies”的前置词词组。然而,至少还有两条预料不到的语法分析。在第二种语法分析中,“time”是修饰“flies”的形容词,“like”是动词,及“an arrow”是动词的宾语。此语法分析所对应的含意是一定类型的苍蝇“time flies”喜欢或吸向一支箭。在第三种语法分析中,“time”是一个命令式动词,“flies”是宾语,及“like an arrow”是修饰“time”的前置词词组。此语法分析对应于为苍蝇计时的命令,犹如一个人可能使用停表为箭计时那样。
通常构造一个或更多个称为句法分析树的层次树以完成句法分析。句法分析树的每个叶节点通常表示输入句的一个词或标点符号。句法规则的应用将生成一个自下连至一个、两个或有时更多个现有点节的中间层节点。现有节点最初只包括叶节点,但当句法分析应用句法规则时,现有节点既包括叶节点又包括中间层节点。完整句法分析树的单个根节点表示一个完整句。
语义分析产生一个逻辑形式图,用于以较单独用句法分析树描述方式更深的方式描述输入文本的含意。逻辑形式图是用模拟于语言的人类讲话者所达到的水平来理解输入文本的第一次尝试。
逻辑形式图具有节点和链,但不像以上描述的句法分析树,它并不按层次排序。逻辑形式图的链有标记以标示一对节点之间的关系。例如,语义分析可能将句中一定名词辨别为动词的深主语或深宾语。动词的深主语是动作的作用者及动词的深宾语是动词所规定的动作的对象。主动式动词的深主语可能是句子的句法主语,及主动式动词的深宾语可能是动词的句法宾语。然而,被动式动词的深主语可由施事格词组表示,而被动式动词的深宾语可能是句子的句法主语。例如,考虑两个句子:(1)“Dogs bite people”及(2)“People are bitten by dogs”。第一句具有主动式动词而第二句具有被动式动词。第一句的句法主语是“Dogs”而动词“bite”的句法宾语是“people”。相反,第二句的句法主语是“People”而动词词组“are bitten”由施事格词组“bydogs”所修饰。对于这两句,“dogs”都是深主语,而“people”都是句中动词或动词词组的深宾语。虽然上面句子1和句子2的句法分析所生成的句法分析树不同,但语义分析所产生的逻辑形式图都是相同的,因为两个句子的基本含意是相同的。
在生成逻辑形式图之后的进一步语义处理可能依靠知识库将分析的文件与真实世界概念联系起来以达到更深层次的理解。一个知识库例子是在线百科全书,从中可获取具体词的更完善定义和上下文信息。
下面在处理输入文本例句:“The person whom I met was myfriend.”的上下文中描述三个NLP子系统-词态的、句法的和语义的。图1是阐述NLP子系统之间信息流的框图。词态子系统101接收输入文本及输出可使用每个词的语言不同部分的词和意义的辨别内容、句法子系统102接收此信息并应用句法规则生成一个句法分析树。语义子系统103接收句法分析树并生成逻辑形式图。
图2-5显示存放在电子存储媒体上的在词态分析期间为输入文本例句的输入词所检索的词典信息。图2显示输入词“the”201和“person”202的词典条目。条目201包括关键词“the”和一个属性/值对的表。第一个属性“Adj”具有含在括号205和206之内的符号,用作它的值。这些符号又包括两对属性/值对:(1)“Lemma”/“the”及(2)“Bits”/“Sing Plur Wa6 Det Art Bo Def.”词目(Lemma)是词的基本的其词形未屈折变化的形式。因此属性“Lemma”标示“the”是词典中此条目所表示的词的基本的没有屈折变化的形式。属性“Bits”包括一组表示一个词的一定词态和句法信息的缩写。此信息标示“the”是:(1)单数,(2)复数,(3)不可屈折变化,(4)限定词,(5)冠词,(6)普通形容词和(7)定的。属性204标示词“the”可用作形容词。属性212标示词“the”可用作副词。属性“Senses”207表示该词在不同定义和例子中的不同含意,其中一部分包括于括号208-209之间和括号210-211之间的属性/值对的表中。“the”的条目中实际上所含更多含意在图2中省略了,由括号中语句“(more sense records)”213所标示。
在自然语言处理的第一步中,词态子系统将输入文本的每个词和标点符号识别为单独的记号,并使用词典信息为每个记号的每个语言部分构造一个属性/值记录。属性是记录中的域,它们可具有该具体属性的不同规定值之一。这些属性/值记录然后送至句法子系统以供进一步处理,它们用作句法子系统所构造的句法分析树的叶节点。所有句法分析树的节点和随后NLP子系统所构造的所有逻辑形式图节点都是属性/值记录。
句法子系统将句法规则应用于由词态子系统送至句法子系统的叶节点上以构造表示输入文本样本的可能的句法分析树的更高层节点。一个完整的句法分析树包括一个根节点,中间层节点和叶节点。根节点表示输入文本样本的句法结构(例如陈述句)。中间层节点表示中间句法结构(例如动词,名词或前置词的词组)。叶节点表示属性/值记录的初始组合。
在一些NLP系统中,句法规则以自上而下方式应用。此处描述的NLP系统的句法子系统以自下向上方式将句法规则应用于叶节点。也即,句法子系统试图将句法规则每次一项地用于单个叶节点,用于叶节点对,及有时用于较大叶节点组。如果句法规则需要两个叶节点进行操作和一对叶节点两个都包含与规则中所规定的要求相符合的属性,则将该规则用于它们以建立一个更高层句法结构。例如,词“my friend”可分别表示一个形容词和一个名词,它们可组合成名词词组的更高层句法结构。一个对应于语法规则“名词词组=形容词+名词”的句法规则可建立一个中间层名词词组节点,并将两个表示“my”和“friend”的叶节点连至新建立的中间层节点。当建立每个新的中间层节点时,该节点即被连至已有的叶节点和中间层节点,并成为应用句法规则的节点总组合的一部分。将句法规则应用于不断增大的节点组合的过程一直继续下去,直至生成一棵完整的句法分析树或直至没有更多句法规则可应用。一棵完整句法分析树包括作为其叶节点的输入句的所有词并且表示该句的一种可能的语法分析。
此自下而上的句法分析方法建立许多中间层节点和子树,它们可能从来不会包括于最终的完整的句法分析树中。此外,此分析方法会同时产生多个完整的句法分析树。
句法子系统会连续地应用规则来无休止地搜索所有可能的完整句法分析树,直至没有更多规则可供应用。句法子系统也可尝试不同探索方案以首先生成可能性最大的节点。在生成一个或数个完整句法分析树之后,句法子系统一般可终止搜索,因为最可能选为最好地表示输入句的句法分析树可能是第一批生成的句法分析树中的一个。如果在合理搜索之后没有产生完整句法分析树,则可将最有可能的子树组合为一个单树,其根节点可应用特定聚合规则来生成,这样可得到一个合适的语法分析。
图6阐述由句法子系统为图2-5中初始显示的词典条目建立的最初叶节点。叶节点包括两个特殊节点601和614,它们分别表示句子的开端和将句子结束的句点。节点602-613中每一个表示句子中一个输入词能表示的语句中的单个部分。这些语句部分可在词典条目中作为属性/值对找到。例如,叶节点602和603表示词“The”的两个可能语句部分,这些在图2中可作为属性204和212找到。
图7-22显示由句法子系统逐条规则地构造最终句法分析树。每个图阐述应用单个句法规则以生成一个表示句法结构的中间层节点。只阐述那些产生用于组成最终分析树的中间层节点的规则。句法子系统生成许多最终并不包括在最终句法分析树中的中间层节点。
在图7-14中句法子系统应用一元句法规则,用于建立表示简单动词、名词和形容词词组的中间层节点。自图15开始,句法子系统开始应用二元句法规则,和于将简单动词、名词和形容词词组组合为多词句法结构。句法子系统按规则的成功应用的可能性将规则排序,然后试图逐条应用它们,直至找到一条能成功地用于现有节点的规则。例如,如图15中所示,句法子系统成功地应用一条规则以自一个形容词词组和一个名词词组中建立一个表示名词词组的节点。该规则规定了形容词和名词词组应具备的特征。此例中形容词词组必须是一个限定词。跟随指针由节点1501回至节点1503,然后访问节点1503中所包括的词态信息,句法子系统确定节点1501并不表示一个限定词。找到两个具备该规则所要求的特征的节点1501和1502后,句法子系统即应用该规则自两个简单词组1501和1502中建立一个表示名词词组“my friend”的中间层节点。在图22中,句法子系统应用一个三元规则,将特殊的BEGIN1叶节点2201,动词词组“The person whom I met was my friend”2202与表示终结句点的叶节点2203组合为表示陈述句的节点2204,从而生成表示输入句的最终的完整句法分析树。
语义子系统由一棵完整句法分析树生成一个逻辑形式图。在某些NLP系统中,由句法分析树的节点构造逻辑形式图,将属性和新的双向链加到它们上面。逻辑形式图是一个带标记有向图。它是输入句的语义表示。通过自逻辑形式图的节点内部指代句法分析树的叶节点,仍可使用由词态子系统为每个词所获取的信息。逻辑形式图的链的方向和标记两者都表示语义信息,包括逻辑形式图的节点的功能作用。在其分析过程中,语义子系统增加链和节点以表示(1)省略但隐含的词;(2)动词词组的省略的或不清楚的内容和修饰成分:及(3)前置词词组所指代的宾语。
图23阐述语义子系统为输入例句所生成的完整逻辑形式图。作为成功应用语义规则的成果,语义子系统将有含意的标记赋予链2301-2306。六个节点2307-2312以及它们之间的链表示该句的语义含意的主要成分。一般而言,逻辑形式节点大致对应于输入的词,但一定的表达语义含意中并不需要的词,例如“The”和“whom”在逻辑形式图中并不出现,而输入的动词“met”和“was”则以它们的不定式形式“meet”和“be”出现。这些节点在计算机系统中用记录来表示,并包含图23中未示出的附加信息。动词以单数过去时态输入这一事实由逻辑形式节点中对应于动词2307和2310含意的附加信息所标示。
将图23与图22比较,可以容易地看出句法分析树与逻辑形式图之间的差别。图22中显示的句法分析树包括10个叶节点和16个在严格层次中连在一起的中间层节点,其中图23中显示的逻辑形式图只包含6个节点。不像句法分析树,逻辑形式图不按层次排序,这根据节点2307和2308之间的两条方向相反的链可明显看出。此外,如上所指出的,这些节点不再表示输入词的确切形式,相反地表示它们的含意。
语义分析之后实行进一步的自然语言处理步骤。它们涉及以下步骤:将逻辑形式图与自知识库中获取的附加信息组合在一起,分析句组,及通常试图在每个逻辑形式图周围聚集一个接近于人们处理自然语言那样的丰富的上下文环境。
现有技术中用于生成逻辑形式图的方法涉及句法分析树在计算上的复杂调整和操纵。其结果是,要将新语义规则加至NLP系统中是愈来愈困难了。增加新规则涉及新的过程逻辑,而后者可能与早已在语义子系统中编程的过程逻辑相矛盾。此外,由于句法分析树的节点被延伸并被重新用作逻辑形式图的节点,现有技术的语义子系统产生大的烦琐的复杂的数据结构。覆盖在句法分析树上的逻辑形式图的尺寸和复杂程度使该组合数据结构在进一步使用中易于出错和低效。因此希望有一个更易延伸和可管理的语义子系统用于产生简单的逻辑形式图数据结构。
本发明是用于对NLP系统内输入句进行语义分析的方法和系统。该语义分析子系统接收由词态和句法子系统生成的句法分析树。语义分析子系统应用两组语义规则以调整收到的句法分析树。然后语义分析子系统应用第三组语义规则以便自句法分析树中建立框架逻辑形式图。最后语义分析子系统应用两组附加语义规则于框架逻辑形式图,以便为逻辑形式图的链提供语义上有意义的标记,以便为省略节点建立附加逻辑形式图节点,及以便统一冗余逻辑形式图节点。语义分析子系统所生成的最终逻辑形式图表示输入句的完整语义分析。
图1是用于阐述NLP系统的子系统之间信息流的框图。
图2-5显示存放在电子存储媒体上的为输入例句:“The personwhom I met was my friend。”的每个词检索的词典信息。
图6显示在分析输入句的第一步中由句法子系统生成的叶节点。
图7-22显示句法子系统连续地应用句法规则来分析输入句并产生一个句法分析树的过程。
图23阐述语义子系统生成的用以表示输入句含意的逻辑形式图。
图24显示用于阐述自然语言处理用的优选计算机系统的框图。
图25阐述新的优选语义子系统三个阶段。
图26是新语义子系统(NSS)的流程图。
图27显示第一组语义规则。
图28A显示第一组语义规则中语义规则PrLF_You的详细描述。
图28B显示第一组语义规则中语义规则PrLF_You的应用例子。
图29显示第二组语义规则。
图30A-30B显示第二组语义规则中语义规则TrLF_MoveProp的详细描述。
图30C显示第二组语义规则中语义规则TrLF_MoveProp的应用例子。
图31显示apply_rules的流程图。
图32显示NSS第一阶段的流程图。
图33显示第三组语义规则。
图34A-C显示第三组语义规则中语义规则SynToSem1的详细描述。
图34D显示第三组语义规则中语义规则SynToSem1的应用例子。
图35显示NSS第二阶段的流程图。
图36-38显示第四组语义规则。
图39A显示第四组语义规则中语义规则LF_Dobj2的详细描述。
图39B显示第四组语义规则中语义规则LF_Dobj2的应用例子。
图40显示第五组语义规则。
图41A-C显示第五组语义规则中语义规则PsLF_PronAnaphora的详细描述。
图41D显示第五组语义规则中语义规则PsLF_PronAnaphora的应用例子。
图42显示NSS的第三阶段的流程图。
图43是NSS的计算机系统的框图。
图44-59显示当NSS处理为输入例句生成的句法分析树时它成功地应用每条规则。
本发明提供一种用于根据句法树生成逻辑形式图的新语义方法和系统。在优选实施例中,新语义子系统(NSS)分三个阶段完成语义分析:(1)填入和调整句法分析树,(2)生成逻辑形式图,及(3)为逻辑形式图的链生成有意义的标记和构造完整的逻辑形式图。每个阶段包括将一组或两组规则或应用于一组句法树节点或应用于一组逻辑形式图节点。
NSS处理上面背景段落中描述的现有技术语义子系统中的提到的缺点。NSS的每个阶段是一个简单和可扩展的基于规则的方法。当认识到附加语言现象时,可容易地将处理它们的规则包括在NSS所应用的规则组中的一组中。此外,NSS第二阶段生成一个完全单独的逻辑形式图,而不是将逻辑形式图覆盖在现有句法分析树上。因此,与现有技术逻辑形式图数据结构相比较,由NSS生成的逻辑形式图数据结构是简单和节省空间的。
图24是阐述用于NLP系统的优选计算机系统的框图。计算机系统2401包含一个中央处理单元,一个内存,一个存储设备和输入输出设备。NLP子系统2406-2409通常自计算机可读存储设备例如磁盘中装入内存2404。使用由NLP系统提供的服务的应用程序2405通常也装入内存。电子词典2411存在存储设备例如磁盘2410上,其条目读入内存以供词态子系统用。在一个实施例中,用户通常在输入设备2404上输入一个或多个自然语言句以响应于在输出设备2403上显示的提示。自然语言句由应用程序接收、处理,然后通过词态子系统2406送至NLP系统。词态子系统使用电子词典的信息以构造描述每个输入词的记录,并将这些记录送至句法子系统2407。句法子系统分析输入词以构造一个句法分析树并将句法分析树送至语义子系统2408。语义子系统根据收到的句法分析树生成逻辑形式图及将该逻辑形式图送至其它NLP子系统2409。然后应用程序能送出和接收信息至自然语言子系统2409以便利用由NLP系统完成的对输入文本的机器理解,并最后在输出设备2403上向用户输出一个响应。
图25阐述优选的新语义子系统的三个阶段。NSS的阶段1-3分别示于2502,2504和2506。NSS每个阶段所输入和输出的有关数据结构的状态在图25中示如标记2501,2503,2505和2507。NSS接收句法子系统生成的句法分析树2501。NSS第一阶段2502使用语义规则完成句法分析树,并将完成的句法分析树2503送至NSS第二阶段2504。NSS第二阶段生成初始逻辑形式图2505并将初始逻辑形式图送至NSS第三阶段2506。NSS第三阶段应用语义规则于初始逻辑形式图以将有意义的语义标记加至逻辑形式图的链上,以增加新链和节点从而填充输入句的语义表示及以便偶而删除冗余节点。完整的逻辑形式图2507然后送至其它NLP子系统以便用于进一步解释由逻辑形式图所表示输入句或用于回答问题或准备基于输入句的数据。
图26中显示NSS的流程图,流程图显示NSS的三个阶段2601、2602和2603的连续调用。下面将详细描述NSS的每个阶段。
NSS第一阶段-完成句法树的句法作用。
在NSS第一阶段中,NSS应用两组不同的语义规则于自句法子系统接收的句法分析树的节点以改变该句法分析树。这些语义规则能改变句法树的链结构或增加新节点。
NSS应用第一组语义规则以解决无法由句法分析处理的不同的可能遗漏和缺陷。应用这些第一组语义规则可实现对输入的句法分析树的初步调整。第一组语义规则所处理的语言现象包括词“to”或“not”后省略的但又被听的人理解为隐含词的动词,命令句中省略的代词如“you”或“we”,涉及词“and”或“or”的并列结构的扩展,以及省略的宾语或删减的动词词组。图27列出NSS在第一阶段内应用的优选第一组语义规则。显示了每条规则的规则名及随于其后的它所处理的语言现象的精确描述。
每条语义规则的一般格式是用于句法分析树节点或逻辑形式图节点的一组条件和用于句法分析树或逻辑形式图的一系列操作。例如,NSS将第一组语义规则中的每一条规则的条件应用于表示句法分析树的一系列句法记录,以及对于能满足该规则全部条件的每条规则NSS都完成该规则中所含的一系列操作,从而具体改变句法分析树。当然,每条语义规则实际形式决定于句法分析树和逻辑形式图的表示细节,它们可能有许多不同表示。在下面的图中,一条语义规则由黑体字“If”后的条件表达式所描述,其后随之以黑体字“Then”后的一系列操作。语义规则的“If”部分表示必须应用于句法分析树节点或逻辑形式图节点的条件,这些条件为真实时该规则整体地应用于该节点,以及“Then”表达式表示在句法分析树或逻辑形式图上完成的一系列操作。所显示表达式紧密地对应于语义规则的计算机源码表达式。
图28A显示第一组语义规则中语义规则PrLF_You的英语表示。如图28A中可看出的,“If”表达式涉及应用规则的句法分析树节点的不同属性值,以及“Then”表达式规定为词目“you”建立代词节点和为代词节点建立一个名词词组父节点并将所建立节点附加至句法分析树上。
图28B显示将语义规则PrLF_You应用于由句法子系统为句子“PLease close the door”所生成的句法分析树2801的例子。应用PrLF_You的结果是修改的句法分析树2802,有两个新节点2803和2804连至该句的根节点。此语义规则的目的是将命令句中不明言的“you”显式地放入句法分析树中。
在将能用于输入句法分析树的第一组语义规则中的所有语义规则都应用后,NSS将第二组语义规则应用于初步调整的句法分析树的节点以执行初步调整句法分析树的主要调整操作。此第二组规则包括用于辨别和解决远距离附加现象,用于将动词词组转换为带有前置词词组宾语的动词及在一定情况下用于将不定式从句代替词“it”的规则。
图29列出NSS在第一阶段中应用的优选第二组语义规则。显示了每条规则的规则名及随于其后的它所处理的语言现象的精确描述。图30A-30B显示第二组语义规则中语义规则TrLF_MoveProp的英语表示。如在图30A-30B所见的,“If”表达式涉及应用规则的句法分析树节点和不同有关句法分析树节点的不同属性值,及“Then”表达式规定句法分析树的较复杂的重新安排。
图30C显示将语义规则TrLF_MoveProp用于由句法子系统为句子“I have no desire to see the man”生成的句法分析树3001的例子。应用TrLF_MoveProp的结果是修改的句法分析树3002。原句法分析树中由节点3003表示的不定式从句已从其作为节点3004的子节点的位置移至作为修改的句法分析树的根节点DECL1 3006的子节点3005的位置。此语义规则的目的是将例如不定式从句3003那样的从句自句法树中较低层移至较高层以便于随后自句法分析树过渡至逻辑形式图。
在本发明的优选实施例中,语义规则是编程语言中的语句,当执行这些语句时,它们自一个、两个或有时更多个现有树或图的节点中建立一个新的树或图节点并在新建立节点与现有树或图节点之间建立合适的链。在优选实施例中,语义规则的左端规定为应用该规则现有节点或多个节点必须具备的特性。语义规则的右端规定将建立的新节点的类型和新节点的属性值。图28和图30中描述的规则例示此形式。
在本发明的优选实施例中,每个句法分析树和每个逻辑形式图表示为一组节点,节点间的链由节点内的属性值表示。每组规则也表示为一个表。将一组规则应用于句法分析树的步骤涉及自一组节点中选择连续的节点和试图将表示该组规则的一组规则中的每一条规则应用于每个所选节点。如一个节点具有一条具体规则的左端中规定的特性,则可将该规则成功地应用于该节点。有时,成功应用规则的结果是建立一个新节点,或者可将一个现有节点标定为删除。
图31中显示将一组规则用于表示句法分析树或逻辑形式图的一组节点的子程序“apply_rules”的流程图。在NSS的三个阶段的每个阶段中NSS调用子程序“ apply_rules”以便应用每组规则。步3101中,apply_rules接收一组节点作为其第一参量和接收一组规则作为其第二参量。步3102至3107表示一个外环,每迭代一次它都试图将输入的一组规则中所有输入规则应用于自输入的一组节点中选出的连续节点。步3103至3106表示一个内环,每迭代一次它都试图将自输入的一组规则中选出的一条规则应用于自输入的一组节点中选出的一个节点。步3102中,apply_rules自第一个节点开始,在输入的一组节点中选择下一个节点。步3103中,apply_rules自第一条规则开始,在输入的一组规则中选择下一条规则。步3104中apply_rules确定所选节点是否具有所选规则左端所规定的特性。如该节点具有所规定特性,则apply_rules在步3105中将所选规则应用于所选节点。如apply_rules在步3106中确定还有更多规则可用于所选节点,则apply_rules回至步3103以选择下一规则。如apply_rules在步3107中确定还有更多节点试图应用输入的一组规则,则apply_rules回至步3102以选择下一节点。
图32中显示在NSS第一阶段中进行处理的流程图。步3201中,变量“parameter1”被赋值为组成由句法子系统生成的句法分析树的一组句法分析树节点的表并输入至NSS。步3202中,变量“parameter2”被赋值为一组显示于图27中的第一组语义规则的表。步3203中,NSS调用子程序“apply_rules”,将变量“parameter1”和“parameter2”送至子程序。子程序“apply_rules”将第一组语义规则应用于句法分析树以实现初步调整。步3204中,变量“parameter1”被赋值为组成初步调整的句法分析树的一组句法分析树节点的表。步3205中,变量“parameter2”被赋值为一组显示于图29中的第二组语义规则的表。步3206中,NSS调用子程序“apply_rules”,将变量“parameter1”和“parameter2”送至子程序。子程序“apply_rules”将第二组语义规则应用于句法分析树以实现主要调整。
NSS第二阶段-生成初始逻辑形式图
在NSS第二阶段中,NSS将第三组语义规则应用于调整的句法树节点。第二阶段中每一次成功的规则应用能建立一个新逻辑形式图节点。通过应用此第三组规则,NSS建立一个新逻辑形式图。逻辑形式图节点只包括语义上有意义的属性和一个指回至相应句法树节点的指针。不像现有技术语义子系统,NSS在第二阶段中建立的逻辑形式图节点是完全单独的并与句法分析树节点分开的。NSS构造一个逻辑形式图框架,它所包括的链作为节点内的属性被存放,并将逻辑形式图节点互相连接。
在图33中显示NSS在第二阶段中应用的一组第三组语义规则的表。图33显示每条规则的规则名,其后随之以它处理的语法现象的精确描述。此第三组规则中只有三条规则,只有第一条规则SynToSem1通常使用。第二和第三规则只在句法子系统生成合适的语法分析的特殊情况下才应用,因此调整的句法分析树包含一个合适的语法分析节点。
图34A-34C显示第三组语义规则中语义规则SynToSem1的英语表示。如可在图34A-34C中看到的,“If”表达式涉及应用规则的句法分析树节点和不同有关句法分析树节点的不同属性值,及“Then”表达式规定建立逻辑形式图节点和将新节点放于刚出现的逻辑形式图中。
图34D显示将语义规则SynToSem1应用于句法子系统为句子“The book was written by John”生成的句法分析树3401的例子。应用SynToSem1的结果是框架逻辑形式图3402。框架逻辑形式图具有三个带有用于标记链的临时修饰语的节点。根据自其中建立新节点的句法分析树节点的句法属性,将属性赋予新节点。逻辑形式图中的节点数比相应的句法分析树中少得多,因逻辑形式图表示句子的语义意义。初始句子中的词“the”、“was”和“by”的语法意义被或将被包括入逻辑形式图的属性和标记中,因此在逻辑形式图中不须要源自作为句法分析树中叶节点的存在的复杂节点层次。
图35显示NSS第二阶段的流程图。步3501中,变量“parameter1”被赋值为表示调整的句法分析树的一组节点,步3502中,变量“parameter2”被赋值为一组显示于图33中的第三组语义规则。步3503中,NSS调用子程序“apply_rules”以将第三组语义规则应用于调整的句法分析树节点,从而建立一个对应于调整的句法分析树的新逻辑形式图。
NSS第三阶段-完成逻辑形式图
在NSS第三阶段中,NSS将第四组语义规则应用于框架逻辑形式图以将语义上有意义的标记加至逻辑形式图的链上。这些新标记包括“深主语”(“Dsub”),“深宾语”(“Dobj”),“深间接宾语”(“Dind”),“深主格谓语”(“Dnom”),“深补语”(“Dcmp”),和“深形容谓语”(“Dadj”)。在图36-38中显示一组NSS在第三阶段中应用的第四组语义规则。图36-38显示每条规则的规则名和随于其后的它处理的语法现象的精确描述。
图39A显示第四组语义规则中的语义规则LF_Dobj2的英语表示。如可在图39A中看到的,“If”表达式涉及应用该规则的逻辑形式图节点的不同属性值,及“Then”表达式规定逻辑形式图中链的标记。
图39B显示将语义规则LF_Dobj2应用于由NSS为句子“The bookwas written by John”生成的逻辑形式图3901的例子。将LF_Dobj2应用于包含被动从句的逻辑形式图的操作能将句法主语辨别为动作的深宾语。在图39B中这是通过将链3903自临时修饰语重新标记为用于标示深宾语关系的标记3904而完成的。
作为第三阶段中的最后步骤,NSS通过应用第五组语义规则而进行逻辑形式图的最后调整。此组规则包括用于将关系代词与其先行词结合,寻找并显式地包括省略的代词,解决数码省略号,提供省略的深主语,将人称代词的冗余实例统一及将在语义分析的第一子步骤中扩展的并列结构缩约的一些规则。这些规则也涉及取一个代词(或“代词形式”)和辨别它所指代的名词词组的问题。在很多情况下,不可能按照逻辑形式图提供的信息层次来辨别正确的名词词组所指对象。在这些情况下,建立一组最可能的候选人,并将处理操作推迟至以后采用更多全局信息的NLP系统的步骤。图40中显示一组由NSS在第三阶段中应用的第五组语义规则。图40显示每条规则的规则名,其后随之以它处理的语法现象的精确描述。
图41A-41C显示第五组语义规则中语义规则PsLF_PronAnaphora的英语表示。如可自图41A-41C中看到的,“If”表达式涉及应用该规则的逻辑形式图节点和有关的逻辑形式图节点的不同属性值,及“Then”表达式规定增加一个表示代词的省略指代事物的逻辑形式图节点。
图41D显示将语义规则PsLF_PronAnaphora应用于由NSS为句子“Mary likes the man who came to dinner,and Joan likes him too.”生成的逻辑形式图4101的例子。将PsLF_PronAnaphora应用于包含一个带有位于逻辑形式图不同部分内的所指事物的代词节点的逻辑形式图的结果是增加一个有一个代词节点与其直接连接的新节点。图41D中已应用PsLF_PronAnaphora增加新节点4103以标示节点“he1”指代“man”。
图42中显示NSS第三阶段中所做处理的流程图。步4201中,变量“parameter1”被赋值为用于组成在NSS第二阶段中生成的逻辑形式图的一组逻辑形式图节点。步4202中,变量“parameter2”被赋值为一组显示于图36-38中的第四组语义规则。步4203中NSS调用子程序“apply_rules”,将变量“parameter1”和“parameter2”送至子程序。子程序“apply_rules”将第四组语义规则应用于逻辑形式图以将语义上有意义的标记加至逻辑形式图的链上。步4204中,变量“parameter1”被赋值为用于组成在步4203中生成的有意义的标记的逻辑形式图的一组逻辑形式图节点。步4205中,变量“parameter2”被赋值为一组于图40中显示的第五组语义规则。步4206中,NSS调用子程序“apply_rules”,将变量“parameter1”和“parameter2”送至子程序。子程序“apply_rules”将第五组语义规则应用于逻辑形式图以实现最终调整。
图43是用于NSS的计算机系统的框图。计算机4300包含具有语义规则4304-4308的内存及规则应用机4303。在中央处理单元控制下,规则应用机将五组规则应用于句法分析树4301以生成一个相应的逻辑形式图4302。句法分析树由未示出的词态和句法子系统优选地生成。句法树和逻辑形式图也能用于完成随后的任务,该任务要求类似于人类读者自输入句中获取的信息的那些信息。例如,语法检查程序可建议输入句的新的用语以便更准确或简明地叙述输入句中所叙述内容。作为另一例子,计算机操作系统可能完成由输入句描述的计算任务。作为又一个例子,含于输入句中的信息可以分类并由数据库管理系统存放于别处以供以后检索用。
输入例句的语义处理
下面的讨论和图44-59描述例句“The person whom I met wasmy friend”的完整NSS处理。将描述由NSS应用的每条语义规则及应用规则的结果的表示。
第一组语义规则中设有一条初步调整规则成功地应用于在第一阶段中自句法子系统输入NSS的句法分析树。第二组语义规则中的一条主要调整规则应用于输入句法分析树。图44显示具有其输入形式的句法分析树4400。可注意到它在图44中的表示比在图22中简单。NSS成功地将显示于图29中的语义规则TrLF_LongDist1作为规则1应用于句法分析树4400的关系从句节点RELCL1 4401以生成调整的句法分析树4402。应用规则TrLF_LongDist1的效果是在名词词组节点4403中引入一个直接宾语属性以标示词“whom”是词组“I met”的直接宾语。英语中正常时态动词的直接宾语随于动词之后。因为在被分析以产生句法树4400的句子中“whom”并不随于“I met”之后,所以应用句法规则时不能辨别出“whom”是“I met”的直接宾语这一事实。
在NSS第二阶段中成功地应用第三组规则中的七条规则。图45中NSS成功地将显示于图33中的语义规则SynToSem1作为规则1应用于句法分析树的限定代词节点DETP2 4501以生成逻辑形式图节点“my”4502。图46中NSS成功地将语义规则SynToSem1应用于句法分析树的名词词组节点NP4 4601以生成逻辑形式图节点“friend”4602和带有临时语义标记“Tmods”4606的链4603。图47中NSS成功地将语义规则SynToSem1应用于句法分析树的名词词组节点NP3 4701以生成逻辑形式图节点“I”4702。图48中NSS成功地将语义规则SynToSem1应用于句法分析树的名词词组节点NP2 4801以生成逻辑形式图节点“whom”4802。图49中NSS成功地将语义规则SynToSem1应用于句法分析树的关系从句节点RELCL1 4901以生成逻辑形式图节点“meet”4902和带有临时语义标记“Tmods”4904的链4903。图50中NSS成功地将语义规则SynToSem1应用于句法分析树的名词词组节点NP1 5001以生成逻辑形式图节点“person”5002和带有临时语义标记“Tmods”5004的链5003。图51中NSS成功地将语义规则SynToSem1应用于句法分析树的陈述句节点DECL1 5101以生成逻辑形式图节点“be”5102和带有临时语义标记“Tmods”5104的链5103。因此,完成NSS第二阶段后即建立了一个框架逻辑形式图。
NSS第三阶段中成功地应用第四组语义规则中的六条规则。图52中NSS成功地将显示于图36中的语义规则LF_Dsub1作为规则1应用于逻辑形式图节点“be”5201以生成链标记“Dsub”5202和带有临时语义标记“Tmods”5204的链5203。图53中NSS成功地将显示于图36中的语义规则LF_Dnom作为规则10应用于逻辑形式图节点“be”5301以生成链标记“Dnom”5302。图54中NSS成功地将显示于图38中的语义规则LF_Props作为规则21应用于逻辑形式图节点“person”5401以生成链标记“Props”5402。图55中NSS成功地将显示于图36中的语义规则LF_Dsub1作为规则1应用于逻辑形式图节点“meet”5501以生成链标记“Dsub”5502。图56中NSS成功地将显示于图36中的语义规则LF_Dobj1作为规则3应用于逻辑形式图节点“meet”5601以生成标记为“Dobj”5603的链从而将节点“meet”连至节点“whom”5602。图57中NSS成功地将显示于图38中的语义规则LF_Ops作为规则22应用于逻辑形式图节点“friend”5701以生成链标记“PossBy”5702。
在NSS第三阶段中成功地应用第五组词义规则中的一条规则。图58中NSS成功地将显示于图40中的词义规则PsLF_RelPro作为规则1应用于作为5602显示于图56中的逻辑形式图节点“whom”以生成标记为“Dobj”5801的链并删除节点“whom”。图59中NSS成功地将显示于图40中的语义规则PsLF_UnifyProns作为规则10应用于逻辑形式图以将节点“I”和“my”合并为单个节点。这是NSS成功地应用的最后一条规则。因此图59显示NSS为输入句“The person whom I metwas my friend”生成的最终的完整的逻辑形式图。
虽然本发明是用优选实施例描述的,但这不意味着本发明只限于此实施例。在本发明实质范围内的修改对于熟悉技术的人是显而易见的,后随的权利要求书规定了本发明的范围。
Claims (34)
1.一种用于在计算机系统中为自然语言句子生成逻辑形式图的方法,该句子由具有用于表示句子句法结构成分的节点的句法分析树所表示,该句法分析树被表示于数据结构中,该方法包括:
根据句法分析树的语义分析调整句法分析树,该调整是无法根据句法分析树的句法分析作出的调整;
为该调整的句法分析树生成框架逻辑形式图,该框架逻辑形式图被表示于与句法分析树数据结构分开的数据结构中;以及
在框架逻辑形式图上完成语义分析以完成逻辑形式图。
2.权利要求1的方法,其中调整句法分析树的步骤包括为句中隐含的句法结构成分增加句法作用。
3.权利要求2的方法,其中当该句子在预定义的词之后省略动词时,增加句法作用的步骤为省略的动词增加句法结构成分。
4.权利要求3的方法,其中预定义的词是词“to”。
5.权利要求3的方法,其中预定义的词是词“not”。
6.权利要求2的方法,其中当句子省略代词时,增加句法作用的步骤为省略的代词增加句法结构成分。
7.权利要求6的方法,其中省略的代词是命令句中的词“you”。
8.权利要求2的方法,其中当句子包括并列结构时,增加句法作用的步骤增加句法结构成分以扩展并列结构。
9.权利要求8的方法,其中并列结构包括词“and”。
10.权利要求8的方法,其中并列结构包括词“or”。
11.权利要求2的方法,其中调整句法分析树的步骤包括在增加句法作用后解决远距附加现象。
12.权利要求2的方法,其中调整句法分析树的步骤包括在增加句法作用后将动词词组转换为带前置词词组宾语的动词。
13.权利要求2的方法,其中调整句法分析树的步骤包括在增加句法作用后用不定式从句替代词“it”。
14.权利要求1的方法,其中生成框架逻辑形式图的步骤包括根据调整的句法分析树的属性将属性赋予框架逻辑形式图的节点。
15.权利要求1的方法,其中在框架逻辑形式图上完成语义分析的步骤包括将语义标记加至框架逻辑形式图上。
16.权利要求15的方法,其中语义标记标示语言的深部。
17.权利要求15的方法,其中在框架逻辑形式图上完成语义分析的步骤包括在增加语义标记后增加语义结构成分。
18.一种为自然语言词组生成逻辑形式图的计算机系统,该词组由具有用于表示词组的句法结构成分的节点的句法分析树所表示,该计算机系统包括:
第一部件,用于根据句法分析树的语义分析调整句法分析树,该调整是无法根据句法分析树的句法分析作出的调整;
第二部件,用于为调整的句法分析树生成框架逻辑形式图,该框架逻辑形式图被表示于与句法分析树数据结构分开的数据结构中;以及
第三部件,用于在框架逻辑形式图上完成语义分析以完成逻辑形式图。
19.权利要求18的计算机系统,其中第一部件被配置为通过为词组中隐含的句法结构成分增加句法作用来调整句法分析树。
20.权利要求19的计算机系统,其中第一部件被配置为在词组中在预定义的词之后省略动词时,通过为省略的动词增加句法结构成分来增加句法作用。
21.权利要求20的计算机系统,其中预定义的词是词“to”。
22.权利要求20的计算机系统,其中预定义的词是词“not”。
23.权利要求19的计算机系统,其中第一部件被配置为在词组中省略代词时,通过为省略的代词增加句法结构成分来增加句法作用。
24.权利要求23的计算机系统,其中省略的代词是命令词组中的词“you”。
25.权利要求19的计算机系统,其中第一部件被配置为在词组包括并列结构时增加句法结构成分以扩展并列结构。
26.权利要求25的计算机系统,其中并列结构包括词“and”。
27.权利要求25的计算机系统,其中并列结构包括词“or”。
28.权利要求19的计算机系统,其中第一部件被配置为通过在增加句法作用后解决远距附加现象来调整句法分析树。
29.权利要求19的计算机系统,其中第一部件被配置为通过在增加句法作用后将动词词组转换为带前置词词组宾语的动词来调整句法分析树。
30.权利要求19的计算机系统,其中第一部件被配置为通过在增加句法作用后用不定式从句替代词“it”来调整句法分析树。
31.权利要求18的计算机系统,其中第二部件被配置为通过根据调整的句法分析树的属性将属性赋予框架逻辑形式图节点来生成框架逻辑形式图。
32.权利要求18的计算机系统,其中第三部件被配置为通过将语义标记加至框架逻辑形式图来在框架逻辑形式图上完成语义分析。
33.权利要求32的计算机系统,其中语义标记包括语言的深部。
34.权利要求32的计算机系统,其中第三部件被配置为通过在增加语义标记后增加语义结构成分来在框架逻辑形式图上完成语义分析。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/674,610 US5966686A (en) | 1996-06-28 | 1996-06-28 | Method and system for computing semantic logical forms from syntax trees |
US08/674,610 | 1996-06-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1226327A CN1226327A (zh) | 1999-08-18 |
CN1122231C true CN1122231C (zh) | 2003-09-24 |
Family
ID=24707266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97196852A Expired - Lifetime CN1122231C (zh) | 1996-06-28 | 1997-06-27 | 为自然语言语句生成逻辑形式图的方法和系统 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5966686A (zh) |
EP (1) | EP0907923B1 (zh) |
JP (1) | JP4668363B2 (zh) |
CN (1) | CN1122231C (zh) |
DE (1) | DE69710458T2 (zh) |
HK (1) | HK1022027A1 (zh) |
WO (1) | WO1998000793A1 (zh) |
Families Citing this family (164)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6272495B1 (en) * | 1997-04-22 | 2001-08-07 | Greg Hetherington | Method and apparatus for processing free-format data |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US6078878A (en) * | 1997-07-31 | 2000-06-20 | Microsoft Corporation | Bootstrapping sense characterizations of occurrences of polysemous words |
JP3531468B2 (ja) * | 1998-03-30 | 2004-05-31 | 株式会社日立製作所 | 文書処理装置及び方法 |
US7197451B1 (en) | 1998-07-02 | 2007-03-27 | Novell, Inc. | Method and mechanism for the creation, maintenance, and comparison of semantic abstracts |
US7152031B1 (en) * | 2000-02-25 | 2006-12-19 | Novell, Inc. | Construction, manipulation, and comparison of a multi-dimensional semantic space |
US6108619A (en) * | 1998-07-02 | 2000-08-22 | Novell, Inc. | Method and apparatus for semantic characterization of general content streams and repositories |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
US6405199B1 (en) * | 1998-10-30 | 2002-06-11 | Novell, Inc. | Method and apparatus for semantic token generation based on marked phrases in a content stream |
US6901402B1 (en) * | 1999-06-18 | 2005-05-31 | Microsoft Corporation | System for improving the performance of information retrieval-type tasks by identifying the relations of constituents |
US7509572B1 (en) * | 1999-07-16 | 2009-03-24 | Oracle International Corporation | Automatic generation of document summaries through use of structured text |
JP3702414B2 (ja) * | 1999-08-11 | 2005-10-05 | 株式会社日立製作所 | 情報検索支援方法、コンピュータ読み取り可能な記憶媒体および情報検索装置 |
JP2001075957A (ja) * | 1999-08-24 | 2001-03-23 | Internatl Business Mach Corp <Ibm> | 自然言語構造の表示方法及び装置 |
US6928448B1 (en) | 1999-10-18 | 2005-08-09 | Sony Corporation | System and method to match linguistic structures using thesaurus information |
US6721697B1 (en) * | 1999-10-18 | 2004-04-13 | Sony Corporation | Method and system for reducing lexical ambiguity |
US6778949B2 (en) | 1999-10-18 | 2004-08-17 | Sony Corporation | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures |
US6529865B1 (en) * | 1999-10-18 | 2003-03-04 | Sony Corporation | System and method to compile instructions to manipulate linguistic structures into separate functions |
US6535886B1 (en) | 1999-10-18 | 2003-03-18 | Sony Corporation | Method to compress linguistic structures |
US7379862B1 (en) * | 1999-11-19 | 2008-05-27 | Microsoft Corporation | Method and apparatus for analyzing and debugging natural language parses |
US7421395B1 (en) * | 2000-02-18 | 2008-09-02 | Microsoft Corporation | System and method for producing unique account names |
GB0006721D0 (en) * | 2000-03-20 | 2000-05-10 | Mitchell Thomas A | Assessment methods and systems |
EP1279165B1 (en) * | 2000-03-24 | 2011-01-05 | Eliza Corporation | Speech recognition |
US7120574B2 (en) * | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US6556973B1 (en) * | 2000-04-19 | 2003-04-29 | Voxi Ab | Conversion between data representation formats |
US7962326B2 (en) * | 2000-04-20 | 2011-06-14 | Invention Machine Corporation | Semantic answering system and method |
US6965857B1 (en) * | 2000-06-02 | 2005-11-15 | Cogilex Recherches & Developpement Inc. | Method and apparatus for deriving information from written text |
US7653530B2 (en) * | 2000-07-13 | 2010-01-26 | Novell, Inc. | Method and mechanism for the creation, maintenance, and comparison of semantic abstracts |
US7286977B1 (en) * | 2000-09-05 | 2007-10-23 | Novell, Inc. | Intentional-stance characterization of a general content stream or repository |
US7389225B1 (en) | 2000-10-18 | 2008-06-17 | Novell, Inc. | Method and mechanism for superpositioning state vectors in a semantic abstract |
US7672952B2 (en) * | 2000-07-13 | 2010-03-02 | Novell, Inc. | System and method of semantic correlation of rich content |
US6952666B1 (en) * | 2000-07-20 | 2005-10-04 | Microsoft Corporation | Ranking parser for a natural language processing system |
US20090234718A1 (en) * | 2000-09-05 | 2009-09-17 | Novell, Inc. | Predictive service systems using emotion detection |
US20100122312A1 (en) * | 2008-11-07 | 2010-05-13 | Novell, Inc. | Predictive service systems |
US7177922B1 (en) | 2000-09-05 | 2007-02-13 | Novell, Inc. | Policy enforcement using the semantic characterization of traffic |
US7085708B2 (en) * | 2000-09-23 | 2006-08-01 | Ravenflow, Inc. | Computer system with natural language to machine language translator |
WO2002027542A1 (en) * | 2000-09-28 | 2002-04-04 | Intel Corporation (A Corporation Of Delaware) | A method and apparatus for extracting entity names and their relations |
WO2002033582A2 (en) * | 2000-10-16 | 2002-04-25 | Text Analysis International, Inc. | Method for analyzing text and method for builing text analyzers |
US20020063691A1 (en) * | 2000-11-30 | 2002-05-30 | Rich Rogers | LCD and active web icon download |
WO2002054279A1 (en) * | 2001-01-04 | 2002-07-11 | Agency For Science, Technology And Research | Improved method of text similarity measurement |
US7174536B1 (en) * | 2001-02-12 | 2007-02-06 | Iowa State University Research Foundation, Inc. | Integrated interactive software visualization environment |
US9009590B2 (en) * | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US20050216456A1 (en) | 2001-08-10 | 2005-09-29 | T-Systemev, Ltd. | Method for entering, recording, distributing and reporting data |
US7024351B2 (en) * | 2001-08-21 | 2006-04-04 | Microsoft Corporation | Method and apparatus for robust efficient parsing |
US7113905B2 (en) * | 2001-12-20 | 2006-09-26 | Microsoft Corporation | Method and apparatus for determining unbounded dependencies during syntactic parsing |
US8380491B2 (en) * | 2002-04-19 | 2013-02-19 | Educational Testing Service | System for rating constructed responses based on concepts and a model answer |
US7634398B2 (en) * | 2002-05-16 | 2009-12-15 | Microsoft Corporation | Method and apparatus for reattaching nodes in a parse structure |
JP4038717B2 (ja) * | 2002-09-13 | 2008-01-30 | 富士ゼロックス株式会社 | テキスト文比較装置 |
US20040098250A1 (en) * | 2002-11-19 | 2004-05-20 | Gur Kimchi | Semantic search system and method |
US7584208B2 (en) * | 2002-11-20 | 2009-09-01 | Radar Networks, Inc. | Methods and systems for managing offers and requests in a network |
US7640267B2 (en) * | 2002-11-20 | 2009-12-29 | Radar Networks, Inc. | Methods and systems for managing entities in a computing device using semantic objects |
AU2004202391A1 (en) | 2003-06-20 | 2005-01-13 | Microsoft Corporation | Adaptive machine translation |
US7440890B2 (en) * | 2003-12-19 | 2008-10-21 | Xerox Corporation | Systems and methods for normalization of linguisitic structures |
US7433876B2 (en) | 2004-02-23 | 2008-10-07 | Radar Networks, Inc. | Semantic web portal and platform |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7689410B2 (en) * | 2004-04-23 | 2010-03-30 | Microsoft Corporation | Lexical semantic structure |
US7761858B2 (en) * | 2004-04-23 | 2010-07-20 | Microsoft Corporation | Semantic programming language |
CN1310171C (zh) * | 2004-09-29 | 2007-04-11 | 上海交通大学 | 建立基于语法模型的语义分析器的方法 |
US8051096B1 (en) | 2004-09-30 | 2011-11-01 | Google Inc. | Methods and systems for augmenting a token lexicon |
US7680648B2 (en) | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
US7996208B2 (en) | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
WO2006042321A2 (en) * | 2004-10-12 | 2006-04-20 | University Of Southern California | Training for a text-to-text application which uses string to tree conversion for training and decoding |
US7742911B2 (en) * | 2004-10-12 | 2010-06-22 | At&T Intellectual Property Ii, L.P. | Apparatus and method for spoken language understanding by using semantic role labeling |
US7835902B2 (en) * | 2004-10-20 | 2010-11-16 | Microsoft Corporation | Technique for document editorial quality assessment |
US7698124B2 (en) * | 2004-11-04 | 2010-04-13 | Microsoft Corporaiton | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
US8843536B1 (en) | 2004-12-31 | 2014-09-23 | Google Inc. | Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries |
TWI315044B (en) * | 2005-01-21 | 2009-09-21 | Hon Hai Prec Ind Co Ltd | File server and method for displaying and editing information searching conditions |
US20060195313A1 (en) * | 2005-02-25 | 2006-08-31 | Microsoft Corporation | Method and system for selecting and conjugating a verb |
US7555475B2 (en) * | 2005-03-31 | 2009-06-30 | Jiles, Inc. | Natural language based search engine for handling pronouns and methods of use therefor |
US20060277525A1 (en) * | 2005-06-06 | 2006-12-07 | Microsoft Corporation | Lexical, grammatical, and semantic inference mechanisms |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) * | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US7809551B2 (en) * | 2005-07-01 | 2010-10-05 | Xerox Corporation | Concept matching system |
US7689411B2 (en) | 2005-07-01 | 2010-03-30 | Xerox Corporation | Concept matching |
US20070094183A1 (en) * | 2005-07-21 | 2007-04-26 | Microsoft Corporation | Jargon-based modeling |
US20070055491A1 (en) * | 2005-08-24 | 2007-03-08 | Keith Manson | Method for apparatus for construction and use of an operational lexicon in process models and managing their synchronized representations |
US20070050185A1 (en) * | 2005-08-24 | 2007-03-01 | Keith Manson | Methods and apparatus for constructing graphs, semitic object networks, process models, and managing their synchronized representations |
CN100424685C (zh) * | 2005-09-08 | 2008-10-08 | 中国科学院自动化研究所 | 一种基于标点处理的层次化汉语长句句法分析方法及装置 |
US7672831B2 (en) * | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US7756890B2 (en) * | 2005-10-28 | 2010-07-13 | Novell, Inc. | Semantic identities |
US20070100600A1 (en) * | 2005-10-28 | 2007-05-03 | Inventec Corporation | Explication system and method |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US7805455B2 (en) * | 2005-11-14 | 2010-09-28 | Invention Machine Corporation | System and method for problem analysis |
US20070214153A1 (en) * | 2006-03-10 | 2007-09-13 | Mazzagatti Jane C | Method for processing an input particle stream for creating upper levels of KStore |
US7962328B2 (en) * | 2006-03-13 | 2011-06-14 | Lexikos Corporation | Method and apparatus for generating a compact data structure to identify the meaning of a symbol |
US20070220069A1 (en) * | 2006-03-20 | 2007-09-20 | Mazzagatti Jane C | Method for processing an input particle stream for creating lower levels of a KStore |
US8238351B2 (en) * | 2006-04-04 | 2012-08-07 | Unisys Corporation | Method for determining a most probable K location |
US8943080B2 (en) * | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8060567B2 (en) * | 2006-04-12 | 2011-11-15 | Google Inc. | Method, system, graphical user interface, and data structure for creating electronic calendar entries from email messages |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8924838B2 (en) | 2006-08-09 | 2014-12-30 | Vcvc Iii Llc. | Harvesting data from page |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US8397157B2 (en) * | 2006-10-20 | 2013-03-12 | Adobe Systems Incorporated | Context-free grammar |
US20080141230A1 (en) * | 2006-12-06 | 2008-06-12 | Microsoft Corporation | Scope-Constrained Specification Of Features In A Programming Language |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US20080208566A1 (en) * | 2007-02-23 | 2008-08-28 | Microsoft Corporation | Automated word-form transformation and part of speech tag assignment |
US20080221870A1 (en) * | 2007-03-08 | 2008-09-11 | Yahoo! Inc. | System and method for revising natural language parse trees |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US20090076887A1 (en) | 2007-09-16 | 2009-03-19 | Nova Spivack | System And Method Of Collecting Market-Related Data Via A Web-Based Networking Environment |
US8082151B2 (en) * | 2007-09-18 | 2011-12-20 | At&T Intellectual Property I, Lp | System and method of generating responses to text-based messages |
US20100017293A1 (en) * | 2008-07-17 | 2010-01-21 | Language Weaver, Inc. | System, method, and computer program for providing multilingual text advertisments |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US8301622B2 (en) * | 2008-12-30 | 2012-10-30 | Novell, Inc. | Identity analysis and correlation |
US8296297B2 (en) * | 2008-12-30 | 2012-10-23 | Novell, Inc. | Content analysis and correlation |
US8386475B2 (en) * | 2008-12-30 | 2013-02-26 | Novell, Inc. | Attribution analysis and correlation |
US8370129B2 (en) * | 2009-01-07 | 2013-02-05 | Guangsheng Zhang | System and methods for quantitative assessment of information in natural language contents |
CN101520775B (zh) * | 2009-02-17 | 2012-05-30 | 北京大学 | 一种融入语义信息的中文句法分析与解码方法 |
CN101814065B (zh) * | 2009-02-23 | 2014-07-30 | 富士通株式会社 | 句法分析装置及句法分析方法 |
JP2012520528A (ja) * | 2009-03-13 | 2012-09-06 | インベンション マシーン コーポレーション | 自然言語テキストの自動的意味ラベリングのためのシステム及び方法 |
US20100250479A1 (en) * | 2009-03-31 | 2010-09-30 | Novell, Inc. | Intellectual property discovery and mapping systems and methods |
US8862579B2 (en) | 2009-04-15 | 2014-10-14 | Vcvc Iii Llc | Search and search optimization using a pattern of a location identifier |
WO2010120934A2 (en) | 2009-04-15 | 2010-10-21 | Evri Inc. | Search enhanced semantic advertising |
US8200617B2 (en) | 2009-04-15 | 2012-06-12 | Evri, Inc. | Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata |
US9037567B2 (en) | 2009-04-15 | 2015-05-19 | Vcvc Iii Llc | Generating user-customized search results and building a semantics-enhanced search engine |
US8990064B2 (en) * | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8949773B2 (en) * | 2010-03-25 | 2015-02-03 | International Business Machines Corporation | Deriving process models from natural language use case models |
US8676565B2 (en) * | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US8694304B2 (en) * | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US20120016661A1 (en) * | 2010-07-19 | 2012-01-19 | Eyal Pinkas | System, method and device for intelligent textual conversation system |
US9524291B2 (en) * | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
US8688453B1 (en) * | 2011-02-28 | 2014-04-01 | Nuance Communications, Inc. | Intent mining via analysis of utterances |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US9015031B2 (en) * | 2011-08-04 | 2015-04-21 | International Business Machines Corporation | Predicting lexical answer types in open domain question and answering (QA) systems |
US9971849B2 (en) * | 2011-09-29 | 2018-05-15 | International Business Machines Corporation | Method and system for retrieving legal data for user interface form generation by merging syntactic and semantic contraints |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8935277B2 (en) * | 2012-03-30 | 2015-01-13 | Sap Se | Context-aware question answering system |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US10073827B2 (en) * | 2012-06-07 | 2018-09-11 | Robert Kevin Houston | Method and system to generate a process flow diagram |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US20140278362A1 (en) * | 2013-03-15 | 2014-09-18 | International Business Machines Corporation | Entity Recognition in Natural Language Processing Systems |
US9760644B2 (en) | 2013-04-17 | 2017-09-12 | Google Inc. | Embedding event creation link in a document |
JP6152711B2 (ja) * | 2013-06-04 | 2017-06-28 | 富士通株式会社 | 情報検索装置および情報検索方法 |
US8805845B1 (en) * | 2013-07-31 | 2014-08-12 | LinedIn Corporation | Framework for large-scale multi-label classification |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
CN105373527B (zh) * | 2014-08-27 | 2020-11-27 | 中兴通讯股份有限公司 | 一种省略恢复方法及问答系统 |
GB2546028A (en) * | 2014-10-06 | 2017-07-05 | Ibm | Natural language processing utilizing logical tree structures and propagation of knowledge through logical parse tree structures |
US9588961B2 (en) | 2014-10-06 | 2017-03-07 | International Business Machines Corporation | Natural language processing utilizing propagation of knowledge through logical parse tree structures |
US9715488B2 (en) | 2014-10-06 | 2017-07-25 | International Business Machines Corporation | Natural language processing utilizing transaction based knowledge representation |
US9665564B2 (en) | 2014-10-06 | 2017-05-30 | International Business Machines Corporation | Natural language processing utilizing logical tree structures |
US10019437B2 (en) * | 2015-02-23 | 2018-07-10 | International Business Machines Corporation | Facilitating information extraction via semantic abstraction |
US20170161386A1 (en) * | 2015-12-02 | 2017-06-08 | International Business Machines Corporation | Adaptive product questionnaire |
CN106933809A (zh) * | 2017-03-27 | 2017-07-07 | 三角兽(北京)科技有限公司 | 信息处理装置及信息处理方法 |
US10460044B2 (en) | 2017-05-26 | 2019-10-29 | General Electric Company | Methods and systems for translating natural language requirements to a semantic modeling language statement |
KR101985309B1 (ko) * | 2017-06-12 | 2019-06-04 | 주식회사 티맥스데이터 | 최적화된 높이를 가지는 밸런스드 파스 트리를 생성하는 방법 |
KR102509822B1 (ko) * | 2017-09-25 | 2023-03-14 | 삼성전자주식회사 | 문장 생성 방법 및 장치 |
WO2019172849A1 (en) * | 2018-03-06 | 2019-09-12 | Agency For Science, Technology And Research | Method and system for generating a structured knowledge data for a text |
CN109145315B (zh) * | 2018-09-05 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、存储介质和计算机设备 |
US10902208B2 (en) | 2018-09-28 | 2021-01-26 | International Business Machines Corporation | Personalized interactive semantic parsing using a graph-to-sequence model |
CN109545202B (zh) * | 2018-11-08 | 2021-05-11 | 广东小天才科技有限公司 | 一种调整语义逻辑混乱的语料的方法及系统 |
CN109754809B (zh) * | 2019-01-29 | 2021-02-09 | 北京猎户星空科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
US10936801B2 (en) * | 2019-03-25 | 2021-03-02 | International Business Machines Corporation | Automated electronic form generation with context cues |
CN110705316B (zh) * | 2019-09-29 | 2023-03-24 | 南京大学 | 一种智能家居线性时序逻辑规约生成的方法和装置 |
US11386902B2 (en) * | 2020-04-28 | 2022-07-12 | Bank Of America Corporation | System for generation and maintenance of verified data records |
US11669613B2 (en) | 2020-05-29 | 2023-06-06 | EnSoft Corp. | Method for analyzing and verifying software for safety and security |
CN111859990B (zh) * | 2020-07-30 | 2023-11-21 | 韩朝晖 | 基于语义逻辑唯一性判断的处理问答数据的方法及系统 |
CN112685605A (zh) * | 2020-12-24 | 2021-04-20 | 深圳科安达电子科技股份有限公司 | 一种报警分析方法及系统 |
CN115905524B (zh) * | 2022-11-07 | 2023-10-03 | 华南师范大学 | 融合句法和语义信息的情感分析方法、装置以及设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5111398A (en) * | 1988-11-21 | 1992-05-05 | Xerox Corporation | Processing natural language text using autonomous punctuational structure |
SE466029B (sv) * | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
US5146406A (en) * | 1989-08-16 | 1992-09-08 | International Business Machines Corporation | Computer method for identifying predicate-argument structures in natural language text |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
JP2640793B2 (ja) * | 1992-01-17 | 1997-08-13 | 松下電器産業株式会社 | 共起辞書構築装置及びこの共起辞書を用いた文解析装置 |
-
1996
- 1996-06-28 US US08/674,610 patent/US5966686A/en not_active Expired - Lifetime
-
1997
- 1997-06-27 DE DE69710458T patent/DE69710458T2/de not_active Expired - Lifetime
- 1997-06-27 WO PCT/US1997/011160 patent/WO1998000793A1/en active IP Right Grant
- 1997-06-27 CN CN97196852A patent/CN1122231C/zh not_active Expired - Lifetime
- 1997-06-27 JP JP50430298A patent/JP4668363B2/ja not_active Expired - Fee Related
- 1997-06-27 EP EP97932316A patent/EP0907923B1/en not_active Expired - Lifetime
-
2000
- 2000-02-18 HK HK00100970A patent/HK1022027A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE69710458D1 (de) | 2002-03-21 |
JP4668363B2 (ja) | 2011-04-13 |
WO1998000793A1 (en) | 1998-01-08 |
JP2000513473A (ja) | 2000-10-10 |
EP0907923A1 (en) | 1999-04-14 |
US5966686A (en) | 1999-10-12 |
CN1226327A (zh) | 1999-08-18 |
HK1022027A1 (en) | 2000-07-21 |
EP0907923B1 (en) | 2002-02-13 |
DE69710458T2 (de) | 2002-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1122231C (zh) | 为自然语言语句生成逻辑形式图的方法和系统 | |
Savary et al. | The PARSEME shared task on automatic identification of verbal multiword expressions | |
US8359191B2 (en) | Deriving ontology based on linguistics and community tag clouds | |
CN106844658B (zh) | 一种中文文本知识图谱自动构建方法及系统 | |
CN1135485C (zh) | 利用计算机系统的日文文本字的识别 | |
US7890500B2 (en) | Systems and methods for using and constructing user-interest sensitive indicators of search results | |
US6735583B1 (en) | Method and system for classifying and locating media content | |
WO2018000272A1 (zh) | 一种语料生成装置和方法 | |
US20030163302A1 (en) | Method and system of knowledge based search engine using text mining | |
CN1774713A (zh) | 使用语汇数据库用以命名萃取自文件组中的字汇群集和词组群集的方法、系统和计算机程序 | |
CN1617134A (zh) | 使用机器翻译技术处理释义的系统 | |
CN101065746A (zh) | 文件自动丰富的方法和系统 | |
JP2003308320A (ja) | 文実現システム | |
CN1845104A (zh) | 信息智能检索加工的系统和方法 | |
DE102019001267A1 (de) | Dialogartiges System zur Beantwortung von Anfragen | |
KR102376489B1 (ko) | 단어 랭킹 기반의 텍스트 문서 군집 및 주제 생성 장치 및 그 방법 | |
US20090234852A1 (en) | Sub-linear approximate string match | |
JP2003271592A (ja) | テキスト生成方法及びテキスト生成装置 | |
Chifu et al. | Self-organizing maps in Web mining and semantic Web | |
US8000955B2 (en) | Generating Chinese language banners | |
CN1169555A (zh) | 不同自然语言语义受限统一编码的计算机输入法 | |
JP2786118B2 (ja) | 意味知識獲得装置 | |
JPH0594478A (ja) | 画像データベースシステム | |
CN1180204A (zh) | 大写和无重音文本的词典处理的方法和系统 | |
Wu | Design of Chinese Corpus Based on Semantic Mining Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150422 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150422 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |
|
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20030924 |