CN1179576A - 自动翻译方法和自动翻译机 - Google Patents
自动翻译方法和自动翻译机 Download PDFInfo
- Publication number
- CN1179576A CN1179576A CN97118526A CN97118526A CN1179576A CN 1179576 A CN1179576 A CN 1179576A CN 97118526 A CN97118526 A CN 97118526A CN 97118526 A CN97118526 A CN 97118526A CN 1179576 A CN1179576 A CN 1179576A
- Authority
- CN
- China
- Prior art keywords
- translation
- character string
- certain
- text
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Abstract
具有多个翻译环境的一种高级自动翻译系统,根据本发明的计算机处理过程包括将外语文本翻译成本地语言文本的翻译机;多个翻译环境;以及关于URL字符串和翻译环境的数据库。当用户在全球网浏览器屏上输入某个URL字符串时,检查该数据库以查找最接近该输入的URL字符串的某个URL字符串,翻译机利用对应于所检索到的URL字符串的翻译环境来翻译从所输入的URL字符串指定的全球网页上下载的文件中的文本。
Description
本发明涉及一种自动翻译方法和自动翻译机,将外语形式(例如英文)的文本翻译为某种本地语言形式(例如日文或朝鲜文、中文等等)的文本,尤其涉及装有多种翻译环境的自动翻译方法和自动翻译机。更具体地说,本发明涉及一种自动翻译方法和自动翻译机,将由互联网上的某个WWW服务器提供的WWW页中的外语文本翻译为本地文本,尤其涉及这样的一种自动翻译方法和机器,能自动地选择一种适合于该外语文本的翻译环境来翻译外语文本。在这种情况下,“翻译环境”意味着用于翻译的某个字典数据库和文法算法(例如,子句的设置,辅助动词定义的设置,风格的选择)。
互联网:
利用类似公共电话线这样的通信线路远程地连接本地化计算机的“远程计算系统”已经得到研究和开发。例如,在日本,1985年电信工业法开始生效后,对利用个人计算机的通信普遍感兴趣。
最新的主要远程计算活动涉及到互联网的使用。互联网是由多个计算机网络协同互连而形成的一个网络,是70年代在美国的国家科学基金会(NSF)投资建立的网络“NSFnet”的基础上形成的。互联网作为一个国际网络,最初连接54个国家的大学和研究所,用于交换学术研究信息。然而,安装在大学和研究所的服务器(主要是UNIX工作站)随意地继续互相连接,使得互联网已经成为一个庞大的世界范围的网络。目前的互联网是由世界范围内的超过几十万个服务器构成的。利用所谓的“TCP/IP(传输控制协议/互联网协议)”通信协议将远程定位的服务器互相连接起来,并且通过传送数据或借助BRS(电子公告牌系统)可以互相通信。
传统的(例如最初的)互联网或多或少被看作基于计算机连接的一种UNIX系统。然而,随着1994年对公众的开放以及连接服务供应商的出现,互联网已经逐渐地被普通办公室和个人所使用。例如,在日本,主要的个人计算机通信服务(例如“PC-VAN”和“NiftyServe”)提供互联网的连接服务。
互联网是由不同组织运行的并且具有不同策略的各种网络的聚集。尽管各个组织管理着各自的网络,但没有一个组织对互联网提供全局的管理。即,世界范围的各种服务器,例如数据库服务器和文件服务器,由网络的各自的用户局部管理。互联网的用户也可以通过某个服务器连接互联网而成为信息的提供者,并且可以严密地存取互联网上任何类型的信息。这和个人计算机服务有很大的区别,通过个人计算机服务,用户只能访问某个特定的主机,即某个信息服务器。在英文中,“互联网”通常被看作一个合适的名词,用以区分“互联网”和为特定公司的计算机互相连接而建立起来的广域网。
全球网(WWW):
毫无疑义,“全球网(WWW)”的引入加速了互联网的普及进程。全球网是一个广域信息系统(互联网应用),在网络(尤其是在互联网)上建立超文本/*/以便严密地存取信息,全球网最初是由欧洲粒子物理实验室(CERN)在1989年发展起来的。利用全球网,用户,即全球网客户,可以从服务器跳到另一个服务器来检索目标信息,或者只需用鼠标选择屏幕上醒目的字、词组或图像,就能从数据库中检索所要的信息。
根据“全球网”这一名称的含义,目前,互联网上有大量的全球网服务器。由称为HTML(超文本标记语言)的语言描述的多个文件构成的多个全球网页累积在每个全球网服务器的本地磁盘上。
包含在HTML文件中的是文本文件和其它各种类型的文件,例如图像、语音和图像混合文件。HTML通常基于SGML(标准通用化标记语言),并且,其当前的版本“HTML 3.X”是由全球网标准化组织“W3 Consortium”在1996年发行的。符合HTML的文件基本上是由文本文件构成的,并且文本的格式、图像文件和语音文件的定位以及链接目标都是用“标记”描述的,而“标记”则由辅助文件分类的“<”和“>”来定界。
全球网用户(全球网客户)可以借助称为HTTP(超文本传输协议)(HTTP对应TCP/IP的上层协议)的通信协议读出存放在全球网服务器的全球网页中的文件。所谓的“全球网浏览器”,一种用作互联网导游的计算机程序,能解释HTML文件的内容并将这些内容显示在用户机器的屏幕上。全球网浏览器的典型例子为IBM公司生产的“Web Explorer”(“Web Explorer”为IBM公司的商标)、NetScape通信公司生产的“Netscape Navigator”以及微软公司生产的“Internet Explorer”。
HTML文件中设计的图像文件可以在不同的全球网服务器上被定位。全球网浏览器不但能解释HTML文件,而且能读图像文件,并且能将包含有图像的组合文本显示在全球网客户机的显示屏上。此外,HTML文件包含类似“当该文本(或图像)被鼠标选中时,读哪个服务器的什么文件”这样的命令。用户只需用鼠标选择出现在显示屏上的文本或者点屏幕上的某个位置,就能读出另一个HTML文件。由鼠标选择的HTML文件或者定位在与其前面的HTML文件相同的全球网服务器上,或者定位在另一个全球网服务器上。
将指示读下一个HTML文件的命令包含在HTML文件中,在该技术领域中也称为“形成一个链”。链接目标是用称为URL(均匀资源定位)的标识符指定的。URL是用于识别互联网上的信息资源(即由服务器存放在互联网上的文件)的一种标准的寻址技术。URL的规格由RFC1738规定,这是由IETF(互联网工程任务组织)/**/准备的一个正式的RFC(要求注释)文档集。
组成URL的字符串包括三个部分:访问信息源的协议名(模式名);存放信息源的服务器名;以及该服务器中的文件名。可选择的协议名为HTTP(http)、NNTP(news)、FTP(ftp:文件传输协议)、Telnet(Telenet)以及访问本地磁盘(文件)。典型的服务器名为“www.ibm.com”、“www.yahoo.com”等等。由服务器“www.ya-hoo.com”的全球网(WWW)服务提供的文件“Arts”的URL被表示为“http://www.yahoo.com/Arts/”。URL的各部分之间用“/”隔开。换句话说,URL是全球网页的地址。应该注意:“全球网页”是由某个全球网服务器提供的屏幕的一般名称,也称为“主页(homepage)”。
在构成URL的字符串中,根据该规格说明,由“/”隔开的每个字符串段以下称为“部分URL字符串”。
全球网页的翻译程序:
如上所述,使用全球网,互联网的用户坐在桌子前能访问世界范围内的全球网服务器,并且在浏览器屏幕上可以看到所需的全球网页。
由于全球网页中的大部分文本是用英文写的,因此,使用英语区外面的互联网用户(例如在日本、中国或朝鲜)或者不熟悉英文的其他互联网用户读这样的全球网页都会麻烦,因此就无法充分利用这种广域信息系统。因此,自动翻译软件或自动翻译支持软件最近已经得到开发和生产。某些自动翻译软件程序是专门为互联网上的文本(即全球网页)的翻译而设计的。自动翻译软件利用全球网浏览器的代理功能(Proxy function)/***/转达经互联网得到的数据,被翻译的文档重新被传送到全球网浏览器并在浏览器屏幕上显示。由承诺和互联网兼容而产生的自动翻译软件的一个例子是由IBM日本公司销售的“King of Internet Translation”1.X版。
自动翻译是这样一种技术,通过这种技术,计算机系统的处理能力被用来将用某种外国语言(例如英语)准备的文本翻译成为用本地语言(例如日语)表达的文本,或反之。按照人类处理相关语言的庞大知识库的模型建立数据库,并且当执行自动翻译时,翻译机引用该数据库。
准确地实现对原始文本的自动翻译而将原始文本的内容完全忠实地反映在翻译中,这样做通常是很困难的。这是由于自然语言本身固有的二义性所造成的直接结果。这种二义性的一个根源是由于所用的词汇具有多种意义,即具有两种或多种意义,而这经常出现在原始文本中。每当具有多种意义的一个词出现在文本中时,翻译机必须选择一种意义,而这种意义的选择伴随着某些错误,即错译。二义性的另一种来源是语法变化。例如,英文句子被划分为几种基本句型,例如SVO,SVOO和SVOC,这是从主语、动词等之间的关系来划分的。当省略关联词(“that,“which”,“why”等)时,理解句型和语法是很困难的。
提供多种翻译环境的方法已经得到广泛的使用,以保证更加准确的自动翻译。术语“翻译环境”描述了用于某个翻译过程中的字典数据库和文法算法(子句设置和辅助动词意义设置以及句子风格设计),并且一般认为原文所属的风格、领域和应用必须和某个翻译环境相关。同样的词用在不同的领域(例如艺术、运动、教育和科学)时,通常具有不同的意义和用法,而且用在不同方面的特定翻译环境,例如互联网字典、艺术字典和运动字典,都已经被用在实际中。当使用适合原文内容的翻译环境时,可以去掉自动翻译期间的不必要的分析,并且提高翻译精度。
选择适当翻译环境最容易和基本的方法是根据原文的内容,由用户手工选择合适的翻译环境。在这种情况下,执行自动翻译之前,用户必须理解原文的内容。然而,用户很难对用一种非本地语言的语言写的原文的内容一看就能理解,而用户可能要花许多时间才能理解文本,结果是,翻译系统的提供就没有太大的意义。尤其是因为许多互联网用户当选择有用的信息时需要自动翻译功能的帮助,以便扫描大量的全球网页,如果看原文需要许多时间,自动翻译将是一种毫无意义的活动。
还有另一种背景技术,也用在自动翻译系统中;负责选择某个翻译环境。例如,在日本未审查的专利发布号Hei7-191999,Hei6-332946,Hei6-318229,Hei6-6011 7和Sho 61-173060中,提出了一种自动选择翻译环境的翻译系统。这种翻译系统消除了用户选择某个翻译环境时所要求的麻烦过程,因此提高了工作效率。然而,在选择匹配原文内容的一种翻译环境之前,大多数常规技术分析原文的内容,分析原文的过程需要相当长的时间才能完成,这就使得翻译系统变得复杂。换句话说,从其结构和其使用两方面来看,常规技术都是复杂的系统。
《注释》*:超文本是一种软件,将字符、图形和表格作为目标并提供目标之间的各种相互关系,以便访问这些目标。**:IETF是一个组织,研究互联网上的各种技术问题,讨论服务并提供解决方案。***:代理功能是这样一种功能,当主机服务作为代理时,接收来自互联网的通信数据,并将这些数据转送给不会影响直接外部访问的另一个主机。
本发明的一个目的是提供一种优良的自动翻译方法和机器,利用装有多个翻译环境的翻译系统,将外文文本(如英文文本)翻译成本国语言文本(如日文、朝鲜文或中文文本)。本发明的另一个目的是提供一种优良的自动翻译方法和机器,在将外语文本翻译成本国语言文本之前,自动选择适合于将被翻译的外语文本的一种翻译环境。
本发明的又一个目的是提供一种优良的自动翻译方法和机器,利用装有多种翻译环境的翻译系统,以便将互联网上的全球网服务器提供的全球网页中的外语文本适当地翻译成本地语言的文本。
为了实现上述的目标,根据本发明的第一方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,翻译存放在由用户指定的信息源中的某个文件中的文本,包括步骤:(a)解释某个组合的字符串,在该字符串中,访问信息源的装置和信息源的名称被指定;(b)根据解释得到的结果选择多个翻译环境中的一个;以及(c)使用所选择的翻译环境,翻译存在由组合的字符串指定的信息源中的文件中的文本。
根据本发明的第二方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,翻译存放在由用户指定的信息源中的某个文件中的文本,包括步骤:(a)用户输入某个组合的字符串,在该字符串中,信息源的访问装置以及信息源的名称被指定;(b)根据组合字符串指定的访问装置,下载存放在由组合字符串指定的信息源中的某个文件;(c)解释该组合字符串;(d)根据解释的结果选择多个翻译环境中的一个;并且(e)利用所选择的翻译环境翻译下载文件中的文本。
根据本发明的第三方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,翻译存放在由用户指定的信息源中的某个文件中的文本,包括步骤:(a)用户输入某个组合字符串,在该字符串中,对信息源的访问装置和信息源的名称被指定;(b)根据组合字符串中所指定的访问装置,下载存放在由组合字符串指定的信息源中的文件;(c)在显示屏上显示被下载的文件以及该文件中的原始文件;(d)解释该组合字符串;(e)根据所解释的结果,选择多个翻译环境中的一个;(f)利用所选择的翻译环境翻译原文;并且(g)在显示屏上显示被翻译的文本和原文。
根据本发明的第四方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,下载存放在由用户输入的并指定了对信息源的访问装置和信息源的名称的组合字符串指定的信息源中的文件,并翻译该文件中的文本,包括步骤:(a)作为数据库记录该组合字符串和与所指定的信息源相关的某个翻译环境的组合形式;(b)在该数据库中查找最接近新输入的某个组合字符串的某个组合字符串;并且(c)利用对应在步(b)中找到的组合字符串的翻译环境翻译被下载文件的文本。
根据本发明的第五方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,下载存放在由用户输入的并指定了对信息源的访问装置和信息源的名称的组合字符串指定的信息源中的某个文件,并翻译该文件中的文本,包括步骤:(a)作为数据库记录该组合字符串和与被指定的信息源相关的某个翻译环境的某种组合形式;(b)在该数据库中查找某个组合字符串,该字符串最接近新输入的某个组合字符串;(c)利用对应在步(b)中找到的组合字符串的翻译环境,翻译从被指定的信息源中下载的文件中的文本;并且(d)在没有获得正确翻译结果的情况下,利用另一个翻译环境重新翻译该文本。
根据本发明的第六方面,由装有多个翻译环境的翻译系统执行的一种自动翻译方法,下载存放在由用户输入的并指定了对信息源的访问装置和信息源的名称的某个组合字符串指定的信息源中的某个文件,并翻译该文件中的文件,包括步骤:(a)作为数据库记录该组合字符串和与被指定信息源相关的某个翻译环境的某种组合形式;(b)在该数据库中,查找某个组合字符串,该字符串最接近新输入的某个组合字符串;(c)利用对应在步(b)中找到的组合字符串的翻译环境,翻译从被指定的信息源中下载的文件中的文本;(d)在得不到正确翻译结果的情况下,利用另一个翻译环境重新翻译该文本;并且(e)在得到正确翻译结果的情况下,在数据库中另外再记录新的组合字符串和所使用的翻译环境之间的关系。
根据本发明的第七方面,一种自动翻译方法,根据作为访问某个信息源的协议名和存放信息源的服务器的名称(以及服务器中的某个文件名)的组合的URL(均匀资源定位)字符串,通过互联网下载在某个被指定的服务器中的文件,并利用多个翻译环境中的一个,翻译被下载文件中的文本,包括步骤:(a)解释该URL字符串;(b)根据某个解释结果选择多个翻译环境中的一个;并且(c)利用所选择的翻译环境翻译被下载文件中的文本。
根据本发明的第八方面,一种自动翻译方法,根据作为访问某个信息源的协议名和存放该信息源的服务器的名称(以及该服务器中的某个文件名)的一种组合形式的URL(均匀资源定位)字符串,通过互联网下载某个被指定的服务器中的文件,并利用多个翻译环境中的一个翻译被下载文件中的文本,包括步骤:(a)在显示屏上显示被下载文件以及原始文本;(b)解释该URL字符串;(c)根据某个解释结果,选择多个翻译环境中的一个;(d)利用被选择的翻译环境翻译原始文本;并且(e)在显示屏上显示翻译的文本和原始文本。
根据本发明的第九个方面,一种自动翻译方法,根据作为访问某个信息源的协议名和存放信息源的服务器的名称(以及该服务器中的某个文件名)的一种组合形式的URL(均匀资源定位)字符串,通过互联网下载所指定服务器中的文件,并利用多个翻译环境中的一个翻译被下载文件中的文本,包括步骤:(a)作为数据库记录URL字符串和某个翻译环境的组合;(b)在该数据库中查找某个URL字符串,该字符串最接近新输入的某个URL字符串;并且(c)利用对应在步(b)中找到的URL字符串的某个翻译环境,翻译被下载文件中的文本。
根据本发明的第十个方面,一种自动翻译方法,根据作为访问某个信息源的协议名和存放该信息源的服务器的名称(以及该服务器中的某个文件名)的一种组合形式的URL(均匀资源定位)字符串,通过互联网下载被指定服务器中的文件,并利用多个翻译环境中的一个翻译被下载文件中的文本,包括步骤:(a)作为数据库记录该URL字符串和某个翻译环境的某种组合形式;(b)在该数据库中查找某个URL字符串,该字符串最接近新输入的某个URL字符串;(c)利用对应在步(b)中得到的URL字符串的翻译环境,翻译被下载文件中的文本;并且(d)在得不到正确翻译结果的情况下,利用另一种翻译环境重新翻译该文本。
根据本发明的第十一方面,一种自动翻译方法,根据作为访问某个信息源的协议名和存放该信息源的服务器的名称(以及该服务器中的某个文件名)的某种组合形式的URL(均匀资源定位)字符串,通过互联网下载被指定服务器中的文件,并利用多个翻译环境中的一个,翻译被下载文件中的文本,包括步骤:(a)作为数据库记录该URL字符串和某个翻译环境的一种组合形式;(b)在该数据库中查找某个URL字符串,该字符串最接近新输入的某个URL字符串;(c)利用对应在步(b)中得到的URL字符串的翻译环境,翻译被下载文件中的文本;(d)在没有得到正确释译结果的情况下,利用另一个翻译环境重新翻译该文本;并且(e)在得到正确的翻译结果的情况下,将新的URL字符串和该翻译环境之间的关系也记录在数据库中。
根据本发明的第十二方面,一种自动翻译机器,使用多个翻译环境中的一个翻译通过互联网从某个全球网服务器中下载的某个文件中的文本,包括:(a)存放某个数据库的第一装置,该数据库管理URL字符串和某个翻译环境的组合形式;(b)输入URL字符串的第二装置;(c)从某个全球网服务器中下载由输入的URL串指定的文件的第三装置;(d)在第一装置中查找某个URL字符串的第四装置,该字符串最接近新输入的某个URL字符串;(e)选择和被查找到的URL字符串相关的翻译环境作为合适的一个翻译环境的第五装置;(f)利用所选择的翻译环境,翻译从全球网服务器中下载的文件中的文本的第六装置;并且(g)将翻译结果显示在屏幕上的第七装置。
“翻译环境”为某个字典数据库和文法算法(例如,设置子句,设置辅助动词的意义,指定句子的风格),用在翻译处理过程中。
本发明主要用于全球网页的自动翻译,并且基于这样的事实,作为某个全球网页的地址的URL字符串由描述性字符串段的组合构成(即“部分URL字符串”):协议名,服务器名和文件名。
根据本发明的自动翻译方法和机器可以借助计算机处理的方式来实现,通过和从全球网服务器中接收全球网页并将其在浏览屏上显示的一系列浏览操作互锁,实现这种计算机处理。
这种计算机处理包括翻译机,用于将外国语言的文本翻译为本地语言的文本(或反之),还包括多种翻译环境,例如翻译环境A(互联网字典)、翻译环境B(艺术字典)以及翻译环境C(运动字典)。根据本发明的自动翻译方法,用于URL字符串的数据库被累积。该数据库可以采用表的格式,如表1所示,该表格给出了与相当频繁访问的全球网页相关的URL字符串和翻译环境之间的对应关系。根据该翻译过程的过去执行情况得到的结果,对应各个URL字符串的翻译环境被认为是适当的环境。
[表1]
在表1中,翻译环境A(互联网字典)被记录为URL名“www.ibm.com/”和“www.yahoo.com/”的适当环境;翻译环境B(艺术字典)被记录为“www.yahoo.com/Arts”的适当环境;而翻译环境C(运动字典)则被记录为“www.yahoo.com/Arts/Recreation/Sports/”的适当环境。数据库可以由系统设计者根据一般用户的使用倾向预先准备好。进一步研究用户的访问习惯可以扩大该数据库。
当用户将某个URL字符串输入到某个全球网浏览器的屏幕上时,借助互联网,全球网浏览器(或该浏览器的代理)可从由URL字符串指定的全球网页中下载文件。根据本发明的计算机处理解释该输入的URL字符串。在这里,对URL字符串的解释引用了查找某个URL字符串的一个处理过程,该字符串最接近(即最类似)该输入的URL字符串。更具体地说,一个URL字符串被看作部分URL字符串的一种组合,而具有最接近输入的URL字符串的部分URL字符串的组合形式的URL字符串在数据库中被查找。例如,当输入的URL为“www.ibm.com/”(已在数据库中)时,对应的翻译环境A(互联网字典)被自动地选择。如果输入的URL串为“www.ya-hoo.com/Arts/Architecture/”(该字符串没有记录在数据库中),翻译环境B(艺术字典),对应“www.yahoo.com/Arts/”,其部分URL字符串最接近输入的URL串,因此被自动选择。在根据本发明的计算机处理过程中,URL字符串可以在全球网页已经被下载之后被解释,也可以和下载过程并行处理。根据本发明的计算机处理过程可以包括全球网浏览器下载全球网页的代理功能。
翻译机使用所选择的翻译环境将下载文件中的外语文本翻译成本地语的文本。例如,经翻译得到的本地语言文本被传送给全球网浏览器并被显示在浏览器屏幕上。这时,对原始的外语文本的原始文本窗口和对本地语言文本的翻译窗口可同时被显示在同一屏幕上(原始文本及其对应的翻译文本都可以被显示)。
当用户判定显示在浏览屏上的翻译结果不正确时,可以选择另一个翻译环境并再次执行自动翻译。当对应没有被登记的URL字符串的适当翻译环境被找到时,该环境可以被加到该数据库中。
即,根据本发明提供的一种自动翻译方法和机器,在执行对全球网页的自动翻译之前,根据由某个全球网服务器经互联网提供的某个全球网页地址的URL字符串,自动地选择某个翻译环境。由于选择了合适的翻译环境,因此提高了翻译的精度。由于翻译环境的选择并将该环境加入到数据库仅仅是对某个URL字符串实现的,只涉及到相当少量的数据,因此,处理过程简单而且系统的结构也便于实现。
在自动翻译之前实现的一种技术,从多个翻译环境中,选择适合于原文内容的一种翻译环境,这种技术在本发明提出申请之前就已经被推荐(见前面提到的日本未审查专利公布)。大多数常规的技术选择一种翻译环境,而不是引用分析原文得到的结果的URL字符串。换句话说,常规的技术,包括分析原文的一个过程,无论在其结构还是其用法上都是复杂的系统,和本发明有根本的区别。这些常规的技术不是为翻译全球网页而建立的,从某个不同的方面来看,本发明和不同于本发明的常规技术可以共存。
在结合附图详细介绍本发明的实施例的过程中,本发明的其他目的、特征和优点将变得更加明显。
现在将结合附图介绍本发明的最佳实施例。
图1给出了根据本发明的计算机系统10的硬件结构简图。
图2给出根据本发明的自动翻译系统的系统配置的简图。
图3说明翻译环境选择器130的结构。
图4给出显示在全球网浏览器屏上的URL数据库133。
图5给出显示在全球网浏览器屏上的URL数据库133(图4的继续)。
图6是当选择某个翻译环境时,由URL比较段134执行的一个程序的流程图。
图7给出了本发明的自动翻译系统100所附加到的全球网浏览器150的示例屏幕。
图8表示执行加一个登记项到URL数据库133的程序的流程图。
A.硬件环境
图1是个示意图,说明适合于实施本发明的计算机系统10的硬件结构。现在将介绍各个部分。CPU11,主控制器,在操作系统(OS)的控制下执行各种程序。例如,CPU11可以是Intel公司的“Pentium/1xx MHz”。操作系统可以是IBM公司的“OS/2”(“OS/2是IBM公司的商标)或者是微软公司的“Windows 95”。
CPU11通过三条总线和各种硬件模块互相连接:直接连接到CPU11外部引线的处理器总线12,用作局部总线的PCI(外围部件互连)总线16和用作输入/输出总线的ISA(工业标准结构)总线18。
处理器总线12借助桥电路(主机-PCI桥)13和PCI总线16通信联系。在本实施例中的桥电路13包括控制访问主存储器14的存储控制器,以及用于吸收总线12和16的速度之间的差别的数据缓冲区。
主存储器14被用作装入程序的一个区域,也用作当前执行程序的工作区,并且一般是由多个DRAM(动态RAM)芯片组成的。L2-高速缓存15,一种高速存储器,用于临时存放经常被访问的代码/数据并用来吸收CPU11访问主存储器14所需的时间,通常由一个SRAM(静态RAM)芯片组成。ROM17为非易失存储器,其中,永久地存放着检测程序(POST),当系统启动时执行该程序,还存放着代码组,用于运作系统10的各个硬件部分。
PCI总线16是使系统能进行高速数据传输的总线(宽度为32位,操作频率为33MHz,最大数据传输速度为132KBps)。外围设备,例如高速驱动的视频控制器20和卡总线控制器(图中没有表示)都被连接到PCI总线16上。
视频控制器20是用于实际处理由CPU11发出的图像处理命令的专用控制器。视频控制器20临时将被处理的图像数据存在屏幕缓冲区(VRAM)21中,并且从VRAM21中读出数据并输出到显示器22上。
PCI总线16和ISA总线18经桥电路(PCI-ISA桥)19互相连接。在该实施例中的桥电路19包括DMA控制器、可编程中断控制器(PIC)和可编程区间定时器(PIT)。在该实施例中的桥电路还有一个IDE(集成驱动电路)连接器,用于连接外部的IDE存储设备。IDE硬盘驱动器(HDD)23和IDE CD-ROM驱动器24被连接到IDE连接器。
上述的桥电路13和19符合由PCI提供的规格说明,并且一般采用单个芯片组的方式提供。这种芯片组的例子是“Triton”,由In-tel公司销售。
ISA总线18(宽度为16位,最大数据传输速率为4 MBps)的数据传输速率比PCI总线16低,用于连接外围设备,例如键盘/鼠标控制器(KMC)25,I/O控制器28和音频控制器34,这些设备的驱动速度较低。
键盘/鼠标控制器25是一个专用控制器,取出在键盘26上输入的电脑数据、代码以及经鼠标27输入的座标值。
I/O控制器28是一个专用的控制器,用于驱动软盘驱动器(FDD)29并经并行口30或串行口32控制并行或串行数据的交换。通常,打印机31连接到并行口30,而调制解调器33则连接到串行口32。
调制解调器33借助模拟公用电话线50交换数据。调制解调器33将计算机系统10中的数字信号转换为模拟信号,并经线路50传输模拟信号,并且将由线路50接收到的模拟信号转换为数字信号并将其提供给计算机系统10。在该实施例中的计算机系统10可通过拨号连接经线路50和服务器机器60通信(更具体地说,是和服务器机器60的调制解调器(没有表示)通信)。“服务器机器”是提供互联网连接服务的“服务提供者”所拥有的服务器机器中的一台(例如最接近操作该系统10的用户的一台服务器)。服务器机器60一般在互联网70上被提供,并执行已经对服务器机器60拨号的计算机系统10对互联网70的IP联接。例如,服务提供者有IBM日本公司的“IBM互联网连接服务”和Bekkoame互联网的“BEKKOAME/INTERNET”。
音频控制器34也是一个专用的控制器,用于输入/输出音频信号,音频控制器34从麦克风35取出计算机数据音频信号,或者执行音频数据的DA转换并经喇叭36输出其结果。
常用的所谓个人计算机足以用作图1所示的计算机系统10。除图1所示的电路外还需很多其他电路来构成计算机系统10。因为这些电路对本领域技术人员是熟知的,故这里略去对其的说明。B.自动翻译系统
图2是一个简图说明实施本发明的自动翻译系统100的系统配置。自动翻译系统100实际上是作为由图1所示的计算机系统10运行的应用程序中的一个实现的。
自动翻译系统100包括翻译代理110、翻译机120和翻译环境选择器130。这些模块和全球网浏览器150交互作用,更好地执行自动翻译处理过程。
全球网浏览器150是一个计算机程序,其作用是互联网的导游。全球网浏览器150为计算机系统10的用户提供一个用户界面,用于输入URL(均匀资源定位),即所需全球网页的地址。另外,全球网浏览器150解释包含在该全球网页中的HTML文件的内容,并且在显示器22上显示解释的结果。本实施例中的全球网浏览器150具有代理功能。更具体地说,全球网浏览器150要求翻译代理110从全球网页中下载文件。全球网浏览器150还接收来自翻译代理110的文本文件的翻译结果,并将其和图像文件(例如GIF文件)显示在显示器22上。全球网浏览器150支持某些显示方式,例如“只显示原本”、“只显示翻译文本”和“原始和翻译文本”,并且这些方式可以在浏览屏上切换。浏览器屏可以是多窗口的一个窗口,后面将介绍。
一旦接到来自全球网浏览器150的请求,翻译代理110借助互联网70,从由URL指定的某个全球网页中下载一个文件,并将被下载文件中的文本传送给翻译机120。翻译代理110也接收来自翻译机120的翻译文本并将其送到全球网浏览器150上。“代理”就是某个主机的代理人,该主机不能执行直接的外部访问,“代理”也是中继功能的一般术语,例如接收互联网的通信数据。
翻译机120是执行翻译处理过程的主体,即提供原始文本(例如英文这样的外文写的文本)的翻译文本(例如采用日文这样的本地语言写的文本)。利用某个翻译环境,翻译机120翻译已经从翻译代理110中接收到的原始文本,并将翻译的文本送给翻译代理110。本实施例中的翻译机具有多个翻译环境,例如翻译环境A、翻译环境B和翻译环境C。“翻译环境”是用于翻译过程的字典数据库和文法算法(例如设置子句、设置辅助动词的意义,指定句子的风格)。正如通常所知道的,在原文的类型、领域和应用与翻译环境之间存在着相互的关系。在本实施例中,为每个类型提供特定的字典数据库,例如互联网字典,商业字典、政治字典、娱乐字典、艺术字典或运动字典。
翻译环境选择器130根据需要改变由翻译机120使用的翻译环境。在本实施例中,翻译环境选择器130的设计基于这样的事实:URL(某个全球网页的地址)是由若干字符串段(即“部分URL字符串”)组成的,这些字符串段分别描述协议名、服务器名和文件名。翻译环境选择器130根据全球网浏览器150输入的URL字符串,自动选择某个适当的翻译环境。
图3是一个简图,说明翻译环境选择器130的结构。如图3所示,翻译环境选择器130被划分为URL输入段131、翻译环境输出段132、URL数据库133、URL比较段134和基本操作段135。
URL数据库133是一个表格,在该表中给出了被相当频繁访问的全球网页的URL字符串,以及在每个URL字符串及其适当的翻译环境之间的对应关系。
图4和图5给出了显示在全球网浏览器屏上的URL数据库133(图5是图4中屏幕显示的继续)。如图4和图5所示,被经常访问的全球网服务器/全球网页的URL字符串被登记在数据库133中,并列出了与其适当的翻译环境的相互关系。例如,“www.ibm.com/”和“www.yahoo.com/”和它们的适当的翻译环境“互联网,一般的”结合在一起被登记,而“cnn.com/”则与其适当的环境“政治”结合在一起被登记。在本实施例的URL数据库133中,各字符串不规则地被描述(即,只按照它们被登记的次序描述,而不是按照其他的任何次序,例如按字母顺序、部分URL字符串排列或串的计数)。
涉及URL字符串和其合适的翻译环境之间对应关系的一个特点是:当URL字符串描述相同的全球网服务器名而被指定的文件不同时,在许多情况下,适合的翻译环境也是不同的。如图4和图5所示,例如,“互联网,一般的”被登记作为“www.yahoo.com/”的一个合适环境。然而,“政治”、“运动”和“艺术”被登记为同一全球网服务器中的分别为“www.yahoo.com/Government/”、“www.yahoo.com/Recreation/Sports/,”和“www.yahoo.com/Arts/”的文件的合适的环境。另外,根据最初由本发明人设计的经验规则,发现即使在同一全球网服务器中的文件中,具有最相互接近或最类似的“部分URL字符串”(在构成一个URL的字符串中由“/”分开的字符段)的组合形式的文件倾向于利用相同的合适的翻译环境。例如,由URL字符串“www.yahoo.com/Arts/Architecture”指定的文件具有适当的翻译环境“arts”,这和字符串“www.yahoo.com/Arts/”的相同,其部分URL字符串比“www.yahoo.com/”的更接近。
自动翻译系统100的设计者可以预先在URL数据库133中登记URL字符串。此外,系统100的用户也可以借助基本操作段135来登记URL字符串,这将在下面介绍。
通过翻译代理110,URL输入段131接收在全球网浏览器屏幕上输入的某个URL字符串,并将其传送给URL比较段134。URL比较段134执行一个比较过程,以便在URL数据库133中输入URL字符串,并找出某个适当的翻译环境。URL比较段通过翻译环境输出段132向翻译机120报告比较结果。
C.翻译环境的选择
URL比较段134在URL数据库133中查找某个URL字符串,该串最接近输入的URL字符串,并将与得到的URL字符串对应的某个翻译环境输出到翻译机120。图6是当选择翻译环境时,由URL比较段134执行的程序的流程图。在该程序中,S表示由全球网浏览器输入的URL字符串,i表示在URL数据库133上的一个索引,而m则表示在查找过程中得到的最接近S的URL字符串的索引。例如,S(i)表示被登记为URL数据库133中的第i个记录的URL字符串。当由数据库查到得到的最后结果是m=M时,意味着合适的翻译环境就是对应URL数据库133的第M个URL字符串S(M)的那个翻译环境。E(m)表示对应被登记在URL数据库133的第m个记录中的URL字符串的翻译环境。
在该程序中,首先,为每个索引置初值(步S10)。索引i的初值为1,表示URL数据库133的第一个记录。索引m的初值为0,表示类似的URL字符串还没有找到。
在步S20中,执行检查以确定由当前索引i保持的值是否已经超出了URL数据库133中最后记录的计数。
当判定步骤S20得到的结果为否定时,即,当某个没有被比较的记录仍留在URL数据库133中时,在步S30中执行检查以判定当前输入的URL字符串S,作为一个部分URL字符串,是否包括第i个记录的URL字符串S(i)。
当判定块S30得到的结果为否定时,即,当URL字符串S(i)并不类似当前输入的URL字符串S时,程序控制跳到步S70,在步S70中,i被增1,以便比较URL数据库133中的下一个记录和当前的URL字符串S。然后将程序控制返回到步S20。
当判定模块S30得到的结果为肯定的时,即,当URL字符串S(i)接近当前输入的URL字符串S时,程序控制跳到步S40。在步S40中,执行检查以判定是否m=0,即,是否类似的字符串还没有被找到。当m=0时,i替换m,以便临时存放用于比较的URL字符串。
在判定块S40中,如果m≠0,即,如果某个类似的URL字符串已经被临时存放起来,程序控制移到步S50。在步S50中,将当前正用于比较的URL字符串S(i)和已经被存放起来的URL字符串S(m)进行比较,以便确定该URL字符串是否更接近当前输入的URL字符串S。实现这一判定是通过比较URL字符串S(i)和S(m)以判定哪一个具有更大的部分URL字符串的顺序号。对于“www.yahoo.com/”和“www.yahoo.com/Arts/”来说,由于前者包含一个部分URL字符串,而后者包含两个,因此后者是更好的。所谓“更大的部分URL字符串的顺序号”是指:即便更多的部分URL字符串互相对应,除非部分URL字符串的排列不匹配,作为URL比较的结果的相似性就低。假定当前输入的URL字符串为“www.yahoo.com/Recreation/Sports/”,并且有两个URL字符串“www.yahoo.com/Sports/”和“www.yahoo.com/Recreation/”被登记在URL数据库133中。虽然后者有两个顺序部分URL字符串匹配输入的URL字符串,而前者只有一个部分URL字符串匹配输入的URL字符串(虽然“Sports”被包含在输入的URL字符串中,但不能计数,因为其排列不能互相对应),因此,后者的URL字符串被优选。
在判定块S50中,当确认新比较的URL字符串S(i)较好时,在步S60中,i替换m,以便改变最类似的URL字符串。接着,程序控制进入步S70。
在判定步S50中,如果先前被存放的URL字符串S(m)较好,则程序控制跳到步S60,维持m的当前值,并进入步S70。
在步S70中,i被增1以便比较URL数据库133中的下一个记录,并且接着将程序控制返回步S20。在步S20中,如果在URL数据库133中还有没有被比较的记录,则重复步S30到S70的处理过程。在步S20中,当确认当前索引i保持的值已经超出URL数据库133中最后记录的计数时,程序控制分支到“是”并转到步S80。
在步S80中,执行检查以判定是否m=0。当m=0时,意味着在S20到S70的循环中,在URL数据库133中没有找到接近当前输入的URL字符串S的一个URL字符串。在这种情况下,将缺省的翻译环境输出到翻译机120(步S90),并终止选择翻译环境的程序。
如果m≠0,作为在循环S20到S70中被认为最类似的URL字符串对应的翻译环境E(m)被输出到翻译机120(步S100)。接着终止选择翻译环境的程序。翻译机120使用所选择的翻译环境E(m)翻译下载的文件。
D.更新URL数据库
如上所述,URL数据库133的内容通过基本操作段135被另外登记。在本部分中,增加某个新登记项到URL数据库的过程将被简单介绍。
图8是增加一个新的登记项到URL数据库133的程序的流程图。首先,将翻译的文本显示在全球网浏览器屏幕上,询问用户对该翻译结果是否满意,即,是否已经选择了一种合适的翻译环境(步S200)。
当判定块200得到的结果是否定的时,不需要增加一个登记项,并且跳过所有下面的步骤,该程序被终止执行。
如果判定块S200得到的结果是肯定的,询问用户是否将新输入的URL字符串S及其合适的翻译环境之间的关系加到URL数据库133(步S210)。用户可根据将来对该新输入的URL字符串S的引用频率来决定是否执行登记工作。
如果在判定块S210中得到的结果是肯定的,将这种关系登记在URL数据库133(步S220)。接着终止程序执行。如果判定块S210的结果是否定的,则将程序控制跳到步S220并终止该程序。
E.浏览器屏幕
图7是本发明的自动翻译系统100所附加到的全球网浏览器150的屏幕。图7的屏幕为“原始和翻译文本显示”方式,在这个方式下,被翻译的文本直接显示在原文之下。这种方式可以被切换到另一种方式,在全球网浏览器屏上“只显示原文”或“只显示翻译文本”。全球网浏览器屏可以是显示器22上多个窗口中的一个。
从顶部读下来,在全球网浏览器屏上有“标题条”、“菜单条”和“工具条”。众所周知,标题条是显示在该屏幕上被激活的某个应用软件名称的区域,而菜单条是显示可以被选择的一列命令的区域。同样众所周知的是,工具条是菜单条的一种类型,其中被排列的按钮用于快速激活常用的功能。这些按钮也被称为“灵巧图标”。
紧接在工具条下面的是URL输入部。用户可以在URL输入段中键入某个URL字符串以指定将被访问的所需全球网页。在图7中,URL名“www.yahoo.com/”被输入。
输入的URL字符串被送到翻译代理110。翻译代理110代替全球网浏览器150从被指定的全球网页中下载文件,并将该文件中的原始文本临时送到翻译机120。借助翻译代理110将输入的URL字符串送到翻译环境选择器130中。翻译环境选择器130解释所接收到的URL字符串并为其选择一个合适的翻译环境,该翻译环境被报告给翻译机120。翻译机120使用所选的翻译环境翻译原始文本并将原文和翻译的文本通过翻译代理110送到全球网浏览器150。这一处理系列是在桌面机的背景中实现的。
在URL输入段下面的一个矩形区域,占据了浏览屏的大部分,是全球网浏览器屏幕的主体,其中所显示的是被下载全球网页的内容。在图7中,由URL名指定的“www.yahoo.com/”页被显示在该屏上。
在全球网浏览器屏的主体的最上方给出了一个指示器,用于显示当前的显示方式和所选的翻译环境。在图7中,“原文和翻译文本”方式被高亮度显示为当前的显示方式,因此,被翻译的文本直接显示在屏幕上的原文之下。如图4所示,由于“互联网,一般的”被登记为URL数据库中的“www.yahoo.com/”的适当环境,有关的消息被显示在指示器中。用户可以动态地改变显示方式和所用的翻译环境,只需用鼠标27点该指示器。
F.附录
本发明在引用具体的实施例时已经被详细介绍。然而,对于具有该技术的一般知识的人来说,显然能在本发明的范围内对该实施例进行各种修改和修正。例如,自动翻译系统并不局限于使用全球网浏览器的代理功能的系统,而可以是借助某个剪辑板在全球网屏上接收原始文本并翻译的系统。即,虽然本发明的提出是利用一个例子,但不应该局限于该例子。为了充分理解本发明的主题,应该参考权利要求书。
如上所详述的,根据本发明,提供一种优良的自动翻译方法和机器,利用装有多个翻译环境的翻译系统,将外文的文本(例如英文)翻译成本地语言文本(例如日文,朝鲜文或中文文本)。
此外,根据本发明,提供的一种优良的自动翻译方法和机器,在将外语文本翻译成本地语言文本之前,为将被翻译的外语文本自动选择一种适当的翻译环境。
此外,根据本发明,提供一种优良的自动翻译方法和机器,使用装有多个翻译环境的翻译系统,将某个全球网服务器经互联网提供的某个全球网页中的外语文本正确地翻译成本地语言的文本。
URL字符串 | 翻译环境 |
www.lbm.com/www.yahoo.com/www.yahoo.com/Arts/www.yahoo.com/Arts/Recreatlon/Sports/ | 翻译环境 A(互联网字典)翻译环境 A(互联网字典)翻译环境 B(艺术字典)翻译环境 C(运动字典) |
表1
Claims (13)
1.由装有多个翻译环境的翻译系统执行的一种自动翻译方法,用于翻译存放在由用户指定的某个信息资源中的文件中的文本,其特征在于包括步骤:
(a)解释某个组合的字符串,在该字符串中,访问信息源的装置和所述信息源的名称被指定;
(b)根据解释的结果,选择所述多个翻译环境中的一个;
(c)使用所选择的翻译环境,翻译存放在由所述的组合字符串指定的所述信息源中的文件中的文本。
2.由装有多种翻译环境的翻译系统执行的一种自动翻译方法,用于翻译存放在由用户指定的信息源中的某个文件中的文本,其特证在于包括步骤:
(a)用户输入某个组合的字符串,在该字符串中,访问信息源的装置和所述信息源的名称被指定;
(b)根据所述组合的字符串所指定的访问装置,下载存放在由所述的组合字符串指定的所述信息源中的某个文件;
(c)解释所述的组合字符串;
(d)根据解释的结果,选择所述的多个翻译环境中的一个;并且
(e)使用所选择的翻译环境,翻译被下载文件中的文本。
3.由装有多种翻译环境的翻译系统执行的一种自动翻译方法,用于翻译存放在由用户指定的信息源中的某个文件中的文本,其特证在于包括步骤:
(a)用户输入某个组合字符串,在该字符串中指定信息源的访问装置和所述信息源的名称;
(b)根据所述组合字符串指定的访问装置,下载存放在由所述组合字符串指定的所述信息源中的某个文件
(c)在显示屏上显示下载的文件以及所述文件中的原始文件;
(d)解释所述的组合字符串;
(e)根据解释结果,从所述的多个翻译环境中选择一个;
(f)使用所选择的翻译环境翻译所述的原始文件;并且
(g)在显示屏上显示被翻译的文本以及原始文本。
4.由装有多个翻译环境的翻译系统执行的一种翻译方法,用于下载存放在由说明了所述信息源访问装置和所述的信息源的名称的某个组合字符串指出的信息源中的某个文件并翻译所述文件中的文本,其特征在于包括步骤:
(a)作为一个数据库,记录所述组合字符串和与被指定的信息源相关的某个翻译环境的一种组合;
(b)在所述的数据库中查找最类似某个新输入的组合字符串的组合字符串;并且
(c)使用对应在所述的步骤(b)中找到的组合字符串的翻译环境,翻译下载文件中的文本。
5.由装有多个翻译环境的翻译系统执行的一种自动翻译方法,下载存放在由说明了所述信息源以及所述信息源的名称的用户输入组合字符串指定的信息源中的某个文件并翻译所述文件中的文本,其特征在于包括步骤:
(a)作为一个数据库,记录所述组合字符串和与被指定的信息源相关的翻译环境的一种组合;
(b)在所述的数据库中查找某个组合的字符串,该字符串最类似某个新输入的组合字符串;
(c)利用对应于在所述的步骤(b)中找到的组合字符串的翻译环境,翻译从被指定的信息源中下载的文件中的文本;并且
(d)在没有得到适当的翻译结果的情况下,使用另一个翻译环境来重新翻译该文本。
6.由装有多个翻译环境的翻译系统执行的一种自动翻译方法,下载存放在由说明了所述信息源的访问装置和所述信息源的名称的用户输入的组合字符串指定的信息源中的某个文件并翻译所述文件中的文本,其特征在于包括步骤:
(a)作为数据库,记录下所述组合字符串和与被指定的信息源有关的翻译环境的一种组合;
(b)在所述的数据库中查找某个组合的字符串,该字符串最类似某个新输入的组合字符串;
(c)使用对应于在所述的步骤(b)中找到的组合字符串的翻译环境,翻译从被指定的信息源中下载的文件中的文本;
(d)在没有得到适当的翻译结果的情况下,使用另一个翻译环境重新翻译所述的文本;并且
(e)在得到正确的翻译结果的情况下,在所述的数据库中另外再记录新的组合字符串和被使用的翻译环境之间的关系。
7.一种自动翻译方法,该方法根据某个由访问信息源的协议名和存放所述信息源的服务器名(以及在所述服务器中的某个文件名)组合的某个URL(均匀资源定位)字符串,通过互联网下载被指定服务器上的某个文件,并利用多个翻译环境中的一个翻译被下载文件中的文本,其特征在于包括步骤:
(a)解释该URL字符串:
(b)根据解释结果从所述的多个翻译环境中选择一个;并且
(c)利用所选择的翻译环境来翻译下载文件中的文本。
8.一种自动翻译方法,该方法根据某个访问信息源的协议名和存放所述信息源的服务器名(以及在所述服务器中的某个文件名)组合而成的URL(均匀资源定位)字符串,通过互联网下载在指定服务器上的文件,并利用多个翻译环境中的一个翻译被下载文件中的文本,其特征在于包括步骤:
(a)在显示屏上显示被下载的文件及原始文本;
(b)解释该URL字符串;
(c)根据解释结果从所述的多个翻译环境中选择一个;
(d)利用所选择的翻译环境来翻译下载文件中的文本;并且
(e)在所述显示屏上显示翻译文本和原文。
9.一种自动翻译方法,该方法根据由某个访问信息源的协议名称和存放所述信息源的服务器名(以及在所述的服务器中的文件名)组合而成的URL(均匀资源定位)字符串,通过互联网下载被指定服务器上的文件,并利用多个翻译环境中的一个来翻译被下载文件中的文本,其特征在于包括步骤:
(a)作为数据库记录URL字符串和翻译环境的一种组合形式;
(b)在所述的数据库中查找某个URL字符串,该字符串最类似某个新输入的URL字符串;并且
(c)利用对应在所述的步骤(b)中得到的URL字符串的翻译环境,翻译被下载文件中的文本。
10.一种自动翻译方法,该方法根据由访问信息源的协议名称和存放所述信息源的服务器名组合而成的某个URL(均匀资源定位)字符串,通过互联网下载被指定服务器上的文件,并利用多个翻译环境中的一个来翻译被下载文件中的文本,其特征在于包括步骤:
(a)作为数据库,记录所述URL字符串和某个翻译环境的某种组合形式;
(b)在所述的数据库中查找某个URL字符串,该字符串最类似某个新输入的URL字符串;
(c)利用对应在所述的步骤(b)中得到的URL字符串的某个翻译环境,翻译下载文件中的文本;并且
(d)在得不到正确的翻译结果的情况下,使用另一种翻译环境重新翻译该文本。
11.一种自动翻译方法,该方法根据由访问信息源的协议名和存放所述信息源的服务器的名称(以及在所述服务器中的文件名)组成的URL(均匀资源定位)字符串,通过互联网下载指定服务器中的文件,并利用多个翻译环境中的一个来翻译下载文件中的文本,其特征在于包括步骤:
(a)作为数据库,记录所述URL字符串和某个翻译环境的某种组合形式;
(b)在所述的数据库中查找某个URL字符串,该字符串最接近某个新输入的URL字符串;
(c)使用和在所述的步骤(b)中得到的URL字符串对应的某个翻译环境,翻译下载文件中的文本;
(d)在得不到正确的翻译结果的情况下,利用另一个翻译环境重新翻译所述的文本;并且
(e)在得到正确的翻译结果的情况下,另外再记录新的URL字符串和该翻译环境之间的关系。
12.一种自动翻译机,使用多个翻译环境中的一个来翻译借助互联网从某个WWW(全球网)服务器中下载的文件中的文本,其特征在于包括:
(a)存放数据库的第一装置,该数据库管理URL字符串和翻译环境的组合形式;
(b)输入某个URL字符串的第二装置;
(c)从某个WWW服务器中下载由所述的输入URL字符串指定的文件的第三装置;
(d)在所述的第一装置中查找某个URL字符串的第四装置,该字符串最接近新输入的URL字符串;
(e)选择和被查找的URL字符串相关的某个合适的翻译环境的第五装置;
(f)利用所选择的翻译环境,翻译从WWW服务器中下载的文件中的文本的第六装置;以及
(g)在显示屏上显示翻译结果的第七装置。
13.一种计算机可编程存储介质,存放某个计算机程序,用于翻译从互联网的某个WWW服务器中下载的文件中的文本,所述的计算机程序的特征在于包括:
(a)多个翻译环境;
(b)记录某个表的数据库,在该表中,管理着URL字符串和所述翻译环境的组合;
(c)第一计算机程序代码装置,下载由用户以URL字符串的形式指定的WWW服务器上的文件;
(d)第二计算机程序代码装置,在所述的数据库中,查找某个URL字符串,该字符串最接近新输入的某个URL字符串;
(e)第三计算机程序代码装置,选择与被查找出来的URL字符串相关的某个适当的翻译环境;
(f)第四计算机程序代码装置,利用所选择的翻译环境,翻译由WWW服务器上下载的文件中的文本;以及
(g)第五计算机程序代码装置,在显示屏上显示该文本的翻译结果。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08272755A JP3121548B2 (ja) | 1996-10-15 | 1996-10-15 | 機械翻訳方法及び装置 |
JP272755/96 | 1996-10-15 | ||
JP272755/1996 | 1996-10-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1179576A true CN1179576A (zh) | 1998-04-22 |
CN1148685C CN1148685C (zh) | 2004-05-05 |
Family
ID=17518307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB971185263A Expired - Lifetime CN1148685C (zh) | 1996-10-15 | 1997-09-12 | 自动翻译方法和自动翻译机 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6119078A (zh) |
JP (1) | JP3121548B2 (zh) |
KR (1) | KR100265548B1 (zh) |
CN (1) | CN1148685C (zh) |
GB (1) | GB2320773A (zh) |
SG (1) | SG54551A1 (zh) |
TW (1) | TW315437B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457041B (zh) * | 2002-05-10 | 2010-05-26 | 微软公司 | 为一个自然语言理解系统用来自动注解训练数据的一个系统 |
US8095355B2 (en) | 2006-10-02 | 2012-01-10 | Google Inc. | Displaying original text in a user interface with translated text |
CN101661480B (zh) * | 2008-08-29 | 2012-08-08 | 国际商业机器公司 | 确定组织在不同语言中的名称的方法和系统 |
CN102722479A (zh) * | 2011-03-30 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 一种实现语言翻译的方法及装置 |
CN102811140A (zh) * | 2011-05-31 | 2012-12-05 | 国际商业机器公司 | 测试基于浏览器的应用的方法和系统 |
WO2013086666A1 (en) * | 2011-12-12 | 2013-06-20 | Google Inc. | Techniques for assisting a human translator in translating a document including at least one tag |
CN105760542A (zh) * | 2016-03-15 | 2016-07-13 | 腾讯科技(深圳)有限公司 | 一种显示控制方法、终端及服务器 |
CN107943797A (zh) * | 2017-11-22 | 2018-04-20 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译系统 |
CN108345589A (zh) * | 2017-11-22 | 2018-07-31 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译方法 |
CN109074326A (zh) * | 2016-04-04 | 2018-12-21 | 沃文技术株式会社 | 翻译系统 |
Families Citing this family (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6044205A (en) * | 1996-02-29 | 2000-03-28 | Intermind Corporation | Communications system for transferring information between memories according to processes transferred with the information |
US10541973B2 (en) * | 1998-02-23 | 2020-01-21 | Transperfect Global, Inc. | Service of cached translated content in a requested language |
US6122666A (en) * | 1998-02-23 | 2000-09-19 | International Business Machines Corporation | Method for collaborative transformation and caching of web objects in a proxy network |
US8489980B2 (en) * | 1998-02-23 | 2013-07-16 | Transperfect Global, Inc. | Translation management system |
US6272531B1 (en) * | 1998-03-31 | 2001-08-07 | International Business Machines Corporation | Method and system for recognizing and acting upon dynamic data on the internet |
GB2337611A (en) | 1998-05-20 | 1999-11-24 | Sharp Kk | Multilingual document retrieval system |
US7191393B1 (en) * | 1998-09-25 | 2007-03-13 | International Business Machines Corporation | Interface for providing different-language versions of markup-language resources |
US6738827B1 (en) | 1998-09-29 | 2004-05-18 | Eli Abir | Method and system for alternate internet resource identifiers and addresses |
US6370532B1 (en) * | 1998-11-09 | 2002-04-09 | Unisys Corporation | Cool ICE batch interface |
US6374247B1 (en) * | 1998-11-09 | 2002-04-16 | Unisys Corporation | Cool ice service templates |
US6490550B1 (en) * | 1998-11-30 | 2002-12-03 | Ericsson Inc. | System and method for IP-based communication transmitting speech and speech-generated text |
US6347316B1 (en) * | 1998-12-14 | 2002-02-12 | International Business Machines Corporation | National language proxy file save and incremental cache translation option for world wide web documents |
US6363337B1 (en) * | 1999-01-19 | 2002-03-26 | Universal Ad Ltd. | Translation of data according to a template |
JP2000276431A (ja) * | 1999-03-25 | 2000-10-06 | Nec Corp | 翻訳機能付きプロキシキャッシュサーバ及びそれを有する翻訳機能付きブラウジング・システム |
US6654741B1 (en) * | 1999-05-03 | 2003-11-25 | Microsoft Corporation | URL mapping methods and systems |
US7607085B1 (en) * | 1999-05-11 | 2009-10-20 | Microsoft Corporation | Client side localizations on the world wide web |
JP3664917B2 (ja) * | 1999-08-06 | 2005-06-29 | シャープ株式会社 | ネットワーク情報の表示方法およびその方法をプログラムとして格納した記憶媒体ならびにそのプログラムを実行するコンピュータ |
US6993476B1 (en) * | 1999-08-26 | 2006-01-31 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
US6957247B1 (en) * | 1999-09-22 | 2005-10-18 | Ates Gorkem I | Internet system |
JP2003514282A (ja) * | 1999-11-02 | 2003-04-15 | イー−クラリティ, インコーポレイテッド | 情報の効率的送受信のための言語分類システム |
US6950881B1 (en) * | 1999-11-02 | 2005-09-27 | Mshift, Inc. | System for converting wireless communications for a mobile device |
US7039722B1 (en) * | 1999-11-12 | 2006-05-02 | Fuisz Richard C | Method and apparatus for translating web addresses and using numerically entered web addresses |
US7107325B1 (en) * | 1999-11-15 | 2006-09-12 | Insweb Corporation | System and method for optimizing and processing electronic pages in multiple languages |
AUPQ539700A0 (en) * | 2000-02-02 | 2000-02-24 | Worldlingo.Com Pty Ltd | Translation ordering system |
US7225181B2 (en) * | 2000-02-04 | 2007-05-29 | Fujitsu Limited | Document searching apparatus, method thereof, and record medium thereof |
US7216072B2 (en) * | 2000-02-29 | 2007-05-08 | Fujitsu Limited | Relay device, server device, terminal device, and translation server system utilizing these devices |
US9614934B2 (en) | 2000-02-29 | 2017-04-04 | Paypal, Inc. | Methods and systems for harvesting comments regarding users on a network-based facility |
KR20010085157A (ko) * | 2000-02-29 | 2001-09-07 | 박종득 | 인터넷에서 단어,철자를 조합하여 일기,편지등의문장,글을 한글로 쓰면 외국어로 실시간 번역을 하고,외국어를 한글로 혹은 외국어를 다른 외국어로 실시간통,번역해주는 시스템 |
US6415249B1 (en) * | 2000-03-01 | 2002-07-02 | International Business Machines Corporation | Method and system for using machine translation with content language specification |
WO2001067304A1 (en) * | 2000-03-07 | 2001-09-13 | Hotlens.Com Inc. | Server-side web browsing and multiple lens system, method and apparatus |
KR20000036408A (ko) * | 2000-03-07 | 2000-07-05 | 손상범 | 일대일 대응 방식을 이용한 인터넷 브라우저상의자국어/기준어 도메인 문자 전환 알고리즘. |
US20010047477A1 (en) * | 2000-03-20 | 2001-11-29 | Hiang-Swee Chiang | Transparent user and session management for web applications |
JP2003529845A (ja) * | 2000-03-31 | 2003-10-07 | アミカイ・インコーポレイテッド | ネットワーク経由の多言語翻訳を提供する方法と装置 |
US6604101B1 (en) | 2000-06-28 | 2003-08-05 | Qnaturally Systems, Inc. | Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network |
US20040006560A1 (en) * | 2000-05-01 | 2004-01-08 | Ning-Ping Chan | Method and system for translingual translation of query and search and retrieval of multilingual information on the web |
WO2001089171A2 (en) * | 2000-05-16 | 2001-11-22 | Mshift, Inc. | System for providing network content to wireless devices |
US7013340B1 (en) | 2000-05-18 | 2006-03-14 | Microsoft Corporation | Postback input handling by server-side control objects |
KR100373899B1 (ko) * | 2000-05-23 | 2003-02-26 | 주식회사 시스메타 | 암호화된 데이터 처리 방법 및 시스템 |
WO2001093089A1 (en) * | 2000-05-26 | 2001-12-06 | Theone.Com | System and method for providing interactive translation of information in a communication network |
US20010054011A1 (en) * | 2000-06-15 | 2001-12-20 | Nec Corporation | Contents conversion fee charging system, contents conversion fee charging method and storage medium storing program for controlling same |
US6704776B1 (en) * | 2000-06-30 | 2004-03-09 | Webtv Networks, Inc. | Selecting attribute based content for server applications |
JP3982736B2 (ja) * | 2000-06-30 | 2007-09-26 | 沖電気工業株式会社 | 翻訳システム |
AU2000255730A1 (en) * | 2000-07-04 | 2002-01-14 | Aai Inc. | Commerce method and device, system, and recorded medium |
US7389221B1 (en) * | 2000-07-17 | 2008-06-17 | Globalenglish Corporation | System and method for interactive translation |
US7266512B2 (en) | 2000-07-18 | 2007-09-04 | Cnet Networks, Inc. | System and method for establishing business to business connections via the internet |
JP2002041432A (ja) * | 2000-07-25 | 2002-02-08 | Oki Electric Ind Co Ltd | チャットシステム,端末装置,サーバ装置及び媒体 |
US7571217B1 (en) | 2000-08-16 | 2009-08-04 | Parallel Networks, Llc | Method and system for uniform resource locator transformation |
US20020049831A1 (en) * | 2000-09-01 | 2002-04-25 | Lifefiles.Com,Inc. | System for generating a web document |
US8806326B1 (en) * | 2000-09-25 | 2014-08-12 | Nokia Inc. | User preference based content linking |
US20020161928A1 (en) * | 2000-10-10 | 2002-10-31 | Awele Ndili | Smart agent for providing network content to wireless devices |
US20020062396A1 (en) * | 2000-10-31 | 2002-05-23 | Mishou Co., Ltd. | Server devices for displaying web pages |
US20020087302A1 (en) * | 2000-11-10 | 2002-07-04 | Miyuki Tomaru | Processing system, processing method and recording medium |
US20020078152A1 (en) | 2000-12-19 | 2002-06-20 | Barry Boone | Method and apparatus for providing predefined feedback |
US20030115040A1 (en) * | 2001-02-09 | 2003-06-19 | Yue Xing | International (multiple language/non-english) domain name and email user account ID services system |
US20020123879A1 (en) * | 2001-03-01 | 2002-09-05 | Donald Spector | Translation system & method |
JP3379090B2 (ja) * | 2001-03-02 | 2003-02-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム |
US8298160B2 (en) * | 2001-03-16 | 2012-10-30 | Ev3 Inc. | Wire convertible from over-the-wire length to rapid exchange length |
US7380250B2 (en) | 2001-03-16 | 2008-05-27 | Microsoft Corporation | Method and system for interacting with devices having different capabilities |
US20060288212A1 (en) * | 2001-03-20 | 2006-12-21 | Gutenberg Printing Llc | Transparent user and session management for web applications |
US6993474B2 (en) | 2001-05-17 | 2006-01-31 | Curry David G | Interactive conversational speech communicator method and system |
US20020174150A1 (en) * | 2001-05-18 | 2002-11-21 | Xerox Corporation | Systems and methods for dynamic national language service |
US7493397B1 (en) | 2001-06-06 | 2009-02-17 | Microsoft Corporation | Providing remote processing services over a distributed communications network |
US6915454B1 (en) | 2001-06-12 | 2005-07-05 | Microsoft Corporation | Web controls validation |
US20030036976A1 (en) * | 2001-08-14 | 2003-02-20 | Kurt De Ruwe | System and method for providing business transaction information in multiple languages |
US7146358B1 (en) | 2001-08-28 | 2006-12-05 | Google Inc. | Systems and methods for using anchor text as parallel corpora for cross-language information retrieval |
JP2003091344A (ja) * | 2001-09-19 | 2003-03-28 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム |
JP4283466B2 (ja) * | 2001-10-12 | 2009-06-24 | 富士通株式会社 | リンク関係に基づく文書整理方法 |
US20030084143A1 (en) * | 2001-10-31 | 2003-05-01 | Herbert Knoesel | Resource locator management system and method |
US7428725B2 (en) | 2001-11-20 | 2008-09-23 | Microsoft Corporation | Inserting devices specific content |
US6915341B2 (en) * | 2002-01-08 | 2005-07-05 | International Business Machines Corporation | System for sending messages to all users in a web hosting environment |
US20030144912A1 (en) * | 2002-01-29 | 2003-07-31 | Mcgee Todd | Multilingual messaging system and method for e-commerce |
US7987421B1 (en) * | 2002-01-30 | 2011-07-26 | Boyd H Timothy | Method and apparatus to dynamically provide web content resources in a portal |
US7890639B1 (en) | 2002-01-30 | 2011-02-15 | Novell, Inc. | Method and apparatus for controlling access to portal content from outside the portal |
JP3809863B2 (ja) * | 2002-02-28 | 2006-08-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | サーバ |
US7490167B2 (en) * | 2002-05-22 | 2009-02-10 | Sony Corporation | System and method for platform and language-independent development and delivery of page-based content |
US20040003022A1 (en) * | 2002-06-27 | 2004-01-01 | International Business Machines Corporation | Method and system for using modulo arithmetic to distribute processing over multiple processors |
US7113960B2 (en) * | 2002-08-22 | 2006-09-26 | International Business Machines Corporation | Search on and search for functions in applications with varying data types |
US20040049374A1 (en) * | 2002-09-05 | 2004-03-11 | International Business Machines Corporation | Translation aid for multilingual Web sites |
US7236977B1 (en) | 2002-09-20 | 2007-06-26 | Novell, Inc. | Method for dynamically distributing items for changes based on group membership |
US7574653B2 (en) * | 2002-10-11 | 2009-08-11 | Microsoft Corporation | Adaptive image formatting control |
GB2395029A (en) * | 2002-11-06 | 2004-05-12 | Alan Wilkinson | Translation of electronically transmitted messages |
US7660843B1 (en) | 2003-01-21 | 2010-02-09 | Novell, Inc. | Method and apparatus for dynamically delivering a gadget |
FR2850473A1 (fr) * | 2003-01-28 | 2004-07-30 | France Telecom | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
US7580960B2 (en) * | 2003-02-21 | 2009-08-25 | Motionpoint Corporation | Synchronization of web site content between languages |
CN104735194A (zh) * | 2003-03-08 | 2015-06-24 | 任文林 | 多功能通讯装置 |
CN1553584A (zh) * | 2003-03-08 | 2004-12-08 | 多功能通讯装置 | |
US8170863B2 (en) * | 2003-04-01 | 2012-05-01 | International Business Machines Corporation | System, method and program product for portlet-based translation of web content |
US7313587B1 (en) | 2003-07-14 | 2007-12-25 | Microsoft Corporation | Method and apparatus for localizing Web applications |
US7346487B2 (en) * | 2003-07-23 | 2008-03-18 | Microsoft Corporation | Method and apparatus for identifying translations |
US7496497B2 (en) * | 2003-12-18 | 2009-02-24 | Taiwan Semiconductor Manufacturing Co., Ltd. | Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item |
US7543270B1 (en) * | 2004-01-23 | 2009-06-02 | The Math Works, Inc. | Tracing output descriptions generated from corresponding input descriptions |
US20050198573A1 (en) * | 2004-02-24 | 2005-09-08 | Ncr Corporation | System and method for translating web pages into selected languages |
US7890604B2 (en) | 2004-05-07 | 2011-02-15 | Microsoft Corproation | Client-side callbacks to server events |
US9026578B2 (en) | 2004-05-14 | 2015-05-05 | Microsoft Corporation | Systems and methods for persisting data between web pages |
US7464386B2 (en) | 2004-05-17 | 2008-12-09 | Microsoft Corporation | Data controls architecture |
US7562008B2 (en) * | 2004-06-23 | 2009-07-14 | Ning-Ping Chan | Machine translation method and system that decomposes complex sentences into two or more sentences |
US7853473B2 (en) * | 2004-08-31 | 2010-12-14 | Revionics, Inc. | Market-based price optimization system |
US7509318B2 (en) * | 2005-01-28 | 2009-03-24 | Microsoft Corporation | Automatic resource translation |
US20060206797A1 (en) * | 2005-03-08 | 2006-09-14 | Microsoft Corporation | Authorizing implementing application localization rules |
US8219907B2 (en) * | 2005-03-08 | 2012-07-10 | Microsoft Corporation | Resource authoring with re-usability score and suggested re-usable data |
WO2006098019A1 (ja) * | 2005-03-16 | 2006-09-21 | Visionarts, Inc. | メニューバープログラム |
US8249854B2 (en) * | 2005-05-26 | 2012-08-21 | Microsoft Corporation | Integrated native language translation |
US7543189B2 (en) * | 2005-06-29 | 2009-06-02 | International Business Machines Corporation | Automated multilingual software testing method and apparatus |
US7603365B2 (en) * | 2005-10-13 | 2009-10-13 | International Business Machines Corporation | System and method for capture and processing of overflow characters from user input |
US20070088732A1 (en) * | 2005-10-13 | 2007-04-19 | Yen-Fu Chen | Dynamic string length checking for off-line processing using client-side caching of database catalog |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US7822596B2 (en) * | 2005-12-05 | 2010-10-26 | Microsoft Corporation | Flexible display translation |
WO2007124109A2 (en) * | 2006-04-21 | 2007-11-01 | Scomm, Inc. | Interactive conversational speech communicator method and system |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US20080178081A1 (en) * | 2007-01-22 | 2008-07-24 | Eran Reshef | System and method for guiding non-technical people in using web services |
US20090287514A1 (en) * | 2007-03-16 | 2009-11-19 | Alliance Of Professionals & Consultants, Inc. | Rapid candidate opt-in confirmation system |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US20090013268A1 (en) * | 2007-07-02 | 2009-01-08 | Universal Ad Ltd. | Creation Of Visual Composition Of Product Images |
US9201870B2 (en) * | 2008-01-25 | 2015-12-01 | First Data Corporation | Method and system for providing translated dynamic web page content |
US7698688B2 (en) * | 2008-03-28 | 2010-04-13 | International Business Machines Corporation | Method for automating an internationalization test in a multilingual web application |
CN101615181B (zh) * | 2008-06-27 | 2012-05-16 | 国际商业机器公司 | 创建国际化网络应用的系统和方法 |
ATE544274T1 (de) * | 2008-08-01 | 2012-02-15 | Research In Motion Ltd | Elektronisches e-mail-system mit funktionen zur formatierung von nachrichten mittels zeichensätzen und zugehörige verfahren |
KR101579978B1 (ko) * | 2009-03-10 | 2015-12-24 | 엘지전자 주식회사 | 웹페이지 표시방법 및 이를 적용한 이동 통신 단말기 |
EP2409248B1 (en) * | 2009-03-18 | 2021-07-07 | Google LLC | Web translation with display replacement |
US10671698B2 (en) | 2009-05-26 | 2020-06-02 | Microsoft Technology Licensing, Llc | Language translation using embeddable component |
US9405745B2 (en) * | 2009-06-01 | 2016-08-02 | Microsoft Technology Licensing, Llc | Language translation using embeddable component |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
RU2009144948A (ru) * | 2009-12-03 | 2011-06-10 | Виталий Евгеньевич Пилкин (RU) | Система улучшения автоматизированного перевода информации |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8280954B2 (en) | 2010-03-25 | 2012-10-02 | Scomm, Inc. | Method and system for providing live real-time communication via text between mobile user devices |
US9356991B2 (en) * | 2010-05-10 | 2016-05-31 | Litera Technology Llc | Systems and methods for a bidirectional multi-function communication module |
US8635205B1 (en) * | 2010-06-18 | 2014-01-21 | Google Inc. | Displaying local site name information with search results |
US9864809B2 (en) | 2010-07-13 | 2018-01-09 | Motionpoint Corporation | Dynamic language translation of web site content |
US20120072831A1 (en) * | 2010-09-16 | 2012-03-22 | Gemtek Technology Co., Ltd | Method for creating a multi-lingual web page |
JP5908213B2 (ja) * | 2011-02-28 | 2016-04-26 | ブラザー工業株式会社 | 通信装置 |
US8843360B1 (en) * | 2011-03-04 | 2014-09-23 | Amazon Technologies, Inc. | Client-side localization of network pages |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
AU2012250625B2 (en) | 2011-05-05 | 2016-11-24 | Yappn Canada Inc. | Cross-language communication between proximate mobile devices |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) * | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
CN102662935A (zh) * | 2012-04-08 | 2012-09-12 | 北京语智云帆科技有限公司 | 一种交互式的机器翻译方法和机器翻译系统 |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
JP2014059766A (ja) * | 2012-09-18 | 2014-04-03 | Sharp Corp | 画像処理装置、画像形成装置、プログラム、記録媒体 |
JP5708608B2 (ja) * | 2012-10-04 | 2015-04-30 | コニカミノルタ株式会社 | ブラウザプログラム |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9342503B1 (en) * | 2013-03-12 | 2016-05-17 | Amazon Technologies, Inc. | Correlation across languages |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9639526B2 (en) * | 2014-01-10 | 2017-05-02 | Microsoft Technology Licensing, Llc | Mobile language translation of web content |
US20160004697A1 (en) * | 2014-07-05 | 2016-01-07 | Maurice H.P.M. van Putten | Bilingual Search Engine for Mobile Devices |
WO2016018004A1 (en) | 2014-07-31 | 2016-02-04 | Samsung Electronics Co., Ltd. | Method, apparatus, and system for providing translated content |
US10380656B2 (en) | 2015-02-27 | 2019-08-13 | Ebay Inc. | Dynamic predefined product reviews |
US11258872B1 (en) * | 2020-12-10 | 2022-02-22 | Amazon Technologie, Inc. | Techniques for accelerating page rendering |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03268062A (ja) * | 1990-03-19 | 1991-11-28 | Fujitsu Ltd | 機械翻訳電子メール装置における私用単語の登録装置 |
US5175684A (en) * | 1990-12-31 | 1992-12-29 | Trans-Link International Corp. | Automatic text translation and routing system |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
JPH0668144A (ja) * | 1992-08-14 | 1994-03-11 | Fujitsu Ltd | 電子ニュース翻訳配送装置 |
US5568383A (en) * | 1992-11-30 | 1996-10-22 | International Business Machines Corporation | Natural language translation system and document transmission network with translation loss information and restrictions |
JPH07210558A (ja) * | 1994-01-20 | 1995-08-11 | Fujitsu Ltd | 機械翻訳装置 |
US5715466A (en) * | 1995-02-14 | 1998-02-03 | Compuserve Incorporated | System for parallel foreign language communication over a computer network |
JPH0981569A (ja) * | 1995-09-12 | 1997-03-28 | Hitachi Ltd | 多カ国対応サービス提供システム |
US5764906A (en) * | 1995-11-07 | 1998-06-09 | Netword Llc | Universal electronic resource denotation, request and delivery system |
US5987401A (en) * | 1995-12-08 | 1999-11-16 | Apple Computer, Inc. | Language translation for real-time text-based conversations |
US5944790A (en) * | 1996-07-19 | 1999-08-31 | Lucent Technologies Inc. | Method and apparatus for providing a web site having a home page that automatically adapts to user language and customs |
US5884246A (en) * | 1996-12-04 | 1999-03-16 | Transgate Intellectual Properties Ltd. | System and method for transparent translation of electronically transmitted messages |
-
1996
- 1996-10-15 JP JP08272755A patent/JP3121548B2/ja not_active Expired - Lifetime
- 1996-12-26 TW TW085116090A patent/TW315437B/zh not_active IP Right Cessation
-
1997
- 1997-08-23 KR KR1019970040395A patent/KR100265548B1/ko not_active IP Right Cessation
- 1997-08-25 SG SG1997003039A patent/SG54551A1/en unknown
- 1997-09-12 CN CNB971185263A patent/CN1148685C/zh not_active Expired - Lifetime
- 1997-10-10 GB GB9721481A patent/GB2320773A/en not_active Withdrawn
- 1997-10-13 US US08/949,257 patent/US6119078A/en not_active Expired - Fee Related
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457041B (zh) * | 2002-05-10 | 2010-05-26 | 微软公司 | 为一个自然语言理解系统用来自动注解训练数据的一个系统 |
CN105573969A (zh) * | 2006-10-02 | 2016-05-11 | 谷歌公司 | 在带有翻译后的文本的用户界面中显示原始文本 |
US8095355B2 (en) | 2006-10-02 | 2012-01-10 | Google Inc. | Displaying original text in a user interface with translated text |
US9547643B2 (en) | 2006-10-02 | 2017-01-17 | Google Inc. | Displaying original text in a user interface with translated text |
US10114820B2 (en) | 2006-10-02 | 2018-10-30 | Google Llc | Displaying original text in a user interface with translated text |
US8577668B2 (en) | 2006-10-02 | 2013-11-05 | Google Inc. | Displaying original text in a user interface with translated text |
CN101661480B (zh) * | 2008-08-29 | 2012-08-08 | 国际商业机器公司 | 确定组织在不同语言中的名称的方法和系统 |
CN102722479A (zh) * | 2011-03-30 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 一种实现语言翻译的方法及装置 |
CN102722479B (zh) * | 2011-03-30 | 2015-11-04 | 腾讯科技(深圳)有限公司 | 一种实现语言翻译的方法及装置 |
US9201872B2 (en) | 2011-05-31 | 2015-12-01 | International Business Machines Corporation | System for testing a browser-based application |
US9235568B2 (en) | 2011-05-31 | 2016-01-12 | International Business Machines Corporation | Method for testing a browser-based application |
CN102811140A (zh) * | 2011-05-31 | 2012-12-05 | 国际商业机器公司 | 测试基于浏览器的应用的方法和系统 |
US10083109B2 (en) | 2011-05-31 | 2018-09-25 | International Business Machines Corporation | Testing a browser-based application |
US9582404B2 (en) | 2011-05-31 | 2017-02-28 | International Business Machines Corporation | Method for testing a browser-based application |
US9582405B2 (en) | 2011-05-31 | 2017-02-28 | International Business Machines Corporation | System for testing a browser-based application |
WO2013086666A1 (en) * | 2011-12-12 | 2013-06-20 | Google Inc. | Techniques for assisting a human translator in translating a document including at least one tag |
CN105760542A (zh) * | 2016-03-15 | 2016-07-13 | 腾讯科技(深圳)有限公司 | 一种显示控制方法、终端及服务器 |
CN109074326A (zh) * | 2016-04-04 | 2018-12-21 | 沃文技术株式会社 | 翻译系统 |
CN109074326B (zh) * | 2016-04-04 | 2022-02-18 | 沃文技术株式会社 | 翻译系统 |
CN108345589A (zh) * | 2017-11-22 | 2018-07-31 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译方法 |
CN107943797A (zh) * | 2017-11-22 | 2018-04-20 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译系统 |
Also Published As
Publication number | Publication date |
---|---|
KR19980032309A (ko) | 1998-07-25 |
CN1148685C (zh) | 2004-05-05 |
GB2320773A (en) | 1998-07-01 |
JP3121548B2 (ja) | 2001-01-09 |
SG54551A1 (en) | 1998-11-16 |
JPH10134052A (ja) | 1998-05-22 |
US6119078A (en) | 2000-09-12 |
GB9721481D0 (en) | 1997-12-10 |
TW315437B (en) | 1997-09-11 |
KR100265548B1 (ko) | 2000-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1148685C (zh) | 自动翻译方法和自动翻译机 | |
US8307275B2 (en) | Document-based information and uniform resource locator (URL) management | |
US6338059B1 (en) | Hyperlinked search interface for distributed database | |
CN1102267C (zh) | 利用软超连接的超媒体导引 | |
CN1201254C (zh) | 中文文本中的词分割 | |
CN1685341A (zh) | 跨语言搜索结果的闪烁注释标注加亮 | |
CN105243058B (zh) | 一种网页内容翻译方法及电子设备 | |
CN1702621A (zh) | 采用表的语言的本地化 | |
CN1492367A (zh) | 询问应答系统及询问应答方法 | |
KR20040040438A (ko) | 동적 정보 전송 방법 및 시스템 | |
CN101777054B (zh) | 一种展现词条属性信息的方法及装置 | |
CN1781086A (zh) | 内容创建系统、内容创建方法、用于执行该内容创建方法的计算机可执行程序、包括该程序的计算机可读记录介质、图形用户接口系统、以及显示控制方法 | |
Fletcher | Concordancing the web with KWiCFinder | |
US8108410B2 (en) | Determining veracity of data in a repository using a semantic network | |
Conesa et al. | Improving web-query processing through semantic knowledge | |
JP2008537809A (ja) | ページグループを用いた情報検索サービス提供サーバー、方法及びシステム | |
Aridor et al. | Knowledge encapsulation for focused search from pervasive devices | |
CN1154065C (zh) | 用于显示超文本的显示设备和超文本显示系统 | |
CN1311375C (zh) | 服务器和信息处理方法 | |
CN1612524A (zh) | 信息处理方法和信息处理装置 | |
JP3838904B2 (ja) | 辞書装置及び自然言語処理システム | |
CN1922606A (zh) | 用于面向用户的互联网导航的动态关键字处理系统和方法 | |
Lindner | Internet Gopher user’s guide | |
CN1245937A (zh) | 同时进行多个搜寻引擎检索的方法 | |
Wang et al. | Cross-language query classification using web search for exogenous knowledge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20040505 |