CN102763072A - 自适应音频反馈系统和方法 - Google Patents
自适应音频反馈系统和方法 Download PDFInfo
- Publication number
- CN102763072A CN102763072A CN2011800103036A CN201180010303A CN102763072A CN 102763072 A CN102763072 A CN 102763072A CN 2011800103036 A CN2011800103036 A CN 2011800103036A CN 201180010303 A CN201180010303 A CN 201180010303A CN 102763072 A CN102763072 A CN 102763072A
- Authority
- CN
- China
- Prior art keywords
- audio
- audio item
- user interface
- item
- incident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Abstract
所提供的是用于自适应改变电子设备(10)上的音频反馈数据的各种技术。在一个实施例中,实施本公开的某些方面的音频用户接口(38)可以响应于用户接口事件并且至少部分基于在先前发生该用户接口事件的过程中提供的音频反馈的冗长级别来使音频反馈冗长度退化或进化。在另一个实施例中,音频用户接口(38)可被配置成至少部分基于用户导航列表的速度来改变与可导航数据项列表相关联的音频反馈的冗长度。在又一个实施例中,音频用户接口(38)可以被配置成基于用户接口事件的上下文重要性来改变音频反馈的冗长度。实施本技术的电子设备(10)提供了改进的与音频用户接口相关的用户体验。
Description
技术领域
本公开一般涉及电子设备上的用户接口,尤其涉及能够向电子设备的用户提供音频反馈的用户接口。
背景技术
本部分旨在向读者介绍与下文描述和/或要求保护的技术的各方面可能有关的领域的各个方面。我们认为本论述有助于为读者提供便于更好理解本公开的各个方面的背景信息。因此,应该理解的是,这些论述应该从该角度来阅读,而不是对现有技术的认定。
诸如计算机系统、移动电话、数字媒体播放器、个人数字助理(PDA)等等的电子计算设备常被用于各种个人和/或工作相关用途。此类电子设备通常包含某种类型的用户接口,其中该用户接口允许用户与设备上的各种应用(例如电子邮件程序、互联网浏览器、媒体播放器、游戏等等)进行交互,以便执行多种功能。换句话说,用户接口可以提供一个可供用户与应用进行交互以接收内容、信息以及对用户输入的响应的途径。由此,用户接口是这些应用设计中的一个不可分割的部分,并且有助于确定此类设备的易用性以及由此的总体用户体验质量。
在历史上,很多电子设备依靠图形用户接口来允许用户借助视觉显示器与设备进行交互。例如,当用户与设备交互时,设备可以响应于用户动作而显示视觉反馈。然而,随着一些类型的电子设备业已朝着具有相对较小的视觉显示器的较小形状因子迁移,图形用户接口变得不仅难以使用和导航(navigate),而且在能够传达的信息量方面也更加有限。
近来,音频用户接口的流行度已经提升。例如,作为视觉反馈的替换或补充,音频用户接口可以通过提供音频反馈数据来向用户传达信息和内容,由此尤其适合在视觉显示能力有限的电子设备中使用,或者在一些情况下适合在完全没有视觉显示能力的电子设备中使用。例如,一旦发生了请求音频反馈的事件,那么可以通过播放相应的音频剪辑来向用户传达与正在发生的事件有关的音频信息。不幸的是,一些事件可能与大量音频信息相关联,这些信息可能会将用户淹没(overwhelm),由此对用户体验产生负面影响,尤其是在此类事件是在相对较短的时间段中密集重复发生的时候。此外,常规的音频用户接口提供的音频反馈可能不足以使用户能够区分上下文重要性(contextual importance)较高或较低的事件。因此,目前正在努力地进一步改善与电子设备中的音频用户接口相关的用户体验。
发明内容
以下阐述的是在这里公开的某些实施例的概述。应该理解的是,这些方面只是为了向读者提供关于这里的某些实施例的简要概述而被给出的,并且这些方面的目的并不是限制本公开的范围。实际上,本公开可能包含下文中没有阐述的多个方面。
本公开主要涉及的是用于自适应改变电子设备上的音频用户接口提供的音频反馈的技术。根据一个实施例,音频用户接口可被配置成响应于用户接口事件并且至少部分基于在先前发生该用户接口事件的过程中提供的音频反馈的冗长级别(verbosity level)来使音频反馈的冗长度(verbosity)退化(devolve)或进化(evolve)。如下文进一步论述的那样,这里使用的术语“冗长度”指的是音频反馈提供的音频信息的“啰嗦程度”(wordiness),并且可以包括非语言类的音频反馈,例如音调、滴答声、蜂鸣声、啁啾声等等。举个例子,如果在与先前发生用户接口事件相对接近的时间里后续发生了该用户接口事件,那么,音频用户接口可以使音频反馈退化(例如通过减小冗长度),以免重复且高度冗长的信息将用户淹没。
在另一个实施例中,音频用户接口可被配置成至少部分基于用户导航列表的速度来自适应改变与可导航数据项列表相关联的音频反馈。在另一个实施例中,音频用户接口可被配置成提供在听觉上更为显著(more audibly distinct)的音频反馈来指示较新的数据内容在可导航列表中的位置,以及为较老的数据内容提供在听觉上较不显著的音频反馈。在另一个实施例中,音频用户接口可以被配置成基于用户接口事件的上下文重要性来改变音频反馈的冗长度和/或辨识度。在被单独或组合实施时,这里公开的各种音频反馈技术可以提升与音频用户接口相关的用户体验。
在本公开的各个方面可以有对上述特征的各种改进。此外,在这些各个方面中还可以引入其他特征。这些改进和附加特征既可以单独存在,也可以采用任何组合的形式存在。例如,以下结合所示出的一个或多个实施例论述的各个特征可被单独或以任何组合的形式引入至本公开的上述任一方面。同样,对上文给出的简要概述来说,其目的是让读者熟悉本公开的实施例的某些方面和上下文,而不是限制所要保护的主题。
附图说明
通过阅读以下的详细描述以及参考附图,可以更好地理解本公开的不同方面,在附图中:
图1是根据本公开的方面的电子设备的框图,其中该电子设备包括被配置成自适应改变音频反馈的音频用户接口;
图2是根据本公开的方面且采用了台式计算设备形式的图1中的电子设备的前视图;
图3是根据本公开的方面且采用了手持便携电子设备形式的图1中的电子设备的前视图;
图4是示出了根据本公开的方面且可以包含在被配置成自适应改变音频反馈的音频用户接口中的组件的框图;
图5是可以在图1的电子设备上运行的应用的屏幕图像;
图6是根据本公开的方面的图5所示的应用的屏幕图像,其中该屏幕图像描述的是在用户与应用交互时发生的事件的视觉通知;
图7以图形方式描述了根据本公开的方面的音频项的集合,其中这些音频项具有不同的冗长级别,并且与图6所述的事件相关联;
图8和9是描述了根据本公开的方面,关于如何响应于事件的重复发生而在一时间间隔上改变与图6的事件相关联的音频反馈的冗长度的图形时间线;
图10是根据本公开的方面的图5所示应用的屏幕图像,其中该图像进一步描述了图6中的事件的另一种视觉通知;
图11A是描述根据本公开的方面,用于响应于请求音频反馈的事件的发生而选择用于回放的音频项的方法的第一实施例的流程图;
图11B是描述根据本公开的方面的用于响应于请求音频反馈的事件的发生而选择用于回放的音频项的方法的第二实施例的流程图;
图12显示的是根据本公开的方面且可以在图1的设备上显示的多个屏幕图像,其中所述图像示出的是音频用户接口可以如何基于上下文重要性来提供区分事件的音频反馈;
图13是描述根据本公开的方面的用于基于事件的上下文重要性来选择音频项的方法的流程图;
图14描述的是显示了可以在包含了可导航项目列表的图1的电子设备上运行的应用的多个屏幕图像;
图15-17是根据本公开的方面的屏幕图像,其中每一个屏幕图像都显示了图14的可导航列表,并且描述了用户以不同的速度来导航列表;
图18是描述基于导航列表的速度来改变与图1的电子设备上显示的项目列表的导航相关联的音频反馈的方法的流程图;以及
图19-21是根据本公开的方面且可以在图1的设备上显示的屏幕图像,其中该图像示出的是与改变音频用户接口中的音频反馈相关的各种用户可配置选项。
具体实施方式
以下将会描述本公开的一个或多个具体实施例。所描述的这些实施例只是当前公开的技术的示例。此外,为了提供关于这些实施例的简要描述,在本说明书并未描述实际实施方式的全部特征。可以想到的是,与任何工程或设计项目一样,在开发任何此类实际实施方式的过程中必须做出众多特定于实施方式的决定,以便实现开发者的具体目标,例如与那些涉及系统和涉及业务且可能随着实施方式的不同而改变的约束条件相符。此外还应该了解,这些开发工作有可能会很复杂和耗时,但是对得益于本公开的普通技术人员来说,这些仍然是进行设计、制作和制造的例行工作。
在引入本公开的不同实施例的要素时,冠词“一”、“一个”以及“该”旨在表明存在一个或多个要素。术语“包含”、“包括”和“具有”应该是包含性的,并且应该意味着可以存在除了所列举的要素之外的附加要素。此外还应该理解,本公开中关于“一个实施例”或“实施例”的说法不应被解释成是排除了同样引入了所描述的特征的附加实施例的存在。
如下所述,本公开主要涉及的是用于自适应改变电子设备上的音频用户接口提供的音频反馈的技术。应该了解的是,在电子设备的显示能力有限或者没有显示能力的情况下,音频用户接口可能尤其有用。进一步地,即便电子设备包含可视显示器,用户有时也难以导航图形用户接口,诸如在不可能将视觉焦点从重要的活动上移开并且移向图形用户接口这一“眼睛繁忙”的情况下。这种活动可以包括例如开车、锻炼以及穿过繁忙街道。此外,如果设备在由视力受损的用户使用,那么音频反馈将会是视觉反馈的一个实用的替代。
根据一个实施例,音频用户接口可以使音频反馈的冗长度退化或进化。如上所述,这里使用的术语“冗长度”应被理解成是指音频反馈提供的音频信息的“啰嗦程度”,并且可以包括非语言类的音频反馈,例如滴答声、蜂鸣声、啁啾声或是其他各种类型的非语言声音效果。举例来说,冗长级别高的音频反馈可以输出若干个口语单词(例如播放预先存储的包含了口语单词的音频文件,或是使用实时的文本转语音合成),而冗长级别较低的音频反馈则可以输出较少的口语单词,或者在一些情况中输出非语言音调(例如没有口语单词)。在一个实施例中,对响应于用户接口事件而提供的音频反馈来说,其冗长度至少部分是基于在先前发生一次或多次用户接口事件的过程中提供的音频反馈的冗长级别而改变的。因此,当在与先前发生用户接口事件相对接近的时间里后续发生了该用户接口事件时,音频用户接口可以退化音频反馈(例如通过减小冗长度),以免重复且高度冗长的信息将用户淹没。
在另一个实施例中,音频用户接口可以被配置成至少部分基于用户导航列表的速度来自适应地改变与可导航数据项列表相关联的音频反馈。在另一个实施例中,音频用户接口可以被配置成提供听觉上较为显著的音频反馈来指示较新的数据内容在可导航列表中的位置,以及为较老的数据内容提供听觉上较不显著的音频反馈。在另一个实施例中,音频用户接口可以被配置成基于用户接口事件的上下文重要性来改变音频反馈的冗长度和/或辨识度。在被单独或组合实施时,这里公开的各种音频反馈技术可以提升与音频用户接口相关的用户体验。
在继续描述之前,首先将会定义本公开中广泛使用的若干个另外的术语,以便更好地理解所公开的主题。例如,在电子设备工作过程中发生的事件通常可被归类为“用户事件”或“系统事件”。这里使用的术语“用户事件”或类似术语应被理解成是指作为用户与设备交互的结果而发生的事件。作为示例,用户事件可以是表明关于用户请求的特定设备功能的可用性的通知。与之相比,术语“系统事件”或类似术语应被理解成是通常由设备自身在工作过程中发起以便提供关于设备状态的信息的事件,而不管用户是否在主动与设备交互或是在向设备发布请求和/或命令。作为示例,系统事件可以包括低电池电量通知。因此应该理解,这里使用的术语“事件”可以是指如上定义的用户事件或系统事件。
在音频用户接口的上下文中,电子设备可以在发生了某些事件后启动“音频项”的回放,以便提供音频反馈。这里使用的术语“音频项”或类似术语应被理解成是指电子设备的音频用户接口提供的音频信息。例如,音频项可以是存储在设备上的音频文件(例如存储在内存或非易失存储器中),并且可以包含语言的(例如语音数据)音频信息或非语言的音频提示,例如蜂鸣声、滴答声、啁啾声、鸣响声、铃声以及其他各种音调或音效。此外,一些音频项未必是本地存储在设备上的,而是可以与请求音频反馈的特定事件的发生相结合地由合成语音应用(例如文本转语音)来产生。
根据下文描述的技术,某些事件可以与一组具有不同冗长级别的音频项相关联。例如,某一组音频项可以包括非语言的音频项(例如无冗长内容)和具有最高冗长级别的音频项(例如“完全冗长度”),以及具有中间冗长级别的一个或多个音频项。这里使用的术语“退化”、“降级(step down)”或类似术语应被理解成是指通过选择和回放与在先前发生特定事件的过程中选择的音频的冗长度相比具有较低冗长度的音频项来降低与该特定事件相关联的音频反馈的冗长度的动作。同样,术语“进化”、“升级(step up)”应被理解成是指通过选择和回放与在先前发生特定事件的过程中选择的音频的冗长度相比具有较高冗长度的音频项来提高与该特定事件相关联的音频反馈的冗长度的动作。以下将会公开用于确定如何使音频反馈退化或进化的各种技术。
进一步地,在应用于用户接口时,术语“上下文重要性”或类似术语应被理解成是指响应于设备上的事件而提供的信息相对于提供信息的上下文的重要性。例如,与上下文重要性较低的事件相比,上下文重要性较高的事件可以提供更为显著的响亮音频反馈。作为示例,需要用户响应的事件,例如提示用户允许或拒绝到来的网络连接的事件,可能具有较高的上下文重要性,这是因为设备可能需要用户提供响应于该事件的决定来确定如何解决该到来的网络连接请求。作为另一个示例,低电池电量通知事件的首次发生可以具有较低的上下文重要性,这是因为此类通知通常旨在提供信息,并且不一定需要用户响应或是立即的用户动作。然而,如果用户有意或无意中忽略了重复出现了数次的低电池电量通知,由此导致设备趋近于继续操作所需要的临界电力阈值,那么低电池电量通知的上下文重要性可以逐渐提高。
在其他实施例中,用户接口事件的上下文重要性还可以是基于预先编程的信息而被确定的(例如,通过对事件进行编程,可以使其具有高或低的上下文重要性特征)。在其他实施例中,用户接口事件的上下文重要性可以是自适应的,或者可以基于先前的设备行为和/或在先前发生一次或多次该用户接口事件的过程中用户是如何与设备进行交互的来学习。此外,在一些实施例中,上下文重要性可以由用户规定,例如借助电子设备上的一组可配置用户偏好设置来规定。在这里论述了通过改变音频反馈来指示事件的上下文重要性的各种实施例。由此,应该理解的是,音频反馈冗长度的进化和退化可以是由电子设备响应于用户输入(例如直接用户输入、用户偏好设置等等)和/或响应于外界刺激(例如设备运行事件——电力不足、内存不足等等)而执行的智能的自适应行为。实际上,如下文中的各个实施例所示,音频反馈冗长度的进化和退化可以是动态的,并且可以基于存储在设备上的具体的用户偏好和/或设置来定制。
现在转到附图,图1是示出了电子设备10的一个示例的框图,其中该电子设备可以包括被配置成使用以上简要描述的一种或多种技术来改变音频反馈的用户接口。电子设备10可以是包含了被配置成使用音频输出设备来提供音频反馈的音频用户接口的任何类型的电子设备,例如膝上计算机或台式计算机、移动电话、数字媒体播放器等等。作为示例,电子设备10可以是台式或膝上型计算机,例如Cupertino,California的Apple Inc.提供的产品型号 Pro、MacBookMini或Mac此外,电子设备10可以是便携电子设备,例如Apple Inc.提供的产品型号或在其他实施例中,电子设备10还可以是来自其他制造商且包含了能够提供音频反馈的音频用户接口的电子设备型号。
如图1所示,电子设备10可以包括有助于设备10的功能的各种内部和/或外部组件。本领域普通技术人员将会了解,图1所示的各种功能块可以包括硬件部件(包括电路),软件部件(包括存储在计算机可读介质上的计算机代码,例如程序和/或固件)、或是硬件与软件部件的组合。例如,在当前示出的实施例中,电子设备10可以包括以下组件:输入/输出(I/O)端口12、输入结构14、一个或多个处理器16、存储器18、一个或多个非易失存储设备20、显示器22、音频输出设备24、一个或多个扩展卡26、联网设备28以及电源30。此外,电子设备10还可以包括具有图形用户接口36(“GUI”)和音频用户接口38的用户接口34。如下文中进一步论述的那样,音频用户接口38可以被配置成实施如上所述的一种或多种用于改变音频反馈的技术。
对于图1中示出的每一个组件来说,I/O端口12可以包括被配置成与诸如电源或其他电子设备(例如手持设备和/或计算机、打印机、投影仪、外部显示器、调制解调器、坞站等等)之类的各种不同的外部设备相连的各种端口。I/O端口12可以支持任何接口类型,例如通用串行总线(USB)端口、视频端口、串行端口、IEEE-1394端口、以太网或调制解调器端口、和/或AC/DC电力连接端口。在一个实施例中,I/O端口12可以包括来自Apple Inc.的专属端口,该端口的功能可以是为设备10的电源30(该电源可以包括一个或多个可再充电电池)充电,或是在设备10与外部源之间传送数据。进一步地,如果音频输出设备24包括外部音频输出设备(例如耳机或外部扬声器),那么I/O端口12可以包括用于将音频输出设备24连接到设备10的音频连接器端口。
输入结构14可以向处理器16提供用户输入或反馈。例如,输入结构14可以被配置成控制电子设备10的一个或多个功能,例如在设备10上运行的应用。作为示例,输入结构14可以包括按钮、滑动条、开关、控制板、按键、旋钮、滚轮、键盘、鼠标、触摸板等等或是其某种组合。在一个实施例中,输入结构14可以允许用户导航设备10上显示的GUI 36。此外,输入结构14可以包括与显示器22一起提供的触敏机制。在这样的实施例中,用户可以借助触敏机制来选择所显示的接口元素或者与之交互。
设备10的操作通常可以由一个或多个处理器16来控制,其中处理器可以提供运行操作系统、应用程序、GUI 36、音频用户接口38以及设备10上提供的其他任何功能所需要的处理能力。处理器16可以包括单个处理器,或者在其他实施例中可以包括多个处理器。作为示例,处理器16可以包括“通用”微处理器、专用处理器(ASIC)、定制处理器、或是此类处理组件的组合。例如,处理器16可以包括指令集处理器(例如RISC)、图形/视频处理器、音频处理器、和/或其他相关芯片组。处理器16可以耦合到一个或多个数据总线,以便在设备10的各组件之间传送数据和指令。
由处理器16处理的指令或数据可存储在计算机可读介质中,例如存储器18中,其中所述存储器既可以是诸如随机存取存储器(RAM)之类的易失存储器,也可以是诸如只读存储器(ROM)之类的非易失存储器,还可以是RAM和ROM设备的组合。例如,存储器18可以存储设备10的固件,例如操作系统、应用、图形和音频用户接口功能、或是可以在设备10上运行的其他任何例程。虽然用户接口34(包含GUI 36和音频用户接口38)被显示成是存储器18的组件,但是应该理解,定义了GUI 36和音频用户接口38的编码指令(例如机器可读代码)实际可以驻留在非易失存储器28中,并且可以在运行时载入存储器18以便执行。
非易失存储设备20可以包括闪存、硬盘驱动器或是其他任何用于持久存储数据和/或指令的光、磁和/或固态存储介质。作为示例,非易失存储设备20可以用于存储数据文件,这其中包括音频数据、视频数据、图片以及其他任何适当的数据、如下文中进一步论述的那样,设备10可以使用非易失存储器20来存储可以借助音频用户接口38选择和回放以便向设备10的用户提供音频反馈的各种音频项。
显示器22可以用于显示设备10产生的各种图像。例如,显示器22可以接收和显示GUI 36生成的图像40。在各种实施例中,显示器22可以是任何适当的显示器,例如液晶显示器(LCD)、等离子显示器或是有机发光二极管(OLED)显示器。此外,显示器22可以是与如上所述充当设备10的控制接口的一部分的触敏机构(例如触摸屏)一起提供的。进一步地,应该指出的是,在一些实施例中,设备10未必包含显示器22或GUI 36,而是可以只包含可供用户与设备10交互的音频用户接口38。关于没有显示器22的设备10的实施例的一个示例可以是Apple Inc.提供的产品型号Shuffle。
如上所述,音频输出设备24可以包括外部音频输出设备,例如通过I/O端口12与设备10相连的耳机或外部扬声器。此外,音频输出设备24可以包括集成的扬声器。如图1所示,音频用户接口38提供的音频反馈42可以用音频输出设备24来回放。在一些实施例中,音频用户接口38还可以被配置成借助音频输入设备(在图1中并未显示)接收来自用户的音频输入(例如语音命令),其中所述音频输入可被转换成用于在设备10上执行某个任务或功能的指令或命令。
图1所示的实施例还可以包括一个或多个卡槽或扩展槽。这些卡槽可以被配置成接纳一个或多个可以用于为电子设备10添加诸如附加存储器、I/O功能或联网能力之类的功能的扩展卡26。此类扩展卡26可以通过任何类型的适当连接器连接到设备10,并且可以在电子设备10的壳体内部或外部被访问。举例来说,在一个实施例中,扩展卡26可以包括闪存卡,例如安全数字(SD)卡、压缩闪存卡、多媒体卡(MMC)等等,或是PCMCIA设备。此外,扩展卡24可以是与提供移动电话能力的电子设备10的实施例一起使用的订户身份模块(SIM)卡。
电子设备10还包括网络设备28,网络设备28可以是可借助无线802.11标准或任何其他适当的联网标准来提供网络连接的网络控制器或网络接口卡(NIC),网络连接诸如是局域网(LAN)、广域网(WAN),如GSM演进的增强数据速率(EDGE)网络、3G数据网络、或因特网。借助网络设备28,设备10可以与网络上的任何设备相连并与之发送或接收数据,举例来说,所述设备可以是便携电子设备、个人计算机、打印机等等。在某些实施例中,网络设备28可以提供与诸如Apple Inc.提供的服务之类的在线数字媒体内容供应商的连接。
设备10的电源30可以包括在非便携和便携设置中都为设备10供电的能力。例如,在便携设置中,设备10可以包括用于为设备10供电的一个或多个电池,例如锂离子电池。该电池可以通过将设备10连接到诸如墙壁插座之类的外部电源而被重新充电。在非便携设置中,电源30可以包括被配置成从墙壁插座汲取电力以及将电力分发给诸如台式计算系统之类的非便携电子设备的各个组件的供电单元(PSU)。
在描述了图1所述的电子设备10的组件之后,图2和3示出的是电子设备10可以采用的各种形式。如图2所示,电子设备10可以采用计算系统50的形式。所描述的计算机50包括壳体52,显示器22,采用键盘和鼠标的形式的输入结构14,以及采用了集成扬声器的形式的音频输出设备24。计算机50还包括集成的成像设备54,例如数码相机。虽然所示出的计算机50被显示成是通常非便携的计算机系统(例如台式计算机、工作站和/或服务器),但是应该理解,计算机50也可以使用更小和更便携的形状因子来提供(例如膝上型计算机、上网本计算机和/或平板计算机)。
可以想到的是,输入结构14还可以包括各种其他按钮和/或开关,这些按钮和/或开关可以用于与计算机50进行交互,例如为计算机加电或是启动计算机,操作GUI或是在计算机50上运行的程序,以及调节与计算机50的操作相关的各个其他方面(例如音量,显示器亮度等等)。计算机50还可以包括如上所述提供与附加设备的连接的各种I/O端口12,例如或USB端口,高清多媒体接口(HDMI)端口,或是适合连接到外部设备的任何其他类型的端口。此外,计算机50还可以包括在上文中对照图1描述的网络连接(例如网络设备28),存储器(例如存储器18)以及存储能力(例如存储设备20)。
正如进一步显示的那样,显示器22可以被配置成产生可供用户查看的各种图像。例如,在计算机50工作的过程中,显示器28可以显示允许用户与操作系统和/或计算机50上运行的应用交互的GUI36。GUI 36可以包括各种层、窗口、屏幕、模板或是可以在整个显示设备22或是显示设备22的一部分上显示的其他图形元素。例如,在所描述的实施例中,GUI 36可以显示包含了各种图形图标56的操作系统界面,其中各个图标可以对应于可以在检测到用户选择(例如借助键盘/鼠标或触摸屏输入)时打开或运行的各种应用。图标56可被显示在停靠栏58中或是屏幕上显示的一个或多个图形窗口元素60内。
在一些实施例中,通过选择图标56,可能引起层次性的导航过程,由此,选择图标56可能会通向某个屏幕或者打开包含了一个或多个另外的图标或其他GUI元素的另一个图形窗口。作为示例,图2显示的操作系统GUI 36可以来自Apple Inc.提供的某个版本的Mac操作系统。此外,计算机50还可以包括与GUI 36同时运行的音频用户接口(例如38)。例如,响应于用户事件或系统事件,音频用户接口38可以通过音频输出设备24来向用户提供音频反馈。仅作为示例,音频用户接口38的实施例可以是在Apple Inc.提供的Mac操作系统的一些版本以及某些型号的和上可用的实用程序。
图3进一步示出的是采用便携手持电子设备70的形式的电子设备10,其中所述设备可以是Apple Inc.提供的某个型号的或在所描述的实施例中,手持设备70包括外壳52,其可具有保护内部组件免受物理损害以及保护它们免受电磁干扰的功能。外壳52可以是任何适当的材料或材料组合制成,例如塑料、金属或复合材料,并且可以允许无线网络信号传递至可部署在如图3所示的外壳52内的无线通信电路(例如网络设备28)。
外壳52还包括可供用户与手持设备70交互的各种用户输入结构14。例如,每一个输入结构14可以被配置成在被按下或致动时控制一个或多个相应的设备功能。作为示例,一个或多个输入结构14可以被配置成调用“主页”屏幕72或是要显示的菜单,以便在休眠、唤醒、或开机/关机模式之间切换,从而静默蜂窝电话应用的振铃器,提高或降低音量输出等等。应该理解的是,所示出的输入结构14仅仅是例示性的,并且手持设备70可以包括以各种形式存在的任何数量的适当用户输入结构,其中所述形式包括按钮、开关、按键、旋钮、滚轮等等。
如图3所示,手持设备70可以包括各种I/O端口12。例如,所描述的I/O端口12可以包括用于发送和接收数据文件或是为电源26充电的专属连接端口12a,以及用于将设备70连接到外部音频输出设备24(例如耳机或扬声器)的音频连接端口12b。进一步地,在手持设备70提供移动电话功能的实施例中,设备70可以包括用于接纳订户身份模块(SIM)卡(例如扩展卡26)的I/O端口12c。
显示设备22可以显示手持设备70产生的各种图像。例如,显示器22可以显示各种系统指示符73,其向用户提供关于手持设备70的一个或多个状态的反馈,其中举例来说,所述状态可以是电源状态、信号强度、外部设备连接等等。如上文中参考图2所述,显示器22还可以显示允许用户与设备70交互的GUI 36。GUI 36可以包括图标56,其可以与在检测到用户选择了相应图标56时打开或运行的各种应用相对应。例如,图标74可以代表媒体播放器应用,图标76可以代表在线数字媒体服务应用,以及图标78可以代表可供用户配置设备70的一个或多个设置的应用。仅作为示例,图3显示的GUI36可以来自Apple Inc.提供的OS系统的某个版本。
手持设备70还包括音频输出设备24,音频输入设备80,以及输出发射器82。如上所述,设备70上的音频用户接口38可以使用音频输出设备24来通过回放各种音频项向用户提供音频反馈。此外,音频输出设备24可以与诸如用于回放音乐和媒体文件的媒体播放器应用76结合使用。进一步地,如果电子设备70包含移动电话应用,那么音频输入设备80和输出发射器82可以协同工作,以便充当电话的音频接收和发射部件。
现在参考图4,该图示出的是根据一个实施例的描述了可以在图1的设备10中实施的音频用户接口38的功能组件的框图。音频用户接口38包括音频反馈选择逻辑86,该逻辑接收用于指示诸如用户或系统事件之类的事件的发生的数据88。接收到数据88后,音频反馈选择逻辑86可以与事件统计数据存储单元92和音频反馈数据存储单元94(这二者都可以是非易失存储器20(图1)的一部分,或者可以作为独立存储设备来实施)进行通信,以及与用户偏好集合96和时钟或定时器98进行通信,以便确定对使用音频输出设备24回放的音频项100的选择。可以想到的是,图4所示的各种组件提供的功能可以由电子设备10的一个或多个处理器15运行或执行。
举例来说,如上所述,音频反馈选择逻辑86的一个方面可涉及响应于事件88来使音频反馈退化或进化。在一个实施例中,选择逻辑86可以将音频数据存储器94中与事件88相关联的音频项集合(“音频反馈数据集合”)识别成是用于音频反馈的候选者。如上所述,与事件88相对应的音频项集合的冗长级别可以不同,其中每一个级别可被称为一个“等级(step)”。由此,如上文中定义的那样,“降级”音频反馈可以是指降低音频反馈的冗长度,而“升级”音频反馈可以是指提高音频反馈的冗长度。相应地,与期望的冗长级别相对应的音频项100可以是根据事件统计数据存储器92和用户偏好96提供的信息来选择的。
在一个实施例中,事件统计数据存储器92可以存储关于事件88的信息,包括事件88先前已在设备10的工作过程中发生的频率,在最近一次发生事件88的过程中所选择用于回放的音频项,以及事件88最近一次发生时的时间邻近度等等。作为示例,事件88在先前的每一次发生都可被标记一个由定时器98提供的时间值,并且可以作为数据条目存储在事件统计数据存储器92中。定时器98可以实施为独立时钟(例如RC振荡器),或者可以被配置成基于设备10的外部系统时钟来推导出时间值。由此,当事件88在相对于先前发生事件88的非常接近的时间发生,也就是在选定时间量(通过用户偏好96可配置的“等待时间”或“升级时间”)内发生时,音频反馈选择逻辑85可以从音频反馈数据集合中选择与在先前发生该事件的过程中所选择的音频项相比具有更低冗长度的音频项100。这样一来,音频用户接口38可以避免为在相对较短的时间内发生过多次的特定事件88重复回放冗长度同样很高的音频项,由此改善了与音频用户接口38相关的用户体验。
出于同样的原因,音频反馈选择逻辑86的一些实施例还可以被配置成使用与如上所述的退化处理相类似的技术来使音频反馈进化。例如,在检测到发生了事件88时,如果事件统计数据92表明就在发生事件88之前的与所选择的升级时间相对应的间隔内并未发生过事件88,那么选择逻辑86可以通过从音频反馈数据集合中选择与先前发生事件88时选择的音频项相比具有更高冗长度的音频项100来使音频反馈进化。
虽然事件88发生的频率和时间邻近度是音频用户接口38的选择逻辑86改变音频反馈可依据的一个度量,但是其他的因素也可以为选择逻辑86如何选择音频项100做出贡献。例如,在一个实施例中,选择逻辑86可以被配置成基于事件88的上下文重要性来控制或改变音频反馈,其中所述上下文重要性取决于响应于事件88而提供的信息相对于发生事件88的上下文的相对重要性。在其他实施例中,事件的上下文重要性可以基于预先编程的信息来确定(例如,事件可被编程为具有高或低的上下文重要性特征),或者可以基于先前设备行为和/或用户在先前发生一次或多次该事件的过程中与设备如何交互而自适应的或学习的,或者可以是由用户规定的,例如借助电子设备上的可配置的用户偏好设置集合来规定,或者可以基于这些因素的组合来确定。在另一个实施例中,选择逻辑86可以被配置成基于设备10的用户导航列表的速度来改变与所显示的项目列表相关联的音频反馈。
在明确了这些要点之后,剩余附图旨在描述根据本公开的方面来改变音频用户接口(例如38)所提供的音频反馈的各种实施例。特别地,图5-11描述的是音频反馈选择逻辑86被配置成基于设备10上发生一事件相对于先前发生该相同事件的邻近度来改变音频反馈的实施例。图12-13描述的是选择逻辑86被配置成基于设备10上发生的事件的上下文重要性来改变音频反馈的实施例。图14-18描述的是选择逻辑86被配置成基于用户导航设备10上显示的项目列表的方式来改变音频反馈的实施例。最后,图19-21描述的是一个配置应用的实施例,其中通过该配置应用,用户可以定义和/或配置与改变设备10上的音频反馈相关的各种音频用户接口设置。本领域技术人员很容易了解,这里对照这些附图给出的详细描述仅仅是为了借助示例来提供本发明的实施例可以采取的某些形式。换言之,本公开不应被解释成是仅限于这里论述的具体实施例。
参考图5,该图示出的是根据一个实施例的描述了设备10上的应用106的屏幕图像104。屏幕图像104可以是应用106的图形用户接口的一部分,并且可以用图2的计算机50上的显示器22来显示。在所描述的实施例中,应用106可以是数字媒体播放器应用,例如Apple Inc.提供的应用,并且可以在用户从如图2所示的操作系统GUI 36中选择适当图标56的时候启动。考虑到以下论述的实施例,应该理解的是,应用106可以包括音频用户接口(例如38)或者与全局音频用户接口(例如设备10的主操作系统的全局音频用户接口)相兼容,以便向用户提供音频反馈。
如上所述,取决于用户进行的输入和选择,GUI 36可以显示包含了图标(例如56)和图形元素的各种屏幕。这些元素可以代表图形和虚拟元素,或是可供用户使用一个或多个输入结构14(图1)而从显示器22上选择的“按钮”。相应地,应该理解的是,以下关于屏幕图像的后续描述中所使用的术语“按钮”、“虚拟按钮”、“图形按钮”、“图形元素”等等指的是显示器22上提供的图形元素所代表的按钮或图标的图形表示。进一步地,应该理解的是,后续附图中阐述和描述的功能可以使用多种多样的图形元素和视觉方案来实现。因此,本公开并不局限于这里描述的确切的图形接口规范。相反,这里阐述的可被实施的实施例包括多种多样的用户接口类型。
如屏幕104所示,应用106可以显示诸如歌曲文件、视频文件、播客等媒体项110的列表108,并且用户可以从该列表中选择在设备10上回放的项目112。如图5所示,列表108可以显示关于每一个媒体项110的各种特性,诸如歌曲名称、曲目回放时间、艺术家姓名、专辑名称和流派。一旦识别了所选择的项目112,则用户可以通过选择图形回放按钮114而开始回放所选择的项目112。此外,用户可以通过选择图形按钮116返回到先前播放的项目,通过选择图形按钮118来前进到列表108中的另一个项目,或者通过操作图形滑条120来调节所选择的项目112的回放音量。如这里所示,如果显示器22的大小不足以显示整个列表108,那么屏幕104还包括允许用户垂直和水平导航整个列表108的滚动条元素122和124,
图形按钮126、128、130和132描述了应用106所提供的附加回放功能。例如,图形按钮126可以代表一个可供用户手动创建用于回放的新的媒体项目群组的功能,其中所述群组通常被称为“播放列表”。图形按钮128和130分别可以代表启用或禁用“随机”和“重复”播放模式的功能。最后,图形按钮132可以代表使用存储在设备10上的被确定为与所选择的媒体项112相似的媒体来自动生成播放列表的功能。作为示例,该功能可以作为在Apple Inc.提供的应用以及产品型号和上可用的功能来给出。
播放列表可以使用通过诸如Apple Inc.提供的服务器之类的外部集中式服务器提供的评分系统和过滤算法来生成。然而,在一些情况中,功能可能无法满足要求生成播放列表的用户请求,例如在所选择的媒体项112相对较新并且功能无法获取足以识别设备10上(例如在非易失存储器20中)存储的类似媒体的数据点的时候。此外,如果设备10上存储的媒体项的总数不足以生成适当的列表,那么功能同样可能是不可用的。对以下结合图6-10描述的实施例来说,对于按钮132的选择将被用作触发或请求音频反馈的事件88(图4)的示例。图6显示的是在选择了按钮132之后出现的屏幕104的更新视图。在所示出的示例中,假设功能不可用于所选择的媒体项112。响应于该事件88,应用106的图形用户接口36部分可以显示视觉通知窗口140,该窗口包含了向用户告知所请求的功能不可用的视觉通知142。通常,在显示视觉通知窗口140的同时,应用106的音频用户接口38部分可以提供音频反馈来向用户告知所请求的功能不可用。例如,可以通过回放音频项来提供音频反馈,其可以包括播放音频文件或是采用文本转语音应用来使用合成语音“说出”通知142。为了从屏幕104中移除视觉通知窗口140,用户可以选择图形按钮144,其可以向设备10和应用106指示用户已经接收并且确认了视觉通知窗口140所传达的信息。
如上所述,本技术的某些实施例可以包括响应于事件88来使音频反馈退化。举例来说,假设在尝试将功能应用于所选择的媒体项112之后,用户在相对较短的时间间隔中进一步尝试将功能应用于列表108上的其他项目且没有成功,由此在每一次尝试时都触发事件88。如果没有应用如上所述的退化技术,那么在每次发生该事件时都会以“完全冗长度”来提供音频反馈,这样有可能会使用户被重复的信息所淹没,并且由此对应用106的用户体验产生负面影响。
为了提升用户体验,音频反馈选择逻辑86(图4)可以通过分析与事件88有关的事件统计数据(例如来自存储器92)以及从与事件88相关联的音频反馈数据集合中选择适当的音频项,来减小与事件88相对应的音频反馈的冗长度。现在参考图7,该图示出的是音频反馈数据集合148的一个示例。如所示,音频反馈数据集合148可以包括音频项150、152、154和156,各个音频项具有不同的冗长级别。例如,在这里被称为“完全冗长度”的音频项150是最冗长的,并且在被选择逻辑86选择时,该音频项会导致在显示图6的视觉通知窗口140的同时通过音频输出设备24回放语言音频信息“GENIUS ISCURRENTLY UNAVAILABLE FOR THIS TRACK(Genius当前不可用于该曲目)”。
音频项152可以代表第一级退化音频项,它与音频项150相比冗长度相对较低,但是仍旧包含了大部分语言音频信息。举例来说,在被选择时,音频项152可能会导致通过音频输出设备24回放语言音频信息“GENIUS IS NOT AVAILABLE(Genius不可用)”。与音频项152相比,音频项154的冗长度甚至更低,并且只包括相对较短的语言消息“NO GENIUS(无Genius)”。最后,音频项156代表了集合148中的最不冗长的项目,并且不包括语言成分,而是仅仅是采用了具有听起来是否定的音调或蜂鸣声形式的非语言提示。
由此,图7描述的音频反馈数据集合148示出了具有不同冗长级别或等级的音频项(例如150、152、154和156),选择逻辑86可以从这些音频项中进行选择,以使与事件88的发生相对应的音频反馈退化或进化。进一步地,虽然本实施例示出的是具有4个冗长等级的音频反馈数据集合,但是应该理解,在其他实施例中或者对其他事件来说,相应的音频反馈数据集合可以包括更少或更多的冗长等级。进一步地,一些实施例可以提供对于相同冗长级别包括多个音频项的音频反馈数据集合。举例来说并且如下文中进一步所述,在一个实施例中,可以提供不同的非语言提示来帮助用户确定特定事件的上下文重要性。
在图8中借助图形时间线示出了与图6所示的事件88相对应的音频反馈可以如何在一个时间段上退化或进化的示例,其中所述图形时间线描述的是设备10在大小为120分钟的时间段上的操作。如所示,事件88在该时间段中可以多次发生,具体而言是在时间t0(0分钟),t20(20分钟),t35(35分钟),t55(55分钟)以及t110(110分钟)发生。虽然事件88在这其中的每一个时间通常都是相同的,但是为了更好地区分每次发生,在这里为这些事件标记了参考数字88a、88b、88c、88d和88e。本示例假设了一个被设置为45分钟的升级时间间隔,其可以由设备10的制造商或是用户接口34的编程者预先设置,或者可以后续由用户配置(例如借助图4所示的用户偏好96),此外还假设,在时间t0之前的升级时间间隔中(例如之前从-t45到t0的45分钟里),事件88并未发生。
以时间t0为开始,事件88a的发生可能会导致在屏幕104上显示图6的视觉通知窗口140,并且还会导致选择和回放完全冗长度的音频项150。举例来说,事件统计数据存储单元82可以向选择逻辑86指示,就在时间t0之前的升级时间间隔(45分钟)里没有发生过类似的事件88。基于该数据,选择逻辑86可以选择并开始回放完全冗长度的音频项150,以便与显示关于事件88a的发生的视觉信息(例如视觉通知窗口140)基本同时地提供音频信息。一旦开始回放音频项150,音频用户接口38可以使用定时器98来建立从时间t0到时间t45的升级窗口157。如果事件88在该窗口157中再次发生,那么选择逻辑86可以使该音频反馈退化。
在本示例中,在时间t20再次发生了事件88b。一旦发生了事件88b,事件统计数据存储单元92可以向选择逻辑86指示,在不到45分钟(例如升级间隔)之前发生了该事件88a。由此,由于事件88b是在升级窗口157(例如从t0到t45)内发生的,选择逻辑86可以识别出在最近一次发生事件88的过程中播放的音频项(在本示例中是处于时间t0的音频项150),并且会使该音频反馈退化一个冗长等级。这样可使得音频项152被选择和回放,其中如图7所示,该音频项152与音频项150相比要低一个冗长等级。一旦在时间t20发生音频项152的回放,则升级窗口157的剩余部分将会变得不相干,并且将会建立从时间t20到时间t65的新的“当前”升级窗口158。
此后,在时间t35再次发生了事件88c。由于事件88c是在升级窗口158(例如从t20到t65)内发生的,因此,音频用户接口38的选择逻辑86可以通过选择和回放音频项154来使得与事件88c相关联的音频反馈进一步退化,其中音频项154与先前播放的音频项152相比要低一个冗长等级。一旦在时间t35发生音频项154的回放,则升级窗口158的剩余部分将会变得不相干,并且将会建立从时间t35到时间t80的与事件88c相关联的升级窗口159,其将变成当前的升级窗口。
在事件88c之后,在时间t55再次发生了事件88d。同样,由于事件88d是在当前升级窗口159(例如从t35到t80)内发生的,因此,音频用户接口38的选择逻辑86可以将音频反馈的冗长度再降低一个等级,由此使得与事件88相关联的音频反馈完全退化到非语言音频项156。此后,一旦在时间t55发生非语言音频项156的回放,则会建立从时间t55到时间t100的与事件88d相关联的新的升级窗口160,并且先前升级窗口159的剩余部分将会变得不相干。换句话说,只要事件88在先前最近一次发生事件88之后的当前升级时间窗口中继续发生,则选择逻辑86可以继续使得与事件88相对应的音频反馈退化。然而应该指出的是,由于在本示例中不能进一步使音频项156退化,因此,窗口160中事件的再次发生可能导致选择逻辑86再次选择和播放音频项156。
接下来,在时间t110,事件88e再次发生。然而,这次发生是在升级窗口160之外。在这种情况下,选择逻辑86可以被配置成使音频反馈进化。例如,在一个实施例中,无论最近一次播放的音频项(例如音频项156)的冗长级别如何,选择逻辑86都可以通过在时间110选择和回放音频项150而将音频反馈的冗长度“复位”到完全冗长度。在另一个实施例中,选择逻辑86可以相对于最近一次播放的音频项将音频反馈的冗长度提高一个等级,来使音频反馈进化。举例来说,在本示例中,通过在时间t110选择音频项154,可以在音频反馈的冗长度方面相对于最近一次播放的音频项156提升一个等级。
可以想到的是,除了触发音频反馈之外,每一次事件88a-88e的发生还可触发在GUI 36上显示视觉反馈,例如借助图6所示的视觉通知窗口140来显示。进一步地,每一次事件88a-88e的发生可以存储在事件统计数据存储器92中,以便提供音频反馈选择逻辑86在为未来发生事件88确定适当的音频反馈时可使用的统计数据。
虽然图8所示的图形时间线示出的是对于在当前升级窗口内发生的每一次后续事件88具有恒定的退化速率(例如,一个冗长等级),但是本技术的其他实施例也可以不仅基于事件88的发生相对于先前的发生的邻近度还至少部分基于用户对事件88引起的视觉反馈和/或音频反馈的反应或响应,来改变音频反馈退化的速率。
举例来说,一个使音频反馈退化的实施例可以对“回放终止事件”的发生加以考虑。如这里使用的,回放终止事件指的是由用户做出的在完成音频项回放之前终止其回放的响应。举例来说,参考图6,在一个实施例中,用户可以在所选择的音频反馈项(例如音频项150、152、154和156之一)的回放期间但是在其完成之前选择图形按钮144,以引起回放终止事件。回放终止事件还可以使用其他动作传达给设备10,例如基于手势的动作(例如轻轻晃动设备10)。相应地,设备10可以将回放终止事件解释成是用户对视觉通知窗口140和所选择的音频反馈之一或二者所提供的信息不感兴趣的响应。
在图9中借助图形时间线显示了一个示出了回放终止事件可如何影响音频反馈退化的示例,其中该图形时间线描述的是设备10在120分钟的时间段上的操作,在该时间段中,在时间t0、t30和t110发生了事件88。为了加以区分,在这里使用了参考数字88f、88g和88h来标引这些发生。此外,对于图9所示的示例来说,在这里假设了45分钟的升级间隔。此外还假设就在时间t0之前的升级时间间隔(例如之前从-t45到t0的45分钟)内没有发生事件88。
以时间t0为开始,事件88f的发生可能导致在屏幕104上显示图6的视觉通知窗口140,并且还会导致在时间t0选择和回放完全冗长度的音频项150。在回放音频项150的过程中,检测到回放终止事件161,其可能导致提早终止音频项150的回放。举例来说,这种状况有可能是用户在完成音频项150的回放之前选择了图形按钮144的结果,或者可能是终止手势(例如晃动设备10)或是在完成音频项150的回放之前将其终止的其他任何类型的动作的结果。事件88f以及回放终止事件161的发生被存入事件统计数据存储器92。此外,建立从时间t0到时间t45的用于检测事件88的后续发生的升级窗口162。
接下来,事件88g在时间t30再次发生。一旦发生了事件88g,事件统计数据存储单元92可以向选择逻辑86指示曾检测到与先前在t0发生事件88f相关联的回放终止事件161。在所示出的实施例中,这可能导致选择逻辑86通过选择和回放非语言音频项156来使音频反馈完全退化,由此绕过音频项152和154所代表的冗长级别。建立从时间t30到时间t75的新的升级窗口163。可以想到的是,类似图8的实施例,如果后续在窗口163内发生了事件88,那么可能导致再次播放音频项156,而如果后续在窗口163之外发生了事件88,那么可能导致音频反馈被复位到完全冗长度(例如音频项150),如图9中的时间t110显示的那样。
在一些实施例中,除了影响音频反馈行为之外,回放终止事件(例如161)还有可能影响视觉反馈行为。举例来说,参考图10,描述了在图9中的时间t30发生事件88g的过程中的屏幕104。如所示,由于在最近一次发生该事件(例如时间t0处的88f)的过程中检测到了回放终止事件161,因此,先前在图6的屏幕104的中心出现的视觉通知窗口140将被退化为在屏幕104的右上角附近出现的不太突出且较小的栏164。通知栏164包括视觉通知消息165,其中与图6所示的冗长度较高的通知消息142相比,该消息165同样也退化了。
通知栏164可以包括图形元素166和168。通过选择图形元素166,用户可以扩展通知栏164,由此导致改为显现窗口140。在一个实施例中,GUI 36可以仅仅短暂地显示通知栏164,例如显示5到10秒的时段,此后则会自动从屏幕104中移除栏164。此外,用户可以通过选择图形按钮168来选择手动移除通知栏164。
图11A中的流程图描述的方法169以及图11B所示的流程图描述的方法174对在上文中参考图5-10示出的用于使音频反馈退化和进化的各种技术进行了一般性概括。
首先参考图11A,方法169示出的是一种基于期望的冗长级别来提供进化/退化的音频反馈的更基本的方法。举例来说,方法169始于步骤170,其中设备10的音频用户接口38检测到在第一时间(T(x))发生了触发或请求音频反馈的事件(例如表明图6的功能不可用的指示)。接下来,在步骤171,与检测到的事件相对应的音频项集合被识别,由此,该集合内的各个音频项可以具有与集合中的每一个其他音频项不同的冗长级别。
此后,在步骤172,与期望的冗长级别相对应的第一音频项被选择,如图11A所示,该冗长级别可以至少部分基于从步骤170中检测到的事件是否在时间T(x)之前的特定时间间隔(例如升级窗口)内发生过而确定。在一个实施例中,如果该事件先前在该特定时间间隔内发生过,那么相对于前一次发生该事件的过程中选择的音频项的冗长度,期望的冗长级别可以退化。同样,如果先前在该特定时间间隔内没有发生该事件,那么相对于前一次发生该事件的过程中选择的音频项的冗长度,期望的冗长级别可以进化。随后,在步骤173,回放所选择的音频项(例如具有期望的冗长级别),以便响应于检测到的事件来提供音频反馈。
图11B示出的是描述了以上参考图8-9所述的附加特征的更详细的流程图。例如,方法174始于步骤175,其中设备10的音频用户接口检测到发生了触发或请求音频反馈的事件(例如表明图6的功能不可用的指示)。接下来,在步骤176中将会识别事件统计数据集合和音频反馈数据集合,其中音频反馈数据集合可以包括与在步骤175检测到的事件相对应的具有不同冗长级别的多个音频项。
基于来自步骤176的事件统计数据,在判定框177,选择逻辑86可以确定该事件是否在之前最近一次发生该事件之后的升级窗口内发生过。如果该事件没有在该升级窗口内发生过,那么方法174继续进行至步骤178,从而以完全的冗长度来提供音频反馈。如上所述,在替换实施例中,与提供完全冗长度不同,选择逻辑186可以改为使音频反馈进化一个等级。举例来说,如图11所示,如果事件没有在该升级窗口内发生过,那么作为替换,方法174可以继续至步骤180,其中在步骤180,与之前最近一次发生的事件相对应的最近一次选择的音频项将被识别,并且在步骤182,与该先前选择的音频项相比,音频反馈进化一个等级并且由设备10回放。
再次参考判定框177,如果事件在先前的发生之后的升级窗口中发生过,那么方法174将会继续至判定框186,在判定框186中,确定该先前的发生是否伴随有回放终止事件(例如161)。如果检测到与先前的事件发生并存的回放终止事件,那么方法174继续至步骤188,并且选择和回放来自音频反馈数据集合(例如148)的最为退化的音频项。作为示例,最为退化的音频项可以是非语言的音频提示(例如音频项156)。
如果判定框186确定在先前的事件发生过程中没有检测到回放终止事件,那么在步骤190,与该先前发生的事件相对应的最近一次选择的音频项被识别。在步骤192,确定该最近一次选择的音频项是否已经是来自步骤176的音频反馈数据集合中最为退化的音频项。如果确定该最近一次选择的音频项是来自该集合的最为退化的音频项,则在步骤188选择该音频项作为当前音频项并进行回放。如果该最近一次选择的音频项不是来自该集合的最为退化的音频项,那么选择逻辑86可以使音频反馈退化一个等级,并且播放相应的退化的音频项。
继续图12和13,根据本公开的方面示出了可以如何基于事件的上下文重要性来改变音频反馈的实施例。如上文中定义的那样,上下文重要性指的是响应于设备上的事件而提供的信息相对于提供该信息的上下文的重要性。
首先参考图12,该图示出的是描述了有两个具有不同上下文重要性特征的事件发生的一系列屏幕图像。图12所示的屏幕图像可以是在图3所示的手持设备70上显示的GUI 36的一部分。举例来说,从GUI 36的主页屏幕72开始,用户可以通过选择图标74来启动媒体播放器应用。作为示例,媒体播放器应用74可以是在AppleInc.提供的产品型号iPod或上运行的应用。此外,如图12所示,GUI 36可以是也由Apple Inc.提供的或操作系统的某一版本。
一旦选择了图标74,用户可被导航至媒体播放器应用74的主页屏幕200。如图12所示,屏幕200可以最初显示播放列表204的清单202,每一个播放列表都可以包括用户定义的多个媒体文件。例如,播放列表204可以构成来自整个音乐专辑的所有歌曲文件,并且可以是设备10的用户所选择的媒体文件的定制“混合”。屏幕200还包括图形按钮206、208、210、212和214,其中每一个按钮都可以对应于特定的功能。举例来说,如果用户从屏幕200离开,那么通过选择图形按钮206,可以让用户返回到屏幕200。图形按钮208可以基于与每一个媒体文件相关联的艺术家名称来按字母顺序组织存储在设备10上的媒体文件。图形按钮210可以代表用于排序以及在设备10上显示专门与音乐对应的媒体文件(例如歌曲文件)的功能。例如,通过选择图形按钮210,可以在可由用户导航的清单中按字母顺序显示存储在设备10上的所有音乐文件。此外,图形按钮210可以代表使用户可访问存储在设备10上的视频文件的功能。最后,图形按钮214可以为用户提供可供用户配置以进一步定制设备10和媒体播放器74的功能的选项列表。
如上所述,在设备10的工作过程中,如上文中定义的包括用户事件和系统事件在内的各种事件都有可能发生。例如,在屏幕200上可能显示视觉通知窗口218,以便指示响应于用户发起的允许媒体播放器74接受到来的网络连接的动作而发生了用户事件216。如图12所示,窗口218可以包括视觉通知消息220,此外还可以包括在被选择的情况下拒绝到来的网络连接的决定按钮222,以及在被选择的情况下允许到来的网络连接的决定按钮224。
在该上下文中,由于需要用户输入来执行或者不执行所请求的操作(例如允许到来的网络连接),因此,事件216的“上下文重要性”可以相对较高。换言之,在没有来自用户的响应的情况下,设备10将无法继续执行处理,因为用户没有确认或拒绝对到来的网络连接的允许。由此,与事件216相关联的音频反馈数据集合至少可以包括在被回放时表示出事件216的高上下文重要性的非语言音频音调226,其目标是提示用户对视觉通知窗口218做出响应。例如,非语言音调226可以包括容易辨识的警报声、啁啾声、蜂鸣声、或是任何其他能够强调事件216的上下文重要性的非语言音频音调(例如音高较高的声音、较强的音量、较长的回放时间等等)。换句话说,虽然事件216也可以与一个或多个语言音频项相关联,但在音频用户接口38选择非语言音频项226或者用户将设备10配置成只回放非语言音频反馈的情况下,非语言音频项226可有助于在听觉上将事件216与上下文重要性较低的事件区分开来。
作为示例,初始与事件216相比具有较低上下文重要性的事件可以是低电池电量警报228形式的系统事件。举例来说,一旦发生了低电池电量警报事件228,则在屏幕200上会显示视觉通知窗口230,并且该窗口230包含视觉通知消息232,表明设备10的电源30(图1)只剩下了其完全充电容量的20%的电力。窗口230还包含图形按钮234,用户可以选择该按钮来从屏幕200中移除窗口230。由此,与事件216不同,设备10不需要一个决定输入。
理想情况下,用户在心理上将会处理窗口230提供的通知,并且采取必要的动作来为电源30重新充电。然而,无论用户是否立即开始为电源30重新充电,设备10短期内都将会继续工作。就此而论,与事件216相比,事件228的上下文重要性通常被认为相对较低。由此,事件228可以关联有与非语言音频项226相比较不显著(例如,较低的音高、较弱的音量、较短的回放时间等等)的非语言音频项236,由此表示出事件228的较低的上下文重要性。
虽然事件228最初可被归类为具有低的上下文重要性,但是应该理解,事件228发生时的上下文有可能随时间改变。例如,通知230可以是基于大小为20%的低电力通知阈值的第一警报。然而,假设用户选择没有采取行动来补充电源30,那么设备10将会继续消耗剩余电力,由此进一步耗尽电源30。因而,在一些实施例中,用户接口34可以被配置成在一个或多个更低的阈值处提供附加警报。举例来说,在一个实施例中,当电源30中的剩余电量消耗至总电量的1%时,用户接口34可以提供后续的低电力警报。在该上下文中,该1%的警报可被视为具有高的上下文重要性,因为当电源30在未被重新充电或更换的情况下必然会完全耗尽时,设备10将无法继续工作。由此,后一个示例代表的是这样一个实施例,其中多个非语言项(例如具有相同的冗长级别)与一个共同的事件相关联,由此,在初始的20%警报事件中,音频用户接口38可以播放指示低上下文重要性的非语言音频项,而在后续的1%警报事件期间,可以播放指示高上下文重要性的另一个非语言音频项。
在另外的实施例中,事件226或230的上下文重要性可以基于预先编程的信息来确定(例如对事件进行编程,以使其具有高或低的上下文重要性特征),其中所述信息可以由设备10的制造商是音频用户接口的编程者确定,或者可以在以后由用户进行配置/修改,例如通过用户偏好设置96(图4)来进行配置/修改。在其他实施例中,事件226或230的上下文重要性可以是基于先前的设备行为和/或用户在先前的一次或多次发生该用户接口事件的过程中如何与设备交互而自适应的或学习的。举个例子,在一个实施例中,如果确定与当前事件(例如226或230)类型相同的事件在当前事件发生之前的紧挨着的特定时间间隔内频繁发生,那么该当前事件可被识别成具有较高的上下文重要性,而如果相同类型的事件在当前事件发生之前的紧挨着的特定时间间隔内很少发生或者根本没有发生,那么可以将该当前事件识别成具有较低的上下文重要性。
图13提供的是描述了基于如图12所示的上下文重要性来改变音频反馈的方法240的流程图。举例来说,以步骤242为开始,方法240可以检测到请求音频反馈的事件。接下来,在步骤244,事件的上下文重要性被确定。举例来说,如上所述,在一些情况中,该步骤可以包括确定用户方的行动是否是设备继续工作所必需的。随后,在步骤246,基于步骤244确定的事件的上下文重要性来选择音频项。举例来说,如果事件具有低的上下文重要性,那么可以回放较不显著的非语言音调236,如果事件具有高的上下文重要性,那么可以回放更为显著的非语言音调226。
继续至图14-18,根据本公开的方面,示出了阐释可以如何基于用户导航设备10上显示的项目列表的方式来改变音频反馈的实施例。举例来说,首先参考图14,示出的是描述用户可以如何访问媒体播放器应用74中的歌曲列表的屏幕图像。屏幕72和200与图12所示的屏幕类似,并且描述的是启动媒体播放器应用74以及从主页屏幕72导航至屏幕200,其中屏幕200显示的是播放列表204的清单202。
通过选择图形按钮210,用户可导航至屏幕250,其中屏幕250可以按字母顺序显示存储在设备10上的音乐文件(歌曲)254的可导航列表252。举例来说,如图14所示,列表252中的第一个歌曲用参考数字256来标引。为了选择特定的歌曲进行回放,用户可以使用设备10的输入结构14(例如触摸屏)来选择所显示的歌曲。屏幕250还可以包括滚动条元素258,以便提供滚动功能。从而,如果音乐文件254的列表252超出了设备10的显示容量,那么用户可以与滚动条元素258交互以导航列表252的剩余部分。一旦选择了特定项(在这里用参考数字260标引)来进行回放,用户就可以继续至屏幕264。
如屏幕264中所示,在这里显示的是关于所选择的音乐文件260的信息。举例来说,所显示的信息可以包括录制艺术家的名称、所选择的音乐文件260的标题、以及在一些实施例可以包括与所选择的音乐文件260相关联的专辑。屏幕264还可以显示专辑封面266以及图形按钮268、270和272。应该了解的是,图形按钮268可以允许用户暂停或者取消暂停所选择的音乐文件260的回放。此外,如果当前选择的媒体文件260是播放列表的一部分,那么图形按钮270和272可以代表返回到播放列表中的前一个文件或是继续至播放列表中的后一个文件的功能。可以想到的是,如果播放列表是以随机模式或乱序模式播放的,那么图形按钮270和272的功能可以是从列表中选择一个随机文件进行回放。屏幕264还包括滑动条元素274,用户可以操纵该元素来控制音频回放的音量。对于以下结合图15-17描述的列表导航示例来说,假设用户暂停所选择的音乐文件260的回放(通过选择图形按钮268),并且通过选择屏幕264上的图形按钮262返回到屏幕250上的列表252。
现在参考图15-17,根据本公开的方面,示出了可以如何基于导航诸如歌曲列表252之类的列表的速度来改变音频反馈的示例。在所示出的示例中,以初始列表项256为开始,列表252中的每一个歌曲文件都被给予一个列表位置参考标签,其中所述标签以用于第一个项256的L0为开始,接下来是用于第二个项的L1,依此类推。应该理解的是,这里公开的技术可以应用于列表的垂直导航和列表的水平导航二者。
如图15所示,列表252是以第一速度280导航的。第一导航速度280可以相对较慢,并且可以在从一个列表项转换到另一个列表项之间有足够的时间以便为每一个列表项提供完全冗长度的音频反馈。举例来说,在所描述的示例中,用户可以通过从第一列表项L0开始向下滚动列表并且停在列表项L3来开始导航列表252。在这个操作过程中,如下表1所示,音频用户接口38可以为每一个歌曲L0、L1、L2和L3说出每一个歌曲的标题以及录制艺术家的名称:
表1:以第一速度进行且具有完全冗长度音频反馈的列表导航
根据本公开的技术,音频用户接口38可以被配置成与导航速度280的轻微变化相适配。例如,在一种情况下,导航速度可以略微提高,从而列表项之间的转换时间减小以使得分配的时间足以仅仅说出两个音频项之一(例如歌曲标题或艺术家名称)。在一个实施例中,音频用户接口38仍旧可以提供与歌曲标题信息相关的完全冗长度音频反馈,但是可以忽略与艺术家名称相关的信息。
接下来,图16显示的是导航速度282并未在列表项之间提供足够的转换时间来允许完全冗长度音频反馈的示例,其中所述导航速度282与图15的导航速度280相比明显增大。作为示例,导航速度可以基于每秒导航的列表项数量来表述(例如列表项/秒)。作为示例,导航速度282可以是大约每秒2个列表项(或是每半秒1个列表项),而图15所示的导航速度280则明显更慢,例如每秒0.25个列表项(或是每4秒1个列表项)。
在图16的当前示例中,用户可以使用导航速度282从第一列表项L0导航到列表项L11。在以速度282导航时,为了适应各个列表项之间的减小的转换时间,在一个实施例中,如果列表项是某个字母群组(例如,以“A”、“B”等开头的歌曲标题)内的第一个列表项,那么音频用户接口38可以通过仅仅说出与该列表项的字母次序相对应的字母以及为每一个其他列表项提供非语言音调,来使得与该列表导航相关联的音频反馈退化。在下表2中描述了该实施例。
列表项 | 音频反馈 |
L0 | 说出字母“A” |
L1 | 非语言音调 |
L2 | 非语言音调 |
L3 | 非语言音调 |
L4 | 说出字母“B” |
L5 | 非语言音调 |
L6 | 非语言音调 |
L7 | 非语言音调 |
L8 | 指示新内容的非语言音调 |
L9 | 说出字母“C” |
L10 | 非语言音调 |
L11 | 说出字母“D” |
表2:以第二速度进行且具有冗长度减小的音频反馈的列表导航
此外,如列表项L8所示,音频用户接口38还可以被配置成基于列表项的“新鲜度”来选择性地提供非语言音调。例如,列表项L8可以代表一个最近从诸如Apple Inc.提供的服务之类的在线数字媒体服务那里购买的歌曲。由此,当在导航过程中到达该较新的歌曲L8时,为了强调歌曲L8的新鲜度,音频用户接口38可以播放一个与为较老的内容(例如L6、L7等等)播放的非语言音调相比更为显著的非语言音调(例如音高更高的蜂鸣声)。应该了解的是,“新鲜度”阈值可以通过设备10上的用户偏好96来配置。作为示例,用户可以将设备10配置成将最近三天购买或下载的内容识别为新内容。
在另一个实施例中,对“较新的”内容的识别可以包括定义多个新鲜度层级。举例来说,除了使用3天阈值来识别设备10上的最新内容之外,还可以设立一个用于检测相对而言仍然算是新近(recent)内容的第二阈值(例如14天)。在这样的实施例中,不同的非语言音调可以用于那些被识别成是最新项和新近项的列表项,其中用于新近项的非语言音调与关联于最新项的非语言音调相比较为不显著,但是用于新近项和最新项的非语言音调与用于未被识别为新或新近(例如早于14天的项目)的项的非语言音调相比要显著得多。实际上,本领域技术人员将会了解,在本技术的各种实施例中,可以使用用于区分设备10上存储的内容的年龄的任何数量的非语言音调(例如基于由相应阈值定义的任何数量的层级)。
继续至图17,该图提供的是描述了以速度284来导航列表252的附加示例,其中与图16的速度282相比,速度284更大。作为示例,导航速度284可以是大约每秒4个列表项。在本示例中,用户可以使用导航速度284从第一列表项L0导航至列表项L18。在以速度284导航时,为了适应各个列表项之间进一步减小的转换时间,音频用户接口38可以使音频反馈进一步退化,从而仅仅为一部分列表项提供音频反馈。举例来说,如下表3所示,在一个实施例中,音频用户接口38可以通过说出与每一个字母群组(例如以“A”、“B”等等开头的歌曲标题)内的第一个列表项的列表项字母次序相对应的字母以及每三个列表项才播放非语言音调(例如项目L2、L5、L8和L17),来使得与该列表导航相关联的音频反馈退化。对于有资格回放非语言音调并且也是某个字母群组中的第一个项的列表项来说,为其说出的可以是字母而不是非语言音调(例如项目L11和L14)。
列表项 | 音频反馈 |
L0 | 说出字母“A” |
L1 | |
L2 | 非语言音调 |
L3 | |
L4 | 说出字母“B” |
L5 | 非语言音调 |
L6 | |
L7 | |
L8 | 指示新内容的非语言音调 |
L9 | 说出字母“C” |
L10 | |
L11 | 说出字母“D” |
L12 | |
L13 | |
L14 | 说出字母“E” |
L15 | |
L16 | |
L17 | 非语言音调 |
L18 | 说出字母“G” |
表3:以第三速度进行且具有冗长度减小的音频反馈的列表导航
应该了解的是,在其他实施例中,当列表导航速度继续增大时,提供非语言音调的频率可以进一步减小(例如每四个、每五个、或每六个项)。此外还应该理解,列表252的导航未必是以恒定速度进行的。因此,音频用户接口38可以相应地调整音频反馈的冗长度。举例来说,如果用户初始以很慢的速度(例如速度280)导航列表252,并且逐渐提高至较快的速度(例如速度284),那么音频用户接口38最初可以提供多个数据片段(例如歌曲标题和艺术家名称)的完全冗长度的音频反馈,并且可以使冗长度逐渐退化以仅仅提供歌曲标题,最终达到与表3所示相似的退化的冗长度方案。如果用户随后逐渐降低导航速度,那么音频反馈也可以逐渐地进化回到完全冗长度模式。
此外,虽然本技术是结合图形用户接口示出的,但是应该理解,某些实施例可能只包括音频用户接口。在这样的实施例中,由于用户可以在没有相应视觉接口的情况下导航项目列表(例如使用滚轮),因此,上述音频反馈技术同样是可以应用的。如上所述,没有显示器22并且由此没有图形用户接口的设备10的实施例可以是Apple Inc.提供的产品型号Shuffle。
在图18所示的流程图中描述了方法290,其中该方法一般性概括了参考图15-17以及表1-3示出的实施例描述的用于在列表导航过程中改变音频反馈的各种技术。方法290始于检测到列表导航事件的步骤292。举例来说,列表导航事件可以包括从一个列表项(例如L0)到后续列表项(例如L1)的转换。在步骤294,当前列表项被识别。此后,在判定框296,确定用户的导航速度是否允许完全冗长度的音频反馈。作为示例,在一个实施例中,导航速度可以是通过计算在紧邻的两个或更多个之前的列表项(或者,如果用户正在向上导航,那么也可以是之后的项)之间发生的转换的速度的平均值来确定的。如果确定导航速度允许完全冗长度的音频反馈,那么方法290继续进行至步骤298,由此回放与当前选择的列表项相关联的一个或多个完全冗长度的音频项。
如果判定框296的导航速度不允许完全冗长度的音频反馈,那么方法290继续进行至判定框300,在这里确定当前列表项是不是某个字母群组中的第一个项,如果是的话,则音频用户接口38说出该字母群组的字母,并且将其作为音频反馈来提供(步骤302)。如果当前列表项不是某个字母群组中的第一个项,那么方法290前进至判定框304,由此确定当前列表项的新鲜度。如果将当前列表项识别为新内容,那么如步骤306所示,播放一个表明当前列表项的新鲜度的显著的非语言音频项。如果没有将当前列表项识别为新内容,那么如步骤308所示,播放一个较不显著的非语言音频项。
图19-21描述的是示出根据一个实施例可以如何在设备10上配置音频反馈选项的各种屏幕图像。举例来说,首先参考图19的屏幕300,该图示出的是用于操作系统的GUI 36的主“主页”屏幕312。作为示例,操作系统可以是Apple Inc.提供MAC操作系统的版本。如图2所讨论的,GUI 36可以提供包含各种图标56的停靠栏58。通过选择图标316,可以导致显示图形窗口318。如所示的,图形窗口318包括附加的图标56,其可以涉及设备10的系统偏好的各个方面的配置。特别地,图形图标320可以代表用于配置音频用户接口38的功能。
参考图20,通过选择图标320,可以导致显示图形配置窗口322。最初,配置窗口322包括图形开关324、326、328和330。当前处于“ON”位置的开关324可以启用或禁用音频用户接口38,而开关326、328和330则可以切换以允许音频用户接口38在不同的模式下工作。举例来说,当前处于“ON”位置的开关326表明当前启用的是恒定的完全冗长度模式,并且当前禁用了音频反馈退化/进化(开关328)和仅使用非语言音频反馈(开关330)的附加模式。
图21描述的是在用户执行了各种配置步骤之后的配置窗口322。举例来说,如所示的,开关326被切换到“OFF”位置,以便禁用恒定的完全冗长度模式,并且开关328被切换至“ON”位置,以便指示启用了自适应退化/进化模式。一旦启用了退化/进化模式,就可以显示一组附加配置参数322,并且用户可以对其进行配置。举例来说,用户可以通过将图形开关334、338、340、342、344、346和350切换到期望的位置来启用或禁用各个配置参数332。如上文中参考图8和9所讨论的,用户还可以使用选择字段336来规定升级时间。此外,如上文中参考图15-17所讨论的,用户可以使用选择字段348来规定用于在列表导航过程中区分较新和较老内容的阈值。
总的来说,上文给出的实施例提供了一种智能且自适应的技术,借助该技术,电子设备(例如设备10)能够响应于用户输入和/或响应于外部激励来使音频反馈冗长度进化和退化。举例来说,基于用户动作和/或用户定义的偏好(例如偏好96),用于使音频反馈退化和/或进化的特定动作可以是动态的和自适应的。作为示例,如以上的图9所示,检测到回放终止事件形式的用户动作可以使设备10提高退化速率(例如,由于表明了用户对与终止事件相对应的音频反馈没有兴趣,因此使冗长度更快地退化)。此外,诸如低电力事件或检测到网络连接(图12)之类的并非由用户输入引发的外部激励也有可能导致设备10提高或降低音频反馈的冗长度(例如基于上下文重要性)。实际上,当前描述的技术提供一种稳健且自适应的系统来调整音频用户接口所提供的音频反馈的冗长度。
更进一步,应该理解的是,在这里仅仅通过举例提供了如上所述与自适应改变由音频用户接口提供的音频反馈有关的各种技术。因此,应该理解的是,本公开不应该被解释成是仅限于上文提供的示例。实际上,如上所述的音频反馈技术的大量变形都是可以存在的。更进一步,应该了解的是,上述技术可以用任何适当的方式实施。例如,一起被配置成实施当前公开的技术的各个方面的音频用户接口38和音频反馈选择逻辑86可以用硬件(例如适当配置的电路)、软件(例如借助包含了存储在一个或多个有形计算机可读介质上的可执行代码的计算机程序)、或是通过使用硬件与软件部件的组合来实施。
上文描述的具体实施例是作为示例来示出的,应该理解,这些实施例很容易采用各种修改及替换形式。此外还应该理解,权利要求并不局限于所公开的特定形式,而是包含了落入本公开的实质和范围以内的所有修改、等同及替换。
Claims (30)
1.一种方法,包括:
使用电子设备上的处理器来执行:
检测到在第一时间在电子设备上发生了请求音频反馈的用户接口事件;
识别与该用户接口事件相关联的多个音频项,其中所述多个音频项中的每一个具有不同的冗长级别;
从所述多个音频项中选择与第一期望冗长级别相对应的第一音频项,其中第一期望冗长级别是至少部分基于该用户接口事件是否先前在第一时间之前的特定时间间隔内发生过而确定的;以及
通过使用音频输出设备在电子设备上回放所选择的第一音频项来提供音频反馈。
2.根据权利要求1所述的方法,其中选择第一音频项包括:
如果该用户接口事件先前没有在第一时间之前的特定时间间隔内发生过,则从所述多个音频项中选择具有最高冗长级别的音频项;以及
如果该用户接口事件先前在第一时间之前的特定时间间隔内发生过,则确定从所述多个音频项中选择的音频项在先前发生该用户接口事件期间的冗长级别,并且从所述多个音频项中选择与先前选择的音频项相比至少低一个冗长等级的音频项。
3.根据权利要求2所述的方法,包括:
检测到在第二时间在电子设备上后续发生了该用户接口事件;
从所述多个音频项中选择与第二期望冗长级别相对应的第二音频项,其中所述第二期望冗长级别是基于第一时间与第二时间之间的持续时间而确定的;以及
使用音频输出设备在电子设备上播放所选择的第二音频项。
4.根据权利要求3所述的方法,其中选择第二音频项包括:
如果第一时间与第二时间之间的持续时间小于或等于所述特定时间间隔,则从所述多个音频项中选择与第一音频项相比至少低一个冗长等级的音频项;以及
如果第一时间与第二时间之间的持续时间大于所述特定时间间隔,则从所述多个音频项中选择与第一音频项相比至少高一个冗长等级的音频项。
5.根据权利要求4所述的方法,其中选择与第一音频项相比至少高一个冗长等级的音频项包括:不管第一音频项的冗长级别如何,都选择所述多个音频项中具有最高冗长级别的音频项。
6.根据权利要求2所述的方法,其中选择第一音频项包括:
确定在先前发生该用户接口事件的过程中是否检测到了回放终止事件;以及
如果在先前发生该用户接口事件的过程中检测到了回放终止事件,那么无论先前选择的音频项的冗长级别如何,都从所述多个音频项中选择具有较低冗长级别的音频项。
7.根据权利要求6所述的方法,其中具有较低冗长级别的音频项包括非语言音频项。
8.根据权利要求6所述的方法,其中用户终止事件包括:提早终止先前选择的音频项的回放的用户输入或手势。
9.根据权利要求6所述的方法,包括:
如果在先前发生该用户接口事件的过程中没有检测到回放终止事件,则使用图形用户接口来与所选择的第一音频项的回放至少部分同时地显示第一视觉通知;以及
如果在先前发生该用户接口事件的过程中检测到了回放终止事件,则使用图形用户接口来与所选择的第一音频项的回放基本同时地显示第二视觉通知,其中与第一视觉通知相比,第二视觉通知较不冗长。
10.一种方法,包括:
使用电子设备上的处理器来执行:
识别存储在电子设备上的可导航数据项集合;
接收来自电子设备用户的与导航事件相对应的输入,其中该导航事件包括在可导航数据项集合内从第一数据项转换到第二数据项,以使得第二数据项变成当前选择的数据项;
检测与该导航事件相对应的导航速度;以及
至少部分基于该导航速度来改变与当前选择的数据项相关联的音频反馈。
11.根据权利要求10所述的方法,其中改变音频反馈包括:
对于第一导航速度,回放具有完全冗长级别的第一音频项;以及
对于第二导航速度,回放与第一音频项相比较不冗长的第二音频项;
其中第二导航速度大于第一导航速度。
12.根据权利要求11所述的方法,所述可导航数据项集合在电子设备上是按字母顺序排序的,并且其中选择和回放第二音频项包括:
如果当前选择的数据项是一个字母群组中的第一个项,则回放与该字母群组相对应的字母,否则,回放非语言音频项。
13.根据权利要求11所述的方法,其中回放第二音频项包括:
确定当前选择的数据项是否包括新内容;
如果当前选择的数据项不包括新内容,则回放第一非语言音频项;以及
如果当前选择的数据项包括新内容,则回放第二非语言音频项;
其中与第一非语言音频项相比,第二非语言音频项在听觉上更为显著。
14.根据权利要求13所述的方法,其中确定当前选择的数据项是否包括新内容包括:
确定电子设备获取该当前选择的数据项的时间;
确定该获取时间是否处于当前时间之前的特定时间间隔内;以及
如果该获取时间处于该特定时间间隔内,则将当前选择的数据项识别成是新内容,否则,将当前选择的数据项识别成不是新内容。
15.根据权利要求10所述的方法,其中存储在电子设备上的可导航数据项集合能够作为列表显示在显示设备上,并且其中,来自用户的输入对应于被配置成导航所显示的列表的滚动命令。
16.一种方法,包括:
使用电子设备上的处理器来执行:
检测到在电子设备上发生了请求音频反馈的用户接口事件;
识别与该用户接口事件相关联的多个音频项;
基于该用户接口事件的上下文重要性来从所述多个音频项中选择音频项;以及
通过使用音频输出设备在电子设备上回放所选择的音频项来提供音频反馈。
17.根据权利要求16所述的方法,其中所述多个音频项至少包括第一音频项和第二音频项,其中第一音频项和第二音频项具有相同的冗长级别。
18.根据权利要求17所述的方法,其中选择音频项包括:
如果上下文重要性高,则选择第一音频项;以及
如果上下文重要性低,则选择第二音频项;
其中与第一非语言音频项相比,第一音频项在听觉上更为显著。
19.根据权利要求18所述的方法,其中如果用户接口事件要求来自电子设备用户的响应,则该用户接口事件的上下文重要性被确定为高。
20.根据权利要求18所述的方法,其中第一音频项和第二音频项中的每一个都包括非语言音频项。
21.根据权利要求18所述的方法,其中第一音频项具有在听觉上更显著的音高、音量、回放时间、或其组合。
22.根据权利要求16所述的方法,其中用户接口事件的上下文重要性是基于存储在所述设备上的信息确定的,其中存储在所述设备上的信息包括下列各项之一:预编程的信息、通过一组用户偏好设置来配置的特定于用户的信息、或是其组合。
23.根据权利要求16所述的方法,其中用户接口事件的上下文重要性是基于就在发生该用户接口事件之前的一段时间内发生相同类型的用户接口事件的频率而确定的。
24.一种电子设备,包括:
至少一个存储设备,被配置成存储多个音频项;
包括音频用户接口的用户接口,其中该音频用户接口包括:
音频反馈选择逻辑单元,被配置成:
检测到发生了请求音频反馈的用户接口事件;
识别与该用户接口事件相关联且具有不同冗长级别的音频项的集合;
基于与该用户接口事件相关联的统计数据来确定期望的冗长级别;
从所述音频项的集合中选择冗长级别与该期望的冗长级别相对应的音频项;以及
启动所选择的音频项的回放。
25.根据权利要求24所述的电子设备,其中所选择的音频项在音频输出设备上被回放,所述音频输出设备包括以下的至少一个:集成的音频输出设备、经由音频连接端口耦接到电子设备的外部音频输出设备、或其组合。
26.根据权利要求24所述的电子设备,包括显示器,其中用户接口包括被配置成响应于用户接口事件而在显示器上显示视觉通知的图形用户接口,其中所选择的音频项的回放与视觉通知的显示是至少部分同时的。
27.根据权利要求24所述的电子设备,其中与用户接口事件相关联的统计数据被存储在所述至少一个存储设备中。
28.根据权利要求27所述的电子设备,其中与用户接口事件相关联的统计数据包括关于先前发生用户接口事件的数据,并且其中期望的冗长级别的确定至少部分基于在最近一次发生用户接口事件期间选择的音频项的冗长级别。
29.一种音频处理逻辑单元,包括:
一个或多个存储设备,被配置成存储多个音频项,其中所述多个音频项中的每一个都能够响应于检测到请求音频反馈事件的音频用户接口事件而被选择以供回放;以及
音频反馈选择逻辑单元,被配置成检测请求音频反馈的音频用户接口事件的发生,从存储在所述一个或多个存储设备中的所述多个音频项中识别具有不同冗长级别并且与该音频用户接口事件相关联的音频项的集合,其中该音频项的集合中的每个音频项具有不同的冗长级别,确定期望的冗长级别,从该音频项的集合中选择冗长级别与该期望的冗长级别相对应的音频项,以及将所选择的音频项输出到音频输出设备。
30.根据权利要求29所述的音频处理逻辑单元,其中期望的冗长级别是基于以下至少之一而确定的:一组用户偏好设置、或与音频用户接口事件相关联的统计数据,其中用户偏好设置和统计数据存储在所述一个或多个存储设备中。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/686,876 | 2010-01-13 | ||
US12/686,876 US8381107B2 (en) | 2010-01-13 | 2010-01-13 | Adaptive audio feedback system and method |
PCT/US2011/020350 WO2011087953A1 (en) | 2010-01-13 | 2011-01-06 | Adaptive audio feedback system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102763072A true CN102763072A (zh) | 2012-10-31 |
CN102763072B CN102763072B (zh) | 2016-01-20 |
Family
ID=43768975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180010303.6A Active CN102763072B (zh) | 2010-01-13 | 2011-01-06 | 自适应音频反馈系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8381107B2 (zh) |
EP (2) | EP3128414A1 (zh) |
KR (2) | KR101798269B1 (zh) |
CN (1) | CN102763072B (zh) |
AU (1) | AU2011205498B2 (zh) |
WO (1) | WO2011087953A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914344A (zh) * | 2013-01-07 | 2014-07-09 | 泰为信息科技公司 | 具有多模式互动机构的计算系统及其操作方法 |
Families Citing this family (235)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) * | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8977584B2 (en) | 2010-01-25 | 2015-03-10 | Newvaluexchange Global Ai Llp | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US10908794B2 (en) * | 2010-08-16 | 2021-02-02 | Iheartmedia Management Services, Inc. | Automated scheduling of multimedia content avoiding adjacency conflicts |
US20120102400A1 (en) * | 2010-10-22 | 2012-04-26 | Microsoft Corporation | Touch Gesture Notification Dismissal Techniques |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8863040B2 (en) * | 2011-01-04 | 2014-10-14 | Google Inc. | Gesture-based selection |
WO2012112277A1 (en) * | 2011-01-26 | 2012-08-23 | Novodigit Sarl | Breath-sensitive digital interface |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
KR101250250B1 (ko) * | 2011-05-18 | 2013-04-03 | 한국과학기술연구원 | 콘텐츠 표시 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
US9043715B2 (en) * | 2011-06-02 | 2015-05-26 | International Business Machines Corporation | Alert event notification |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US20130080968A1 (en) * | 2011-09-27 | 2013-03-28 | Amazon Technologies Inc. | User interface with media content prediction |
US20130100042A1 (en) * | 2011-10-21 | 2013-04-25 | Robert H. Kincaid | Touch screen implemented control panel |
US9167368B2 (en) * | 2011-12-23 | 2015-10-20 | Blackberry Limited | Event notification on a mobile device using binaural sounds |
WO2013122269A1 (ko) * | 2012-02-13 | 2013-08-22 | 엘지전자 주식회사 | 단말기의 사용자 인터페이스 제공 방법 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
KR20140003151A (ko) * | 2012-06-29 | 2014-01-09 | 엘지전자 주식회사 | 디지털 기기 및 그 제어 방법 |
US8965624B2 (en) | 2012-08-14 | 2015-02-24 | Ebay Inc. | Method and system of vehicle tracking portal |
US8868426B2 (en) | 2012-08-23 | 2014-10-21 | Freedom Scientific, Inc. | Screen reader with focus-based speech verbosity |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9886166B2 (en) * | 2012-12-29 | 2018-02-06 | Nokia Technologies Oy | Method and apparatus for generating audio information |
US20140195979A1 (en) * | 2013-01-10 | 2014-07-10 | Appsense Limited | Interactive user interface |
EP2954514B1 (en) | 2013-02-07 | 2021-03-31 | Apple Inc. | Voice trigger for a digital assistant |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US10255038B2 (en) | 2013-04-26 | 2019-04-09 | Microsoft Technology Licensing, Llc | Techniques to present a user interface for the visually impaired |
US20140355665A1 (en) * | 2013-05-31 | 2014-12-04 | Altera Corporation | Adaptive Video Reference Frame Compression with Control Elements |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
WO2014200728A1 (en) | 2013-06-09 | 2014-12-18 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
US9930402B2 (en) * | 2013-06-27 | 2018-03-27 | Verizon Patent And Licensing Inc. | Automated audio adjustment |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
EP2869176A3 (en) * | 2013-10-10 | 2015-06-24 | Lg Electronics Inc. | Mobile terminal and method of controlling therefor |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
WO2016029039A1 (en) * | 2014-08-20 | 2016-02-25 | Puretech Management, Inc. | Systems and techniques for identifying and exploiting relationships between media consumption and health |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US9921805B2 (en) * | 2015-06-17 | 2018-03-20 | Lenovo (Singapore) Pte. Ltd. | Multi-modal disambiguation of voice assisted input |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
FR3044784B1 (fr) * | 2015-12-02 | 2019-08-02 | Sebastien Ricarde | Dispositif de commande vocale d'un appareil de capture d'images |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
FR3050293A1 (fr) * | 2016-04-18 | 2017-10-20 | Orange | Procede d'assistance sonore d'interface de controle d'un terminal, un programme et un terminal |
US10175941B2 (en) | 2016-05-24 | 2019-01-08 | Oracle International Corporation | Audio feedback for continuous scrolled content |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10572031B2 (en) | 2016-09-28 | 2020-02-25 | Salesforce.Com, Inc. | Processing keyboard input to cause re-sizing of items in a user interface of a web browser-based application |
US10642474B2 (en) * | 2016-09-28 | 2020-05-05 | Salesforce.Com, Inc. | Processing keyboard input to cause movement of items in a user interface of a web browser-based application |
US10649725B1 (en) * | 2016-10-27 | 2020-05-12 | Intuit Inc. | Integrating multi-channel inputs to determine user preferences |
US10559297B2 (en) | 2016-11-28 | 2020-02-11 | Microsoft Technology Licensing, Llc | Audio landmarking for aural user interface |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10594812B2 (en) * | 2017-03-10 | 2020-03-17 | Sony Interactive Entertainment LLC | Post-engagement metadata generation |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10861463B2 (en) * | 2018-01-09 | 2020-12-08 | Sennheiser Electronic Gmbh & Co. Kg | Method for speech processing and speech processing device |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11368443B2 (en) | 2018-05-02 | 2022-06-21 | Cloud People Llc | Decentralized digital communication platform system and method |
SG11202010892QA (en) * | 2018-05-02 | 2020-11-27 | Cloud People Llc | Decentralized digital communication platform system and method |
US11094316B2 (en) * | 2018-05-04 | 2021-08-17 | Qualcomm Incorporated | Audio analytics for natural language processing |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10877718B2 (en) | 2018-05-07 | 2020-12-29 | Spotify Ab | Adaptive voice communication |
US10908873B2 (en) | 2018-05-07 | 2021-02-02 | Spotify Ab | Command confirmation for a media playback device |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11030269B2 (en) * | 2018-06-03 | 2021-06-08 | Apple Inc. | Analytic data collection for application navigation |
US11037558B2 (en) * | 2018-09-24 | 2021-06-15 | International Business Machines Corporation | Audio modulation for an audio interface |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11120707B2 (en) * | 2018-11-15 | 2021-09-14 | International Business Machines Corporation | Cognitive snapshots for visually-impaired users |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
KR20210009189A (ko) * | 2019-07-16 | 2021-01-26 | 삼성전자주식회사 | 디스플레이 장치 및 그 제어 방법 |
US11238234B2 (en) * | 2019-09-11 | 2022-02-01 | International Business Machines Corporation | Adjusting a verbosity of a conversation turn |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11664044B2 (en) | 2019-11-25 | 2023-05-30 | Qualcomm Incorporated | Sound event detection learning |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11410677B2 (en) | 2020-11-24 | 2022-08-09 | Qualcomm Incorporated | Adaptive sound event classification |
CN113032029A (zh) * | 2021-03-26 | 2021-06-25 | 北京字节跳动网络技术有限公司 | 音乐应用的续听处理方法、装置及设备 |
US11804215B1 (en) * | 2022-04-29 | 2023-10-31 | Apple Inc. | Sonic responses |
US11650789B1 (en) * | 2022-04-29 | 2023-05-16 | Picked Cherries Inc. | System for creating audio snippet of the given podcast audio file and related methods |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471098A (zh) * | 2002-06-25 | 2004-01-28 | 根据用户反应选择项 | |
US20040036715A1 (en) * | 2002-08-26 | 2004-02-26 | Peter Warren | Multi-level user help |
EP1818786A1 (en) * | 2006-02-13 | 2007-08-15 | Research In Motion Limited | Navigation tool with audible feedback on a handheld communication device |
CN101228503A (zh) * | 2005-03-23 | 2008-07-23 | 摩托罗拉公司 | 用于用户界面的自适应菜单 |
Family Cites Families (626)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3828132A (en) | 1970-10-30 | 1974-08-06 | Bell Telephone Labor Inc | Speech synthesis by concatenation of formant encoded words |
US3704345A (en) | 1971-03-19 | 1972-11-28 | Bell Telephone Labor Inc | Conversion of printed text into synthetic speech |
US3979557A (en) | 1974-07-03 | 1976-09-07 | International Telephone And Telegraph Corporation | Speech processor system for pitch period extraction using prediction filters |
BG24190A1 (en) | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
JPS597120B2 (ja) | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
US4310721A (en) | 1980-01-23 | 1982-01-12 | The United States Of America As Represented By The Secretary Of The Army | Half duplex integral vocoder modem system |
US4348553A (en) | 1980-07-02 | 1982-09-07 | International Business Machines Corporation | Parallel pattern verifier with dynamic time warping |
DE3382796T2 (de) | 1982-06-11 | 1996-03-28 | Mitsubishi Electric Corp | Vorrichtung zur Zwischenbildkodierung. |
US4688195A (en) | 1983-01-28 | 1987-08-18 | Texas Instruments Incorporated | Natural-language interface generating system |
JPS603056A (ja) | 1983-06-21 | 1985-01-09 | Toshiba Corp | 情報整理装置 |
DE3335358A1 (de) | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US5164900A (en) | 1983-11-14 | 1992-11-17 | Colman Bernath | Method and device for phonetically encoding Chinese textual data for data processing entry |
US4726065A (en) | 1984-01-26 | 1988-02-16 | Horst Froessl | Image manipulation by speech signals |
US4955047A (en) | 1984-03-26 | 1990-09-04 | Dytel Corporation | Automated attendant with direct inward system access |
US4811243A (en) | 1984-04-06 | 1989-03-07 | Racine Marsh V | Computer aided coordinate digitizing system |
US4692941A (en) | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
US4783807A (en) | 1984-08-27 | 1988-11-08 | John Marley | System and method for sound recognition with feature selection synchronized to voice pitch |
US4718094A (en) | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
US5165007A (en) | 1985-02-01 | 1992-11-17 | International Business Machines Corporation | Feneme-based Markov models for words |
US4944013A (en) | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
US4819271A (en) | 1985-05-29 | 1989-04-04 | International Business Machines Corporation | Constructing Markov model word baseforms from multiple utterances by concatenating model sequences for word segments |
US4833712A (en) | 1985-05-29 | 1989-05-23 | International Business Machines Corporation | Automatic generation of simple Markov model stunted baseforms for words in a vocabulary |
EP0218859A3 (en) | 1985-10-11 | 1989-09-06 | International Business Machines Corporation | Signal processor communication interface |
US4776016A (en) | 1985-11-21 | 1988-10-04 | Position Orientation Systems, Inc. | Voice control system |
JPH0833744B2 (ja) | 1986-01-09 | 1996-03-29 | 株式会社東芝 | 音声合成装置 |
US4724542A (en) | 1986-01-22 | 1988-02-09 | International Business Machines Corporation | Automatic reference adaptation during dynamic signature verification |
US5128752A (en) | 1986-03-10 | 1992-07-07 | Kohorn H Von | System and method for generating and redeeming tokens |
US5759101A (en) | 1986-03-10 | 1998-06-02 | Response Reward Systems L.C. | Central and remote evaluation of responses of participatory broadcast audience with automatic crediting and couponing |
US5032989A (en) | 1986-03-19 | 1991-07-16 | Realpro, Ltd. | Real estate search and location system and method |
EP0241170B1 (en) | 1986-03-28 | 1992-05-27 | AT&T Corp. | Adaptive speech feature signal generation arrangement |
US4903305A (en) | 1986-05-12 | 1990-02-20 | Dragon Systems, Inc. | Method for representing word models for use in speech recognition |
WO1988002516A1 (en) | 1986-10-03 | 1988-04-07 | British Telecommunications Public Limited Company | Language translation system |
WO1988002975A1 (en) | 1986-10-16 | 1988-04-21 | Mitsubishi Denki Kabushiki Kaisha | Amplitude-adapted vector quantizer |
US4829576A (en) | 1986-10-21 | 1989-05-09 | Dragon Systems, Inc. | Voice recognition system |
US4852168A (en) | 1986-11-18 | 1989-07-25 | Sprague Richard P | Compression of stored waveforms for artificial speech |
US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
US4827520A (en) | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
US4965763A (en) | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
US5644727A (en) | 1987-04-15 | 1997-07-01 | Proprietary Financial Products, Inc. | System for the operation and management of one or more financial accounts through the use of a digital communication and computation system for exchange, investment and borrowing |
CA1295064C (en) | 1987-05-29 | 1992-01-28 | Kuniyoshi Marui | Voice recognition system used in telephone apparatus |
DE3723078A1 (de) | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
CA1288516C (en) | 1987-07-31 | 1991-09-03 | Leendert M. Bijnagte | Apparatus and method for communicating textual and image information between a host computer and a remote display terminal |
US4974191A (en) | 1987-07-31 | 1990-11-27 | Syntellect Software Inc. | Adaptive natural language computer interface system |
US5022081A (en) | 1987-10-01 | 1991-06-04 | Sharp Kabushiki Kaisha | Information recognition system |
US4852173A (en) | 1987-10-29 | 1989-07-25 | International Business Machines Corporation | Design and construction of a binary-tree system for language modelling |
US5072452A (en) | 1987-10-30 | 1991-12-10 | International Business Machines Corporation | Automatic determination of labels and Markov word models in a speech recognition system |
DE3876379T2 (de) | 1987-10-30 | 1993-06-09 | Ibm | Automatische bestimmung von kennzeichen und markov-wortmodellen in einem spracherkennungssystem. |
US4914586A (en) | 1987-11-06 | 1990-04-03 | Xerox Corporation | Garbage collector for hypermedia systems |
US4992972A (en) | 1987-11-18 | 1991-02-12 | International Business Machines Corporation | Flexible context searchable on-line information system with help files and modules for on-line computer system documentation |
US5220657A (en) | 1987-12-02 | 1993-06-15 | Xerox Corporation | Updating local copy of shared data in a collaborative system |
JPH0619965Y2 (ja) | 1988-01-22 | 1994-05-25 | サンデン株式会社 | 熱交換器 |
US4984177A (en) | 1988-02-05 | 1991-01-08 | Advanced Products And Technologies, Inc. | Voice language translator |
US5194950A (en) | 1988-02-29 | 1993-03-16 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4914590A (en) | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
FR2636163B1 (fr) | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
US4839853A (en) | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
JPH0293597A (ja) | 1988-09-30 | 1990-04-04 | Nippon I B M Kk | 音声認識装置 |
US4905163A (en) | 1988-10-03 | 1990-02-27 | Minnesota Mining & Manufacturing Company | Intelligent optical navigator dynamic information presentation and navigation system |
US5282265A (en) | 1988-10-04 | 1994-01-25 | Canon Kabushiki Kaisha | Knowledge information processing system |
DE3837590A1 (de) | 1988-11-05 | 1990-05-10 | Ant Nachrichtentech | Verfahren zum reduzieren der datenrate von digitalen bilddaten |
DE68913669T2 (de) | 1988-11-23 | 1994-07-21 | Digital Equipment Corp | Namenaussprache durch einen Synthetisator. |
US5027406A (en) | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5127055A (en) | 1988-12-30 | 1992-06-30 | Kurzweil Applied Intelligence, Inc. | Speech recognition apparatus & method having dynamic reference pattern adaptation |
US5293448A (en) | 1989-10-02 | 1994-03-08 | Nippon Telegraph And Telephone Corporation | Speech analysis-synthesis method and apparatus therefor |
US5047614A (en) | 1989-01-23 | 1991-09-10 | Bianco James S | Method and apparatus for computer-aided shopping |
SE466029B (sv) | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
JPH0782544B2 (ja) | 1989-03-24 | 1995-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | マルチテンプレートを用いるdpマツチング方法及び装置 |
US4977598A (en) | 1989-04-13 | 1990-12-11 | Texas Instruments Incorporated | Efficient pruning algorithm for hidden markov model speech recognition |
US5197005A (en) | 1989-05-01 | 1993-03-23 | Intelligent Business Systems | Database retrieval system having a natural language interface |
US5010574A (en) | 1989-06-13 | 1991-04-23 | At&T Bell Laboratories | Vector quantizer search arrangement |
JP2940005B2 (ja) | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
US5091945A (en) | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
CA2027705C (en) | 1989-10-17 | 1994-02-15 | Masami Akamine | Speech coding system utilizing a recursive computation technique for improvement in processing speed |
US5020112A (en) | 1989-10-31 | 1991-05-28 | At&T Bell Laboratories | Image recognition method using two-dimensional stochastic grammars |
US5220639A (en) | 1989-12-01 | 1993-06-15 | National Science Council | Mandarin speech input method for Chinese computers and a mandarin speech recognition machine |
US5021971A (en) | 1989-12-07 | 1991-06-04 | Unisys Corporation | Reflective binary encoder for vector quantization |
US5179652A (en) | 1989-12-13 | 1993-01-12 | Anthony I. Rozmanith | Method and apparatus for storing, transmitting and retrieving graphical and tabular data |
CH681573A5 (en) | 1990-02-13 | 1993-04-15 | Astral | Automatic teller arrangement involving bank computers - is operated by user data card carrying personal data, account information and transaction records |
DE69133296T2 (de) | 1990-02-22 | 2004-01-29 | Nec Corp | Sprachcodierer |
US5301109A (en) | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
JP3266246B2 (ja) | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5202952A (en) | 1990-06-22 | 1993-04-13 | Dragon Systems, Inc. | Large-vocabulary continuous speech prefiltering and processing system |
GB9017600D0 (en) | 1990-08-10 | 1990-09-26 | British Aerospace | An assembly and method for binary tree-searched vector quanisation data compression processing |
US5309359A (en) | 1990-08-16 | 1994-05-03 | Boris Katz | Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval |
US5404295A (en) | 1990-08-16 | 1995-04-04 | Katz; Boris | Method and apparatus for utilizing annotations to facilitate computer retrieval of database material |
US5297170A (en) | 1990-08-21 | 1994-03-22 | Codex Corporation | Lattice and trellis-coded quantization |
US5400434A (en) | 1990-09-04 | 1995-03-21 | Matsushita Electric Industrial Co., Ltd. | Voice source for synthetic speech system |
US5216747A (en) | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5128672A (en) | 1990-10-30 | 1992-07-07 | Apple Computer, Inc. | Dynamic predictive keyboard |
US5317507A (en) | 1990-11-07 | 1994-05-31 | Gallant Stephen I | Method for document retrieval and for word sense disambiguation using neural networks |
US5325298A (en) | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5247579A (en) | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5345536A (en) | 1990-12-21 | 1994-09-06 | Matsushita Electric Industrial Co., Ltd. | Method of speech recognition |
US5127053A (en) | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5133011A (en) | 1990-12-26 | 1992-07-21 | International Business Machines Corporation | Method and apparatus for linear vocal control of cursor position |
US5268990A (en) | 1991-01-31 | 1993-12-07 | Sri International | Method for recognizing speech using linguistically-motivated hidden Markov models |
GB9105367D0 (en) | 1991-03-13 | 1991-04-24 | Univ Strathclyde | Computerised information-retrieval database systems |
US5303406A (en) | 1991-04-29 | 1994-04-12 | Motorola, Inc. | Noise squelch circuit with adaptive noise shaping |
US5475587A (en) | 1991-06-28 | 1995-12-12 | Digital Equipment Corporation | Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms |
US5293452A (en) | 1991-07-01 | 1994-03-08 | Texas Instruments Incorporated | Voice log-in using spoken name input |
US5687077A (en) | 1991-07-31 | 1997-11-11 | Universal Dynamics Limited | Method and apparatus for adaptive control |
US5199077A (en) | 1991-09-19 | 1993-03-30 | Xerox Corporation | Wordspotting for voice editing and indexing |
JP2662120B2 (ja) | 1991-10-01 | 1997-10-08 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声認識装置および音声認識用処理ユニット |
US5222146A (en) | 1991-10-23 | 1993-06-22 | International Business Machines Corporation | Speech recognition apparatus having a speech coder outputting acoustic prototype ranks |
KR940002854B1 (ko) | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
US5386494A (en) | 1991-12-06 | 1995-01-31 | Apple Computer, Inc. | Method and apparatus for controlling a speech recognition function using a cursor control device |
US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US6081750A (en) | 1991-12-23 | 2000-06-27 | Hoffberg; Steven Mark | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5502790A (en) | 1991-12-24 | 1996-03-26 | Oki Electric Industry Co., Ltd. | Speech recognition method and system using triphones, diphones, and phonemes |
US5349645A (en) | 1991-12-31 | 1994-09-20 | Matsushita Electric Industrial Co., Ltd. | Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches |
US5267345A (en) | 1992-02-10 | 1993-11-30 | International Business Machines Corporation | Speech recognition apparatus which predicts word classes from context and words from word classes |
DE69322894T2 (de) | 1992-03-02 | 1999-07-29 | At & T Corp | Lernverfahren und Gerät zur Spracherkennung |
US6055514A (en) | 1992-03-20 | 2000-04-25 | Wren; Stephen Corey | System for marketing foods and services utilizing computerized centraland remote facilities |
US5317647A (en) | 1992-04-07 | 1994-05-31 | Apple Computer, Inc. | Constrained attribute grammars for syntactic pattern recognition |
US5412804A (en) | 1992-04-30 | 1995-05-02 | Oracle Corporation | Extending the semantics of the outer join operator for un-nesting queries to a data base |
US5293584A (en) | 1992-05-21 | 1994-03-08 | International Business Machines Corporation | Speech recognition system for natural language translation |
US5434777A (en) | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
US5390281A (en) | 1992-05-27 | 1995-02-14 | Apple Computer, Inc. | Method and apparatus for deducing user intent and providing computer implemented services |
US5734789A (en) | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5333275A (en) | 1992-06-23 | 1994-07-26 | Wheatley Barbara J | System and method for time aligning speech |
US5325297A (en) | 1992-06-25 | 1994-06-28 | System Of Multiple-Colored Images For Internationally Listed Estates, Inc. | Computer implemented method and system for storing and retrieving textual data and compressed image data |
US5999908A (en) | 1992-08-06 | 1999-12-07 | Abelow; Daniel H. | Customer-based product design module |
GB9220404D0 (en) | 1992-08-20 | 1992-11-11 | Nat Security Agency | Method of identifying,retrieving and sorting documents |
US5412806A (en) | 1992-08-20 | 1995-05-02 | Hewlett-Packard Company | Calibration of logical cost formulae for queries in a heterogeneous DBMS using synthetic database |
US5333236A (en) | 1992-09-10 | 1994-07-26 | International Business Machines Corporation | Speech recognizer having a speech coder for an acoustic match based on context-dependent speech-transition acoustic models |
US5384893A (en) | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
FR2696036B1 (fr) | 1992-09-24 | 1994-10-14 | France Telecom | Procédé de mesure de ressemblance entre échantillons sonores et dispositif de mise en Óoeuvre de ce procédé. |
JPH0772840B2 (ja) | 1992-09-29 | 1995-08-02 | 日本アイ・ビー・エム株式会社 | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 |
US5758313A (en) | 1992-10-16 | 1998-05-26 | Mobile Information Systems, Inc. | Method and apparatus for tracking vehicle location |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US5412756A (en) | 1992-12-22 | 1995-05-02 | Mitsubishi Denki Kabushiki Kaisha | Artificial intelligence software shell for plant operation simulation |
US5390279A (en) | 1992-12-31 | 1995-02-14 | Apple Computer, Inc. | Partitioning speech rules by context for speech recognition |
US5734791A (en) | 1992-12-31 | 1998-03-31 | Apple Computer, Inc. | Rapid tree-based method for vector quantization |
US5613036A (en) | 1992-12-31 | 1997-03-18 | Apple Computer, Inc. | Dynamic categories for a speech recognition system |
US5384892A (en) | 1992-12-31 | 1995-01-24 | Apple Computer, Inc. | Dynamic language model for speech recognition |
US6122616A (en) | 1993-01-21 | 2000-09-19 | Apple Computer, Inc. | Method and apparatus for diphone aliasing |
US5864844A (en) | 1993-02-18 | 1999-01-26 | Apple Computer, Inc. | System and method for enhancing a user interface with a computer based training tool |
CA2091658A1 (en) | 1993-03-15 | 1994-09-16 | Matthew Lennig | Method and apparatus for automation of directory assistance using speech recognition |
US6055531A (en) | 1993-03-24 | 2000-04-25 | Engate Incorporated | Down-line transcription system having context sensitive searching capability |
US5536902A (en) | 1993-04-14 | 1996-07-16 | Yamaha Corporation | Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter |
US5444823A (en) | 1993-04-16 | 1995-08-22 | Compaq Computer Corporation | Intelligent search engine for associated on-line documentation having questionless case-based knowledge base |
US5574823A (en) | 1993-06-23 | 1996-11-12 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Communications | Frequency selective harmonic coding |
US5515475A (en) | 1993-06-24 | 1996-05-07 | Northern Telecom Limited | Speech recognition method using a two-pass search |
JPH0756933A (ja) | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
JP3685812B2 (ja) | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
US5794207A (en) | 1996-09-04 | 1998-08-11 | Walker Asset Management Limited Partnership | Method and apparatus for a cryptographically assisted commercial network system designed to facilitate buyer-driven conditional purchase offers |
WO1995002221A1 (en) | 1993-07-07 | 1995-01-19 | Inference Corporation | Case-based organizing and querying of a database |
US5495604A (en) | 1993-08-25 | 1996-02-27 | Asymetrix Corporation | Method and apparatus for the modeling and query of database structures using natural language-like constructs |
US5619694A (en) | 1993-08-26 | 1997-04-08 | Nec Corporation | Case database storage/retrieval system |
US5940811A (en) | 1993-08-27 | 1999-08-17 | Affinity Technology Group, Inc. | Closed loop financial transaction method and apparatus |
US5377258A (en) | 1993-08-30 | 1994-12-27 | National Medical Research Council | Method and apparatus for an automated and interactive behavioral guidance system |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5578808A (en) | 1993-12-22 | 1996-11-26 | Datamark Services, Inc. | Data card that can be used for transactions involving separate card issuers |
CA2179523A1 (en) | 1993-12-23 | 1995-06-29 | David A. Boulton | Method and apparatus for implementing user feedback |
US5621859A (en) | 1994-01-19 | 1997-04-15 | Bbn Corporation | Single tree method for grammar directed, very large vocabulary speech recognizer |
US5584024A (en) | 1994-03-24 | 1996-12-10 | Software Ag | Interactive database query system and method for prohibiting the selection of semantically incorrect query parameters |
US5642519A (en) | 1994-04-29 | 1997-06-24 | Sun Microsystems, Inc. | Speech interpreter with a unified grammer compiler |
KR100250509B1 (ko) | 1994-05-25 | 2000-04-01 | 슈즈이 다께오 | 가변 전송속도 데이터 전송장치 |
US5493677A (en) | 1994-06-08 | 1996-02-20 | Systems Research & Applications Corporation | Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
JPH0869470A (ja) | 1994-06-21 | 1996-03-12 | Canon Inc | 自然言語処理装置及びその方法 |
US5948040A (en) | 1994-06-24 | 1999-09-07 | Delorme Publishing Co. | Travel reservation information and planning system |
US5682539A (en) | 1994-09-29 | 1997-10-28 | Conrad; Donovan | Anticipated meaning natural language interface |
GB2293667B (en) | 1994-09-30 | 1998-05-27 | Intermation Limited | Database management system |
US5715468A (en) | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
US5737609A (en) * | 1994-10-18 | 1998-04-07 | Marcam Corporation | Method and apparatus for testing object-oriented programming constructs |
US5845255A (en) | 1994-10-28 | 1998-12-01 | Advanced Health Med-E-Systems Corporation | Prescription management system |
US5577241A (en) | 1994-12-07 | 1996-11-19 | Excite, Inc. | Information retrieval system and method with implementation extensible query architecture |
US5748974A (en) | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
CA2683230C (en) | 1995-02-13 | 2013-08-27 | Intertrust Technologies Corporation | Systems and methods for secure transaction management and electronic rights protection |
US5701400A (en) | 1995-03-08 | 1997-12-23 | Amado; Carlos Armando | Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data |
US5749081A (en) | 1995-04-06 | 1998-05-05 | Firefly Network, Inc. | System and method for recommending items to a user |
US5642464A (en) | 1995-05-03 | 1997-06-24 | Northern Telecom Limited | Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding |
US5664055A (en) | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US5710886A (en) | 1995-06-16 | 1998-01-20 | Sellectsoft, L.C. | Electric couponing method and apparatus |
JP3284832B2 (ja) | 1995-06-22 | 2002-05-20 | セイコーエプソン株式会社 | 音声認識対話処理方法および音声認識対話装置 |
US6038533A (en) | 1995-07-07 | 2000-03-14 | Lucent Technologies Inc. | System and method for selecting training text |
US6026388A (en) | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
JP3697748B2 (ja) | 1995-08-21 | 2005-09-21 | セイコーエプソン株式会社 | 端末、音声認識装置 |
US5712957A (en) | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US5790978A (en) | 1995-09-15 | 1998-08-04 | Lucent Technologies, Inc. | System and method for determining pitch contours |
US6173261B1 (en) | 1998-09-30 | 2001-01-09 | At&T Corp | Grammar fragment acquisition using syntactic and semantic clustering |
US5737734A (en) | 1995-09-15 | 1998-04-07 | Infonautics Corporation | Query word relevance adjustment in a search of an information retrieval system |
US5884323A (en) | 1995-10-13 | 1999-03-16 | 3Com Corporation | Extendible method and apparatus for synchronizing files on two different computer systems |
US5799276A (en) | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
US5794237A (en) | 1995-11-13 | 1998-08-11 | International Business Machines Corporation | System and method for improving problem source identification in computer systems employing relevance feedback and statistical source ranking |
US5801692A (en) | 1995-11-30 | 1998-09-01 | Microsoft Corporation | Audio-visual user interface controls |
US5706442A (en) | 1995-12-20 | 1998-01-06 | Block Financial Corporation | System for on-line financial services using distributed objects |
AU1836297A (en) | 1996-01-17 | 1997-08-11 | Personal Agents, Inc. | Intelligent agents for electronic commerce |
US6119101A (en) | 1996-01-17 | 2000-09-12 | Personal Agents, Inc. | Intelligent agents for electronic commerce |
US6125356A (en) | 1996-01-18 | 2000-09-26 | Rosefaire Development, Ltd. | Portable sales presentation system with selective scripted seller prompts |
US5987404A (en) | 1996-01-29 | 1999-11-16 | International Business Machines Corporation | Statistical natural language understanding using hidden clumpings |
US5729694A (en) | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
US6076088A (en) | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
US5835893A (en) | 1996-02-15 | 1998-11-10 | Atr Interpreting Telecommunications Research Labs | Class-based word clustering for speech recognition using a three-level balanced hierarchical similarity |
US5901287A (en) | 1996-04-01 | 1999-05-04 | The Sabre Group Inc. | Information aggregation and synthesization system |
US5867799A (en) | 1996-04-04 | 1999-02-02 | Lang; Andrew K. | Information system and method for filtering a massive flow of information entities to meet user information classification needs |
US5987140A (en) | 1996-04-26 | 1999-11-16 | Verifone, Inc. | System, method and article of manufacture for secure network electronic payment and credit collection |
US5963924A (en) | 1996-04-26 | 1999-10-05 | Verifone, Inc. | System, method and article of manufacture for the use of payment instrument holders and payment instruments in network electronic commerce |
US5913193A (en) | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
US5857184A (en) | 1996-05-03 | 1999-01-05 | Walden Media, Inc. | Language and method for creating, organizing, and retrieving data from a database |
FR2748342B1 (fr) | 1996-05-06 | 1998-07-17 | France Telecom | Procede et dispositif de filtrage par egalisation d'un signal de parole, mettant en oeuvre un modele statistique de ce signal |
US5828999A (en) | 1996-05-06 | 1998-10-27 | Apple Computer, Inc. | Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems |
US5826261A (en) | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US6366883B1 (en) | 1996-05-15 | 2002-04-02 | Atr Interpreting Telecommunications | Concatenation of speech segments by use of a speech synthesizer |
US5727950A (en) | 1996-05-22 | 1998-03-17 | Netsage Corporation | Agent based instruction system and method |
US5966533A (en) | 1996-06-11 | 1999-10-12 | Excite, Inc. | Method and system for dynamically synthesizing a computer program by differentially resolving atoms based on user context data |
US5915249A (en) | 1996-06-14 | 1999-06-22 | Excite, Inc. | System and method for accelerated query evaluation of very large full-text databases |
US5987132A (en) | 1996-06-17 | 1999-11-16 | Verifone, Inc. | System, method and article of manufacture for conditionally accepting a payment method utilizing an extensible, flexible architecture |
US5825881A (en) | 1996-06-28 | 1998-10-20 | Allsoft Distributing Inc. | Public network merchandising system |
US6070147A (en) | 1996-07-02 | 2000-05-30 | Tecmark Services, Inc. | Customer identification and marketing analysis systems |
WO1998003927A2 (en) | 1996-07-22 | 1998-01-29 | Cyva Research Corp | Personal information security and exchange tool |
US5862223A (en) | 1996-07-24 | 1999-01-19 | Walker Asset Management Limited Partnership | Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce |
EP0829811A1 (en) | 1996-09-11 | 1998-03-18 | Nippon Telegraph And Telephone Corporation | Method and system for information retrieval |
US5973612A (en) * | 1996-09-19 | 1999-10-26 | Microsoft Corporation | Flexible object notification |
US6181935B1 (en) | 1996-09-27 | 2001-01-30 | Software.Com, Inc. | Mobility extended telephone application programming interface and method of use |
US5794182A (en) | 1996-09-30 | 1998-08-11 | Apple Computer, Inc. | Linear predictive speech encoding systems with efficient combination pitch coefficients computation |
US5721827A (en) | 1996-10-02 | 1998-02-24 | James Logan | System for electrically distributing personalized information |
US5913203A (en) | 1996-10-03 | 1999-06-15 | Jaesent Inc. | System and method for pseudo cash transactions |
US5930769A (en) | 1996-10-07 | 1999-07-27 | Rose; Andrea | System and method for fashion shopping |
US5836771A (en) | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US6078914A (en) | 1996-12-09 | 2000-06-20 | Open Text Corporation | Natural language meta-search system and method |
US5839106A (en) | 1996-12-17 | 1998-11-17 | Apple Computer, Inc. | Large-vocabulary speech recognition using an integrated syntactic and semantic statistical language model |
US5966126A (en) | 1996-12-23 | 1999-10-12 | Szabo; Andrew J. | Graphic user interface for database system |
US5932869A (en) | 1996-12-27 | 1999-08-03 | Graphic Technology, Inc. | Promotional system with magnetic stripe and visual thermo-reversible print surfaced medium |
US6111562A (en) * | 1997-01-06 | 2000-08-29 | Intel Corporation | System for generating an audible cue indicating the status of a display object |
JP3579204B2 (ja) | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
US5941944A (en) | 1997-03-03 | 1999-08-24 | Microsoft Corporation | Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US5930801A (en) | 1997-03-07 | 1999-07-27 | Xerox Corporation | Shared-data environment in which each file has independent security properties |
WO1998041956A1 (en) | 1997-03-20 | 1998-09-24 | Schlumberger Technologies, Inc. | System and method of transactional taxation using secure stored data devices |
US5822743A (en) | 1997-04-08 | 1998-10-13 | 1215627 Ontario Inc. | Knowledge-based information retrieval system |
US5970474A (en) | 1997-04-24 | 1999-10-19 | Sears, Roebuck And Co. | Registry information system for shoppers |
US5895464A (en) | 1997-04-30 | 1999-04-20 | Eastman Kodak Company | Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects |
WO1999001834A1 (en) | 1997-07-02 | 1999-01-14 | Coueignoux, Philippe, J., M. | System and method for the secure discovery, exploitation and publication of information |
US5860063A (en) | 1997-07-11 | 1999-01-12 | At&T Corp | Automated meaningful phrase clustering |
US5933822A (en) | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US5974146A (en) | 1997-07-30 | 1999-10-26 | Huntington Bancshares Incorporated | Real time bank-centric universal payment system |
US6016476A (en) | 1997-08-11 | 2000-01-18 | International Business Machines Corporation | Portable information and transaction processing system and method utilizing biometric authorization and digital certificate security |
US5895466A (en) | 1997-08-19 | 1999-04-20 | At&T Corp | Automated natural language understanding customer service system |
US6081774A (en) | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
US6404876B1 (en) | 1997-09-25 | 2002-06-11 | Gte Intelligent Network Services Incorporated | System and method for voice activated dialing and routing under open access network control |
US6023684A (en) | 1997-10-01 | 2000-02-08 | Security First Technologies, Inc. | Three tier financial transaction system with cache memory |
US6385662B1 (en) * | 1997-10-03 | 2002-05-07 | Ericsson Inc. | Method of processing information using a personal communication assistant |
DE69712485T2 (de) | 1997-10-23 | 2002-12-12 | Sony Int Europe Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
US6108627A (en) | 1997-10-31 | 2000-08-22 | Nortel Networks Corporation | Automatic transcription tool |
US5943670A (en) | 1997-11-21 | 1999-08-24 | International Business Machines Corporation | System and method for categorizing objects in combined categories |
US5960422A (en) | 1997-11-26 | 1999-09-28 | International Business Machines Corporation | System and method for optimized source selection in an information retrieval system |
US6026375A (en) | 1997-12-05 | 2000-02-15 | Nortel Networks Corporation | Method and apparatus for processing orders from customers in a mobile environment |
US6064960A (en) | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
US6094649A (en) | 1997-12-22 | 2000-07-25 | Partnet, Inc. | Keyword searches of structured databases |
US6173287B1 (en) | 1998-03-11 | 2001-01-09 | Digital Equipment Corporation | Technique for ranking multimedia annotations of interest |
US6195641B1 (en) | 1998-03-27 | 2001-02-27 | International Business Machines Corp. | Network universal spoken language vocabulary |
US6026393A (en) | 1998-03-31 | 2000-02-15 | Casebank Technologies Inc. | Configuration knowledge as an aid to case retrieval |
US6233559B1 (en) | 1998-04-01 | 2001-05-15 | Motorola, Inc. | Speech control of multiple applications using applets |
US6173279B1 (en) | 1998-04-09 | 2001-01-09 | At&T Corp. | Method of using a natural language interface to retrieve information from one or more data resources |
US6088731A (en) | 1998-04-24 | 2000-07-11 | Associative Computing, Inc. | Intelligent assistant for use with a local computer and with the internet |
WO1999056227A1 (en) | 1998-04-27 | 1999-11-04 | British Telecommunications Public Limited Company | Database access tool |
US6016471A (en) | 1998-04-29 | 2000-01-18 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word |
US6029132A (en) | 1998-04-30 | 2000-02-22 | Matsushita Electric Industrial Co. | Method for letter-to-sound in text-to-speech synthesis |
US6285786B1 (en) | 1998-04-30 | 2001-09-04 | Motorola, Inc. | Text recognizer and method using non-cumulative character scoring in a forward search |
US6144938A (en) | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US6297818B1 (en) | 1998-05-08 | 2001-10-02 | Apple Computer, Inc. | Graphical user interface having sound effects for operating control elements and dragging objects |
US6188967B1 (en) * | 1998-05-27 | 2001-02-13 | International Business Machines Corporation | Audio feedback control for manufacturing processes |
US7711672B2 (en) | 1998-05-28 | 2010-05-04 | Lawrence Au | Semantic network methods to disambiguate natural language meaning |
US20070094223A1 (en) | 1998-05-28 | 2007-04-26 | Lawrence Au | Method and system for using contextual meaning in voice to text conversion |
US6778970B2 (en) | 1998-05-28 | 2004-08-17 | Lawrence Au | Topological methods to organize semantic network data flows for conversational applications |
US6144958A (en) | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6105865A (en) | 1998-07-17 | 2000-08-22 | Hardesty; Laurence Daniel | Financial transaction system with retirement saving benefit |
US6434524B1 (en) | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
US6499013B1 (en) | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6266637B1 (en) | 1998-09-11 | 2001-07-24 | International Business Machines Corporation | Phrase splicing and variable substitution using a trainable speech synthesizer |
US6792082B1 (en) | 1998-09-11 | 2004-09-14 | Comverse Ltd. | Voice mail system with personal assistant provisioning |
DE29825146U1 (de) | 1998-09-11 | 2005-08-18 | Püllen, Rainer | Teilnehmereinheit und System für einen Multimediadienst |
US6317831B1 (en) | 1998-09-21 | 2001-11-13 | Openwave Systems Inc. | Method and apparatus for establishing a secure connection over a one-way data path |
EP1133734A4 (en) | 1998-10-02 | 2005-12-14 | Ibm | INTERACTIVE NAVIGATOR AND INTERACTIVE SYSTEMS |
US6275824B1 (en) | 1998-10-02 | 2001-08-14 | Ncr Corporation | System and method for managing data privacy in a database management system |
GB9821969D0 (en) | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
US6928614B1 (en) | 1998-10-13 | 2005-08-09 | Visteon Global Technologies, Inc. | Mobile office with speech recognition |
US6453292B2 (en) | 1998-10-28 | 2002-09-17 | International Business Machines Corporation | Command boundary identifier for conversational natural language |
US6208971B1 (en) | 1998-10-30 | 2001-03-27 | Apple Computer, Inc. | Method and apparatus for command recognition using data-driven semantic inference |
US6321092B1 (en) | 1998-11-03 | 2001-11-20 | Signal Soft Corporation | Multiple input data management for wireless location-based applications |
US6446076B1 (en) | 1998-11-12 | 2002-09-03 | Accenture Llp. | Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information |
WO2000030069A2 (en) | 1998-11-13 | 2000-05-25 | Lernout & Hauspie Speech Products N.V. | Speech synthesis using concatenation of speech waveforms |
US6606599B2 (en) | 1998-12-23 | 2003-08-12 | Interactive Speech Technologies, Llc | Method for integrating computing processes with an interface controlled by voice actuated grammars |
US6246981B1 (en) | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US7082397B2 (en) | 1998-12-01 | 2006-07-25 | Nuance Communications, Inc. | System for and method of creating and browsing a voice web |
US6260024B1 (en) | 1998-12-02 | 2001-07-10 | Gary Shkedy | Method and apparatus for facilitating buyer-driven purchase orders on a commercial network system |
US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US6317707B1 (en) | 1998-12-07 | 2001-11-13 | At&T Corp. | Automatic clustering of tokens from a corpus for grammar acquisition |
US6308149B1 (en) | 1998-12-16 | 2001-10-23 | Xerox Corporation | Grouping words with equivalent substrings by automatic clustering based on suffix relationships |
US6523172B1 (en) | 1998-12-17 | 2003-02-18 | Evolutionary Technologies International, Inc. | Parser translator system and method |
US6460029B1 (en) | 1998-12-23 | 2002-10-01 | Microsoft Corporation | System for improving search text |
US6523061B1 (en) | 1999-01-05 | 2003-02-18 | Sri International, Inc. | System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system |
US6851115B1 (en) | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US6757718B1 (en) | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
US7036128B1 (en) | 1999-01-05 | 2006-04-25 | Sri International Offices | Using a community of distributed electronic agents to support a highly mobile, ambient computing environment |
US6742021B1 (en) | 1999-01-05 | 2004-05-25 | Sri International, Inc. | Navigating network-based electronic information using spoken input with multimodal error feedback |
US6513063B1 (en) | 1999-01-05 | 2003-01-28 | Sri International | Accessing network-based electronic information through scripted online interfaces using spoken input |
US7152070B1 (en) | 1999-01-08 | 2006-12-19 | The Regents Of The University Of California | System and method for integrating and accessing multiple data sources within a data warehouse architecture |
US6505183B1 (en) | 1999-02-04 | 2003-01-07 | Authoria, Inc. | Human resource knowledge modeling and delivery system |
US6317718B1 (en) | 1999-02-26 | 2001-11-13 | Accenture Properties (2) B.V. | System, method and article of manufacture for location-based filtering for shopping agent in the physical world |
GB9904662D0 (en) | 1999-03-01 | 1999-04-21 | Canon Kk | Natural language search method and apparatus |
US6356905B1 (en) | 1999-03-05 | 2002-03-12 | Accenture Llp | System, method and article of manufacture for mobile communication utilizing an interface support framework |
US6928404B1 (en) | 1999-03-17 | 2005-08-09 | International Business Machines Corporation | System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies |
US6584464B1 (en) | 1999-03-19 | 2003-06-24 | Ask Jeeves, Inc. | Grammar template query system |
US6469712B1 (en) | 1999-03-25 | 2002-10-22 | International Business Machines Corporation | Projected audio for computer displays |
WO2000058942A2 (en) | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
US6356854B1 (en) | 1999-04-05 | 2002-03-12 | Delphi Technologies, Inc. | Holographic object position and type sensing system and method |
WO2000060435A2 (en) | 1999-04-07 | 2000-10-12 | Rensselaer Polytechnic Institute | System and method for accessing personal information |
US6631346B1 (en) | 1999-04-07 | 2003-10-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for natural language parsing using multiple passes and tags |
US6647260B2 (en) | 1999-04-09 | 2003-11-11 | Openwave Systems Inc. | Method and system facilitating web based provisioning of two-way mobile communications devices |
US6924828B1 (en) | 1999-04-27 | 2005-08-02 | Surfnotes | Method and apparatus for improved information representation |
US6697780B1 (en) | 1999-04-30 | 2004-02-24 | At&T Corp. | Method and apparatus for rapid acoustic unit selection from a large speech corpus |
WO2000073936A1 (en) | 1999-05-28 | 2000-12-07 | Sehda, Inc. | Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces |
US20020032564A1 (en) | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
US6931384B1 (en) | 1999-06-04 | 2005-08-16 | Microsoft Corporation | System and method providing utility-based decision making about clarification dialog given communicative uncertainty |
US6598039B1 (en) | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
US7711565B1 (en) | 1999-06-10 | 2010-05-04 | Gazdzinski Robert F | “Smart” elevator system and method |
US6615175B1 (en) | 1999-06-10 | 2003-09-02 | Robert F. Gazdzinski | “Smart” elevator system and method |
US7093693B1 (en) | 1999-06-10 | 2006-08-22 | Gazdzinski Robert F | Elevator access control system and method |
US8065155B1 (en) | 1999-06-10 | 2011-11-22 | Gazdzinski Robert F | Adaptive advertising apparatus and methods |
US6711585B1 (en) | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
JP3361291B2 (ja) | 1999-07-23 | 2003-01-07 | コナミ株式会社 | 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体 |
US6421672B1 (en) | 1999-07-27 | 2002-07-16 | Verizon Services Corp. | Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys |
EP1079387A3 (en) | 1999-08-26 | 2003-07-09 | Matsushita Electric Industrial Co., Ltd. | Mechanism for storing information about recorded television broadcasts |
US6601234B1 (en) | 1999-08-31 | 2003-07-29 | Accenture Llp | Attribute dictionary in a business logic services environment |
US6912499B1 (en) | 1999-08-31 | 2005-06-28 | Nortel Networks Limited | Method and apparatus for training a multilingual speech model set |
US6697824B1 (en) | 1999-08-31 | 2004-02-24 | Accenture Llp | Relationship management in an E-commerce application framework |
US7127403B1 (en) | 1999-09-13 | 2006-10-24 | Microstrategy, Inc. | System and method for personalizing an interactive voice broadcast of a voice service based on particulars of a request |
US6601026B2 (en) | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US6625583B1 (en) | 1999-10-06 | 2003-09-23 | Goldman, Sachs & Co. | Handheld trading system interface |
US6505175B1 (en) | 1999-10-06 | 2003-01-07 | Goldman, Sachs & Co. | Order centric tracking system |
US7020685B1 (en) | 1999-10-08 | 2006-03-28 | Openwave Systems Inc. | Method and apparatus for providing internet content to SMS-based wireless devices |
AU8030300A (en) | 1999-10-19 | 2001-04-30 | Sony Electronics Inc. | Natural language interface control system |
US6771982B1 (en) * | 1999-10-20 | 2004-08-03 | Curo Interactive Incorporated | Single action audio prompt interface utlizing binary state time domain multiple selection protocol |
US6807574B1 (en) | 1999-10-22 | 2004-10-19 | Tellme Networks, Inc. | Method and apparatus for content personalization over a telephone interface |
JP2001125896A (ja) | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 自然言語対話システム |
US7310600B1 (en) | 1999-10-28 | 2007-12-18 | Canon Kabushiki Kaisha | Language recognition using a similarity measure |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6615172B1 (en) | 1999-11-12 | 2003-09-02 | Phoenix Solutions, Inc. | Intelligent query engine for processing voice based queries |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US6633846B1 (en) | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6532446B1 (en) | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
US6526382B1 (en) | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
US6978127B1 (en) * | 1999-12-16 | 2005-12-20 | Koninklijke Philips Electronics N.V. | Hand-ear user interface for hand-held device |
US6526395B1 (en) | 1999-12-31 | 2003-02-25 | Intel Corporation | Application of personality models and interaction with synthetic characters in a computing system |
US7024366B1 (en) * | 2000-01-10 | 2006-04-04 | Delphi Technologies, Inc. | Speech recognition with user specific adaptive voice feedback |
US6556983B1 (en) | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
US6546388B1 (en) | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6701294B1 (en) | 2000-01-19 | 2004-03-02 | Lucent Technologies, Inc. | User interface for translating natural language inquiries into database queries and data presentations |
US6269712B1 (en) * | 2000-01-28 | 2001-08-07 | John Zentmyer | Automotive full locking differential |
US6829603B1 (en) | 2000-02-02 | 2004-12-07 | International Business Machines Corp. | System, method and program product for interactive natural dialog |
US6895558B1 (en) | 2000-02-11 | 2005-05-17 | Microsoft Corporation | Multi-access mode electronic personal assistant |
US6640098B1 (en) | 2000-02-14 | 2003-10-28 | Action Engine Corporation | System for obtaining service-related information for local interactive wireless devices |
AU2001243277A1 (en) | 2000-02-25 | 2001-09-03 | Synquiry Technologies, Ltd. | Conceptual factoring and unification of graphs representing semantic models |
US6895380B2 (en) | 2000-03-02 | 2005-05-17 | Electro Standards Laboratories | Voice actuation with contextual learning for intelligent machine control |
US6449620B1 (en) | 2000-03-02 | 2002-09-10 | Nimble Technology, Inc. | Method and apparatus for generating information pages using semi-structured data stored in a structured manner |
EP1275042A2 (en) | 2000-03-06 | 2003-01-15 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
US6757362B1 (en) | 2000-03-06 | 2004-06-29 | Avaya Technology Corp. | Personal virtual assistant |
US6466654B1 (en) | 2000-03-06 | 2002-10-15 | Avaya Technology Corp. | Personal virtual assistant with semantic tagging |
US6477488B1 (en) | 2000-03-10 | 2002-11-05 | Apple Computer, Inc. | Method for dynamic context scope selection in hybrid n-gram+LSA language modeling |
US6615220B1 (en) | 2000-03-14 | 2003-09-02 | Oracle International Corporation | Method and mechanism for data consolidation |
US6510417B1 (en) | 2000-03-21 | 2003-01-21 | America Online, Inc. | System and method for voice access to internet-based information |
GB2366009B (en) | 2000-03-22 | 2004-07-21 | Canon Kk | Natural language machine interface |
JP3728172B2 (ja) | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
US7177798B2 (en) | 2000-04-07 | 2007-02-13 | Rensselaer Polytechnic Institute | Natural language interface using constrained intermediate dictionary of results |
US6810379B1 (en) | 2000-04-24 | 2004-10-26 | Sensory, Inc. | Client/server architecture for text-to-speech synthesis |
US6684187B1 (en) | 2000-06-30 | 2004-01-27 | At&T Corp. | Method and system for preselection of suitable units for concatenative speech |
US6691111B2 (en) | 2000-06-30 | 2004-02-10 | Research In Motion Limited | System and method for implementing a natural language user interface |
US6505158B1 (en) | 2000-07-05 | 2003-01-07 | At&T Corp. | Synthesis-based pre-selection of suitable units for concatenative speech |
JP3949356B2 (ja) | 2000-07-12 | 2007-07-25 | 三菱電機株式会社 | 音声対話システム |
US7139709B2 (en) | 2000-07-20 | 2006-11-21 | Microsoft Corporation | Middleware layer between speech related applications and engines |
JP2002041276A (ja) | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US20060143007A1 (en) | 2000-07-24 | 2006-06-29 | Koh V E | User interaction with voice information services |
US7092928B1 (en) | 2000-07-31 | 2006-08-15 | Quantum Leap Research, Inc. | Intelligent portal engine |
US6778951B1 (en) | 2000-08-09 | 2004-08-17 | Concerto Software, Inc. | Information retrieval method with natural language interface |
US6766320B1 (en) | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
DE10042944C2 (de) | 2000-08-31 | 2003-03-13 | Siemens Ag | Graphem-Phonem-Konvertierung |
DE60127274T2 (de) | 2000-09-15 | 2007-12-20 | Lernout & Hauspie Speech Products N.V. | Schnelle wellenformsynchronisation für die verkettung und zeitskalenmodifikation von sprachsignalen |
US7216080B2 (en) | 2000-09-29 | 2007-05-08 | Mindfabric Holdings Llc | Natural-language voice-activated personal assistant |
US6832194B1 (en) | 2000-10-26 | 2004-12-14 | Sensory, Incorporated | Audio recognition peripheral system |
US7027974B1 (en) | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US7006969B2 (en) | 2000-11-02 | 2006-02-28 | At&T Corp. | System and method of pattern recognition in very high-dimensional space |
WO2002050816A1 (en) | 2000-12-18 | 2002-06-27 | Koninklijke Philips Electronics N.V. | Store speech, select vocabulary to recognize word |
US6937986B2 (en) | 2000-12-28 | 2005-08-30 | Comverse, Inc. | Automatic dynamic speech recognition vocabulary based on external sources of information |
WO2002054239A2 (en) | 2000-12-29 | 2002-07-11 | General Electric Company | Method and system for identifying repeatedly malfunctioning equipment |
US7257537B2 (en) | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US6964023B2 (en) | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7698652B2 (en) * | 2001-02-09 | 2010-04-13 | Koninklijke Philips Electronics N.V. | Rapid retrieval user interface designed around small displays and few buttons for searching long lists |
US7290039B1 (en) | 2001-02-27 | 2007-10-30 | Microsoft Corporation | Intent based processing |
US6721728B2 (en) | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
WO2002073451A2 (en) | 2001-03-13 | 2002-09-19 | Intelligate Ltd. | Dynamic natural language understanding |
US6996531B2 (en) | 2001-03-30 | 2006-02-07 | Comverse Ltd. | Automated database assistance using a telephone for a speech based or text based multimedia communication mode |
EP1380154A1 (en) * | 2001-04-19 | 2004-01-14 | BRITISH TELECOMMUNICATIONS public limited company | Voice response system |
US6654740B2 (en) | 2001-05-08 | 2003-11-25 | Sunflare Co., Ltd. | Probabilistic information retrieval based on differential latent semantic space |
US7085722B2 (en) | 2001-05-14 | 2006-08-01 | Sony Computer Entertainment America Inc. | System and method for menu-driven voice control of characters in a game environment |
US6944594B2 (en) | 2001-05-30 | 2005-09-13 | Bellsouth Intellectual Property Corporation | Multi-context conversational environment system and method |
US20020194003A1 (en) | 2001-06-05 | 2002-12-19 | Mozer Todd F. | Client-server security system and method |
US20020198714A1 (en) | 2001-06-26 | 2002-12-26 | Guojun Zhou | Statistical spoken dialog system |
US7139722B2 (en) | 2001-06-27 | 2006-11-21 | Bellsouth Intellectual Property Corporation | Location and time sensitive wireless calendaring |
US6604059B2 (en) | 2001-07-10 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Predictive calendar |
US7987151B2 (en) | 2001-08-10 | 2011-07-26 | General Dynamics Advanced Info Systems, Inc. | Apparatus and method for problem solving using intelligent agents |
US7176931B2 (en) * | 2001-08-13 | 2007-02-13 | International Business Machines Corporation | Modifying hyperlink display characteristics |
US6813491B1 (en) | 2001-08-31 | 2004-11-02 | Openwave Systems Inc. | Method and apparatus for adapting settings of wireless communication devices in accordance with user proximity |
US7403938B2 (en) | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US20050196732A1 (en) | 2001-09-26 | 2005-09-08 | Scientific Learning Corporation | Method and apparatus for automated training of language learning skills |
US6985865B1 (en) | 2001-09-26 | 2006-01-10 | Sprint Spectrum L.P. | Method and system for enhanced response to voice commands in a voice command platform |
US6650735B2 (en) | 2001-09-27 | 2003-11-18 | Microsoft Corporation | Integrated voice access to a variety of personal information services |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
US7167832B2 (en) | 2001-10-15 | 2007-01-23 | At&T Corp. | Method for dialog management |
US7312785B2 (en) * | 2001-10-22 | 2007-12-25 | Apple Inc. | Method and apparatus for accelerated scrolling |
GB2381409B (en) | 2001-10-27 | 2004-04-28 | Hewlett Packard Ltd | Asynchronous access to synchronous voice services |
NO316480B1 (no) | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US20030101054A1 (en) | 2001-11-27 | 2003-05-29 | Ncc, Llc | Integrated system and method for electronic speech recognition and transcription |
TW541517B (en) | 2001-12-25 | 2003-07-11 | Univ Nat Cheng Kung | Speech recognition system |
US7197460B1 (en) | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US6847966B1 (en) | 2002-04-24 | 2005-01-25 | Engenium Corporation | Method and system for optimally searching a document database using a representative semantic space |
US7546382B2 (en) | 2002-05-28 | 2009-06-09 | International Business Machines Corporation | Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7299033B2 (en) | 2002-06-28 | 2007-11-20 | Openwave Systems Inc. | Domain-based management of distribution of digital content from multiple suppliers to multiple wireless services subscribers |
US7233790B2 (en) | 2002-06-28 | 2007-06-19 | Openwave Systems, Inc. | Device capability based discovery, packaging and provisioning of content for wireless mobile devices |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7467087B1 (en) | 2002-10-10 | 2008-12-16 | Gillick Laurence S | Training and using pronunciation guessers in speech recognition |
WO2004049306A1 (en) | 2002-11-22 | 2004-06-10 | Roy Rosser | Autonomous response engine |
WO2004053836A1 (en) | 2002-12-10 | 2004-06-24 | Kirusa, Inc. | Techniques for disambiguating speech input using multimodal interfaces |
US7386449B2 (en) | 2002-12-11 | 2008-06-10 | Voice Enabling Systems Technology Inc. | Knowledge-based flexible natural speech dialogue system |
US7956766B2 (en) | 2003-01-06 | 2011-06-07 | Panasonic Corporation | Apparatus operating system |
US7529671B2 (en) | 2003-03-04 | 2009-05-05 | Microsoft Corporation | Block synchronous decoding |
US6980949B2 (en) | 2003-03-14 | 2005-12-27 | Sonum Technologies, Inc. | Natural language processor |
US7496498B2 (en) | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
US7421393B1 (en) | 2004-03-01 | 2008-09-02 | At&T Corp. | System for developing a dialog manager using modular spoken-dialog components |
US7200559B2 (en) | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
US7720683B1 (en) | 2003-06-13 | 2010-05-18 | Sensory, Inc. | Method and apparatus of specifying and performing speech recognition operations |
US7231633B2 (en) * | 2003-07-15 | 2007-06-12 | Lsi Corporation | Debugging with set verbosity level during read and analysis of executable code and associated comments while logging according to set verbosity level |
US7475010B2 (en) | 2003-09-03 | 2009-01-06 | Lingospot, Inc. | Adaptive and scalable method for resolving natural language ambiguities |
JP4314463B2 (ja) | 2003-09-05 | 2009-08-19 | 横河電機株式会社 | アラーム管理システム |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US7155706B2 (en) | 2003-10-24 | 2006-12-26 | Microsoft Corporation | Administrative tool environment |
US7412385B2 (en) | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
US7584092B2 (en) | 2004-11-15 | 2009-09-01 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7447630B2 (en) | 2003-11-26 | 2008-11-04 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
CN1890708B (zh) | 2003-12-05 | 2011-12-07 | 株式会社建伍 | 音频设备控制装置、音频设备控制方法及程序 |
ES2312851T3 (es) | 2003-12-16 | 2009-03-01 | Loquendo Spa | Procedimiento y sistema texto a voz y el programa informatico asociado. |
US7427024B1 (en) | 2003-12-17 | 2008-09-23 | Gazdzinski Mark J | Chattel management apparatus and methods |
US7552055B2 (en) | 2004-01-10 | 2009-06-23 | Microsoft Corporation | Dialog component re-use in recognition systems |
EP1704558B8 (en) | 2004-01-16 | 2011-09-21 | Nuance Communications, Inc. | Corpus-based speech synthesis based on segment recombination |
US20050165607A1 (en) | 2004-01-22 | 2005-07-28 | At&T Corp. | System and method to disambiguate and clarify user intention in a spoken dialog system |
ATE415684T1 (de) | 2004-01-29 | 2008-12-15 | Harman Becker Automotive Sys | Verfahren und system zur sprachdialogschnittstelle |
KR100462292B1 (ko) | 2004-02-26 | 2004-12-17 | 엔에이치엔(주) | 중요도 정보를 반영한 검색 결과 리스트 제공 방법 및 그시스템 |
US7693715B2 (en) | 2004-03-10 | 2010-04-06 | Microsoft Corporation | Generating large units of graphonemes with mutual information criterion for letter to sound conversion |
US7409337B1 (en) | 2004-03-30 | 2008-08-05 | Microsoft Corporation | Natural language processing interface |
US7496512B2 (en) | 2004-04-13 | 2009-02-24 | Microsoft Corporation | Refining of segmental boundaries in speech waveforms using contextual-dependent models |
US7809825B2 (en) * | 2004-05-05 | 2010-10-05 | International Business Machines Corporation | Dissolving network resource monitor |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7720674B2 (en) | 2004-06-29 | 2010-05-18 | Sap Ag | Systems and methods for processing natural language queries |
TWI252049B (en) | 2004-07-23 | 2006-03-21 | Inventec Corp | Sound control system and method |
US7725318B2 (en) | 2004-07-30 | 2010-05-25 | Nice Systems Inc. | System and method for improving the accuracy of audio searching |
US7853574B2 (en) | 2004-08-26 | 2010-12-14 | International Business Machines Corporation | Method of generating a context-inferenced search query and of sorting a result of the query |
US20060050865A1 (en) * | 2004-09-07 | 2006-03-09 | Sbc Knowledge Ventures, Lp | System and method for adapting the level of instructional detail provided through a user interface |
ITRM20040447A1 (it) * | 2004-09-22 | 2004-12-22 | Link Formazione S R L | Sistema di fornitura di seminari interattivi, e relativo metodo. |
US7716056B2 (en) | 2004-09-27 | 2010-05-11 | Robert Bosch Corporation | Method and system for interactive conversational dialogue for cognitively overloaded device users |
US8107401B2 (en) | 2004-09-30 | 2012-01-31 | Avaya Inc. | Method and apparatus for providing a virtual assistant to a communication participant |
US7735012B2 (en) | 2004-11-04 | 2010-06-08 | Apple Inc. | Audio user interface for computing devices |
US7546235B2 (en) | 2004-11-15 | 2009-06-09 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7552046B2 (en) | 2004-11-15 | 2009-06-23 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7702500B2 (en) | 2004-11-24 | 2010-04-20 | Blaedow Karen R | Method and apparatus for determining the meaning of natural language |
CN1609859A (zh) | 2004-11-26 | 2005-04-27 | 孙斌 | 搜索结果聚类的方法 |
US7376645B2 (en) | 2004-11-29 | 2008-05-20 | The Intellection Group, Inc. | Multimodal natural language query system and architecture for processing voice and proximity-based queries |
US8606516B2 (en) * | 2004-11-30 | 2013-12-10 | Dash Navigation, Inc. | User interface system and method for a vehicle navigation device |
US20060122834A1 (en) | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US8214214B2 (en) | 2004-12-03 | 2012-07-03 | Phoenix Solutions, Inc. | Emotion detection device and method for use in distributed systems |
US7636657B2 (en) | 2004-12-09 | 2009-12-22 | Microsoft Corporation | Method and apparatus for automatic grammar generation from data entries |
US7536565B2 (en) | 2005-01-07 | 2009-05-19 | Apple Inc. | Techniques for improved playlist processing on media devices |
US7873654B2 (en) | 2005-01-24 | 2011-01-18 | The Intellection Group, Inc. | Multimodal natural language query system for processing and analyzing voice and proximity-based queries |
US7508373B2 (en) | 2005-01-28 | 2009-03-24 | Microsoft Corporation | Form factor and input method for language input |
GB0502259D0 (en) | 2005-02-03 | 2005-03-09 | British Telecomm | Document searching tool and method |
US7676026B1 (en) | 2005-03-08 | 2010-03-09 | Baxtech Asia Pte Ltd | Desktop telephony system |
US7925525B2 (en) | 2005-03-25 | 2011-04-12 | Microsoft Corporation | Smart reminders |
WO2006129967A1 (en) | 2005-05-30 | 2006-12-07 | Daumsoft, Inc. | Conversation system and method using conversational agent |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8024195B2 (en) | 2005-06-27 | 2011-09-20 | Sensory, Inc. | Systems and methods of performing speech recognition using historical information |
US7538685B1 (en) * | 2005-06-28 | 2009-05-26 | Avaya Inc. | Use of auditory feedback and audio queues in the realization of a personal virtual assistant |
US7826945B2 (en) | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US20070067309A1 (en) | 2005-08-05 | 2007-03-22 | Realnetworks, Inc. | System and method for updating profiles |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
WO2007027989A2 (en) | 2005-08-31 | 2007-03-08 | Voicebox Technologies, Inc. | Dynamic speech sharpening |
US8265939B2 (en) | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP4908094B2 (ja) | 2005-09-30 | 2012-04-04 | 株式会社リコー | 情報処理システム、情報処理方法及び情報処理プログラム |
US7930168B2 (en) | 2005-10-04 | 2011-04-19 | Robert Bosch Gmbh | Natural language processing of disfluent sentences |
US8620667B2 (en) | 2005-10-17 | 2013-12-31 | Microsoft Corporation | Flexible speech-activated command and control |
US7707032B2 (en) | 2005-10-20 | 2010-04-27 | National Cheng Kung University | Method and system for matching speech data |
US20070100883A1 (en) | 2005-10-31 | 2007-05-03 | Rose Daniel E | Methods for providing audio feedback during the navigation of collections of information |
US20070106674A1 (en) | 2005-11-10 | 2007-05-10 | Purusharth Agrawal | Field sales process facilitation systems and methods |
US7822749B2 (en) | 2005-11-28 | 2010-10-26 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
KR20070057496A (ko) | 2005-12-02 | 2007-06-07 | 삼성전자주식회사 | 액정 표시 장치 |
KR100810500B1 (ko) | 2005-12-08 | 2008-03-07 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법 |
DE102005061365A1 (de) | 2005-12-21 | 2007-06-28 | Siemens Ag | Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem |
US7996228B2 (en) | 2005-12-22 | 2011-08-09 | Microsoft Corporation | Voice initiated network operations |
US7599918B2 (en) | 2005-12-29 | 2009-10-06 | Microsoft Corporation | Dynamic search with implicit user intention mining |
JP2007183864A (ja) | 2006-01-10 | 2007-07-19 | Fujitsu Ltd | ファイル検索方法及びそのシステム |
US20070174188A1 (en) | 2006-01-25 | 2007-07-26 | Fish Robert D | Electronic marketplace that facilitates transactions between consolidated buyers and/or sellers |
IL174107A0 (en) | 2006-02-01 | 2006-08-01 | Grois Dan | Method and system for advertising by means of a search engine over a data network |
US20070192027A1 (en) | 2006-02-13 | 2007-08-16 | Research In Motion Limited | Navigation tool with audible feedback on a wireless handheld communication device |
KR100764174B1 (ko) | 2006-03-03 | 2007-10-08 | 삼성전자주식회사 | 음성 대화 서비스 장치 및 방법 |
US7752152B2 (en) | 2006-03-17 | 2010-07-06 | Microsoft Corporation | Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling |
JP4734155B2 (ja) | 2006-03-24 | 2011-07-27 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
US7707027B2 (en) | 2006-04-13 | 2010-04-27 | Nuance Communications, Inc. | Identification and rejection of meaningless input during natural language classification |
US7676699B2 (en) * | 2006-04-28 | 2010-03-09 | Microsoft Corporation | Event trace conditional logging |
US8423347B2 (en) | 2006-06-06 | 2013-04-16 | Microsoft Corporation | Natural language personal information management |
US20100257160A1 (en) | 2006-06-07 | 2010-10-07 | Yu Cao | Methods & apparatus for searching with awareness of different types of information |
US7523108B2 (en) | 2006-06-07 | 2009-04-21 | Platformation, Inc. | Methods and apparatus for searching with awareness of geography and languages |
US7483894B2 (en) | 2006-06-07 | 2009-01-27 | Platformation Technologies, Inc | Methods and apparatus for entity search |
KR100776800B1 (ko) | 2006-06-16 | 2007-11-19 | 한국전자통신연구원 | 지능형 가제트를 이용한 맞춤형 서비스 제공 방법 및시스템 |
US7548895B2 (en) | 2006-06-30 | 2009-06-16 | Microsoft Corporation | Communication-prompted user assistance |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8037179B2 (en) * | 2006-11-02 | 2011-10-11 | Storz Endoskop Produktions Gmbh | Device control system employing extensible markup language for defining information resources |
US20080129520A1 (en) | 2006-12-01 | 2008-06-05 | Apple Computer, Inc. | Electronic device with enhanced audio feedback |
WO2008085742A2 (en) | 2007-01-07 | 2008-07-17 | Apple Inc. | Portable multifunction device, method and graphical user interface for interacting with user input elements in displayed content |
KR100883657B1 (ko) | 2007-01-26 | 2009-02-18 | 삼성전자주식회사 | 음성 인식 기반의 음악 검색 방법 및 장치 |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US7822608B2 (en) | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US20080221880A1 (en) | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile music environment speech processing facility |
US7801729B2 (en) | 2007-03-13 | 2010-09-21 | Sensory, Inc. | Using multiple attributes to create a voice search playlist |
US8924844B2 (en) * | 2007-03-13 | 2014-12-30 | Visual Cues Llc | Object annotation |
US8219406B2 (en) | 2007-03-15 | 2012-07-10 | Microsoft Corporation | Speech-centric multimodal user interface design in mobile technology |
US7809610B2 (en) | 2007-04-09 | 2010-10-05 | Platformation, Inc. | Methods and apparatus for freshness and completeness of information |
US7983915B2 (en) | 2007-04-30 | 2011-07-19 | Sonic Foundry, Inc. | Audio content search engine |
US8055708B2 (en) | 2007-06-01 | 2011-11-08 | Microsoft Corporation | Multimedia spaces |
US8204238B2 (en) | 2007-06-08 | 2012-06-19 | Sensory, Inc | Systems and methods of sonic communication |
US8190627B2 (en) | 2007-06-28 | 2012-05-29 | Microsoft Corporation | Machine assisted query formulation |
US8019606B2 (en) | 2007-06-29 | 2011-09-13 | Microsoft Corporation | Identification and selection of a software application via speech |
US7617074B2 (en) * | 2007-07-06 | 2009-11-10 | Microsoft Corporation | Suppressing repeated events and storing diagnostic information |
JP2009036999A (ja) | 2007-08-01 | 2009-02-19 | Infocom Corp | コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体 |
KR101359715B1 (ko) | 2007-08-24 | 2014-02-10 | 삼성전자주식회사 | 모바일 음성 웹 제공 방법 및 장치 |
US8190359B2 (en) | 2007-08-31 | 2012-05-29 | Proxpro, Inc. | Situation-aware personal information management for a mobile device |
US8826132B2 (en) | 2007-09-04 | 2014-09-02 | Apple Inc. | Methods and systems for navigating content on a portable device |
US20090058823A1 (en) | 2007-09-04 | 2009-03-05 | Apple Inc. | Virtual Keyboards in Multi-Language Environment |
US8683378B2 (en) * | 2007-09-04 | 2014-03-25 | Apple Inc. | Scrolling techniques for user interfaces |
US8838760B2 (en) | 2007-09-14 | 2014-09-16 | Ricoh Co., Ltd. | Workflow-enabled provider |
KR100920267B1 (ko) | 2007-09-17 | 2009-10-05 | 한국전자통신연구원 | 음성 대화 분석 시스템 및 그 방법 |
US8706476B2 (en) | 2007-09-18 | 2014-04-22 | Ariadne Genomics, Inc. | Natural language processing method by analyzing primitive sentences, logical clauses, clause types and verbal blocks |
ES2363037T3 (es) * | 2007-09-21 | 2011-07-19 | The Boeing Company | Control de vehículos. |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8036901B2 (en) | 2007-10-05 | 2011-10-11 | Sensory, Incorporated | Systems and methods of performing speech recognition using sensory inputs of human position |
US20090112677A1 (en) | 2007-10-24 | 2009-04-30 | Rhett Randolph L | Method for automatically developing suggested optimal work schedules from unsorted group and individual task lists |
US7840447B2 (en) | 2007-10-30 | 2010-11-23 | Leonard Kleinrock | Pricing and auctioning of bundled items among multiple sellers and buyers |
US7983997B2 (en) | 2007-11-02 | 2011-07-19 | Florida Institute For Human And Machine Cognition, Inc. | Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes |
US8112280B2 (en) | 2007-11-19 | 2012-02-07 | Sensory, Inc. | Systems and methods of performing speech recognition with barge-in for use in a bluetooth system |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US8099289B2 (en) | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US8165884B2 (en) * | 2008-02-15 | 2012-04-24 | Microsoft Corporation | Layered prompting: self-calibrating instructional prompting for verbal interfaces |
CA2719301C (en) * | 2008-03-25 | 2016-10-04 | E-Lane Systems Inc. | Multi-participant, mixed-initiative voice interaction system |
EP2274895A1 (en) * | 2008-03-27 | 2011-01-19 | Markport Limited | Processing of messaging service attributes in communication systems |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US8666824B2 (en) | 2008-04-23 | 2014-03-04 | Dell Products L.P. | Digital media content location and purchasing system |
US8285344B2 (en) | 2008-05-21 | 2012-10-09 | DP Technlogies, Inc. | Method and apparatus for adjusting audio for a user environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8694355B2 (en) | 2008-05-30 | 2014-04-08 | Sri International | Method and apparatus for automated assistance with task management |
US8233366B2 (en) | 2008-06-02 | 2012-07-31 | Apple Inc. | Context-based error indication methods and apparatus |
US20090313564A1 (en) | 2008-06-12 | 2009-12-17 | Apple Inc. | Systems and methods for adjusting playback of media files based on previous usage |
US8527876B2 (en) | 2008-06-12 | 2013-09-03 | Apple Inc. | System and methods for adjusting graphical representations of media files based on previous usage |
US8423288B2 (en) | 2009-11-30 | 2013-04-16 | Apple Inc. | Dynamic alerts for calendar events |
US8166019B1 (en) | 2008-07-21 | 2012-04-24 | Sprint Communications Company L.P. | Providing suggested actions in response to textual communications |
WO2010022561A1 (en) * | 2008-08-29 | 2010-03-04 | Mediatek (Hefei) Inc. | Method for playing voice guidance and navigation device using the same |
KR101005074B1 (ko) | 2008-09-18 | 2010-12-30 | 주식회사 수현테크 | 합성수지제 파이프 연결 고정구 |
US9200913B2 (en) | 2008-10-07 | 2015-12-01 | Telecommunication Systems, Inc. | User interface for predictive traffic |
US8140328B2 (en) | 2008-12-01 | 2012-03-20 | At&T Intellectual Property I, L.P. | User intention based on N-best list of recognition hypotheses for utterances in a dialog |
US8456420B2 (en) * | 2008-12-31 | 2013-06-04 | Intel Corporation | Audible list traversal |
US8447609B2 (en) * | 2008-12-31 | 2013-05-21 | Intel Corporation | Adjustment of temporal acoustical characteristics |
US9489131B2 (en) * | 2009-02-05 | 2016-11-08 | Apple Inc. | Method of presenting a web page for accessibility browsing |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8165321B2 (en) | 2009-03-10 | 2012-04-24 | Apple Inc. | Intelligent clip mixing |
US8805823B2 (en) | 2009-04-14 | 2014-08-12 | Sri International | Content processing systems and methods |
US8606735B2 (en) | 2009-04-30 | 2013-12-10 | Samsung Electronics Co., Ltd. | Apparatus and method for predicting user's intention based on multimodal information |
KR101581883B1 (ko) | 2009-04-30 | 2016-01-11 | 삼성전자주식회사 | 모션 정보를 이용하는 음성 검출 장치 및 방법 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
KR101562792B1 (ko) | 2009-06-10 | 2015-10-23 | 삼성전자주식회사 | 목표 예측 인터페이스 제공 장치 및 그 방법 |
US8527278B2 (en) | 2009-06-29 | 2013-09-03 | Abraham Ben David | Intelligent home automation |
US20110047072A1 (en) | 2009-08-07 | 2011-02-24 | Visa U.S.A. Inc. | Systems and Methods for Propensity Analysis and Validation |
US8768313B2 (en) | 2009-08-17 | 2014-07-01 | Digimarc Corporation | Methods and systems for image or audio recognition processing |
US9213558B2 (en) | 2009-09-02 | 2015-12-15 | Sri International | Method and apparatus for tailoring the output of an intelligent automated assistant to a user |
US8321527B2 (en) | 2009-09-10 | 2012-11-27 | Tribal Brands | System and method for tracking user location and associated activity and responsively providing mobile device updates |
KR20110036385A (ko) | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US9197736B2 (en) | 2009-12-31 | 2015-11-24 | Digimarc Corporation | Intuitive computing methods and systems |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US20120137367A1 (en) | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US8712759B2 (en) | 2009-11-13 | 2014-04-29 | Clausal Computing Oy | Specializing disambiguation of a natural language expression |
KR101960835B1 (ko) | 2009-11-24 | 2019-03-21 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
US8396888B2 (en) | 2009-12-04 | 2013-03-12 | Google Inc. | Location-based searching using a search area that corresponds to a geographical location of a computing device |
KR101622111B1 (ko) | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
US20110161309A1 (en) | 2009-12-29 | 2011-06-30 | Lx1 Technology Limited | Method Of Sorting The Result Set Of A Search Engine |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8334842B2 (en) | 2010-01-15 | 2012-12-18 | Microsoft Corporation | Recognizing user intent in motion capture system |
US8626511B2 (en) | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
US20110218855A1 (en) | 2010-03-03 | 2011-09-08 | Platformation, Inc. | Offering Promotions Based on Query Analysis |
KR101369810B1 (ko) | 2010-04-09 | 2014-03-05 | 이초강 | 로봇을 위한 경험적 상황인식 방법을 실행하는 프로그램을 기록한 컴퓨터 판독가능한 기록 매체. |
US8265928B2 (en) | 2010-04-14 | 2012-09-11 | Google Inc. | Geotagged environmental audio for enhanced speech recognition accuracy |
US20110279368A1 (en) | 2010-05-12 | 2011-11-17 | Microsoft Corporation | Inferring user intent to engage a motion capture system |
US8694313B2 (en) | 2010-05-19 | 2014-04-08 | Google Inc. | Disambiguation of contact information using historical data |
US8522283B2 (en) | 2010-05-20 | 2013-08-27 | Google Inc. | Television remote control data transfer |
US8468012B2 (en) | 2010-05-26 | 2013-06-18 | Google Inc. | Acoustic model adaptation using geographic information |
US20110306426A1 (en) | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Activity Participation Based On User Intent |
US8234111B2 (en) | 2010-06-14 | 2012-07-31 | Google Inc. | Speech and noise models for speech recognition |
US8411874B2 (en) | 2010-06-30 | 2013-04-02 | Google Inc. | Removing noise from audio |
US8775156B2 (en) | 2010-08-05 | 2014-07-08 | Google Inc. | Translating languages in response to device motion |
US8473289B2 (en) | 2010-08-06 | 2013-06-25 | Google Inc. | Disambiguating input based on context |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
JP2014520297A (ja) | 2011-04-25 | 2014-08-21 | ベベオ,インク. | 高度な個人的時刻表アシスタントのためのシステムよび方法 |
-
2010
- 2010-01-13 US US12/686,876 patent/US8381107B2/en active Active
-
2011
- 2011-01-06 EP EP16188055.4A patent/EP3128414A1/en not_active Ceased
- 2011-01-06 EP EP11701893A patent/EP2524298A1/en not_active Ceased
- 2011-01-06 WO PCT/US2011/020350 patent/WO2011087953A1/en active Application Filing
- 2011-01-06 AU AU2011205498A patent/AU2011205498B2/en active Active
- 2011-01-06 KR KR1020137008581A patent/KR101798269B1/ko active IP Right Grant
- 2011-01-06 KR KR1020127021094A patent/KR101280090B1/ko active IP Right Grant
- 2011-01-06 CN CN201180010303.6A patent/CN102763072B/zh active Active
-
2013
- 2013-02-15 US US13/769,217 patent/US9311043B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471098A (zh) * | 2002-06-25 | 2004-01-28 | 根据用户反应选择项 | |
US20040036715A1 (en) * | 2002-08-26 | 2004-02-26 | Peter Warren | Multi-level user help |
CN101228503A (zh) * | 2005-03-23 | 2008-07-23 | 摩托罗拉公司 | 用于用户界面的自适应菜单 |
EP1818786A1 (en) * | 2006-02-13 | 2007-08-15 | Research In Motion Limited | Navigation tool with audible feedback on a handheld communication device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914344A (zh) * | 2013-01-07 | 2014-07-09 | 泰为信息科技公司 | 具有多模式互动机构的计算系统及其操作方法 |
CN103914344B (zh) * | 2013-01-07 | 2019-05-03 | 泰为信息科技公司 | 具有多模式互动机构的计算系统及其操作方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2524298A1 (en) | 2012-11-21 |
US8381107B2 (en) | 2013-02-19 |
KR20130043245A (ko) | 2013-04-29 |
KR101798269B1 (ko) | 2017-11-15 |
AU2011205498A1 (en) | 2012-08-02 |
AU2011205498B2 (en) | 2015-04-09 |
US9311043B2 (en) | 2016-04-12 |
US20110173539A1 (en) | 2011-07-14 |
WO2011087953A1 (en) | 2011-07-21 |
EP3128414A1 (en) | 2017-02-08 |
KR20120105561A (ko) | 2012-09-25 |
US20130159861A1 (en) | 2013-06-20 |
KR101280090B1 (ko) | 2013-06-28 |
CN102763072B (zh) | 2016-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102763072A (zh) | 自适应音频反馈系统和方法 | |
US10191552B2 (en) | Haptic authoring tool using a haptification model | |
CN103677261A (zh) | 用户装置的情景感知服务提供方法和设备 | |
CN103716454A (zh) | 利用语音识别执行预设操作模式的方法和设备 | |
US20110154235A1 (en) | Apparatus and method of searching for contents in touch screen device | |
CN102830898A (zh) | 具有触摸屏的设备中的滚动装置及方法 | |
CN106712179B (zh) | 一种实现反向充电的方法及装置 | |
CN104102376A (zh) | 触摸输入设备触觉反馈 | |
CN104035672A (zh) | 用于通过检测摩擦手势提供预览的移动设备及其控制方法 | |
CN104111794A (zh) | 用于提供与设备状态相应的改变的快捷图标的方法和设备 | |
CN103577091A (zh) | 用于执行多个应用的显示装置和用于控制它的方法 | |
CN102782631A (zh) | 具有多个触摸屏幕的移动终端的屏幕控制方法和设备 | |
CN102541430A (zh) | 在便携式终端中对电子书翻页的设备和方法 | |
CN105308550A (zh) | 信息显示终端 | |
CN103220580A (zh) | 图像显示设备及其搜索多媒体内容回放点的方法 | |
CN103870133A (zh) | 用于滚动显示装置的屏幕的方法和设备 | |
CN108027695A (zh) | 基于体验模式转换的应用用户接口重新配置 | |
CN103903613A (zh) | 一种信息处理方法及电子设备 | |
CN105074643A (zh) | 非词典字符串的手势键盘输入 | |
CN104049891A (zh) | 在显示器未确认模式下执行动作的移动装置及其控制方法 | |
CN104391644A (zh) | 一种输入方法及装置 | |
CN103207726A (zh) | 在便携式终端中提供快捷服务的装置和方法 | |
CN103577060A (zh) | 一种数据处理方法及电子设备 | |
CN103995659A (zh) | 一种通过语音控制文段复制粘贴的方法及其装置 | |
EP2940563A1 (en) | Display control device, display control method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |