DE69818161T2 - Automatisierte Gruppierung von sinnvollen Sätzen - Google Patents
Automatisierte Gruppierung von sinnvollen Sätzen Download PDFInfo
- Publication number
- DE69818161T2 DE69818161T2 DE69818161T DE69818161T DE69818161T2 DE 69818161 T2 DE69818161 T2 DE 69818161T2 DE 69818161 T DE69818161 T DE 69818161T DE 69818161 T DE69818161 T DE 69818161T DE 69818161 T2 DE69818161 T2 DE 69818161T2
- Authority
- DE
- Germany
- Prior art keywords
- sentences
- meaningful
- task
- meaningful sentences
- distortion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 45
- 230000014509 gene expression Effects 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 9
- 238000013179 statistical model Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims 3
- 238000009826 distribution Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
Description
- HINTERGRUND DER ERFINDUNG
- 1. Erfindungsgebiet
- Diese Erfindung betrifft die Sprachverarbeitung und insbesodere ein System und ein Verfahren zur automatischen Gruppie- rung von sinnvollen Sätzen in Bezug auf die Leistung von einer oder mehreren Aufgaben.
- 2. Beschreibung des Standes der Technik
- In Nachrichtennetzwerken gibt es viele Fälle, wo es wünschenswert ist, für die automatische Implementierung von besonderen Aufgaben zu sorgen, die von einem Benutzer eines solchen Netzwerkes erwünscht sind -- d. h. die Implementierung einer solchen Aufgabe ohne menschlichen Eingriff. Im Stand der Technik wird eine solche automatische Aufgabenimplementierung allgemein mithilfe einer Mehrzahl an Menüauswahlen durchgeführt, die durch bestimmte Signale von einem Benutzer – allgemein numerische Signale, die von einer Tastatur erzeugt werden, die mit einem Telefonapparat des Benutzers verknüpft ist – und in einigen Fällen durch den Benutzer, der solche Zahlen als Schlüsselworte ausspricht, ausgewählt werden müssen. In einigen Fällen beinhalten einem Menü zugrundeliegende automatische Aufgabenimplementierungsanordnungen mehrstufige Menüs. Solche mehrstufigen Menüaufbauten sind im allgemein nicht sehr beliebt für Benutzer und beim Erzielen der gewünschten Aufgabe beträchtlich ineffizient. Der Prozentsatz der erfolgreichen Leitwegführungen in einem mehrstufigen Menüaufbau kann relativ niedrig sein. Anders dargelegt, könnten unter solchen Umständen viele der Anrufe, die auf einen solche mehrstufige Menüstruktur zugreifen, entweder beendet werden, ohne dass der Anrufer das gewünschte Ziel erreicht hat, oder sie könnten andernfalls einem Operator zugeführt werden (oder eine anders besetzte vorgegebene Stelle).
- Den Grenzen aus dem Stand der Technik begegnete man in der Patentschrift US-A-5 794 193, "Automated Phrase Generation", und in der Patentschrift US-A-5 675 707 "Automated Call Routing System", die beide am 15. September 1995 eingereicht wurden. Diese Schriften stellen eine Methode für die automatische Aufgabenauswahl bereit, worin die ausgewählte Aufgabe in der natürlichere Sprache eines eine solche Auswahl treffenden Benutzers identifiziert wird. Ein fundamentaler Aspekt dieses Verfahrens ist die Bestimmung einer Reihe von sinnvollen Sätzen. Diese sinnvollen Sätze werden von einem grammatikalischen Rückschluss-Algorithmus bestimmt, der an einem vorbestimmten Corpus an Sprachausdrücken arbeitet, wobei jeder dieser Ausdrücke mit einem speziellen Aufgabenziel verknüpft wird, und worin jeder Ausdruck mit seinem dazugehörigen Aufgabenziel markiert wird.
- Die in der oben geschilderten Anwendung verwendete Bestimmung der sinnvollen Sätze findet man im Konzept der Kombination eines Maßes der Geläufigkeit an Worten und/oder einer Struktur innerhalb der Sprache -- d. h. wie häufig Gruppierungen von Dingen zusammen erfolgen -- mit einem Maß der Bedeutung in Bezug auf eine bestimmte Aufgabe für eine solche Gruppierung. Dieses Maß an Geläufigkeit innerhalb der Sprache kann als wechselseitige Information in n-grams erscheinen, die von einer Datenbank aus Schulungs-Sprachausdrücken hergeleitet wird, und das Maß der Nützlichkeit in Bezug auf eine Aufgabe erscheint als ein Maß an Ausgeprägtheit.
- Die wechselseitige Information ("MI" = Mutual Information), die die Wahrscheinlichkeit des Mit-Auftretens für zwei oder mehrere Worte misst, involviert nur die Sprache selbst . Bei Vorgabe von z. B. Krieg und Frieden in Original-Russisch könnte man die wechselseitige Information für alle möglichen Wortpaare in diesem Text berechnen, ohne überhaupt ein Wort der Sprache zu verstehen, in der sie geschrieben ist. Im Gegensatz dazu involviert das Rechen der Ausgeprägtheit sowohl die Sprache als auch ihre extra-linguistischen Verknüpfungen für eine Umgebung der Vorrichtung. Mittels der Verwendung einer solchen Kombination aus der MI- und einem Ausgeprägtheitsfaktor werden sinnvolle Sätze ausgewählt, die sowohl eine positive MI (die eine relativ enge Verknüpfung zwischen den Worten anzeigt, die den Satz umfassen) als auch einen hohen Ausgeprägtheitswert aufweisen.
- Jedoch basieren diese Verfahren auf die Wahrscheinlichkeit, dass in einem besonderen Eingabausdruck unabhängige Reihen an ausgeprägten Worten auftreten. Beispielsweise würden die ausgeprägten Sätze "habe ein Ferngespräch gemacht", "ein Ferngespräch" und "Ferngespräch", aufgrund ihrer individuellen wechselseitigen Information und Ausgeprägtheitswerte durch diesen grammatikalischen Rückschluss-Algorithmus als unabhängige sinnvolle Sätze bestimmt, obwohl sie von den Benutzern zum Erreichen desselben Ziels gesprochen werden. Solchermaßen werden viele einzelne Sätze, die virtuell identisch sind und dieselbe Bedeutung haben, erzeugt, bleiben getrennt und stellen unabhängige Wahrscheinlichkeiten des Auftretens im grammatikalischen Rückschluss-Algorithmus dar. Indem diese "ähnlichen" ausgeprägten Sätze nicht gruppiert werden, könnten die obigen Verfahren schlechtere Wahrscheinlichkeits-Schätzwerte bereitstellen und solchermaßen letztlich für die falsche Leitwegführung der Anfragen von den Benutzern sorgen.
- ZUSAMMENFASSUNG DER ERFINDUNG
- Ein Verfahren und ein System für die automatische Aufgabenklassifizierung, wie in den Ansprüchen 1–16 beansprucht, wird bereitgestellt, worin eine ausgewählte Aufgabe von der natürlichen Sprache des die Wahl treffenden Benutzers identifiziert wird. Das Verfahren und das System schließen die Wahl der sinnvollen Sätze mittels der Verwendung eines Tests für die Bedeutung ein. Die ausgewählten sinnvollen Sätze werden dann mittels Verwendung einer Kombination von Folgen und von semantischen Verzerrungen gruppiert. Die Gruppierungen von sinnvollen Sätzen werden an einen Spracherkenner eingegeben, der bestimmt, ob irgendwelche Gruppierungen von sinnvollen Sätzen in der Eingabesprache vorliegen. Daraufhin werden Aufgaben-artige Entscheidungen auf der Grundlage der Gruppierungen von erkannten sinnvollen Sätzen getroffen.
- KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 veranschaulicht Beispiele für die falsche und verpasste Erfassung durch einen Klassifizierer für ein auto matisches Anruf-Leitwegführung-System auf der Grundlage der Verwendung von "sinnvollen Sätzen"; -
2 veranschaulicht Beispiele der richtigen Erfassung durch einen Klassifizierer für ein automatisches Anruf-Leitwegführung-System auf der Grundlage der Verwendung von "sinn- vollem Sätzen"; -
3 veranschaulicht ein Beispiel für den Vorteil, der vom "sinnvollen Satz"-Klassifizierungsparameter des Systems der Erfindung bereitgestellt wird; -
4 zeigt in Blockdiagrammform eine beispielhafte Struktur des Systems der Erfindung; -
5 schildert das Verfahren der Erfindung in Flussdiagrammform; -
6 veranschaulicht eine Gruppierung für einen sinnvollen Satz (Meaningful Phrase Cluster); -
7 veranschaulicht eine Gruppierung für einen sinnvollen Satz (Meaningful Phrase Cluster) mittels Verwendung einer annähernden Übereinstimmung; und -
8 ist ein Graph der ROC-Kurven, der die Leistung des Systems darstellt. - DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
- Die folgende Erörterung wird teilweise im Sinne von Algorithmen und symbolischen Darstellungen der Betriebe auf Datenbits innerhalb eines Computersystems dargelegt. Wie verständlich sein wird, sind diese algorithmischen Beschreibungen und Darstellungen ein Mittel, das für gewöhnlich von Fachleuten auf Computerverarbeitungsgebieten verwendet wird, um die Substanz ihrer Arbeit an andere Fachleute zu befördern.
- Wie hierin (und allgemein) verwendet, kann ein Algorithmus als eine in sich geschlossene Schrittabfolge angesehen werden, die zu einem gewünschten Ergebnis führt. Diese Schritte beinhalten im allgemeinen Manipulierungen von physikalischen Größen. Für gewöhnlich – obwohl nicht notwendigerweise – nehmen diese Größen die Form von elektrischen oder magnetischen Signalen an, die in der Lage sind, gespeichert, überführt, kombiniert, verglichen oder auf eine andere Art und Weise manipuliert zu werden. Zur Bequemlichkeit der Beschreibung und um des Verhaltens mit einem allgemeinen Verwendung willen werden diese Signale von Zeit zu Zeit im Sinne von Bits, Werten, Elementen, Symbolen, Zeichen, Begriffen, Zahlen oder dergleichen beschrieben werden. Jedoch sollte hervorgehoben werden, dass diese und ähnliche Begriffe mit den richtigen physikalischen Größen verknüpft werden müssen -- wobei diese Begriffe bloß vorteilhafte, an diesen Größen angelegte Etiketts sind.
- Es ist wichtig, sowohl die Unterscheidung des Verfahrens der Betriebe und des Betreibens eines Computers als auch das Verfahren der Berechnung selbst zu berücksichtigen. Die vorliegende Erfindung betrifft Verfahren zum Betreiben eines Computers beim Verarbeiten von elektrischen oder anderen (z. B. mechanischen, chemikalischen) physikalischen Signalen, damit andere gewünschte physikalische Signale erzeugt werden.
- Um der Erläuterung willen, wird die darstellende Ausführungsform der vorliegenden Erfindung als einzelne Funktionsblöcke umfassend (einschließlich von Funktionsblöcken, die als "Prozessoren" gekennzeichnet sind) dargelegt. Die Funktionen, die diese Blöcke darstellen, können mittels Verwendung von entweder einer geteilten oder zweckgebundenen Hardware einschließlich einer Hardware, die in der Lage ist, eine Software auszuführen (aber nicht darauf beschränkt) bereitgestellt werden. Zum Beispiel können die Funktionen der in der
4 gezeigten Prozessoren von einem einzelnen geteilten Prozessor bereitgestellt werden. (Die Verwendung des Begriffs "Prozessor" sollte nicht so gedeutet werden, als betreffe er ausschließlich eine Hardware, die in der Lage ist, eine Software auszuführen.) Darstellende Ausführungsformen können eine Mikroprozessor- und/oder Digital-Signal-Prozessor-(DSP)-Hardware wie beispielsweise die AT&T DSPI6 oder DSP32C, einen Festspeicher (ROM) zum Speichern der die unten erörterten Betriebe durchführenden Software und einen Direktzugriffspeicher (RAM) zum Speichern von Ergebnissen umfassen. Hardware-Ausführungsformen mit sehr hohem Integrationsgrad (VLSI) sowie eine kundenspezifische VLSI-Schaltung in Kombination mit einem Allzweck-DSP-Stromkreis können ebenfalls bereitgestellt werden. - Ein fundamentales Ziel der Erfindung ist ein Aufgaben-Auswahl-Verfahren, das die Kommunikation zwischen einem menschlichen Benutzer und der Vorrichtung beinhaltet und das die Last des Verstehens eines bestimmten Vokabulars vom Benutzer auf die Vorrichtung verschiebt. Solchermaßen wird die Erfindung in einer allgemeinen Ausführungsform als ein Aufgaben-Auswahl-Verfahren dargestellt, das die folgenden Merkmale hat: Als erstes wird einem Benutzer, der auf ein System zugreift, ein Gruß so ähnlich wie "Wie kann ich Ihnen helfen?" vorgelegt.
- Nachdem der Benutzer mit einer natürlichen Spracherklärung über sein Ziel (wie beispielsweise die Implementierung einer gewünschten Aufgabe) antwortet, kann die Anfrage des Benutzers in eine einer Anzahl an vorbestimmten Aufgabenzielen klassifiziert werden, wobei das Aufgabenziel danach implementiert wird.
- In der hiernach beschriebenen bevorzugten Ausführungsform der Erfindung wird die Implementierung des Systems und des Verfahrens der Erfindung gelegentlich von beispielhaften Applikationen in Form der von einem Benutzer angeforderten Aufgaben dargestellt, die von einem Telefonsystem oder Netzwerk durchgeführt werden sollen. In solchen beispielhaften Applikationen können Aufgabenziele für einen Benutzer Anruf-Abrechnungsoptionen (z. B. R-Gespräch, Dritte), eine Wählinformation, Abrechnungsfragen, Kreditanfragen (wie für eine falsche oder falsch gewählte Nummer), eine Ortskennzahl, usw. einschließen.
- I. DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
- In traditionellen Kommunikationsumgebungen wird häufig ein Benutzer benötigt, um unabhängige Nummern und/oder Wählmuster zu kennen, um auf verschiedene Dienste zugreifen zu können, die an einem gegebenen Kommunikations-Bestimmungsort erhältlich sind, sowie möglichst ein Menü-betriebenes System navigieren zu müssen, das dann den Benutzer zum gewünschten Ziel führt. Mit dem System und dem Verfahren der Erfindung ist der Benutzer in der Lage, auf eine zentrale Nummer zuzugreifen, und das Ziel des Benutzers wird vom Kommunikations-Empfänger auf der Grundlage seines Inhalts implementiert.
- Ein Beispiel für eine solche Inhalt-basierende Leitwegführung wäre, wenn ein Anrufer auf eine "Wie kann ich Ihnen helfen"-Aufforderung mit Ich will ein R-Gespräch führen antwortet. Die richtige Aktion liegt darin, den Anrufer mit einem automatischen Hilfssystem zu verbinden, das R-Gespräche verarbeitet. Ein weiteres Beispiel wäre eine Anruferantwort wie Ich habe ein Problem damit, meine Rechnung zu verstehen, wobei in diesem Fall der Anrufer mit dem Geschäftsbüro der Telefongesellschaft verbunden werden sollte. Es ist somit nötig, dass das System gesprochene Sprache bis zu dem Ausmaß versteht, dass der Anruf richtig weitergeleitet wird.
- A. Grundlegende Vorgehensweise
- Der Grundaufbau eines solchen Systems wurde von einem der Erfinder in Gorin, A. "On automated language acquisition", J. Acoust. Soc. Am., 97 3441–3461, (Juni, 1995) (hiernach wird darauf als Gorin 95 Bezug genommen), beschrieben. Eine Reihe der Betrachtungen aus dieser grundlegenden Vorgehensweise liefern Material für das System und das Verfahren der Erfindung. Bestimmte Betrachtungen aus diesen Betrachtungen werden hiernach kurz überprüft. Als Einleitung für diese Überprüfung sollte angemerkt werden, dass die in Gorin 95 beschriebene Vorgehensweise – der Klassifizierungsparameter für die Bestimmung einer Verknüpfung zwischen dem eingegebenen Text oder der Sprache und einem einer Reihe von vorbestimmten Aufgabenzielen – als ausgeprägte Worte implementiert wird, die von einem Corpus der Sprachausdrücke hergeleitet werden, der markierte, dazugehörige Aufgabenziele hat. In der Anpassung dieses hierin beschriebenen Verfahrens wird der Klassifizierungsparameter als Gruppierungen von sinnvollen Sätzen implementiert, die von einem Corpus aus Sprachausdrücken hergeleitet werden, die markierte, dazugehörige Leitwegführung-Ziele haben.
- Der Mittelpunkt für die Vorgehensweise bildet hier eine Datenbank einer großen Anzahl an Ausdrücken, wobei jeder mit einem Ziel einer vorbestimmten Reihe von Leitwegführung-Zielen verwandt ist. Diese Datenbank bildet eine Eingabe für einen Klassifizierungsparameter-Algorithmus. Vorzugsweise werden sol che Ausdrücke von tatsächlichen Benutzerantworten auf eine Aufforderung wie "Wie kann ich Ihnen helfen?" (oder ähnlichen Worten für denselben Effekt) extrahiert. Jeder Ausdruck wird dann umgeschrieben und mit einem Ziel einer vorbestimmten Reihe von Leitwegführung-Zielen markiert. Darstellende Ausdrücke der von den Erfindern verwendeten Datenbank lauten wie folgt:
Ja, ich will ein R-Gespräch führen
Ich wurde gerade von dieser Nummer getrennt
Ich habe versucht, den Hörer einzuhängen
Ich versuche, Mexiko zu erreichen
Rechne dies meinem Haustelefon an - In einem betreffenden Artikel, in dem einer der Erfinder (Gorin, A. L., Hanek, H., Rose, R. und Miller, L.,) Mit-Verfasser ist, "Spoken Language Acquisition for Automated Call Routing", in Proceedings of the International Conference on Spoken Language Processing (ICSLP 94), Yokohama (Sept. 18–22, 1994) (hiernach Gorin 94A), wird angemerkt, dass die Verteilung der Leitwegführung-Ziele in einer solchen Datenbank im wesentlichen schief verteilt sein kann. Die Begleiterscheinungen dieser Schief-Verteilung kann bei der Bestimmung der besonderen Reihe der Leitwegführung-Ziele, die auf einer automatischen Grundlage vom System der Erfindung unterstützt werden, berücksichtigt werden.
- Ein Ausgeprägtheitsprinzip, wie das System der Erfindung betreffend, wurde in einem anderen Artikel bestimmt, das von einem der Erfinder mit-verfasst wurde (Gorin, A. L., Levinson, S. E. und Sankar, A. "An Experiment in Spoken Language Acquisition," IEEE Trans. on Speech and Audio, Vol. 2, Nr. 1, Teil II, S. 224–240 (Jan. 1994)) (hiernach Gorin 94). Spezifisch wird die Ausgeprägtheit eines Wortes als Informationsinhalt von diesem Wort für die erwogene Aufgabe bestimmt . Sie kann als ein Maß dafür interpretiert werden, wie sinnvoll dieses Wort für die Aufgabe ist. Die Ausgeprägtheit kann vom traditionellen Shannon-Informationsinhalt unterschieden werden und damit verglichen werden, der die Unbestimmtheit misst, mit der ein Wort erfolgen wird. Wie bekannt, kann ein solcher traditioneller Informationsinhalt aus den Beispielen der Sprache geschätzt werden, während eine Schätzung der Ausgeprägtheit sowohl die Sprache als auch ihre extra-linguistischen Verknüpfungen benötigt.
- Wie zuvor angemerkt, verwendet Gorin 95 als Klassifizierungsparameter Worte aus Testsprachausdrücken, die eine ausgeprägte Verknüpfung mit besonderen Ziel-Leitwegführungenen haben. Die U.S.-Patentschriften US-A-5 675 707 und US-A-5 794 193 stellen einen bedeutenden Ausgangspunkt. für diese Methode mittels Verwendung der sinnvollen Sätze als Klassifizierungsparameter dar. Bevor das Verfahren zur Bestimmung dieser sinnvollem Sätze beschrieben wird, ist es nützlich, zwei Tyspen von Fehlern, die man in einem solchen automatischen Leitwegführung-System erfahren kann, und ein dazugehöriges "Erfolgs" -Konzept zu bestimmen:
Die falsche Erfassung eines Leitwegführung-Ziels kann erfolgen, wenn ein ausgeprägter (sinnvoller) Satz, der ein Leitwegführung-Ziel betrifft, in einer Eingabesprache des Anrufers erfasst wird, sofern die eigentliche Anfrage des Anrufers an ein anderes Leitwegführung-Ziel geleitet wird. Die Wahrscheinlichkeit einer solchen auftretenden falschen Erfassung wird hiernach als die Bestimmung PFD bezeichnet. - Die verpasste Erfassung eines Leitwegführung-Ziels erfolgt, wenn sich die Eingabesprache der Anrufer auf das Leitwegführung-Ziel richtet und keiner der sinnvollen Sätze, die mit diesem Leitwegführung-Ziel verknüpft sind, in der Eingabesprache erfasst wird. Die Wahrscheinlichkeit einer solchen erfolgenden verpassten Erfassung wird hiernach als die Bestimmung PMD bezeichnet.
- Die Abdeckung für ein Leitwegführung-Ziel betrifft die Anzahl der vom System gemachten erfolgreichen Übersetzungen einer Anfrage nach einem Leitwegführung-Ziel an dieses Leitwegführung-Ziel in Bezug auf die Gesamtzahl der eingegebenen Anfragen nach diesem Leitwegführung-Ziel. Man würde als darstellendes Beispiel sagen, dass ein Leitwegführung-Ziel, für das von 100 eingegebenen Anfragen nach diesem Leitwegführung-Ziel 60 erfolgreiche Übersetzungen erfolgten, eine 60%ige Abdeckung erfährt. Es wird vermerkt, dass die Abdeckung = 1 – PMD.
- Von den zwei oben bestimmten Fehlerarten ist eine bedeutend "teurer" als die andere. Die Folge eines falschen Erfassungsfehlers ist das Führen eines Benutzers an ein anderes Aufgabenziel als das vom Benutzer verlangte. Ein solches Ergebnis ist zumindest sehr störend. für den Benutzer. Es besteht auch die Möglichkeit, dass ein solcher Fehler zu direkten Kosten für den System-Provider führen kann -- ein verärgerter Kunde bzw. potentieller Kunde wird hier als indirekter Kostenfaktor klassifiziert -- und zwar durch irgendeinen Nicht-Systemfehler, der daher herrührt, dass der Anrufer mit einem falschen Leit-wegführung-Ziel verbunden ist. Die Folge eines verpassten Erfassungsfehlers ist andererseits einfach das Führen des Benutzers an eine vorgegebene Operatorstelle, und die einzigen Kosten sind die Kosten einer verpassten Gelegenheit zum Abwickeln dieser besonderen Aufgabe auf automatischer Grundlage. Obwohl ideal die Wahrscheinlichkeit sowohl für eine verpasste Erfassung als auch für eine falsche Erfassung annähernd Null sein sollte, ist es aus der Perspektive des Benutzers weit wichtiger, dass dieses Ziel für falsche Erfassungsfehler erzielt wird. Wie unten ersichtlich sein wird, gibt es Umstände, worin Kompromisse gemacht werden müssen, um entweder die eine oder die andere Fehlerwahrscheinlichkeit zu minimieren, und dieses Prinzip wird unter diesen Umständen angelegt.
- B. Anpassung der grundlegenden Vorgehensweise
-
1 sorgt für mehrere darstellende Beispiele der falschen Erfassung und der verpassten Erfassung aus der Datenbank der von den Erfindern verwendeten Sprachausdrücke. Obwohl angenommen wird, dass sich der Grund für einen Fehler in jedem dieser Beispiele weitestgehend von selbst erklärt, wird der Fehler im ersten Beispiel in jeder Reihe kurz beschrieben. Im ersten Beispiel unter der falschen Erfassung ist der sinnvolle Satz ICH BRAUCHE KREDIT EOS (Ende des Satzes), und solchermaßen würde dieser Satz als eine Anfrage nach einem Kredit klassifiziert werden. Aus dem Lesen des gesamten Ausdrucks ist es jedoch ersichtlich, dass der Anrufer eigentlich an einer anderen Telefongesellschaft überführt werden wollte (die Telefongesellschaft, die diese Anfrage empfängt, ist AT&T). Im ersten Beispiel unter der verpassten Erfassung gibt es im Ausdruck keine identifizierten sinnvollen Sätze (und daher keine Grundlage für die Klassifizierung des Ziels des Anrufers), obwohl es für die den Ausdruck lesenden Personen ersichtlich ist, dass der Anrufer nach einem Rechnungskredit sucht. Als Vergleichsdarstellung zeigt die2 mehrere Beispiele für die richtige Erfassung eines Rechnungskredit-Ziels aus sinnvollen Sätzen in der Eingabesprache. - Es gibt zwei wesentliche Vorteile der Methode der Erfindung bei der Verwendung sinnvoller Sätze als Klassifizierungsparameter gegenüber der Verwendung von ausgeprägten Worten im in Gorin 95 beschriebenen grundlegenden Vorgehensweise. Zunächst können in Zusammenhang mit der Verwendung der Worte als Klassifizierungsparameter die Wortauswahlen zum Erfassen eines gegebenen Leitwegführung-Ziels stark eingeschränkt werden, um eine minimale Wahrscheinlichkeit für eine falsche Erfassung zu erzielen -- d. h. die alleinige Verwendung von Worten, die eine nahezu 100%ige Wahrscheinlichkeit der Vorhersage des beabsichtigten Leitwegführung-Ziels haben -- und daher ist es wahrscheinlich, dass die Abdeckung für ein solches Leitwegführung-Ziel sehr niedrig ist, was zu einer hohen Wahrscheinlichkeit des Auftretens von verpassten Erfassungsfehlern führt. Mit sinnvollen Sätzen als Klassifizierungsparameter sind andererseits sowohl die geringe Wahrscheinlichkeit der falschen Erfassung als auch der verpassten Erfassung erzielbar.
-
3 stellt ein darstellendes Beispiel dieses Vorteils bereit. Diese Figur zeigt die Klassifizierungsrate und die Abdeckung für ein beispielhaftes Leitwegführung-Ziel -Rechnungskredit-, wenn der für das Klassifizierungsparamter verwendete Satz in Länge und/oder Komplexität wächst. Die Klassifizierungsrate wird als Wahrscheinlichkeit des angeforderten Leitwegführung-Ziels (KREDIT) bestimmt, wenn das Auftreten des ausgewählten Satzes in der Eingabesprache vorgegeben ist (d. h. P(KREDIT | Satz). Auf eine ähnliche Art und Weise wird der Abdeckungsbegriff als die Wahrscheinlichkeit bestimmt, dass der ausgewählte Satz der in der Eingabesprache erscheint, wenn vorgegeben ist, dass das bestimmte Leitwegführung-Ziel (KREDIT) angefordert wurde. In der Satz-Spalte deuten Klammern, die eine Reihe von Begriffen umgeben, die durch "|" getrennt werden, auf einen. dieser Begriffe, der in der angezeigten Stelle mit anderen Begriffen in dieser Zeile erscheinen. Die Terminologie "F (falsch)" deutet auf ein Grammatikfragment, das das Wort "falsch" umgibt, wobei der Satz in der vierten Zeile dieser Spalte ein solches Grammatikfragment darstellt, das ein ausgeprägtes Wort umgibt. Die Bestimmung "vorherig" deutet auf einen Übertrag von allem aus der vorherigen Zeile. Und schließlich deutet die Abkürzung "EOS" auf das "Ende des Satzes". - In Spracherkennungssystemen gilt, dass je größer das Sprachfragment ist, das einem solchen Spracherkenner vorgelegt wird, desto höher die Wahrscheinlichkeit einer richtigen Erkennung von diesem Sprachfragment ist. Solchermaßen kann man erwarten, dass ein Spracherkenner, der programmiert ist, um ein Wort einer Reihe von ausgeprägten Worten auszumachen, in seiner Aufgabe bedeutend häufiger scheitert als es eine Vorrichtung tut, die programmiert ist, um sinnvolle Sätze, die zwei oder mehrere Wörter umfassen, auszumachen.
- C. Beschreibung der Methode der Erfindung
- Die Methode der Erfindung wird graphisch im Flussdiagramm der
5 dargestellt. Den Schritten des Flussdiagramms folgend werden im Schritt 110 sinnvolle Sätze aus Transkriptionen von erkannten Ausdrücken erzeugt, indem geschätzte spätere Verteilungen über Aufgabentypen und einen Test für die Bedeutung verwendet werden, wie er unten dargelegt wird. Die sinnvollen Sätze, die erzeugt wurden, werden dann im Schritt 120 gruppiert und zu Gruppierungen von sinnvollen Sätzen gebildet, indem auf der Grundlage der Folgen- und der semantischen Verzerrung ein Abstandsmaß zwischen den Sätzen verwendet wird. Im Schritt 130 wird dann mittels Verwendung von genauen oder beinahen Übereinstimmungsverfahren nach Gruppierungen von sinnvollen Sätzen gesucht und in der Eingabesprache erfasst. Aufgaben-artige Entscheidungen werden im Schritt 140 auf der Grundlage von Gruppierungen von erfassten sinnvollen Sätzen gemacht. - D. Auswahl und Gruppierung von sinnvollen Sätzen
- 1. Auswahl der sinnvollen Sätze
- In einem Spracherkennungssystem ist es wünschenswert, Sätze zu suchen, die für die Aufgabe sinnvoll sind. Ein Maß der Ausgeprägtheit kann verwendet werden, um für einen bestimmten Satz die Verzerrung zwischen den vorherigen und späteren Ver- teilungen über die Anruftypen zu schätzen. Jedoch berücksichtigt dies nicht die Häufigkeit, mit der ein Fragment auftritt. Eine glückliche Verbindung von Ereignissen kann z. B. einem Satz mit einer niedrigen Häufigkeit bloß durch Glück eine hohe scheinbare Ausgeprägtheit verleihen.
- Hierin wird dieser Nachteil vermieden, indem für jeden Satz die Nullhypothese geprüft wird, die einfach durch die vorherigen. Wahrscheinlichkeiten geleitet wird (und daher zufällig erfolgt). Angenommen, ein Satz f hat eine Gesamtzahl von n Auftritten der Anruf-artigen Etiketts in der Schulung, und lasse (r1, r2, ...) den Satz aller möglichen Partitionen von n Auftritten in K = 15 Klassen bezeichnen. Lass die eigentlich beobachtete Verteilung der Zählwerte für f rf sein und die vorherige Verteilung {Pk}k=l,...,k. Unter der Nullhypothese wird die Wahrscheinlichkeit einer Verteilung ri = nil,...Ni K durch die Polynom-Verteilung
-
- Jeder Satz, für den die beobachtete Verteilung als relativ wahrscheinliche Zufallsprobe zur Vorherigen gesehen werden kann, wird daher abgelehnt. Dies stellte einen genauen Bedeutungstest dar und ist daher selbst für Sätze mit sehr kleinen Auftritts-Zahlen gültig. Das Auferlegen eines Bedeutungsgrads von 5% reduziert die Gesamtzahl der im Stand der Technik erzeugten Sätze um etwa 30%.
- 2. Gruppierung von sinnvollen Sätzen
- Der zweite Schritt ist es, die Sätze zu gruppieren, indem ein Anhäufungs-Gruppierungsverfahren verwendet wird. Für dieses verwenden wir ein Levenshtein-Folgen-Abstandsmaß ds(f1, f2) zwi schen den Sätzen f1, f2, in dem die Einfügungs-, Löschungs- und Substitutionsstrafen durch die Wortausgeprägtheit gewichtet werden. Jedoch können Sätze, die als Folgen ähnlich sind, unterschiedliche Semantiken haben; z. B. weisen die Sätze "brauche einen Kredit" und "eine Kreditkarte" jeweils auf eine Abrechnungskredit-Anfrage und eine Kreditkarten-Zahlung hin. Es wäre für diese Sätze nicht wünschenswert, dieselbe Gruppierung einzugeben. Wiederum müssen die Veränderlichkeiten, die kleinen Proben zugeschrieben werden können, erwogen werden, um dieses Problem einzuschätzen. Daher wird ein Maß der semantischen Verzerrung verwendet, worin
- P(ck ∊ Ct|⨍ ∊ Ft) ist die ausgewertete spätere Verteilung von Anruftypen Ck für Sätze f, und Ct, Ft sind die Reihen von Etiketts und der beobachteten Sätze für einen Ausdruck t. Der Nenner ist ein Schätzwert der Abweichung des Unterschieds zwischen den geschätzten späteren Werten (für jeden Anruftyp) unter der Hypothese H. Diese Hypothese sagt aus, dass die zwei Sätze dieselbe wahre (aber unbekannte) spätere Verteilung haben. wenn H wahr ist, dann ist der erwartete Wert für dM(f1, f2) ungeachtet der Satzauftrittzahl gleich 1, 0; ein großer Wert für dieses Maß ist Beweis für die Divergenz zwischen den späteren Verteilungen. Das für die Gruppierung verwendete Gesamt-Maß ist eine Kombination aus der Folge und den semantischen Verzerrungen.
- Jede der entstandenen Satz-Gruppierungen wird in eine finite Zustand-Vorrichtung (FSM) konvertiert, die eine Gruppierung von sinnvollen Sätzen darstellt. Ein Beispiel wird in der
6 gezeigt. In diesem Beispiel wird "mache ein R-Gespräch" mit den anderen sinnvollen Sätzen "melde ein R-Gespräch an", "mache R-Gespräch" und "mache ein R-Telefongespräch" gruppiert. - Die spätere Verteilung von den Anruftypen wird dann für jede FSM erhalten. Beobachtungen in Form genauer oder annähernder Übereinstimmungen mit einem weg durch die FSM werden dann für die Testausdrücke gefunden. Die annähernden Übereinstimmungen werden mittels Verwendung eines dynamischen Programmierungs algorithmus gefunden, in dem die Wortausgeprägtheit verwendet wird, um die Fehler zu gewichten. Ein Beispiel für eine annähernde Übereinstimmung wird in der
7 gezeigt, worin das Wort "ein" durch "diese" ersetzt wird, wobei beide Worte eine geringe Ausgeprägtheit haben. - 3. Verwertung mehrerer Sätze
-
- Gruppierungen von sinnvollen Sätzen werden häufig als korreliert befunden, und Experimente, die höherwertige statistische Modelle beinhalten, werden entwickelt.
- 4. Klassifizierungsexperimente
- Die anfänglichen Ergebnisse werden mittels Verwendung einer Reihe von sinnvollen Sätzen bis zu vier Worten Länge erhalten. Eine Testreihe von 1000 Ausdrücken wurde von einem Spracherkenner mit großen Wortschatz verarbeitet. Übereinstimmungen von Sätzen für die Ausgabe wurden gefunden und auf eine Art und weise syntaktisch analysiert, die längere Sätze begünstigt, da diese dazu neigen, ausgeprägter zu sein. Der Typ des Anrufs wurde von einem Peak-an-Fragmenten-Klassifizierer bestimmt. Eines der Anruf-artigen Etiketts ist "anders", und das gewünschte Ziel für diesen besonderen Anruf ist es, abgelehnt zu werden. Durch das Ändern des Akzeptanz-Schwellwerts und das Aufzeichnen der richtigen Klassifizierungsrate gegen diefalschen Ablehnungsrate erhalten wir ROC-Kurven, die von den gestrichelten Linien in der
8 gezeigt werden. - Die durchgezogenen Linien in der
8 zeigen die mittels der oben beschriebenen Verfahren erzielten Ergebnisse. Eine bedeutende Verbesserung in der Leistung wird für dieselbe Ausgabe des Spracherkennungssystems gesehen. Dies ist besonders im Bereich eines nützlichen Betriebspunktes mit 87%iger richtiger Klassifizierungsrate an der Rangzahl2 für eine 40%ige Falsch-Ablehnungsrate bemerkenswert. - E. Beispielhafte Struktur für die Erfindung
-
4 zeigt in Blockdiagrammform den wesentlichen Aufbau der Erfindung. Wie aus der4 ersichtlich, umfasst dieser Aufbau zwei verwandte Untersysteme: ein Untersystem1 zur Erzeugung von sinnvollen Sätzen und ein Untersystem2 zur Klassifizierungs der Eingabesprache. Wie bereits beschrieben, arbeitet das Untersystem1 zur Erzeugung von sinnvollen Sätzen auf einer Datenbank mit einer großen Anzahl an Ausdrücken, die jeweils mit einer vorbestimmten Reihe an Leitwegführung-Zielen verwandt sind, worin jeder dieser Ausdrücke mit seinem dazugehörigen Leitwegführung-Ziel markiert ist. Der Betrieb dieses Untersystems wird im wesentlichen durch den Selektor10 für sinnvolle Sätze durchgeführt, der als eine Ausgabe eine Reihe an sinnvollen Sätzen auswählt, die ein probabilistisches Verhältnis mit einem oder mehreren einer Reihe an vorbestimmten Leitwegführung-Zielen haben, mit denen die Eingabesprachausdrücke verknüpft werden. Die ausgewählten sinnvollen Sätze werden dann an eine Gruppierungsvorrichtung 15 für sinnvolle Sätze eingegeben, die diese sinnvollen Sätze gruppiert, die semantisch verwandt sind. Der Betrieb des Selektors10 für sinnvolle Sätze und der Gruppierungsvorrichtung15 für sinnvolle Sätze wird allgemein in Übereinstimmung mit dem zuvor beschriebenen Algorithmus zur Auswahl und Gruppierung von sinnvollen Sätzen bestimmt. - Der Betrieb des Untersystems
2 zur Klassifizierungs der Eingabesprache beginnt mit der Eingabe einer Aufgabenzielanfrage eines Benutzers in der natürlichen Sprache des Benutzers an den Eingabespracherkenner 20. Der Eingabespracherkenner20 kann irgendeinen bekannten Aufbau haben und führt die Funktion des Erkennens oder Ausmachens des Vorliegens von einem oder mehreren sinnvollen Sätzen in der Eingabesprache durch. Ein Detektor25 für die Gruppierung von sinnvollen Sätzen erfasst dann die unter den erkannten sinnvollen Sätzen vorhandenen Gruppierungen von sinnvollen Sätzen. Wie in der Figur zu sehen, werden die vom Unteresystem1 zur Erzeugung von sinnvollen Sätzen entwickelten Gruppierungen von sinnvollen Sätzen als Eingabe an den Detektor25 für die Gruppierung von sinnvollen Sätzen bereitgestellt. - Die Ausgabe des Detektors
25 von sinnvollen Sätzen, der die Gruppierungen von erfassten sinnvollen Sätzen umfassen wird, die in der Leitwegführung-Ziel-Anfrage des Anrufers erscheinen, wird dem Klassifizierungsprozessor3b bereitgestellt. Der Klassifizierungsprozessor30 kann auf der Grundlage des probabilistischen Verhältnisses zwischen den Gruppierungen von erkannten sinnvollen Sätzen und den ausgewählten Aufgabenzielen eine Vertrauensfunktion anlegen und eine Entscheidung darüber fällen, ob er ein besonderes Aufgabenziel implementiert oder eine Bestimmung macht, dass keine Entscheidung wahrscheinlich ist, wobei in diesem Fall der Benutzer an einer Operatorstelle weitergegeben wird. - Wie solchermaßen ersichtlich, werden die vom Untersystem
1 zur Erzeugung von sinnvollen Sätzen1 entwickelten Gruppierungen von sinnvollen Sätzen vom Detektor25 für die Gruppierung von sinnvollen Sätzen verwendet, um die Gruppierungen von sinnvollen Sätzen zu bestimmen, zu deren Erkennung der Detektor programmiert ist, und vom Klassifizierungsprozessor30 verwendet, der die Aufgabenziele bestimmt, die mit der Eingabe von sinnvollen Sätzen vom Detektor25 für die Gruppierung von sinnvollen Sätzen verwandt sind, und um, falls bestätigt, den Vertrauensgrad für ein Verhältnis von diesen eingegebenen Gruppierungen von sinnvollen Sätzen mit einem besonderen Aufgabenziel zu errichten. - SCHLUSSFOLGERUNG
- Ein Verfahren für die automatische Ausgabenauswahl wurde offenbart, das die Funktion zum Suchen nach Klassifizierungsparametern in einer natürlichen Sprache durchführt. Diese Klassifizierungsparameter werden in Form von kompakten Gruppierungen von sinnvollen Sätzen dargelegt, die aus einer Reihe von ausgewählten sinnvollen Sätzen erzeugt werden. Durch die automatische Auswahl und Gruppierung von sinnvollen Sätzen erhöht sich die Genauigkeit der automatischen Leitwegführung-Systeme.
- Obwohl die vorliegende Ausführungsform der Erfindung detailliert beschrieben wurde, sollte es klar sein, dass darin verschiedene Änderungen, Veränderungen und Ersetzungen vorgenommen werden können, ohne sich vom Schutzumfang der Erfindung, wie von den anliegenden Ansprüchen definiert. zu lösen.
- Wenn technische Merkmale in den Ansprüchen mit Bezugszeichen versehen sind, so sind diese Bezugszeichen lediglich zum besseren Verständnis der Ansprüche vorhanden. Dementsprechend stellen solche Bezugszeichen keine Einschränkungen des Schutzumfangs solcher Elemente dar, die nur exemplarisch durch solche Bezugszeichen gekennzeichnet sind.
Claims (16)
- Ein Verfahren zur automatischen Aufgabenklassifizierung, das an einem Aufgabenziel eines Benutzers arbeitet, wobei das Aufgabenziel in der natürlichen Sprache des Benutzers ausgedrückt wird, wobei das Verfahren umfasst: die Auswahl von sinnvollen Sätzen aus einer Mehrzahl von umgeschriebenen Sprachausdrücken, die ein probabilistisches Verhältnis mit einem oder mehreren einer Reihe von vorbestimmten Aufgabenzielen haben; das Gruppieren von einigen ausgewählten der sinnvollen Sätze, die in ähnlichen semantischen Zusammenhängen auftreten, in Gruppierungen von sinnvollen Sätzen, worin die sinnvollen Sätze mittels Verwendung eines Verzerrungsmaßes zwischen den sinnvollen Sätzen gruppiert werden; das Erfassen von Gruppierungen von sinnvollen Sätzen, die in den Eingabesprachausdrücken des Benutzers vorliegen; und das Treffen von Aufgaben-artigen Klassifizierungs-Entscheidungen auf der Grundlage der Gruppierungen von erfassten sinnvollen Sätzen in den Eingabesprachausdrücken auf der Grundlage eines probabilistischen Verhältnisses zwischen Gruppierungen von erkannten sinnvollen Sätzen und ausgewählten Aufgabenzielen.
- Das automatische Aufgabenklassifizierungsverfahren nach Anspruch 1, worin die sinnvollen Sätze mittels Verwendung eines Tests für die Bedeutung ausgewählt werden.
- Das automatische Aufgabenklassifizierungsverfahren nach Anspruch 1, worin das Verzerrungsmaß auf einer Folgen-Verzerrung basiert; oder worin das Verzerrungsmaß auf einer semantischen Verzerrung basiert; oder worin das Verzerrungsmaß eine Kombination aus der Folgen- und der semantischen Verzerrung ist.
- Das automatische Aufgabenklassifizierungsverfahren nach den Ansprüchen 1 oder 2, worin die Gruppierungen von sinnvollen Sätzen in der Eingabesprache erfasst werden, indem die Eingabesprache genau an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird; oder worin die Gruppierungen in der Eingabesprache erfasst werden, indem die Eingabesprache genau oder ungefähr an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird.
- Das automatische Aufgabenklassifizierungsverfahren nach einem oder mehreren der Ansprüche 1–4, worin die Aufgabenartigen Klassifizierungsentscheidungen mittels Verwendung eines statistischen Modells eingeordnet werden.
- Das automatische Aufgabenklassifizierungsverfahren nach einem. oder mehreren der Ansprüche 1–5, das weiterhin ein neurales Netz zur Erzeugung der Aufgaben-artigen Klassifizierungsentscheidungen umfasst.
- Ein Verfahren zur automatischen Aufgabenklassifizierung, das an einem Anruf-Leitwegführung-Ziel eines Benutzers arbeitet, wobei das Anruf-Leitwegführung-Ziel in der natürlichen Sprache des Benutzers ausgedrückt wird, wobei das Verfahren folgendes umfasst: die Auswahl von sinnvollen Sätzen aus einer Mehrzahl an umgeschriebenen Sprachausdrücken, die ein probabilistisches Verhältnis mit einem oder mehreren einer Reihe von vorbestimmten Aufgabenzielen haben; das Gruppieren von einigen ausgewählten der sinnvollen Sätze, die in ähnlichen semantischen Zusammenhängen auftreten, in Gruppierungen von sinnvollen Sätzen, worin die sinnvollen Sätze mittels Verwendung eines Verzerrungsmaßes zwischen den sinnvollen Sätzen gruppiert werden; das Erfassen von Gruppierungen von sinnvollen Sätzen, die in den Eingabesprachausdrücken des Benutzers vorliegen; und das Treffen von Aufgaben-artigen Klassifizierungs-Entschei dungen auf der Grundlage der Gruppierungen von erfassten sinnvollen Sätzen in den Eingabesprachausdrücken auf der Grundlage eines probabilistischen Verhältnisses zwischen Gruppierungen von erkannten sinnvollen Sätzen und ausgewählten Aufgabenzielen,
- Das automatische Aufgabenklassifizierungsverfahren nach Anspruch 7, worin die sinnvollen Sätze mittels Verwendung eines Tests für die Bedeutung ausgewählt werden.
- Das automatische Aufgabenklassifizierungsverfahren nach Anspruch 7, worin das Verzerrungsmaß auf einer Folgen-Verzerrung basiert; oder worin das Verzerrungsmaß auf einer semantischen Verzerrung basiert oder worin das Verzerrungsmaß eine Kombination aus der Folgen- und der semantischen Verzerrung ist.
- Das automatische Aufgabenklassifizierungsverfahren nach den Ansprüchen 7 oder 8, worin die Gruppierungen von sinnvollen Sätzen in der Eingabesprache erfasst werden, indem die Eingabesprache genau an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird; oder worin die Gruppierungen in der Eingabesprache erfasst werden, indem die Eingabesprache genau oder ungefähr an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird.
- Das automatische Aufgabenklassifizierungsverfahren nach einem oder mehreren der Ansprüche 7–10, worin die Anruf-artigen Klassifizierungsentscheidungen mittels Verwendung eines statistischen Modells eingeordnet werden; oder worin die Anruf-artigen Klassifizierungsentscheidungen mittels Verwendung eines neuralen Netzes getroffen werden.
- Ein automatisches Aufgabenklassifizierungssystem, das an Aufgabenzielen eines Benutzers arbeitet, wobei die Aufgabenziele in der natürlichen Sprache des Benutzers ausgedrückt werden; wobei es folgendes umfasst: einen Selektor (
10 ) für sinnvolle Sätze, der eine Mehrzahl an sinnvollen Sätzen aus einer Reihe von Sprachausdrücken auswählt, die ein probabilistisches Verhältnis mit. einem oder mehreren einer Reihe von vorbestimmten Aufgabenzielen haben, wobei jeder der sinnvollen Sätze auf der Grundlage von einem einer vorbestimmten Reihe von Aufgabenziele ausgewählt wird; eine Vorrichtung (15 ) zur Gruppierung von sinnvollen Sätzen, um ausgewählte sinnvolle Sätze, die in ähnlichen semantischen Zusammenhängen auftreten, in Gruppierungen von sinnvollen Sätzen zu gruppieren, worin die Vorrichtung zur Gruppierung von sinnvollen Sätzen sinnvolle Sätze mittels Verwendung eines Verzerrungsmaßes zwischen den sinnvollen Sätzen gruppiert; eine Vorrichtung (25 ) zur Erkennung der Eingabe zum Erfassen von irgendeinem der gruppierten sinnvollen Sätze in der Eingabesprache des Benutzers, wobei die Vorrichtung zur Erkennung der Eingabe als eine Eingabe die von der Vorrichtung zur Gruppierung von sinnvollen Sätzen gruppierten sinnvollen Sätze hat; und eine Klassifizierungsvorrichtung (30 ), die auf eine Eingabe der Gruppierungen von erfassten sinnvollen Sätzen reagiert, um auf der Grundlage der Gruppierungen von erfassten sinnvollen Sätzen in Bezug auf einem der Reihe von vorbestimmten Aufgabenzielen eine Klassifizierungsentscheidung zu treffen, und zwar auf der Grundlage eines probabilistischen Verhältnisses zwischen Gruppierungen von erkannten sinnvollen Sätzen und ausgewählten Aufgabenzielen. - Das automatische Aufgabenklassifizierungssystem nach Anspruch 12, worin der Selektor für sinnvolle Sätze sinnvolle Sätze mittels Verwendung eines Tests für die Bedeutung auswählt.
- Das automatische Klassifizierungssystem nach Anspruch 12, worin das Verzerrungsmaß auf einer Folgen-Verzerrung basiert; oder worin das Verzerrungsmaß auf einer semantischen Verzerrung basiert; oder worin das Verzerrungsmaß eine Kombination aus der Folgen- und der semantischen Verzerrung ist.
- Das automatische Aufgabenklassifizierungssystem nach den Ansprüchen 12 oder 13, worin die Vorrichtung zur Erkennung der Eingabe die Gruppierungen von sinnvollen Sätzen in der Eingabesprache erfasst, indem die Eingabesprache genau an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird; oder worin die Vorrichtung zur Erkennung der Eingabe die Gruppierungen von sinnvollen Sätzen in der Eingabesprache erfasst, indem die Eingabesprache genau oder ungefähr an irgendeine der Gruppierungen von sinnvollen Sätzen in Übereinstimmung gebracht wird.
- Das automatische Klassifizierungssystem nach Anspruch 15, worin die Klassifizierungsvorrichtung die Entscheidungen mittels Verwendung eines statistischen Modells einordnet; oder worin die Klassifizierungsvorrichtung Entscheidungen mittels Verwendung eines neuralen Netzes fällt.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US893888 | 1997-07-11 | ||
US08/893,888 US5860063A (en) | 1997-07-11 | 1997-07-11 | Automated meaningful phrase clustering |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69818161D1 DE69818161D1 (de) | 2003-10-23 |
DE69818161T2 true DE69818161T2 (de) | 2004-04-08 |
Family
ID=25402301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69818161T Expired - Fee Related DE69818161T2 (de) | 1997-07-11 | 1998-07-03 | Automatisierte Gruppierung von sinnvollen Sätzen |
Country Status (6)
Country | Link |
---|---|
US (1) | US5860063A (de) |
EP (1) | EP0890942B1 (de) |
JP (1) | JP4053141B2 (de) |
CA (1) | CA2235364C (de) |
DE (1) | DE69818161T2 (de) |
ES (1) | ES2210623T3 (de) |
Families Citing this family (211)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6173261B1 (en) * | 1998-09-30 | 2001-01-09 | At&T Corp | Grammar fragment acquisition using syntactic and semantic clustering |
US7590224B1 (en) * | 1995-09-15 | 2009-09-15 | At&T Intellectual Property, Ii, L.P. | Automated task classification system |
US6044337A (en) * | 1997-10-29 | 2000-03-28 | At&T Corp | Selection of superwords based on criteria relevant to both speech recognition and understanding |
US6012049A (en) * | 1998-02-04 | 2000-01-04 | Citicorp Development Center, Inc. | System for performing financial transactions using a smartcard |
US6317707B1 (en) * | 1998-12-07 | 2001-11-13 | At&T Corp. | Automatic clustering of tokens from a corpus for grammar acquisition |
US7356462B2 (en) * | 2001-07-26 | 2008-04-08 | At&T Corp. | Automatic clustering of tokens from a corpus for grammar acquisition |
US6246986B1 (en) * | 1998-12-31 | 2001-06-12 | At&T Corp. | User barge-in enablement in large vocabulary speech recognition systems |
US6519562B1 (en) * | 1999-02-25 | 2003-02-11 | Speechworks International, Inc. | Dynamic semantic control of a speech recognition system |
US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
DE60040536D1 (de) | 1999-06-11 | 2008-11-27 | Telstra Corp Ltd | Verfahren zur entwicklung eines interaktiven systems |
US6510411B1 (en) * | 1999-10-29 | 2003-01-21 | Unisys Corporation | Task oriented dialog model and manager |
US6681206B1 (en) * | 1999-11-05 | 2004-01-20 | At&T Corporation | Method for generating morphemes |
US7085720B1 (en) * | 1999-11-05 | 2006-08-01 | At & T Corp. | Method for task classification using morphemes |
US20030191625A1 (en) * | 1999-11-05 | 2003-10-09 | Gorin Allen Louis | Method and system for creating a named entity language model |
US8392188B1 (en) | 1999-11-05 | 2013-03-05 | At&T Intellectual Property Ii, L.P. | Method and system for building a phonotactic model for domain independent speech recognition |
US7286984B1 (en) | 1999-11-05 | 2007-10-23 | At&T Corp. | Method and system for automatically detecting morphemes in a task classification system using lattices |
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US6526382B1 (en) * | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
WO2001046945A1 (en) * | 1999-12-20 | 2001-06-28 | British Telecommunications Public Limited Company | Learning of dialogue states and language model of spoken information system |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7149695B1 (en) * | 2000-10-13 | 2006-12-12 | Apple Computer, Inc. | Method and apparatus for speech recognition using semantic inference and word agglomeration |
US6941266B1 (en) | 2000-11-15 | 2005-09-06 | At&T Corp. | Method and system for predicting problematic dialog situations in a task classification system |
US7184947B2 (en) * | 2001-01-05 | 2007-02-27 | Fujitsu Limited | Document anonymity setting device, method and computer readable recording medium recording anonymity setting program |
US6751591B1 (en) | 2001-01-22 | 2004-06-15 | At&T Corp. | Method and system for predicting understanding errors in a task classification system |
WO2002073453A1 (en) * | 2001-03-14 | 2002-09-19 | At & T Corp. | A trainable sentence planning system |
US7729918B2 (en) * | 2001-03-14 | 2010-06-01 | At&T Intellectual Property Ii, Lp | Trainable sentence planning system |
US7574362B2 (en) | 2001-03-14 | 2009-08-11 | At&T Intellectual Property Ii, L.P. | Method for automated sentence planning in a task classification system |
US7698228B2 (en) * | 2001-04-27 | 2010-04-13 | Accenture Llp | Tracking purchases in a location-based services system |
US6848542B2 (en) * | 2001-04-27 | 2005-02-01 | Accenture Llp | Method for passive mining of usage information in a location-based services system |
US6944447B2 (en) * | 2001-04-27 | 2005-09-13 | Accenture Llp | Location-based services |
US7437295B2 (en) * | 2001-04-27 | 2008-10-14 | Accenture Llp | Natural language processing for a location-based services system |
US7970648B2 (en) * | 2001-04-27 | 2011-06-28 | Accenture Global Services Limited | Advertising campaign and business listing management for a location-based services system |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
AU2002950336A0 (en) * | 2002-07-24 | 2002-09-12 | Telstra New Wave Pty Ltd | System and process for developing a voice application |
AU2002951244A0 (en) * | 2002-09-06 | 2002-09-19 | Telstra New Wave Pty Ltd | A development system for a dialog system |
US7263486B1 (en) * | 2002-10-25 | 2007-08-28 | At&T Corp. | Active learning for spoken language understanding |
US20030115062A1 (en) * | 2002-10-29 | 2003-06-19 | Walker Marilyn A. | Method for automated sentence planning |
US8645122B1 (en) * | 2002-12-19 | 2014-02-04 | At&T Intellectual Property Ii, L.P. | Method of handling frequently asked questions in a natural language dialog service |
US20040122661A1 (en) * | 2002-12-23 | 2004-06-24 | Gensym Corporation | Method, system, and computer program product for storing, managing and using knowledge expressible as, and organized in accordance with, a natural language |
US20040148170A1 (en) * | 2003-01-23 | 2004-07-29 | Alejandro Acero | Statistical classifiers for spoken language understanding and command/control scenarios |
US8335683B2 (en) * | 2003-01-23 | 2012-12-18 | Microsoft Corporation | System for using statistical classifiers for spoken language understanding |
AU2003900584A0 (en) * | 2003-02-11 | 2003-02-27 | Telstra New Wave Pty Ltd | System for predicting speech recognition accuracy and development for a dialog system |
AU2003902020A0 (en) * | 2003-04-29 | 2003-05-15 | Telstra New Wave Pty Ltd | A process for grammatical inference |
WO2005009205A2 (en) * | 2003-07-09 | 2005-02-03 | Gensym Corporation | System and method for self management of health using natural language interface |
US7933774B1 (en) * | 2004-03-18 | 2011-04-26 | At&T Intellectual Property Ii, L.P. | System and method for automatic generation of a natural language understanding model |
DE102004055230B3 (de) * | 2004-11-16 | 2006-07-20 | Siemens Ag | Verfahren zur Spracherkennung aus einem vorgebbaren Vokabular |
US7634406B2 (en) * | 2004-12-10 | 2009-12-15 | Microsoft Corporation | System and method for identifying semantic intent from acoustic information |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
WO2007118324A1 (en) * | 2006-04-17 | 2007-10-25 | Call Genie Inc. | Method and apparatus for building grammars with lexical semantic clustering in a speech recognizer |
US9245526B2 (en) * | 2006-04-25 | 2016-01-26 | General Motors Llc | Dynamic clustering of nametags in an automated speech recognition system |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080091423A1 (en) * | 2006-10-13 | 2008-04-17 | Shourya Roy | Generation of domain models from noisy transcriptions |
US20080129520A1 (en) * | 2006-12-01 | 2008-06-05 | Apple Computer, Inc. | Electronic device with enhanced audio feedback |
US8380511B2 (en) * | 2007-02-20 | 2013-02-19 | Intervoice Limited Partnership | System and method for semantic categorization |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) * | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) * | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) * | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) * | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) * | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10540976B2 (en) * | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9431006B2 (en) * | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8682649B2 (en) * | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) * | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8661018B2 (en) | 2010-08-10 | 2014-02-25 | Lockheed Martin Corporation | Data service response plan generator |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US9330665B2 (en) * | 2011-01-07 | 2016-05-03 | Nuance Communications, Inc. | Automatic updating of confidence scoring functionality for speech recognition systems with respect to a receiver operating characteristic curve |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
CN112230878A (zh) | 2013-03-15 | 2021-01-15 | 苹果公司 | 对中断进行上下文相关处理 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11151899B2 (en) | 2013-03-15 | 2021-10-19 | Apple Inc. | User training by intelligent digital assistant |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (de) | 2013-06-09 | 2016-04-20 | Apple Inc. | Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
EP3025295A4 (de) * | 2013-07-26 | 2016-07-20 | Greeneden Us Holdings Ii Llc | System und verfahren zur entdeckung und untersuchung von konzepten |
US10061822B2 (en) | 2013-07-26 | 2018-08-28 | Genesys Telecommunications Laboratories, Inc. | System and method for discovering and exploring concepts and root causes of events |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
KR20150081981A (ko) * | 2014-01-07 | 2015-07-15 | 삼성전자주식회사 | 회의 내용 구조화 장치 및 방법 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
EP3149728B1 (de) | 2014-05-30 | 2019-01-16 | Apple Inc. | Eingabeverfahren durch einzelne äusserung mit mehreren befehlen |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10304440B1 (en) * | 2015-07-10 | 2019-05-28 | Amazon Technologies, Inc. | Keyword spotting using multi-task configuration |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9787819B2 (en) | 2015-09-18 | 2017-10-10 | Microsoft Technology Licensing, Llc | Transcription of spoken communications |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
KR101868404B1 (ko) * | 2016-06-14 | 2018-07-19 | 가천대학교 산학협력단 | 한국어 음성인식기술을 이용한 응급상황관제 시스템 및 관제방법 |
JP6729232B2 (ja) * | 2016-09-20 | 2020-07-22 | 富士通株式会社 | メッセージ振り分けプログラム、メッセージ振り分け装置、およびメッセージ振り分け方法 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434777A (en) * | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
US5384892A (en) * | 1992-12-31 | 1995-01-24 | Apple Computer, Inc. | Dynamic language model for speech recognition |
EP0938076B1 (de) * | 1992-12-31 | 2001-11-28 | Apple Computer, Inc. | Spracherkennungssystem |
JPH06318223A (ja) * | 1993-05-07 | 1994-11-15 | Nippon Telegr & Teleph Corp <Ntt> | クラスタリング装置 |
JPH0934863A (ja) * | 1995-07-14 | 1997-02-07 | Hitachi Ltd | ニューラルネットワークによる情報統合処理方法 |
US5794193A (en) * | 1995-09-15 | 1998-08-11 | Lucent Technologies Inc. | Automated phrase generation |
US5675707A (en) * | 1995-09-15 | 1997-10-07 | At&T | Automated call router system and method |
-
1997
- 1997-07-11 US US08/893,888 patent/US5860063A/en not_active Expired - Lifetime
-
1998
- 1998-04-20 CA CA002235364A patent/CA2235364C/en not_active Expired - Lifetime
- 1998-07-03 ES ES98112418T patent/ES2210623T3/es not_active Expired - Lifetime
- 1998-07-03 JP JP18940398A patent/JP4053141B2/ja not_active Expired - Lifetime
- 1998-07-03 EP EP98112418A patent/EP0890942B1/de not_active Expired - Lifetime
- 1998-07-03 DE DE69818161T patent/DE69818161T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
ES2210623T3 (es) | 2004-07-01 |
EP0890942A3 (de) | 1999-04-21 |
DE69818161D1 (de) | 2003-10-23 |
EP0890942A2 (de) | 1999-01-13 |
JPH11143491A (ja) | 1999-05-28 |
EP0890942B1 (de) | 2003-09-17 |
CA2235364C (en) | 2002-07-16 |
CA2235364A1 (en) | 1999-01-11 |
JP4053141B2 (ja) | 2008-02-27 |
US5860063A (en) | 1999-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69818161T2 (de) | Automatisierte Gruppierung von sinnvollen Sätzen | |
DE69814114T2 (de) | Natürliche sprache verstehendes verfahren und verstehende vorrichung zur sprachsteuerung einer anwendung | |
DE69814104T2 (de) | Aufteilung von texten und identifizierung von themen | |
DE69818231T2 (de) | Verfahren zum diskriminativen training von spracherkennungsmodellen | |
DE69925479T2 (de) | Dynamisch konfigurierbares akustisches modell für spracherkennungssysteme | |
EP0604476B1 (de) | Verfahren zur erkennung von mustern in zeitvarianten messsignalen | |
EP1240642B1 (de) | Das lernen von dialogzuständen und sprachmodellen des gesprochenen informationssystems | |
DE69823644T2 (de) | Auswahl von superwörtern auf der basis von kriterien aus spracherkennung sowie sprachverständnis | |
DE69928181T2 (de) | Verfahren und Vorrichtung zur Spracherkennung unter Verwendung einer Wissensbasis | |
EP1273003B1 (de) | Verfahren und vorrichtung zum bestimmen prosodischer markierungen | |
DE69914839T2 (de) | Sprecherverifikation und -erkennung mittels Eigenstimmen | |
DE602004012909T2 (de) | Verfahren und Vorrichtung zur Modellierung eines Spracherkennungssystems und zur Schätzung einer Wort-Fehlerrate basierend auf einem Text | |
DE60033733T2 (de) | Datenbankabfragesystem basierend auf Spracherkennung | |
DE60123952T2 (de) | Erzeugung von einem einheitlichen aufgabeabhängigen sprachmodell mittels informationsauffindungverfahren | |
DE4397100C2 (de) | Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl | |
DE69816676T2 (de) | System und verfahren zur bestimmung und minimalisierung eines endlichen transducers zur spracherkennung | |
EP0925461B1 (de) | Verfahren zur mehrsprachenverwendung eines hidden markov lautmodelles in einem spracherkennungssystem | |
DE102005029869A1 (de) | Verfahren und Vorrichtung zur Anruflenkung für natürliche Sprache unter Verwendung von Vertrauenswertungen | |
EP0797185B1 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE4310190A1 (de) | Sprecher-Verifizierungssystem unter Verwendung der Abstandsmessung nächster Nachbarn | |
DE69819438T2 (de) | Verfahren zur Spracherkennung | |
DE19942178C1 (de) | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung | |
DE602004004310T2 (de) | System mit kombiniertem statistischen und regelbasierten Grammatikmodell zur Spracherkennung und zum Sprachverstehen | |
DE112020003909T5 (de) | Verfahren zum multimodalen abrufen bzw. wiedergewinnen und clustern unter verwendung einer tiefen cca und aktiver paarweiser abfragen | |
DE60128372T2 (de) | Verfahren und system zur verbesserung der genauigkeit in einem spracherkennungssystem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |