DE69724910T2 - Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung - Google Patents

Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung Download PDF

Info

Publication number
DE69724910T2
DE69724910T2 DE69724910T DE69724910T DE69724910T2 DE 69724910 T2 DE69724910 T2 DE 69724910T2 DE 69724910 T DE69724910 T DE 69724910T DE 69724910 T DE69724910 T DE 69724910T DE 69724910 T2 DE69724910 T2 DE 69724910T2
Authority
DE
Germany
Prior art keywords
character
search
book
transition
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69724910T
Other languages
English (en)
Other versions
DE69724910D1 (de
Inventor
Keiko Mito-shi Gunji
Koyo Hitachiohta-shi Katsura
Soshiro Hitachinaka-shi Kuzunuki
Masaki Hitachi-shi Miura
Toshimi Hitachiohta-shi Yokota
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP12536096A external-priority patent/JP3275704B2/ja
Priority claimed from JP22480896A external-priority patent/JPH1063750A/ja
Priority claimed from JP26193696A external-priority patent/JP3205516B2/ja
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of DE69724910D1 publication Critical patent/DE69724910D1/de
Application granted granted Critical
Publication of DE69724910T2 publication Critical patent/DE69724910T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Description

  • HINTERGRUND DER ERFINDUNG
  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft eine Mustererkennungsvorrichtung zur Erkennung eingegebener Muster und zur Darstellung der erkannten Ergebnisse: Insbesondere betrifft die Erfindung eine Vorrichtung zur Erkennung von Mustern, in die vorgegebene Zeichenketten, wie z. B. Adressen und festgelegte Sätze, handschriftlich eingegeben werden.
  • Beschreibung des Standes der Technik
  • Eine Großzahl von Anwendungen zur Verarbeitung von Zetteln, Etiketten, Rechnungen und anderer Druckformen durch so genannte Stift-PCs (PC mit Stift zur Eingabe) beinhaltet in erster Linie die Eingabe von Adressen und festgelegten Sätzen in die Vorrichtung. Bislang wurden drei repräsentative Verfahren vorgeschlagen, um vorbestimmte Zeichenfolgen wie Adressen und festgelegte Sätze einzugeben: (1) Auswahl aus Kandidaten in einem Menüformat; (2) in einem Menü- und Zeichenerkennungskombinationsformat, Eingabe einer Postleitzahl zur Erzeugung einer Menüdarstellung von Adresskandidaten zur Auswahl aus diesen; (3) Schreiben von zu erkennenden Handzeichen, sodass die Kandidaten durch die Verwendung eines Wörterbuchs optimiert werden.
  • Das oben genannte Verfahren (1) ist anschaulich in "Recognition of Handwritten Addresses in Unframed Setup Allowing for Character Position Displacements" (Periodical D-2 of the Institute of Electronics, Information Communication Engineers of Japan, Jan., 1994) offenbart. Das Verfahren umfasst grundsätzlich Vorgeben hierarchischer Daten, wie z. B. Adressen, Auswahl von Kandidatendaten nacheinander folgend, ausgehend von oben nach unten innerhalb der Hierarchie. Beispielsweise kann "
    Figure 00020001
    (Ibaraki-ken (eine Präfektur in Japan))" gefolgt sein von "
    Figure 00020002
    (Hitachi-shi (Großstadt))", was wiederum gefolgt sein kann von "
    Figure 00020003
    (Oomika-cho (Stadt))". Ein Nachteil dieses Verfahrens ist es, dass, wenn der Nutzer nicht sicher ist, ob Hitachi-shi in Tochigi-ken oder Ibaraki-ken (d. h. der präfekturalen oder obersten Kategorie) angesiedelt ist, es für den Nutzer schwierig ist, Hitachi-shi anschaulich auszuwählen.
  • Bei dem oben genannten Verfahren (2) muss der Nutzer nur eine Postleitzahl eingeben und das System erzeugt eine Menüdarstellung der durch die Postleitzahl angeforderten Adressen zur Auswahl aus diesem. Das Verfahren ist verhältnismäßig einfach, solange der Nutzer alle notwendigen Postleitzahlen in Erinnerung behält. Dies kann jedoch – mit Ausnahme der Postleitzahl der Herkunftsstadt des Nutzers – schwierig sein.
  • Das unter (3) genannte Verfahren ermöglicht es, handgeschriebene Zeichen zu erkennen und deren Kandidaten durch die Verwendung eines Wörterbuchs zu optimieren. Wie dieses Verfahren funktioniert, wird im Folgenden unter Bezugnahme auf einige der beigefügten Zeichnungen erläutert. 3 ist ein schematisches Blockdiagramm einem Zeichenerkennungsprozess a3 wird ein durch ein Tablett a1 eingegebenes Zeichen mit einem Erkennungswörterbuch a2 auf Musterübereinstimmung untersucht. Auf diese Weise erhaltene Zeichenkandidaten werden mit in einem Wörterbuch a6 befindlichen Wörtern während eines Wortsortierprozesses b7 auf Übereinstimmung untersucht. Im Anschluss an den Wortvergleich im Rahmen der Übereinstimmungsuntersuchung werden die in Frage kommenden Worte durch eine LCD-Anzeige a8 angezeigt.
  • 4 ist ein schematisches Ablaufdiagramm, das die Verwendung einer herkömmlichen Vorrichtung zur Erkennung von Zeichen zeigt, die zur Eingabe von Adressen verwendet wird. Beispielsweise schreibt der Nutzer zur Eingabe von "
    Figure 00030001
    (Iberaki-ken (Präfektur))" "
    Figure 00030002
    (Hitachi-shi (Großstadt))", "
    Figure 00030003
    (Oomika-cho (Stadt))", all diese Zeichen in ein vorbestimmtes Adresseneingabefeld b1. Die handgeschriebenen Zeichen werden dann in einem Prozess a3 erkannt. Durch den Erkennungsprozess ermittelte Zeichenkandidaten werden mit Wörtern des Wörterbuchs a6 auf Übereinstimmung untersucht, ausgehend von der höchsten Ebenenkategorie (d. h. die präfekturale Ebene). Die Zeichenkandidaten werden auf diese Weise optimiert und die Ergebnisse werden als Zeichenkandidaten ausgegeben.
  • Herkömmlicherweise wird auf hierarchische Daten, wie z. B. Adressen, ausgehend von der höchsten hierarchischen Ebene nach unten zugegriffen. Dies geschieht deshalb, da mit steigender Hierarchieebene die Menge an gegebenen Daten kleiner wird, sodass dann, wenn der Kandidat der höchsten Ebene ermittelt ist, die Kandidaten der unteren Ebenen in einfacher Weise hiervon abgeleitet werden können. Jedoch angenommen, dass das herkömmliche System ein Kennwort "
    Figure 00040001
    (Oomika-cho (Stadt))" zur Suche innerhalb des Wörterbuchs empfängt, hat das System in diesem Fall keine Wahl, sondern muss das gesamte Wörterbuch mit einer Größe von 1,5 MB durchsuchen, da die Ebene des eingegebenen Kennworts unbekannt ist. Dieses Schema ist daher bei Anwendungen, wie z. B. einer Online-Zeichenerkennung unpraktisch, bei der ein hoher Grad an Ansprechempfindlichkeit erforderlich ist.
  • Ein typisches Wörterbuch, das in Japan Adressen speichert, kann wie folgt aufgebaut sein:
  • Präfekturnamen:
  • Ungefähr 50 Namen × ungefähr 3 Zeichen pro Name × 2 Bytes pro Zeichen = ungefähr 300 B Datenmenge.
  • Großstädte und Städte:
  • Ungefähr 4000 Namen × ungefähr 3 Zeichen pro Name × 2 Bytes pro Zeichen = ungefähr 2,5 kB Datenmenge.
  • Untergeordnete Stadtbezirke:
  • Ungefähr 160 000 Namen × ungefähr 4 Zeichen pro Name × 2 Bytes pro Zeichen = ungefähr 1,3 MB Datenmenge.
  • Die Gesamtdatenmenge in einem solchen repräsentativen Wörterbuch beträgt ungefähr 1,5 MB.
  • Ein Nachteil des oben beschriebenen herkömmlichen Verfahrens ist die schwierige Aufgabe, dass der Nutzer handschriftlich die gesamte gewünschte Adresse bereitstellen muss, die so lang sein kann, wie z. B.
    Figure 00050001
    (Ibaraki-ken),
    Figure 00050002
    (Hitachi-shi),
    Figure 00050003
    (Oomika-cho)".
  • Ein Problem, das allen dreien oben beschriebenen Verfahren gemein ist, liegt darin, dass der Nutzer bei Zeichenerkennungsanwendungen der mühseligen Aufgabe ausgesetzt ist, alle Zeichenfolgen, wie z. B. Adressen und festgelegte Sätze mit der Hand zu schreiben. Ein weiteres grundsätzliches Problem liegt darin, dass das Durchsuchen eines Wörterbuchs bezüglich eines Wortes in jeder anderen als der obersten Hierarchieebene eine sehr lange Zeit in Anspruch nehmen kann. Ein weiteres Problem ist darin zu sehen, dass bei einer Menügesteuerten Umgebung einer hierarchischen Datenstruktur, die in anschaulicher Weise aus Adressen gebildet ist, die Elemente der unteren Ebenen nicht ausgewählt werden können, solange die unteren Elemente nicht bekannt sind.
  • Die US-A 654 875 offenbart ein Verfahren zur Zeichenerkennung und Identifikation unter Verwendung eines kombinierten Multiphasen-Top-down- und -Bottom-up-Prozesses. Zeichen eines Gebrauchszeichens werden bei einem Prozess erkannt, der eine Wissensquelle verwendet, die Informationen über Basiselemente des Zeichens enthält und über Zeichenketten der Basiselemente in dem Zeichen. Die Wissensquelle, die von einem Trainingskorpus abgeleitet werden kann, beinhaltet Wortwahrscheinlichkeiten, Wort-digram-Wahrscheinlichkeitenstatistiken, die die Wahrscheinlichkeit der Worte mit besonderen Zeichen in Bezug setzen, und Vorschläge und deren Kosten neu schreiben. n-grams von Worten höherer Ebenen, wie z. B. trigram-Wahrscheinlichkeiten von Worten, können auch verwendet werden. Außerdem wird ein Mechanismus zum Ak zeptieren von Worten, die in der Wissensbasis nicht gefunden wurden, ebenso wie ein Mechanismus zum Neuschreiben von Vorschlägen, die sich nicht in der Wissensbasis befinden, bereitgestellt.
  • Die JP 02308384-A offenbart eine Vorrichtung zur Adressenerkennung mit hoher Geschwindigkeit durch Definition eines Wortes, mit dem die Erkennung der Adresse begonnen wird, als ein Schlüsselwort aus einer Gruppe von Worten, die für das Erkennungsverfahren verwendet werden.
  • Aus einer Gruppe von Worten, die im Vorhinein im einem Wörterbuch 15 präpariert wurden, wird das Wort, das den Startpunkt der Adressenerkennung darstellt, nämlich das Wort, in der am geringsten signifikanten Hierarchie der zu blockierenden Adressen als Schlüsselwort registriert. Aus einer Gruppe von durch eine Worterkennungseinrichtung 14 erkannten Wortkandidaten wird das als Schlüsselwort registrierte Wort abgefragt und das abgefragte Wort wird als der Startpunkt der Sortierung definiert. Nachfolgende verden die Wortkandidaten sukzessive in Richtung der Hierarchien höherer Ordnung sortiert und eine Serie an Worten, die sortiert werden kann, wird durch die Adressenerkennungseinrichtung 16 als die Adresse erkannt.
  • Im Hinblick auf die oben beschriebenen Probleme ist es eine Aufgabe der vorliegenden Erfindung, eine Vorrichtung zur Mustererkennung bereitzustellen, die nur mit der Hand geschriebene Schlüsselworte (z. B. "
    Figure 00060001
    (Oomika)" oder "
    Figure 00060002
    (~Mika-cho)") akzeptiert, bereitzustellen, um die verbleibende Zeichenkette (z. B. "
    Figure 00060003
    (Iaragi-ken),
    Figure 00060004
    (Hitachi-shi)") zu folgern, wodurch die ganze er kannte Zeichenkette ausgegeben wird (z. B. "
    Figure 00070001
    (Ibaraki-ken),
    Figure 00070002
    (Hitachi-shi),
    Figure 00070003
    (Oomika-cho)") .
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Gemäß eines Aspektes der Ausführung der Erfindung ist eine Vorrichtung zum Erkennen von Zeichen bereitgestellt mit einer Zeichenerkennungseinrichtung zum Erkennen von eingegebenen Zeichenketten und einer Anzeigeeinrichtung zum Anzeigen der erkannten Ergebnisse, wobei die Vorrichtung zum Erkennen von Zeichen umfasst: ein Wörterbuch zum Speichern von Wortidentifizierungsinformation und Hierarchieinformation zum Einordnen einer Mehrzahl von Worten in eine Hierarchie und zum Erkennen jedes dieser Worte innerhalb der Hierarchie; eine Zeichenumwandlungswahrscheinlichkeitstabelle, um zumindest Wahrscheinlichkeiten von Umwandlungen eines beliebigen Zeichens in ein anders und solche Stücke der Wortidentifizierungsinformation zu speichern, die Kombinationen von Zeichen entsprechen, die aus diesen Umwandlungen resultieren; eine Optimierungseinrichtung zur Verwendung der Zeichenumwandlungswahrscheinlichkeitstabelle bei einer Optimierung von in Frage kommenden Zeichenketten, die durch die Erkennungseinrichtung erhalten wurden; und Abfragemittel zum Suchen von Worten innerhalb des Wörterbuchs, die durch solche Stücke der Wortidentifizierungsinformation definiert sind, die den optimierten in Frage kommenden Zeichenketten entsprechen, wodurch die gesuchten Worte abgefragt werden, die durch anwendbare Stücke der Hierarchieinformation identifiziert werden und die noch eingegeben werden müssen.
  • Wenn Zeichen einer niedrigen Hierarchieebene, wie z. B. "Oomikacho", alleine eingegeben werden, extrahiert die oben beschriebene erfindungsgemäße Vorrichtung zum Erkennen von Zeichen zunächst "Oomika-cho" als eine in Frage kommende Zeichenkette (Kandidatenzeichenkette), die durch die Optimierungseinrichtung optimiert wurde. Das Wörterbuch wird dann nach Worten höherer Ebenen auf der Basis der Wortidentifizierungsinformation entsprechend der optimierten Zeichenkette durchsucht. Die Suche ergibt noch einzugebende Worte "Ibaraki-ken, Hitachi-shi", die in der Hierarchie höher stehen als das eingegebene "Oomika-cho". Das erkannte Ergebnis ist "Ibaraki-ken, Hitachi-shi, Oomika-cho", wobei die gesamte Zeichenfolge aus eingegebenen und nicht eingegebenen Worten besteht.
  • Gemäß eines anderen Aspektes der Erfindung wird eine Vorrichtung zum Erkennen von Zeichen mit einer Zeichenerkennungseinrichtung zum Erkennen von eingegebenen Zeichenketten und einer Anzeigeeinrichtung bereitgestellt, wobei die Vorrichtung zum Erkennen von Zeichen umfasst: ein Wörterbuch, in dem sämtliche Zeichenketten einer Mehrzahl von Zeichenketten zuvor unter einer spezifischen Adresse abgespeichert wurden; eine Zeichenübergangswahrscheinlichkeitstabelle, um mindestens Wahrscheinlichkeiten von Übergängen eines beliebigen Zeichens in ein anderes zu speichern, wobei die Wahrscheinlichkeiten entsprechend der Adressen der Zeichenketten gespeichert werden, die kombinierte Zeichen beinhalten, die bei den Übergängen beteiligt sind; und einer Optimierungseinrichtung zur Verwendung der Zeichenübergangswahrscheinlichkeitstabelle bei einer Optimierung von in Frage kommenden Zeichenketten, die durch die Erkennungseinrichtung erhalten wurden, wobei auf das Wörterbuch zugegriffen wird, auf die Adressen der Zeichenketten entsprechend der optimierten in Frage kommenden Zeichenkette, und wobei die Zeichenketten unter den Adressen des Wörterbuchs als erkannte Ergebnisse dargestellt werden.
  • KURZE BESCHREIBUNG DER ZEICHNUNG
  • 1 ist ein Funktionsblockschaubild einer Vorrichtung zur Erkennung handschriftlich eingegebener Adressen, die die Erfindung ausführt;
  • 2 ist ein schematisches Flussschaubild, das beispielhaft veranschaulicht, wie die Vorrichtung zur Erkennung handschriftlich eingegebener Adressen die erfindungsgemäßen Arbeiten ausführt;
  • 3 ist ein schematisches Blockschaubild einer herkömmlichen Vorrichtung zur Erkennung von Zeichen;
  • 4 ist ein schematisches Flussschaubild, das veranschaulicht, wie die herkömmliche Vorrichtung zur Erkennung von Zeichen verwendet wird, um Adressen einzugeben;
  • 5 ist ein Schaubild mit Hardwareblöcken der die Erfindung ausführenden Vorrichtung zur Erkennung handschriftlich eingegebener Adressen;
  • 6 ist ein schematisches Flussschaubild, das die Schritte zur Erzeugung einer Zeichenübergangswahrscheinlichkeitstabelle veranschaulicht;
  • 7 ist eine schematische Darstellung eines typischen Wörterbuchs;
  • 8 ist eine schematische Darstellung einer typischen Zeichenauftrittszähltabelle;
  • 9 ist eine schematische Darstellung einer typischen Zeichenübergangszähltabelle;
  • 10 ist eine schematische Darstellung einer typischen Zeichenauftrittswahrscheinlichkeitstabelle;
  • 11 ist eine schematische Darstellung einer typischen Zeichenübergangswahrscheinlichkeitstabelle;
  • 12 ist ein schematisches Flussschaubild einer Nachverarbeitung der Zeichenerkennung unter Verwendung einer Übergangswahrscheinlichkeitstabelle;
  • 13 ist ein schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge ermittelt wird aus dem Ergebnis der Nachverarbeitung;
  • 14 ist ein anderes schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge aus dem Ergebnis der Nachverarbeitung ermittelt wird;
  • 15 ist ein anderes schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge aus dem Ergebnis der Nachverarbeitung ermittelt wird;
  • 16 ist ein anderes schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge aus dem Ergebnis der Nachverarbeitung ermittelt wird;
  • 17 ist eine schematische Darstellung eines typischen Formats, in dem eine ermittelte-Zeichenkette dargestellt wird;
  • 18 ist eine schematische Darstellung eines anderen typischen Formats, in dem eine ermittelte Zeichenkette dargestellt wird;
  • 19 ist eine schematische Darstellung eines anderen typischen Formats, in dem eine ermittelte Zeichenkette dargestellt wird;
  • 20 ist eine schematische Darstellung eines anderen typischen Formats, in dem eine ermittelte Zeichenkette dargestellt wird;
  • 21 ist ein anderes schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge aus dem Ergebnis der Nachverarbeitung ermittelt wird;
  • 22 ist ein anderes schematisches Flussschaubild, das anschaulich zeigt, wie eine Zeichenfolge aus dem Ergebnis der Nachverarbeitung ermittelt wird;
  • 23 ist ein Funktionsblockschaubild, das eine erfindungsgemäße Vorrichtung zum Suchen von handschriftlich eingegebenem Gesundheitsvorsorgezubehör zeigt;
  • 24 ist eine beispielhafte Darstellung, die zur Beschreibung des Betriebs einer erfindungsgemäßen Vorrichtung zum Suchen von handschriftlich eingegebener Medikamente dient;
  • 25 ist eine beispielhafte Darstellung, die eine Tabelle zeigt, die die Anwendung bei einem Rezept der Medikamente, Vorsichtsmaßnahmen beim Einnehmen der Medikamente, Nebenwirkungen der Medikamente und Vorsichtsmaßnahmen beim Einnehmen anderer Medikamente beschreibt;
  • 26 ist eine beispielhafte Darstellung, die den Betrieb einer Vorrichtung zum Suchen von Patientennamen auf der Basis eines die Erfindung ausführenden Verfahrens zeigt;
  • 27 ist ein Blockschaubild, das eine Konfiguration eines Büchereisuchsystems zeigt;
  • 28 ist eine Darstellung, die ein Beispiel einer Display-Ausgabe durch Bücherregal-Anordnungsanleitungsverarbeitung zeigt;
  • 29 ist eine Darstellung, die die Struktur eines Hauptbuches einer Buchsammlung zeigt;
  • 30(a), (b) und (c) sind Darstellungen, die eine Buchsammlungstabelle, eine Autorennamentabelle und eine Verlagstabelle zeigen;
  • 31 ist eine Darstellung, die die Struktur einer Buchtitel-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle zeigt;
  • 32 ist eine Darstellung, die eine andere Struktur einer Buchtitel-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle zeigt;
  • 33 ist ein schematisches Flussschaubild, das ein Verfahren einer Bibliothekssuchverarbeitung zeigt;
  • 34 ist ein Diagramm, das ein Beispiel eines Displays zur Eingabe eines Suchschlüssels in die Bibliotheksuchverarbeitung zeigt;
  • 35 ist ein Diagramm, das ein Beispiel einer Anzeige eines Suchergebnisses zeigt, das durch die Bibliotheksuchverarbeitung erhalten wurde;
  • 36 ist eine Darstellung, die eine Konfiguration eines Multi-Element-Datenbanksuchsystems zeigt, das eine mehrdeutige Eingabe toleriert, gemäß einer Implementation eines erfindungsgemäßen Ausführungsbeispiels;
  • 37(a) bis 37(i) sind Darstellungen, die Tabellen zeigen, die bei dem Ausführungsbeispiel der 36 verwendet werden;
  • 38 ist ein schematisches Flussschaubild, das eine Verarbeitung einer Suche zeigt, die eine mehrdeutige Eingabe toleriert;
  • 39(a) bis 39(d) sind Darstellungen, die Tabellen zeigen, die bei einer Suche einer Multi-Element-Datenbank einschließlich nicht textbasierter Daten, wie z. B. Bildern, verwendet wird;
  • 40 ist eine Darstellung, die eine Konfiguration eines Suchindex-Erzeugungswerkzeugs zeigt;
  • 41(a) bis 41(c) sind Darstellungen, die Beispiele von Zeichen-zu-Zeichen-Übergangs-Indextabellen zeigen;
  • 42 ist eine Darstellung, die eine Konfiguration eines Suchsystems zur Suche in einer Multi-Element-Datenbank einschließlich nicht textbasierter Daten, wie z. B. Bildern, zeigt;
  • 43 ist eine Darstellung, die ein Beispiel einer Suchschlüssel-Eingabepalette zeigt;
  • 44 ist eine Darstellung, die ein Beispiel einer Anzeigepalette für Suchergebnisse zeigt;
  • 45 ist eine Darstellung, die ein Beispiel eines Bildschirms zeigt, der abgeleitet und angezeigt wird durch eine Anwendung von Ergebnissen einer Suche, die von dem Suchsystem empfangen wurde;
  • 46 ist ein schematisches Flussschaubild, das die von einer Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit durchgeführten Verarbeitung zeigt; und
  • 47(a) bis 47(c) sind Darstellungen, die eine Ausgestaltung einer Suche zeigen, die eine vieldeutige Eingabe toleriert, unter Verwendung einer Tabelle, die die Indizes enthält, die einen Zeichen-zu-Zeichen-Übergang mit einem Wort und einem Analogiebetrag bezüglich des Indexes verbindet.
  • DETAILLIERTE BESCHREIBUNG BEVORZUGTER AUSFÜHRUNGS-BEISPIELE
  • Ein bevorzugtes Ausführungsbeispiel der Erfindung wird nun unter Bezugnahme auf die beigefügte Zeichnung beschrieben, wobei das Ausführungsbeispiel eine handgeschriebene Adresse zur Zeichenerkennung zulässt.
  • 2 ist ein schematisches Flussschaubild, das veranschaulicht, wie eine Vorrichtung zur Erkennung handschriftlich eingegebener Adressen die erfindungsgemäßen Arbeiten ausführt. Ein Nutzer schreibt anschaulich ein Schlüsselwort "Oomika" in ein Adresseneingabefeld b1 mit einem Stiftschreiber a9. Handgeschriebene Striche werden in einem Zeichenerkennungsprozess a3 erkannt. Der Zeichenerkennungsprozess produziert eine erste in Frage kommende Zeichenfolge (Kandidaten-Zeichenfolge) "
    Figure 00150001
    (Oomika)" und eine zweite in Frage kommende Zeichenfolge "
    Figure 00150002
    (Inuruka)" anhand des Schlüsselworts. Anhand der vorgegebenen in Frage kommenden Zeichenfolgen wird auf eine Übergangswahrscheinlichkeitstabelle a4 verwiesen bezüglich der Wahrscheinlichkeiten der Zeichen-zu-Zeichen-Übergänge der Folgen (z. B. Wahrscheinlichkeit eines Übergangs des Buchstaben B). Dann wird auf eine Zeichenauftrittswahrscheinlichkeitstabelle a8 verwiesen bezüglich der Auf trittswahrscheinlichkeiten der beteiligten Zeichen. Die Reihenfolge der in Frage kommenden Zeichen wird optimiert, um auf diese Weise die Auftrittswahrscheinlichkeiten der Zeichenfolge zu maximieren. Auf die Zeichenübergangswahrscheinlichkeitstabelle wird weiter verwiesen für in Frage kommende Wortnummern, wodurch Zeiger auf die Worte einschließlich der Zeichen-zu-Zeichen-Übergänge der in Frage kommenden Zeichenfolgen erhalten werden. Bei dem Beispiel der 2 werden die Wahrscheinlichkeiten des Auftritts von Worten maximiert, wenn die in Frage kommenden Zeichen zu "
    Figure 00160001
    (Oomika)" kombiniert werden, sodass der Zeiger Nr. A11, der auf ein Wort hinweist, das einen "
    Figure 00160002
    (Oo)", zu "
    Figure 00160003
    (mi)" Übergang und einen "
    Figure 00160004
    (Mi)" zu "
    Figure 00160005
    (ka)" Übergang umfasst, aus der Zeichenübergangswahrscheinlichkeitstabelle erhalten wird. Durch Verwendung dieses Schemas wird schnell auf ein Zielwort zugegriffen, indem Zeiger auf die Worte in dem Wörterbuch in der Zeichenübergangswahrscheinlichkeitsstabelle bereitgestellt werden zur Verwendung bei der Nachverarbeitung der Zeichenerkennung. Wenn einmal das geeignete Wort in dem Wörterbuch gefunden ist, ermöglicht die Information bezüglich der Einordnungsebene in dem Wörterbuch dieses Wortes die anwendbare höhere Ebene oder Ebenen eindeutig zu identifizieren. Bei dem in 2 gezeigten Beispiel wird die obere Ebene eindeutig erhalten als "
    Figure 00160006
    (Ibaraki-ken)", "
    Figure 00160007
    (Hitachi-shi)". Das heißt, durch einfaches Schreiben vom "
    Figure 00160008
    (Oomika)" per Hand ist es möglich, die Zieladresse "
    Figure 00160009
    (Ibaraki-ken)", "
    Figure 00160010
    (Hitachi-shi)", "
    Figure 00160011
    (Oomika-cho)" als mögliche Kandidaten anzuzeigen und als solche einzugeben.
  • 1 ist ein Funktionsblockbild einer Vorrichtung zur Erkennung handschriftlich eingegebener Adressen, die die vorliegende Erfin dung ausführt. Die Funktionsweise des Ausführungsbeispiels wird unter Bezugnahme auf die 1 erläutert. Indem der Schreibstift a9 über das Tablett a1 gleitet, werden Zeichenmuster handschriftlich eingegeben. Die handschriftlichen Muster werden mit Zeichenmustern, die in dem Erkennungswörterbuch a2 bereitgehalten werden, in einem Zeichenerkennungsprozess a3 auf Übereinstimmung untersucht. Der Erkennungsprozess ergibt Kandidatenzeichen, deren Ordnung optimiert wird durch Verweis auf zwei Tabellen, die im Voraus durch Lernen erzeugt wurden.
  • Eine dieser Tabellen ist die Übergangswahrscheinlichkeitstabelle a4, die die Wahrscheinlichkeiten der Zeichen-zu-Zeichen-Übergänge enthält, ebenso wie die Zeiger auf solche Kandidatenworte in dem Wörterbuch, die derartige Übergänge beinhalten. Die andere Tabelle, auf die verwiesen wird, ist eine Zeichenauftrittswahrscheinlichkeitstabelle a8, die die Wahrscheinlichkeiten des Auftretens- der Zeichen beinhaltet. Bei der Optimierung werden die Kandidatenzeichen in optimierter Weise in eine Abfolge gebracht, sodass die Wahrscheinlichkeit des Auftretens der Zeichen als Zeichenkette maximiert wird. Gleichzeitig werden alle Zeiger bestimmt, die auf solche Worte in dem Wörterbuch hinweisen, die auf die optimierte Zeichenkette anwendbar sind (im Prozess a5). Die auf die oben beschriebene Weise erhaltenen Worte des Wörterbuchs a6 werden mit den in Frage kommenden Zeichenketten auf Übereinstimmung untersucht, und eine Information bezüglich jedes anwendbaren Worts und bezüglich der vorhergehenden Worte und nachfolgenden Worte wird von der Ebeneninformation des Wörterbuchs abgefragt (im Prozess a7). Die auf diese Weise erhaltenen Ergebnisse werden in dem LCD-Feld a8 angezeigt.
  • Die vier wesentlichen Aspekte, die bei der Implementierung der Erfindung berücksichtigt werden müssen, sind die Folgenden: (1) wie die Zeichenübergangswahrscheinlichkeitstabelle a4 erzeugt wird; (2) wie die Optimierung der Reihenfolge der Kandidatenzeichen zu erfolgen hat, um die Wahrscheinlichkeit des Auftretens der Zeichen als Zeichenkette zu maximieren und wie die Zeiger auf die Worte, die die Zeichen-zu-Zeichen-Übergänge in der optimierten Zeichenkette beinhalten, gefunden werden; (3) wie die die handschriftlich eingegebenen Worte (d. h. die Schlüsselworte) beinhaltenden Zeichenketten unter Verwendung der Zeiger der erfassten Worte durch Schlussfolgerung ermittelt werden; und (4) wie eine ermittelte Zeichenkette dargestellt wird. Diese Aspekte werden später im Detail beschrieben.
  • 5 ist ein Blockschaubild, das die Hardwarekomponenten der Vorrichtung zur Erkennung von handschriftlich eingegebenen Adressen zeigt, mittels derer die vorliegende Erfindung ausgeführt wird. Die Vorrichtung umfasst eine Funktion zum Matchen (Untersuchung auf Übereinstimmung) der eingegebenen Muster mit Wörterbuchmustern; eine Funktion zur Optimierung der Kandidatenzeichen, die aus dem Musterabgleich erhalten werden und zum Auffinden von Zeigern auf Worte, die diese Kandidatenzeichen beinhalten; und eine Funktion zum Matchen der Kandidatenzeichen mit den Worten, um die Information bezüglich der vorhergehenden und nachfolgenden Worte abzufragen. Dieses Funktionen werden anschlich ausgeführt durch eine CPU c3, die die entsprechenden Programme ausführt, die von einem ROM c5 abgerufen werden. Diese Funktionen werden später im Detail unter Bezugnahme auf die entsprechende Zeichnung beschrieben.
  • [1] Erzeugung der Übergangswahrscheinlichkeitstabelle a4
  • 6 ist ein schematisches Flussbild, das die Schritte zur Erzeugung der Übergangswahrscheinlichkeitstabelle a4 zeigt. In Schritt d 1 wird das Wörterbuch a6 zu Lernzwecken ausgelesen. Mit einem beliebigen Wort, das von dem Wörterbuch abgefragt wird, wird die Anzahl gezählt, wie häufig jedes Komponentenzeichen in dem Wort auftritt (Schritt d2). Die Anzahl des Auftretens der Zeichen wird in die Zeichenauftrittszähltabelle d3 eingeschrieben. Dann werden die Zeichen-zu-Zeichen-Übergänge in dem Wort gezählt (Schritt d4). Die Anzahl der Übergänge wird in die Zeichenübergangstabelle d6 eingeschrieben. Die Wortzahl (z. B. Wortzeiger) des ursprünglichen Wortes, das die Zeichen-zu-Zeichen-Übergänge enthält, wird in die Zeichenübergangszähltabelle d6 eingeschrieben (Schritt d5). Zur Veranschaulichung wird beispielsweise im Falle des japanischen Wortes "
    Figure 00190001
    (Oomika)" die Komponente der japanischen Zeichen "
    Figure 00190002
    (Oo)" "
    Figure 00190003
    (mi)" und "
    Figure 00190004
    (ka)", die jeweils einmal auftreten, als ein einmaliges Auftreten gezählt. In entsprechender Weise wird ein Übergang von "
    Figure 00190005
    (Oo)" zu "
    Figure 00190006
    (mi)" und ein Übergang von "
    Figure 00190007
    (mi)" zu "
    Figure 00190008
    (ka)" in dem Wort jeweils einmal gezählt. Die Wortnummer des Wortes "
    Figure 00190009
    (Oomika)" wird der Kandidatenwortnummer des "
    Figure 00190010
    (Oo)" zu "
    Figure 00190011
    (mi)" Übergangs und der des "
    Figure 00190012
    (mi)" zu "
    Figure 00190013
    (ka)" Übergangs zugeschrieben. Die oben angeführten Schritte d 1 bis d6 werden für alle Worte des Wörterbuchs a6 wiederholt. Nachfolgend wird die Zeichenauftrittszahltabelle d3 und die Zeichenübergangszahltabelle d6, die auf diese Weise erzeugt wurden, in Bezug ge nommen, um eine Zeichenübergangswahrscheinlichkeitstabelle a4 zu erzeugen, die die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeiten und Informationen bezüglich der Wortnummern der Kandidatenworte, die solche Übergänge beinhalten (d9). Falls notwendig, wird auf die Zeichenauftrittszahltabelle d3 verwiesen, zur Erzeugung einer Zeichenauftrittswahrscheinlichkeitstabelle d8, die die Auftrittswahrscheinlichkeit eines jeden der beteiligen Zeichen beschreibt (Schritt d7). Der Aufbau dieser Tabellen wird später unter Bezugnahme auf die entsprechende Zeichnung beschrieben.
  • 7 ist eine schematische Darstellung eines typischen Wörterbuchs. In 7 wird ein Adressenwörterbuch a6 mit hierarchischer Struktur gezeigt, das aus Namen der Präfekturen, Städte, Ortschaften und zugeordneten Verwaltungen in Japan besteht. Die dieses Wörterbuch bildenden Komponententeile bestehen jeweils aus einer Wortnummer (d. h. einer Wortortsinformation), einer Wortnummer eines Wortes einer höheren Ebene und einem Wort (Zeichenkette). Auf jedes Wort wird unter Verwendung seiner Wortnummer zugegriffen. Die hierarchische Beziehung eines jeden Wortes wird durch seine Wortnummer der höheren Ebene identifiziert.
  • 8 ist eine schematische Darstellung einer typischen Zeichenauftrittszähltabelle. In der Zeichenauftrittszähltabelle d3 ist die Anzahl gespeichert, wie oft jedes Wort in dem Wörterbuch auftritt zum Lernen. Auf diese Wiese wird die Tabelle 3 dazu verwendet, zu zählen, wie häufig jedes Zeichen in dem zu lernenden Wort auftritt.
  • 9 ist eine schematische Darstellung einer typischen Zeichenübergangszähltabelle. In der Zeichenübergangszähltabelle ist die Anzahl gespeichert, wie häufig jeder Zeichen-zu-Zeichen-Übergang in dem Wörterbuch auftritt zum Lernen und die Nummern der Worte, die solche Übergänge beinhalten (d. h. die Kandidatenzeichennummern).
  • 10 ist eine schematische Darstellung einer typischen Zeichenauftrittswahrscheinlichkeitstabelle. Zur Veranschaulichung ist beispielsweise die Auftrittswahrscheinlichkeit des japanischen Zeichens "hi" angegeben als die Anzahl, wie häufig das Zeichen "hi" auftritt, geteilt durch die Gesamtanzahl der Zeichen. Dementsprechend wird die Auftrittswahrscheinlichkeitstabelle d8 erzeugt, indem zunächst auf die Zeichenauftrittszähltabelle d3 verwiesen wird, um die Auftrittsanzahl eines jeden der beteiligten Zeichen zu ermitteln. Die auf diese Weise erhaltene Auftrittsanzahl wird in die Zeichenauftrittscvahrscheinlichkeitstabelle d8 geschrieben.
  • 11 ist eine schematische Darstellung einer typischen Zeichenübergangswahrscheinlichkeitstabelle. Zur Veranschaulichung ist die Wahrscheinlichkeit eines "
    Figure 00210001
    (hi)" zu "
    Figure 00210002
    (tachi)" Übergangs ausgedrückt als die Anzahl von "
    Figure 00210003
    (hi)" zu "
    Figure 00210004
    (tachi)" Übergängen geteilt durch die Anzahl des Auftretens von "
    Figure 00210005
    (hi)". Dementsprechend wird die Zeichenübergangswahrscheinlichkeitstabelle a4 erzeugt, indem zunächst auf die Zeichenauftrittszähltabelle d3 und die Zeichenübergangszähltabelle d6 verwiesen wird, um die Übergangswahrscheinlichkeit eines jeden Zeichens zu ermitteln. Die auf diese Weise erhaltenen Wahrscheinlichkeiten werden in die Zeichenübergangswahrscheinlichkeitstabelle a4 eingeschrieben.
  • Durch Ausführen der oben beschriebenen Prozesse wird die Übergangswahrscheinlichkeitstabelle a4 mit den Zeigern auf die Worte des Wörterbuchs erzeugt. Obgleich das oben beschriebene Ausführungsbeispiel die Wortnummern als Wortidentifikationsinformation zur Identifizierung eines jeden Wortes des Wörterbuchs verwendet, ist die Erfindung nicht auf diese Ausführungsform beschränkt. Alternativ kann eine Kodierungsinformation als Wortidentifikationsinformation verwendet werden. Zusätzlich kann, obgleich in dem oben beschriebenen Ausführungsbeispiel die Nummern von Worten höherer Ebenen als hierarchische Information verwendet wird, die die hierarchische Beziehung zwischen den Worten des Wörterbuchs darstellt, ist die Erfindung hierauf nicht beschränkt. Alternativ kann eine beliebige Information als Kodierungsinformation verwendet werden, um die hierarchischen Beziehungen zwischen den Worten zu beschreiben.
  • [2] Nachverarbeitung anhand von Übergangswahrscheinlichkeiten (d. h. wie die Kandidatenzeichen optimiert werden und wie die Zeiger auf die Kandidatenworte bestimmt werden)
  • 12 ist ein schematisches Flussbild, das die Nachverarbeitung der Zeichenerkennung unter Verwendung einer Übergangswahrscheinlichkeitstabelle zeigt. Wie in 12 gezeigt, wird angenommen, dass ein Eingabemuster "
    Figure 00220001
    (Oomika)" eine erste Kandidatenzeichenkette "
    Figure 00220002
    (Inuruka)" und eine zweite Kandidatenzeichenkette "
    Figure 00220003
    (Kenmika)" aufweist. Das heißt, dass im Gegensatz zu dem oben beschriebenen Beispiel der 2 davon ausgegangen wird, dass die eingegebene Zeichenkette "
    Figure 00220004
    (Oomika)" falsch erkannt wird. In diesem Fall wird das falsche Ergebnis der Zeichenerkennung nichtsdestotrotz durch Optimierung der Kandidatenzeichen anhand ihrer Übergangswahrscheinlichkeiten vermieden, wie nachfolgend genau beschrieben wird. Es gibt acht mögliche Kandidatenzeichenkombinationen, wie in 12 gezeigt. Für jede dieser Zeichenketten wird auf die Zeichenübergangswahrscheinlichkeitstabelle verwiesen zum Auffinden der Auftrittswahrscheinlichkeit der fraglichen Zeichenkette und zum Ermitteln des Zeigers auf in Frage kommende Worte (Wortkandidaten) des Wörterbuchs. Die Kombination von in Frage kommenden Zeichen-zu-Zeichenfolgen mit der höchsten Auftrittswahrscheinlichkeit ist die optimale Zeichenkandidatenkombination. Die Zeichenkombination wird zusammen mit der Wortkandidatennummer als das Ergebnis der Nachverarbeitung auf Basis der Übergangswahrscheinlichkeitsverarbeitung betrachtet.
  • Die Auftrittswahrscheinlichkeit der Zeichenketten wird wie folgt berechnet: Grundsätzlich ist die Auftrittswahrscheinlichkeit der Zeichenketten S1, S2, ... Sn unter Verwendung der folgenden Gleichungen angenähert: Auftrittwahrscheinlichkeit (S1, S2, ..., Sn) = Auftrittswahrscheinlichkeit (S1) × Übergangswahrscheinlichkeit (S1 → S2) × ..., × Übergangswahrscheinlichkeit (Sn – 1 → Sn) (1).
  • Die Auftrittswahrscheinlichkeit von beispielsweise Zeichenkombina tion Nr. 3 "
    Figure 00230001
    (Oomika)" in 12 wird wie folgt berechnet:
  • Auftrittswahrscheinlichkeit ("
    Figure 00230002
    (Oomika)") = Auftrittswahrscheinlichkeit ("
    Figure 00230003
    (Oo)") × Übergangswahrschein
  • Figure 00240001
  • Im Folgenden wird beschrieben, wie die Wortkandidatennummer ermittelt wird, (d. h. wie der Zeiger 0 auf das in Frage kommende Wort des Wörterbuchs bestimmt wird). Zur Veranschaulichung wird beispielsweise die Wortkandidatennummer der Zeichenketten S1, S2, ..., Sn unter Verwendung der folgenden Beziehung erhalten: Wortkandidatennummer (S1, S2, ..., Sn) = Wortkandidatennummer (S1 → S2) ∩ ... ∩ Wortkandidatennummer (Sn – 1 → Sn) (3).
  • Die Zeichenkette "Oomika" der 12 ist gegeben als Wortkandidatennummer, die unter Verweis auf die Zeichenübergangswahrscheinlichkeitstabelle a4 ermittelt wird und unter Verwendung der folgenden Gleichung: Wortkandidatennummer ("Oomika") = ∩ Wortkandidatennummer ("Oo" → "mi") ∩ Wortkandidatennummer ("mi" → "ka") = (A11) ∩ (A11, A12) = A11 (4).
  • Bei dem oben beschriebenen Ausführungsbeispiel wird die Nummer der Wortkandidaten über eine UND-Beziehung (∩) verknüpft, um auf diese Weise die Kandidaten auf "Oomika-cho" (A11) zu begrenzen. Alternativ können die Nummern der Wortkandidaten über eine ODER-Beziehung (∪) verknüpft werden, sodass "Oomika-cho" Lind "Mikanohara-cho" als Kandidaten ausgewählt werden können. In dem alternativen Beispielsfall kann das Wort "Oomika-cho" als erster Kandidat anhand der Zeichenanzahl ausgewählt werden.
  • Bei der beschriebenen Art und Weise werden die Zeichenkandidaten, die durch den Zeichenerkennungsprozess ermittelt wurden, zu Zeichenketten optimiert, die eine deutlich höhere Auftrittswahrscheinlichkeit aufweisen. Die Nummer der Wortkandidaten der optimierten Zeichenkettenkandidaten (d. h. die Zeiger auf die Worte) wird dann erfasst. Mit dem oben beschriebenen Verfahren ergibt die Eingabe von nur einem Teil des Wortes "
    Figure 00250001
    (Oomika-cho)" (z. B. "
    Figure 00250002
    (mika)") immer noch zwei Kandidaten, "
    Figure 00250003
    (Oomikacho)" und "
    Figure 00250004
    (Mikanohara-cho)".
  • [3] Wie auf die Zeichenkette einschließlich des handschriftlich eingegebenen Wortes (d. h. Schlüssehvortes) geschlossen wird
  • Im Folgenden wird mit Bezug auf die zugehörige Zeichnung beschrieben, wie auf die gesamte Zeichenkette einschließlich der optimierten in Frage kommenden Zeichenkette (d. h. handschriftlich eingegebenes Schlüsselwort) geschlossen wird.
  • 13 ist ein schematisches Flussbild, das veranschaulicht, wie anhand des Ergebnisses der Nachverarbeitung auf eine Zeichenkette geschlossen wird. Bei dem Beispiel der 13 ergibt die Nachverarbeitung anhand der Übergangswahrscheinlichkeiten ein Schlüsselwort "
    Figure 00250005
    (Oomika)" (Zeichenkandidaten) und Wortkandidat Nr. A11. Wie gezeigt, existiert lediglich ein Wort "
    Figure 00250006
    (Oomika)" als ein Schlüsselwort in dem Wörterbuch. Da sich das Wort "
    Figure 00250007
    (Oomika)" in der tiefsten Ebene der Hierarchie befindet, ist die Zeichenkette "
    Figure 00260001
    (Ibaraki-ken), Hitachi-shi)" der höheren Ebene eindeutig bestimmt. Als Ergebnis der Gesamtfolgerung anhand der handschriftlich ein e ebenen Zeichen "
    Figure 00260002
    (Oomika)" wird eine in Frage kommende Zeichenkette "
    Figure 00260003
    (Ibarakiken, Hitachi-shi, Oomika-cho)" angezeigt.
  • Das in der 22 Gezeigte ist, ähnlich dem Beispiel der 13, mit der Ausnahme, dass das Beispiel der 22 zwei in Frage kommende Zeichenketten für die handschriftlichen Zeichen "
    Figure 00260004
    (Oomika)" eingibt. Ein Kandidat ist "
    Figure 00260005
    (Ibaraki-ken, Hitashishi, Oomika-cho)" resultierende aus der Zeichenkettenfolgerung und der andere Kandidat ist "
    Figure 00260006
    (Oomika-cho)" aus der Zeichenerkennung ohne Folgerungsverarbeitung, sodass der Nutzer einen der beiden Kandidaten auswählen kann. Ein Vorteil dieses Aufbaus besteht darin, dass dem Nutzer die Möglichkeit gegeben wird, zwischen einer Zeichenkette, die aus einem Schlüsselwort geschlussfolgert wurde, und dem Schlüsselwort alleine ohne Schlussfolgerung auszuwählen.
  • 14 ist ein anderes schematisches Flussschaubild, das zeigt wie Zeichenketten aus dem Ergebnis der Nachverarbeitung durch Schlussfolgerung ermittelt werden. Bei dem Beispiel der 14 ergibt die Nachverarbeitung anhand der Übergangswahrscheinlichkeiten ein Zwischenebenenwort "
    Figure 00260007
    (Hitachi)" (Wortkandidat Nr. A1) aus dem Wörterbuch. Wie in der Figur dargestellt; existiert lediglich das eine Wort "
    Figure 00260008
    (Hitachi)" als ein Schlüsselwort in dem Wörterbuch, sodass die Zeichenkette "
    Figure 00260009
    (Ibaraki-ken)" der höheren Ebene eindeutig bestimmt wird. In diesem Fall hat das Schlüsselwort "
    Figure 00270001
    (Hitachi)" eine Mehrzahl von darauf bezogenen Worten tieferer Ebenen. Auf diese Wiese kann eine Mehrzahl an Kandidaten dargestellt werden z. B. "
    Figure 00270002
    (Ibaraki-ken, Hitachi-shi, Oomika-cho)" "
    Figure 00270003
    (Ibaraki-ken, Hitachi-shi, Mikanohara-cho)" etc.), von denen einer von dem Nutzer ausgewählt werden kann.
  • Das Beispiel der 15 ähnelt dem der 14 darin, dass das Zwischenebenenwort "
    Figure 00270004
    (Hitachi)" (Wortkandidat Nr. A1) aus dem Wörterbuch abgefragt wird durch Nachverarbeitung anhand von Übergangswahrscheinlichkeiten, wobei das Wort eine Mehrzahl von darauf bezogenen Kandidaten tieferer Ebenen hat. In dem veranschaulichten Beispiel speichert das Wörterbuch demographische Information über verschiedene Städte und Orte, sodass eine Mehrzahl von Kandidaten tieferer Ebenen dargestellt werden kann in der Reihenfolge der Bevölkerung. Für den Nutzer ist es einfacher, aus den demographisch angeordneten in Frage kommenden Städten und Ortschaften auf dem Display auszuwählen.
  • Das in 16 Gezeigte ähnelt dem Beispiel der 15 mit der Ausnahme, dass bei dem Beispiel der 16 das Wörterbuch Wort-zu-Wort-Übergangswahrscheinlichkeiten anstelle von demographischer Information speichert. Das heißt, eine Mehrzahl von Wortkandidaten tieferer Ebene werden in der Reihenfolge der Übergangswahrscheinlichkeiten angezeigt. Für den Nutzer ist es einfacher, aus derartigen wahrscheinlichkeitsbezogenen Worthinweisen auszuwählen. Die Wort-zu-Wort-Übergangswahrscheinlichkeit kann zur Veranschaulichung beispielsweise aus Texten mit mehreren geographischen Namen gelernt werden. Bei einer vereinfachten Anordnung können die Übergangswahrscheinlichkeiten anhand der Bevölkerung der beteiligten Städte und Orte bestimmt werden.
  • Bei dem Beispiel der 21 wird, wie bei dem Beispiel der 14, das Zwischenebenenschlüsselwort "
    Figure 00280001
    (Hitachi)" (Wortkandidat Nr. A1) aus dem Wörterbuch abgefragt durch Nachverarbeitung anhand von Übergangswahrscheinlichkeiten, und Kandidaten tieferer Ebenen, die dem Schlüsselwort zugeordnet sind, müssen noch bestimmt werden. Das Beispiel der 21 unterscheidet sich von dem der 14 dadurch, dass nur eindeutig bestimmte Zeichenketten "
    Figure 00280002
    (Ibaraki-ken, Hitachi-shi)" angezeigt werden. Stadtbezirke tieferer Ebenen, die nicht eindeutig bestimmt wurden, müssen durch den Nutzer erneut eingegeben werden.
  • Wie oben beschrieben wurde, können erfindungsgemäß die Worte, die in der Hierarchie höher stehen als das Schlüsselwort, eindeutig und automatisch geschlussfolgert werden. Falls eine Mehrzahl an dem Schlüsselwort untergeordneten Kandidaten tieferer Ebenen vorhanden ist, werden diese nicht eindeutig bestimmt. In derartigen Fällen kann dem Nutzer ein Menü präsentiert werden, aus dem er auswählen kann oder er kann aufgefordert werden, notwendige zusätzliche Eingaben vorzunehmen.
  • [4] Darstellung der durch Schlussfolgerung ermittelten Zeichenkette
  • Im Folgenden wird eine Beschreibung gegeben, wie der auf die oben beschriebene Weise ermittelte Zeichenkettenkandidat dargestellt wird. Die 17 bis 20 zeigen, wie die durch Schlussfolgerung ermittelten Zeichenketten anschaulich dargestellt werden. Bei jedem der Beispiele wird ein Wort "
    Figure 00290001
    (Oomika)" eingegeben und eine Zeichenkette "
    Figure 00290002
    (Ibaraki-ken, Hitachi-shi, Oomikacho)" durch Schlussfolgerung ermittelt und entsprechend angezeigt. Was die gezeigten Beispiele kennzeichnet, ist ihre unterschiedliche Verschiebung (displacements) der Zeichenfolgen auf dem Display.
  • Bei dem Beispiel der 17 wird der Abschnitt "
    Figure 00290003
    (Oomikacho)" der in Frage kommenden Zeichenkette "
    Figure 00290004
    (Ibaraki-ken, Hitachi-shi, Oomika-cho)" nahe der handgeschriebenen Zeichen "
    Figure 00290005
    "(Oomika)" angezeigt. Diese Art der Darstellung hat den Vorteil, dass es dem Nutzer ermöglicht wird, die handgeschriebenen Zeichen in einfacher Weise mit den erkannten Zeichenkandidaten, die in deren Nähe angeordnet sind, zu vergleichen.
  • Bei dem Beispiel der 18 wird die in Frage kommende Zeichenkette "
    Figure 00290006
    (Ibaraki-ken, Hitachi-shi; Oomika-cho)" im Bereich um die Startposition der handgeschriebenen Zeichen
    Figure 00290007
    (Oomika)". Diese Anzeige "ordnet" die handgeschriebenen Zeichen und die in Frage kommende Zeichenkette linksbündig an, wodurch klar angezeigt wird, wo die Anzeige der erkannten Ergebnisse beginnt.
  • Bei dem Beispiel der 19 wird die angezeigte in Frage kommende Zeichenkette "
    Figure 00290008
    (Ibaraki-ken, Hitachi-shi, Oomika-cho)" an der Position der handgeschriebenen Zeichen "
    Figure 00290009
    (Oomika)" zentriert. Diese Anzeige hat den Vorteil, die handgeschriebene Zeichenkette und die in Frage kommende Zeichenkette in unmittelbarer Nähe zueinander anzuzeigen, sodass der Nutzer seinen Betrachtungspunkt nicht stark bewegen muss.
  • Bei dem Beispiel der 20 werden die handgeschriebene Zeichenkette "Oomika" und die in Frage kommende Zeichenkette
    Figure 00300001
    (Ibaraki-ken, Hitachi-shi, Oomika-cho)" derart dargestellt, dass ihr letztes Zeichen in der gleichen Zeile positioniert ist. Diese Anzeige hat insbesondere den Vorteil, dass im Falle der Nutzung durch Rechtshänder die in Frage kommende Zeichenkette nicht unter der rechten Hand des Nutzers versteckt wird, die den Stift hält.
  • Ein beliebiges Anzeigeformat, wie beispielsweise die in den 17 bis 20 dargestellten Beispiele, können entweder von dem System oder von dem Nutzer gemäß ihrer Präferenzen ausgewählt werden.
  • Bei den Beispielen der 17 bis 20 wird das Schlüsselwort "
    Figure 00300002
    (Oomika)" in der in Frage kommenden Zeichenkette zur Betonung als Umkehrdarstellung (weiß auf schwarz) angezeigt. Alternativ kann das Schlüsselwort unter Verwendung einer anderen Schriftart "gehighlightet" werden oder durch ein beliebiges anderes geeignetes Verfahren. Eine andere Alternative bestünde darin, alles zusammen mit der "gehighlighteten" Anzeige darzustellen.
  • Wie oben beschrieben wurde, ermittelt die erfindungsgemäße Vorrichtung zum Erkennen von Zeichen eine vollständige Zeichenkette aus lediglich einem durch Nutzereingabe handschriftlich eingegebenes Schlüsselwort, wie z. B. einer Adresse oder einem festgelegten Satz aus einer hierarchischen Datenstruktur und zeigt die durch Schlussfolgerung ermittelten Ergebnisse aus in Frage kommende Zeichenketten an. Die erfindungsgemäße Vorrichtung gestattet es zur Übereinstimmungsuntersuchung ("matching") von Worten rasch auf ein internes Wörterbuch zuzugreifen. Wenn das Wörterbuch, wie bei dem oben beschriebenen Ausführungsbeispiel, in Ebenen angeordnet ist, kann der Zugriff auf eine beliebige der das Wörterbuch bildenden Ebene mit hoher Geschwindigkeit ausgeführt werden unabhängig davon, ob es sich um eine höherrangige Ebene handelt oder eine niedrigere Ebene.
  • Erfindungsgemäß braucht der Nutzer lediglich Schlüsselzeichen per Hand zu schreiben und die übrige Zeichenkette wird von der erfindungsgemäßen Vorrichtung durch Schlussfolgerung ermittelt, sodass die gesamte Zeichenkette als erkanntes Ergebnis ausgegeben wird. Dieses und andere Merkmale der Erfindung verstärken die Betriebsleistung der Zeichenerkennungsverarbeitung erheblich.
  • Im Folgenden wird eine Vorrichtung zur Suche von Gesundheitsvorsorge beschrieben, die in der Lage ist, u. a. die Zwecke einer Rezeptierung eines Medikaments und Vorsichtshinweise bei der Einnahme des Medikaments durch Eingabe des Namens des Medikamentenherstellers, des Namens des Medikaments oder eines Teils eines Medikamentencodes aufzufinden oder die in der Lage ist, die Historie eines Falls und einer Gesundheitsvorsorge eines Patienten durch Eingabe eines Teils des Namens des Patienten durch Ausführung eines Suchvorgangs aufzufinden. Bei dem Suchvorgang wird eine Vorrichtung zum Erkennen von Zeichen verwendet zum Erkennen von eingegebenen Zeichenmustern und Schlussfolgern von nicht eingegebenen Worten durch Verweis auf ein hierarchisches Wörterbuch und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle.
  • 23 ist ein funktionales Blockschaubild, das eine erfindungsgemäße Suchvorrichtung für Gesundheitsvorsorge mittels handschriftlicher Eingabe zeigt.
  • Zunächst werden Zeichnmuster auf ein Tablett a201 unter Verwendung des Stiftschreibers a209 geschrieben. Jedes eingegebene Zeichenmuster wird mit Zeichenmustern verglichen, die in einem Erkennungswörterbuch a202 im Voraus katalogisiert sind zur Auffindung eines katalogisierten Zeichenmusters, das mit dem eingegebenen übereiristimmt. Für jedes eingegebene Zeichenmuster werden erkannte Zeichen einschließlich in Frage kommender Zeichen ausgegeben. Eine optimale Reihenfolge, bei der die in Frage kommenden Zeichen zur Bildung einer Zeichenkette sortiert werden, wird durch Verweis auf eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 und eine Zeichenauftrittswahrscheinlichkeitstabelle a208 aufgefunden. Sehr ähnlich der zuvor beschriebenen Zeichenzu-Zeichen-Übergangswahrscheinlichkeit wird auch diese Zeichenzu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 dazu verwendet, im Voraus eine Wahrscheinlichkeit sämtlicher Zeichen-zu-Zeichen-Übergänge, ebenso wie Zeiger auf Worte, die eine derartige in einem Wörterbuch a206 katalogisierten Übergang beinhalten, zu speichern. Genauer gesagt werden bei der Optimierung erkannte und in Frage kommende Zeichen nacheinander dargestellt, d. h. sortiert, um eine optimale Kette von Zeichen zu erzeugen, für die die Summe der Wahrscheinlichkeiten der als Kette auftretenden Zeichen maximiert ist. Danach wird in einem Prozess a205 die optimale Kette der in Frage kommenden Zeichen dazu verwendet, einen Zeiger aufzufinden, der auf ein Wort innerhalb des Wörterbuchs a206 hinweist aus der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204. Das Wort, auf das durch den Zeiger hingewiesen wird, ist die optimale Zeichenkette. Dann wird in einer Wortzusammenstellungs- und Zeichenkettenschlussfolgerungseinheit a207 das Wort des Wörterbuchs a206, das unter Verwendung dieser Technik aufgefunden wurde, nachfolgend mit der Kette der in Frage kommenden Zeichen zusammengestellt und die Information bezüglich des Wortes ebenso wie die vorhergehender und nachfolgender Worte aufgefunden.
  • Bezugszeichen a210 ist eine Medikamententabelle, die Informationen wie den Zweck eines Rezepts eines jeden Medikaments, Vorsichtsmaßnahmen bei der Einnahme des Medikaments, Nebeneffekte des Medikaments und Vorsichtsmaßnahmen bei der Einnahme anderer Medikamente beschreibt. Das Bezugszeichen a211 ist eine Patiententabelle, die Informationen bezüglich der Historie eines Falls und die Gesundheitsvorsorge eines jeden Patienten beinhaltet, wohingegen das Bezugszeichen a212 einer Angestelltenaufnahmetabelle zur Speicherung von Anstellungsinformationen von Angestellten von Krankenhäusern, wie z. B. Krankengymnasten, Krankenschwestern, Apotheker und Technikern, die medizinische Geräte betreuen.
  • Die durch den Betrieb der oben beschriebenen Suchvorrichtung für Gesundheitsvorsorge mit handschriftlicher Eingabe ermittelten Ergebnisse werden auf einer Flüssigkristallanzeige a208 angezeigt.
  • Im Folgenden wird unter Bezugnahme auf die 23, 24 und 25 ein Ausführungsbeispiel zur Suche beschrieben, das für Zwecke eines Rezeptes eines jeden Medikamentes, Vorsichtsmaßnahmen bei der Einnahme des Medikaments, Nebeneffekte des Medikaments und Vorsichtsmaßnahmen bei der Einnahme anderer Medikamente verwendet wird, anhand eines Teils eines Codes der Medikamente, der in die Suchvorrichtung für Gesundheitsvorsorge mittels handschriftlicher Eingabe eingegeben wurde.
  • 24 ist eine Darstellung zur Erläuterung, die dazu verwendet wird, den Betrieb einer die Erfindung ausführenden Suchvorrichtung für handschriftlich eingegebene Medikamente zu beschreiben.
  • Wie in der Figur dargestellt, wird ein Medikamentencode TRN in das Medikamenteneingabefeld a201 unter Verwendung des Stiftschreibers a209 eingegeben. Der handschriftliche Strich wird von der Zeichenerkennungseinheit a203 zur Suche in dem Erkennungswörterbuch a202 verwendet. Als Ergebnis der Suche gibt die Zeichenerkennungseinheit a203 unter anderen Kandidaten einem ersten Kandidaten TRN und einen zweiten Kandidaten TKM aus. Eine optimale Reihenfolge, bei der die in Frage kommenden Buchstaben T, R, N, K und M in einer Zeichenfolge angeordnet werden, sodass sie eine Zeichenkette bilden, wird durch Verweis auf die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 und die Zeichenauftrittswahrscheinlichkeitstabelle a208 erzielt. Die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 wird zur im Voraus Speicherung der Wahrscheinlichkeiten von Zeichen-zu-Zeichen-Übergängen dieser Zeichenkandidaten ebenso wie zur im Voraus Speicherung von Zeigern, die auf die in dem Wörterbuch a206 katalogisierten Medikamente hinweisen, verwendet. Es wird darauf hingewiesen, dass die Zeichenauftrittswahrscheinlichkeitstabelle a208 nicht in 24 gezeigt wird. Da die Wahrscheinlichkeit des Über gangs von dem Buchstaben T hin zu dem Buchstaben R und dann zu dem Buchstaben N entsprechend der Eingabe in das Medikamenteneingabefeld a202 als die höchste Wahrscheinlichkeit ermittelt wird, wird die Zeichenkette TRN als eine optimale Reihenfolge der in Frage kommenden Zeichen bestimmt, die den Medikamentencode darstellt, und die Zeichenkette TRN wird bestimmt als zu dem Zeiger X4 in der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 gehörig. Der Zeiger X4 weist auf ein Medikament mit dem Namen "
    Figure 00350001
    (tokarin)" und den Namen "
    Figure 00350002
    (Ibaraki Seiyaku)" des Herstellerbetriebs des Medikaments in dem Wörterbuch a206 zur im Voraus Katalogisierung von Namen von Medikamenten und Medikamentenherstellern ebenso wie Medikamentencodes hin. Aus diesem Grund können die Namen von Medikamenten und deren Hersteller in einfacher Weise identifiziert werden.
  • Nachdem die Namen der Medikamente und deren Hersteller identifiziert wurden, können Informationen betreffs des Rezepts des Medikaments, Vorsichtsmaßnahmen bei der Einnahme des Medikaments, Nebeneffekte bei der Einnahme des Medikaments und Vorsichtsmaßnahmen bei der Einnahme anderer Medikamente, wie in 25 gezeigt, durch Verweis auf die Tabelle a210 ermittelt werden. Aus 25 wird deutlich, dass die Wirkung des Medikaments "
    Figure 00350003
    (tokarin)" die Wirkung eines Medikaments mit dem Namen Lithium erhöht, aber durch ein Medikament namens Aspirin abgeschwächt wird.
  • Ausgehend von einem beispielhaften Patientennamen, z. B. "
    Figure 00350004
    (Ichiro)", der in das Patientennameneingabefeld a201 unter Verwendung des Stiftschreibers a209 eingegeben wurde, wird der hand schriftliche Strich von der Zeichenerkennungseinheit a203 zur Suche in dem Erkennungswörterbuch a202 verwendet. Als Ergebnis der Suche gibt die Zeichenerkennungseinheit a203, unter anderen Kandidaten, einen ersten Kandidaten "
    Figure 00360001
    (Ichiro)" und einen zweiten Kandidaten "
    Figure 00360002
    (Ichiro)" aus. Eine optimale Reihenfolge, in der die in Frage kommenden japanischen Zeichen "–(ichi)", "–(ichi)) und "
    Figure 00360003
    (ro)" in einer Zeichenfolge angeordnet werden zur Bildung einer Zeichenkette, wird unter Bezugnahme auf die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 und die Zeichenauftrittswahrscheinlichkeitstabelle a208 ermittelt. Die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 wird zur Speicherung von Wahrscheinlichkeiten von sämtlichen Zeichenzu-Zeichen-Übergängen dieser in Frage kommenden japanischen Zeichen des Patientennamens ebenso wie zur im Voraus Speicherung des Patientennamens einschließlich der Übergänge entsprechend der Katalogisierung in dem Wörterbuch a206 verwendet. Es soll darauf hingewiesen werden, dass die Zeichenauftrittswahrscheinlichkeitstabelle in 26 nicht gezeigt ist. Da die Wahrscheinlichkeit des Übergangs von dem japanischen Zeichen "–(ichi)" zu dem japanischen Zeichen "
    Figure 00360004
    (ro)", das in das Patientennameneingabefeld a201 eingegeben wurden, am höchsten ist, wird die Zeichenkette "
    Figure 00360005
    (Ichiro)" als die optimale Reihenfolge der in Frage kommenden japanischen Zeichen ermittelt, die den Patientennamen darstellen, und es wird ermittelt, dass die Zeichenkette "
    Figure 00360006
    (Ichiro)" mit dem Zeiger C2 in der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a204 verknüpft ist. Der Zeiger C2 weist auf den Namen eines Patienten "
    Figure 00360007
    (Ichiro Ymagata)" in dem Wörterbuch a206 zur im Voraus Katalogisierung der Patienten namen hin. Als Resultat kann der Patientenname in einfacher Weise identifiziert werden.
  • Daraufhin updated der Doktor oder die Krankenschwester die Information, wie z. B. die Fallgeschichte und die medizinische Behandlung des Patienten in der Patiententabelle a211.
  • Bei dem oben beschriebenen Ausführungsbeispiel wird ein Betrieb zur Verarbeitung von Information bezüglich eines Patienten erläutert. Es soll darauf hingewiesen werden, dass die Verarbeitung auch auf einen Betrieb zur Verarbeitung des Status und Beschäftigungseinträge von Beschäftigten verwendet werden kann, die in großen Krankenhäusern arbeiten, wie z. B. Physiotherapeuten, Krankenschwestern und Techniker, die medizinische Geräte betreuen. In diesem Fall müssen ein Wörterbuch zur im Voraus Speicherung von Angestellteneinträgen und Angestelltenbeziehungen erzeugt werden.
  • Das Ausführungsbeispiel kann nicht nur für Angestellteneinträge großer Krankenhäuser verwendet werden, sondern auch für ganz allgemein für solche Großfirmen.
  • Wie oben beschrieben wurde, kann durch bloße Eingabe eines handschriftlichen Teils eines Namens eines Medikaments, des Namens eines Patienten oder des Namens eines Angestellten, einer Information, wie z. B. die Verwendung von Medikamenten und Vorsichtsmaßnahmen bei der Einnahme der Medikamente oder Einträge bezüglich medizinischer Behandlung eines Patienten, in einfacher Weise durchgeführt werden, was die Funktionsfähigkeit einer Such vorrichtung für Gesundheitsversorgung mittels handschriftlicher Eingabe erhöht.
  • Als Nächstes wird die Anwendung eines Büchereisuchsystems beschrieben.
  • 27 ist ein Blockschaubild, das die Konfiguration eines Bibliotheksuchsystems zeigt.
  • Bezugszeichen a301 und a302, die in der Figur gezeigt sind, zeigen ein Tablett und eine Flüssigkristallanzeige (LCD, liquid-crystal display}. Das Bezugszeichen a303 bezeichnet eine Zeichenerkennungseinheit und das Bezugszeichen a304 ist ein Zeichenerkennungswörterbuch. Die Bezugszeichen a305 und a306 bezeichnen eine Hauptverarbeitungseinheit und eine Nutzermanagementeinheit. Das Bezugszeichen a307 ist ein Nutzerhauptbuch und das Bezugszeichen a308 bezeichnet Buchausleihdaten. Bezugszeichen a309 und a310 sind eine Buchausleihverarbeitungseinheit und eine Bibliotheksuchverarbeitungseinheit. Das Bezugszeichen a311 bezeichnet eine Buchtitelsucheinheit und das Bezugszeichen a312 ist eine Buchtitel-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle. Die Bezugszeichen a313 und a314 bezeichnen eine Autorennamensucheinheit und eine Autorennamen-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle. Das Bezugszeichen a315 ist eine Bücherregalanordnungsverarbeitungseinheit und das Bezugszeichen a316 bezeichnet Bücherregalanordnungsdaten. Die Bezugszeichen a317 und a318 sind eine Buchneuanschaffungsverarbeitungseinheit und eine Suchtabelleerzeugungseinheit. Das Bezugszeichen a319 ist eine Buchsammlungstabelle und das Bezugszeichen a320 bezeich net eine Autorennamentabelle. Die Bezugszeichen a321 und a322 bezeichnen eine Verlagstabelle und ein Buchsammlungsregal. Das Bezugszeichen a323 ist eine Verlagsuchverarbeitungseinheit und das Bezugszeichen a324 bezeichnet eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Verlagsnamen. Die Bezugszeichen a326 und a327 sind eine Schlüsselwortsuch-Verarbeitungseinheit und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Schlüsselworte. Das Bezugszeichen a327 bezeichnet eine Schlüsselworttabelle und das Bezugszeichen a328 ist ein Kartenleser.
  • In einem derartigen Bibliotheksuchsystem gibt der Nutzer durch Schreiben von Zeichen oder dergleichen in das Feld a301 mittels eines Stiftschreibers eine Eingabe in das System ein. Andererseits zeigt das Bibliotheksuchsystem eine Ausgabe für den Nutzer durch die Flüssigkristallanzeige a302 aus.
  • Der Betrieb des Bibliotheksuchsystems wird im Folgenden beschrieben.
  • Wenn das Bibliothek-Suchsystem aktiviert ist, zeigt die Hauptverarbeitungseinheit a305 ein Menü in der Anzeige a302 an. Das Bibliothek-Suchsystem weist Menüs zur Nutzung durch den Nutzer auf, wie z. B. Buchausleihe, Buchsuche, Bücherregalführung und Menüs für Bibliotheksadministratoren auf, wie z. B. Nutzerverwaltung und Buchzugang Wenn der Nutzer ein Buchausleihmenü auswählt, wird eine Aufforderung zur Ausführung einer Buchausleihverarbeitung von der Hauptverarbeitungseinheit a305 an die Buchausleihverarbeitungseinheit a309 übertragen. Das Buchausleihmenü wird von dem Nutzer zum Ausleihen eines Buches und zur Eingabe einer Reservierung eines Buches verwendet. Die Buchausleihverarbeitungseinheit a309 zeigt eine geeignete Nachricht auf der Anzeige a302 an mittels der Hauptverarbeitungseinheit a305, um den Nutzer dazu aufzufordern, einen Betriebsvorgang durchzuführen. Als Antwort auf die Nachricht gibt der Nutzer typischerweise die im Voraus herausgegebene Nutzerkarte in den Kartenleser a328 zur Auslese von Informationen von der Nutzerkarte ein. Der Kartenleser ermittelt die Nutzernummer von der Nutzerkarte und gibt die Nutzernummer an die Nutzermanagementeinheit a306 weiter. Die Nutzermanagementeinheit a306 sucht in dem Nutzerhauptbuch a307 nach der Nummer um herauszufinden, ob die Nummer in dem Nutzerhauptbuch a307 katalogisiert ist, um anzuzeigen, dass der Nutzer ein gültiger Nutzer ist, d. h. um herauszufinden, ob ein Buch durch den Nutzer ausgeliehen werden kann oder nicht. Gleichzeitig wird Information bezüglich des Nutzers aus dem Nutzerhauptbuch a307 ausgelesen und an die Buchausleihverarbeitungseinheit a309 weitergeleitet. Die Information, die an die Buchausleihverarbeitungseinheit a309 weitergeleitet wurde, beinhaltet den gegenwärtigen Status einer Buchausleihe und Bedingungen zur Durchführung einer Reservierung zur Ausleihe eines Buches. Zusätzlich enthält das Nutzerhauptbuch a307 eine Information bezüglich jedes Nutzers, wie z. B. Name, Adresse und Angaben zur Kontaktaufnahme.
  • Wenn die Buchausleihverarbeitungseinheit keine Authentifikation des Nutzers von der Nutzermanagementeinheit a306 erhält, wird eine Nachricht auf der Anzeige a302 angezeigt, die den Nutzer dazu auffordert, den Bibliotheksadministrator zu benachrichtigen. Dabei wird die Verarbeitung an dieser Stelle beendet. Eine Nachricht, die den Nutzer dazu auffordert, ein ausgeliehenes Buch zurückzugeben, das eine abgelaufene Ausleihfrist aufweist, oder eine Nachricht, die Bedingungen zur Durchführung einer Reservierung zur Ausleihe eines Buches erläutert, kann auf der Anzeige a302 dargestellt werden. Wenn die Buchausleihverarbeitungseinheit a309 die Authentifizierung des Nutzers von der Nutzermanagementeinheit a306 empfängt, akzeptiert die Buchausleihverarbeitungseinheit a309 eine Auflistung auszuleihender Bücher oder einer Reservierung zur Ausleihe eines Buches durch den Nutzer auf interaktive Art und Weise. Die Ausleihe eines Buches oder die Durchführung einer Reservierung zur Ausleihe eines Buches werden als Buchausleihdaten a308 zur Katalogisierung des Buchausleihstatus eines jeden Buches verwendet.
  • Nachfolgend wird, nach der Auswahl eines Bücherregalanordnungsführungsmenüs von der Hauptverarbeitungseinheit a305 eine Buchregalanordnungsführungs-Verarbeitungsaufforderung an die Buchregalanordnungs-Verarbeitungseinheit a315 übertragen. Die Buchregalanordnungsführungs-Verarbeitung versorgt den Nutzer mit einer Anleitung, wo an einer bestimmten Stelle in der Bibliothek ein gewünschtes Buch gefunden werden kann. Wenn der Nutzer ein gewünschtes Buch angibt, liest die Buchregalanordnungs-Verarbeitungseinheit a315 Information bezüglich des Ortes eines jeden Buches aus den Buchregalanordnungsdaten a316 aus. Nachfolgend wird als Ergebnis mittels der Hauptverarbeitungseinheit a305 eine Buchregalanordnung, die auf den Ort des gewünschten Buches hinweist, auf der Anzeige a302 angezeigt, gemeinsam mit einem einfachen Hinweis, der den Buchausleihstatus des gewünschten Bu ches anzeigt, der als Ergebnis einer richtigen Anfrage an die Buchausleihverarbeitungseinheit a309 erhalten wurde, wie in einem Fenster W4 der 28 gezeigt. Zusätzlich werden weitere Einzelangaben angezeigt, falls notwendig.
  • Wenn das Nutzermanagementmenü aufgerufen wird, wird eine Anforderung zur Ausführung einer Nutzermanagementverarbeitung einschließlich der Katalogisierung eines Nutzers, der bislang nicht katalogisiert wurde, von der Hauptverarbeitungseinheit a305 an die Nutzermanagementeinheit a306 übertragen.
  • Bei der Nutzermanagementverarbeitung fordert die Nutzermanagementeinheit a306 den Administrator der Bibliothek dazu auf, eine Administratorregistriernummer und ein Passwort zur Authentifizierung des Administrators einzugeben. Wenn der Administrator nicht authentifiziert werden kann, wird eine Nachricht an den Bibliothekadministrator dargestellt und die Verarbeitung beendet. Wenn der Administrator authentifiziert werden kann, werden Personaldaten des neu zu katalogisierenden Nutzers, wie z. B. ein Name und eine Adresse, die von dem Administrator eingegeben wurden, erhalten, und eine Nutzernummer wird dem Nutzer zugewiesen. Die Personaldaten und die Nutzernummer werden dann in dem Nutzerhauptbuch a307 katalogisiert. Zu diesem Zeitpunkt kann ebenfalls eine Nutzerkarte an den Nutzer ausgegeben werden.
  • Wenn das Buchneuanschaffungsmenü aufgerufen wird, überträgt die Hauptverarbeitungseinheit a305 eine Aufforderung an die Buchneuanschaffungs-Verarbeitungseinheit a317 zur Ausführung einer Buchneuanschaffungsverarbeitung.
  • Bei der Buchneuanschaffungsverarbeitung wird ein neues, bislang nicht katalogisiertes Buch in eine Buchsammlung aufgenommen.
  • Wenn die Buchneuanschaffungs-Verarbeitungseinheit a317 vom Administrator der Bibliothek eingegebene Buchdaten empfängt, werden diese Buchdaten an die Suchtabellen-Erzeugungseinheit a318 weitergegeben. Die Buchdaten beinhalten eine Information bezüglich eines neues Buches, das zu katalogisieren ist, wie z. B. den Titel des Buches, den Namen der Autoren, des Verlags und eines Schlüsselworts, das dem Buch von dem Administrator zugewiesen wurde. Die Suchtabellen-Erzeugungseinheit a318 katalogisiert die Buchdaten in dem Buchsammlungshauptbuch a322 und nachfolgend oder zu einem späteren Zeitpunkt werden die Buchdaten des neu in dem Buchsammlungshauptbuch a322 zu katalogisierenden Buches zum Updaten der Inhalte der Buchtitel-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312, der Autorennamen-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a314, der Verlags-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a324, der Schlüsselwort-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a326, der Buchsammlungstabelle a319, der Autorennamentabelle a320, der Verlagstabelle a321 und der Schlüsselworttabelle a327 verwendet.
  • 29 ist eine Darstellung, die die Struktur eines Buchsammlungshauptbuches a322 wiedergibt.
  • Wie in der Figur gezeigt, weist das Buchsammlungshauptbuch a322 Einträge bezüglich der zu katalogisierenden Daten, wie z. B. einen Buchtitel, die Namen der Autoren, des Verlags und ein Schlüsselwort für die Buchsammlungsnummer, die als eine Bezugsnummer des Buches verwendet wird, auf.
  • Die 30(a), (b) und (c) sind Darstellungen, die die Buchsammlungstabelle a319, die Autorennamentabelle a320 und die Verlagstabelle a321 wiedergeben.
  • Die Buchsammlungstabelle a319 enthält die gleiche Information wie das Buchsammlungshauptbuch a322 mit der Ausnahme, dass die Information in der Buchsammlungstabelle a319 in einem Format katalogisiert ist, das es gestattet, dass ein Suchvorgang ausgeführt wird. In der Buchsammlungstabelle a319 werden der Titel eines Buches, der Autorenname, der Verlagsname und ein Schlüsselwort für jede Buchsammlungsnummer katalogisiert.
  • In der Autorennamentabelle a320 wird eine Autorennummer jedem Autorennamen zugewiesen. Für jede Autorennummer werden der Name des Autors, dem die Autorennummer zugewiesen wurde, ebenso wie die Buchsammlung, die durch die Buchsammlungsnummer dargestellt wird, katalogisiert. In der Verlagstabelle a321 wird jedem Verlagsnamen eine Verlagsnummer zugewiesen. Für jede Verlagsnummer werden der Name des Verlags, dem die Verlagsnummer zugewiesen ist, ebenso wie die Sammlung von Büchern, die von den Buchsammlungsnummern dargestellt werden, katalogisiert.
  • Der Aufbau der Schlüsselworttabelle a327 ist in der Figur nicht gezeigt. Jedoch ist in der Schlüsselworttabelle a327 jedem Schlüsselwort eine Schlüsselwortnummer zugewiesen. Für jede Schlüssel wortnummer wird ein Schlüsselwort, das mit der Schlüsselwortnummer verbunden wird, gemeinsam mit der Buchsammlung katalogisiert, die durch Buchsammlungsnummern dargestellt wird, und die das gleiche zugewiesene Schlüsselwort aufweisen.
  • Es wird darauf hingewiesen, dass die Buchnummern mit den Buchtiteln auf Basis einer 1 : 1-Verknüpfung verbunden sind. In der Buchsammlungstabelle a319 stellt der Titel eines Buches die einzigen Daten dar, die das Buch direkt beschreiben. Um die in der Buchsammlungstabelie a319 katalogisierten Daten einheitlich zu gestalten, kann eine Buchtitelnummer in der Buchsammlungstabelle a319 katalogisiert werden, anstelle des Titels eines Buches in einer getrennten Tabelle zur Verbindung sämtlicher Buchtitel mit einer Buchtitelnummer.
  • 31 ist eine Darstellung, die den Aufbau einer Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel zeigt. Die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a314 für Autorennamen, die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a324 für Verlage und die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a326 für Schlüsselworte weisen die gleichen Struktur wie die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel auf, die in der Figur gezeigt ist.
  • Wie in der Figur gezeigt, werden in der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel die Nummern der auftretenden Zeichen, die Nummern der Zeichen-zu-Zeichen-Übergänge und die Nummern der Buchsammlungen, die Titel mit einem derartigen Übergang enthalten, katalogisiert für jedes in dem Titel eines jeden Buches enthaltene Zeichen.
  • Die Bezugszeicheneinheit 101 bis 105, die in der linken Spalte der Figur gezeigt sind, bezeichnen die Anzahl, wie häufig das entsprechende Zeichen in Titeln von Büchern der Buchsammlung auftritt. Wie in der Figur gezeigt wird, tritt das japanische Zeichen "
    Figure 00460001
    (shi)" 27-mal und das Zeichen "
    Figure 00460002
    "(su)" 108-mal auf, wohingegen das Zei chen "
    Figure 00460003
    (ta)" 250-mal auftritt. Das Ergebnis, das durch Teilen der Auftrittsanzahl eines Zeichens durch die Gesamtauftrittszahl sämtlicher Zeichen ermittelt wird, ist die Auftrittswahrscheinlichkeit für das betreffende Zeichen.
  • Die Bezugszeichen 110 bis 117 der zweiten Spalte von links bezeichnen die Anzahl der Zeichen-zu-Zeichen-Übergänge. Zum Beispiel ist das Bezugszeichen 101 mit dem Bezugszeichen 110 verbunden, um darauf hinzuweisen, dass die Anzahl mit der ein bestimmtes Paar hintereinander folgender Zeichen mit den Zeichen "
    Figure 00460004
    (shi)" 101 gefolgt von dem Zeichen "
    Figure 00460005
    (ng)" auftritt, in den Buchtiteln 10 beträgt. Obgleich das Bezugszeichen 101 mit dem Bezugszeichen 111 durch das Bezugszeichen 110 verbunden ist, zeigt diese indirekte Verbindung die Anzahl an, mit der zwei hintereinander folgende Zeichen mit den Zeichen "
    Figure 00460006
    (shi)" 101 gefolgt von dem Zeichen "
    Figure 00460007
    (su)" in den Buchtiteln 17 vorkommen, wie in dem Fall der direkten Verbindung der Bezugszeichen 101 und 110. Auf diese Weise stellt die Zahl der Zeichen-zu-Zeichen-Übergänge die Anzahl dar, mit der zwei Zeichen hintereinander in Titeln oder Büchern erscheinen. Als Ergebnis wird die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeit des Paars an aufeinander folgenden Zeichen er halten durch Teilen der Anzahl an Zeichen-zu-Zeichen-Übergängen durch die Auftrittsanzahl des ersten Zeichens.
  • Bezugszeichen 121 bis 135 der dritten Spalte von links in der Figur bezeichnen eine Buchsammlungsnummer. Beispielsweise bezeichnen die Bezugszeichen 121 bis 123 jeweils eine Buchsammlungsnummer eines Buches enthält, dessen Titel die zwei Zeichen "
    Figure 00470001
    (shing)" mit dem Bezugszeichen 110 bezeichnet, obgleich das Bezugszeichen 121 direkt mit dem Bezugszeichen 110 verbunden ist, während das Bezugszeichen 122 indirekt mit dem Bezugszeichen 110 durch das Bezugszeichen 121 verbunden ist, und das Bezugszeichen 123 ist indirekt mit dem Bezugszeichen 110 durch die Bezugszeichen 122 und 121 verbunden. Daher bezeichnen die Bezugszeichen 121 bis 123 Bücher mit Buchsammlungsnummer Bi, Bi + 1 und Bj, deren Titel die beiden Zeichen "
    Figure 00470002
    (shing)" beinhalten. Es wird darauf hingewiesen, dass das Wort "Null", das in der Figur gezeigt ist, das Ende der Verbindung bezeichnet.
  • Nebenbei bemerkt kann die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel auch in der in 32 gezeigten Form umgeordnet sein.
  • Der in 32 gezeigte Aufbau ist für eine Anwendung geeignet, bei der der Titel eines Buches in japanischen Kana-Buchstaben oder alphabetischen Zeichen katalogisiert ist. Das heißt, die in der Figur gezeigte Struktur ist geeignet für eine Anwendung, bei der der Titel des Buches beispielsweise für japanischen Katakana-Zeichen katalogisiert ist, deren Anzahl typischerweise eine Zahl von 70 nicht überschreitet, entsprechend der Implementierung in einem Biblio thek-Suchsystem, wie dem in 38 gezeigten zur Katalogisierung der Anzahl von Zeichenauftritten, der Anzahl von Zeichen-zu-Zeichen-Übergängen und einer Buchsammlungsnummer, mit hoher Effizienz.
  • Die in 32 gezeigte Struktur umfasst eine Zeichenwahrscheinlichkeitszähltabelle a312-1 zur Katalogisierung der Anzahl mit der jedes Zeichen in Titeln von Büchern auftritt, eine Zeichen-zu-Zeichen-Übergangszähltabelle a312-2 zur Katalogisierung der Anzahl mit der jedes Zeichen durch ein anderes Zeichen gefolgt wird innerhalb der Buchtitel und eine Zeichenübergangs/Buchsammlungsnummertabelle a312-3, deren Einträge zur Katalogisierung eines Zeichen-zu-Zeichen-Übergangs und der Buchsammlungsnummern der Bücher verwendet wird, deren Titel einen derartigen Übergang beinhalten.
  • Im Folgenden wird die bei Auswahl des Bibliothek-Suchmenüs aufgerufene Bibliothek-Suchverarbeitung beschrieben.
  • Wenn das Bibliothek-Suchmenü in dem Bibliothek-Suchsystem der 27 ausgewählt wird, wird eine Aufforderung an die Bibliothek-Suchverarbeitungseinheit a310 übertragen, die Bibliothek-Suchverarbeitung auszuführen.
  • 33 ist ein schematisches Flussschaubild, das einen Ablauf der Bibliothek-Suchverarbeitung darstellt.
  • Wie in der Figur dargestellt, beginnt die Bibliothek-Suchverarbeitung mit einer Unterprozedur p1 zur Identifizierung des Nutzers.
  • Der Nutzer wird durch die gleiche Verarbeitung identifiziert wie die Authentifikation des Nutzers, die von der oben erläuterten Buchausleih-Verarbeitungseinheit a309 ausgeführt wird. Wenn der Nutzer nicht authentifiziert werden kann, wird eine Nachricht auf der Anzeige a302 angezeigt, die den Nutzer dazu auffordert, den Bibliotheksadministrator zu kontaktieren, womit die Verarbeitung beendet wird. Selbst wenn der Nutzer nicht authentifiziert werden kann, kann der Verfahrensablauf mit der folgenden Unterprozedur p2 fortgesetzt werden, um den Nutzer als Gast zu behandeln. Wenn der Nutzer authentifiziert werden kann, geht das Verfahren zu der Unterprozedur p2 über.
  • Bei der Unterprozedur p2 werden Suchschlüssel und eine Wichtung für jeden Suchschlüssel von dem Nutzer eingegeben. Genauer gesagt wird das mit W1 bezeichnete Fenster, das in der 34 gezeigt ist, auf der Anzeige a302 dargestellt. Der Nutzer gibt dann eine Zeichenkette für jedes Suchelement des Fensters W1 ein. Wenn ein Suchknopf des Fensters W1 gedrückt wird, werden die Zeichenketten als Suchschlüssel für das betreffenden Suchelement akzeptiert. Für ein Suchelement kann eine Mehrzahl von Zeichenketten eingegeben werden. Bei diesem Beispiel gibt der Nutzer einen Leerraum zwischen zwei hintereinander folgenden Zeichenketten als Begrenzer ein. Es wird darauf hingewiesen, dass bei diesem Ausführungsbeispiel ein Interface für handschriftliche Eingabe verwendet wird. Genauer gesagt wird eine von dem Nutzer handschriftlich auf dem Tablett a301 eingegebene Zeichenkette in einem Fenster W2 der Anzeige a302 dargestellt, wie in 34 gezeigt. Die Zeichenkette wird erkannt und ein Ergebnis der Erkennung wird auf einer Cursorpositi on in dem Rahmen des betreffenden Suchpunktes des Fensters W1 angezeigt.
  • Was die Wichtung des Suchschlüssels anbelangt, wird ein Wichtungseingabefenster W4 angezeigt für eine Zeichenkette eines jeden Suchelements, während die Zeichenkette in den Rahmen des Suchelements eingegeben wird. Eine Eingabe des Nutzers in dem Wichtungseingabefenster W4 wird als Wichtung für den Suchschlüssel akzeptiert. Falls keine Eingabe durch den Nutzer in das Wichtungsfenster W4 erfolgt, wird eine Wichtung mit dem Faktor 1 angenommen. Nachdem eine Wichtung durch den Nutzer in das Wichtungseingabefenster W4 eingegeben wurde, d. h. wenn ein Vorgang zur Eingabe einer anderen Zeichenkette gestartet wird, wird die eingegebene Wichtung für die Zeichenkette angezeigt durch Einfügen in (). Es wird darauf hingewiesen, dass anstelle der Wichtung eine Prioritätsreihenfolgenummer jeder Zeichenkette zugewiesen werden kann, die als Suchschlüssel verwendet wird.
  • Dabei gestattet eine Wichtung, die, wie oben beschrieben, einer als Suchschlüssel zu verwendenden Zeichenkette zugewiesen wurde, dem Nutzer, beispielsweise zwischen einer Zeichenkette, bezüglich derer sich der Nutzer sicher ist, und einer Zeichenkette in einem Schnellzugriffsspeicher, die der Nutzer als Suchschlüssel eingegeben hat, zu unterscheiden. Beispielsweise wird der Nutzer dann, wenn sich der Nutzer an ein Wort in einem Titel eines Buches, nach dem gesucht wird, das als Suchschlüssel verwendet werden soll, deutlich erinnert, die Wichtung des Suchschlüssels auf einen hohen Wert festlegen. Wenn sich ein Wort eines Titels eines Buches, nach dem gesucht wird, das als Suchschlüssel verwendet werden soll, in einem Schnellzugriffsspeicher des Nutzers befindet, wird umgekehrt die Wichtung des Suchschlüssels auf einen kleinen Wert festgelegt. Zusätzlich kann im Voraus eine Grundeinstellung eines Wichtungswerts (Default-Wert) oder ein Standardwert einer Prioritätenreihenfolge jedes Suchelement zugewiesen werden. In diesem Fall wird dann, wenn der Nutzer keine Wichtung oder keine Prioritätsreihenfolge für ein Suchelement eingibt, der dem Suchelement zugewiesene Standardwert verwendet. Ein Standardwert kann lediglich durch einen Datenbankverwalter oder einen Bibliotheksadministrator festgelegt werden.
  • Bei dem Beis iel der 34 wird eine Wichtung von 2 und eine Wichtung von 1 der Zeichenkette "
    Figure 00510001
    (interface)" und er Zeichenkette "
    Figure 00510002
    (sekkei)" des Buchtitel-Suchelements zugewiesen, während eine Wichtung von 1 für die Zeichenkette "
    Figure 00510003
    (Yokota)" des Autornamen-Suchelements festgelegt wird.
  • Der Verfahrensablauf geht nachfolgend zu den Unterprozeduren p3 bis p6 über, wie in 33 gezeigt. In den Unterprozeduren p3 bis p6 werden von der Bibliothek-Suchverarbeitungseinheit a310 Aufforderungen an die Suchverarbeitungseinheiten übermittelt zur Durchführung von Suchverarbeitungen nach den durch die als Suchschlüssel für die betreffenden Suchelemente eingegebenen Zeichenketten. Die Suchverarbeitungseinheiten sind die Buchtitel-Sucheinheit a311, die Autorennamen-Sucheinheit a313, die Verlags-Sucheinheit a323 und die Schlüsselworteinheit a325. Es wird darauf hingewiesen, dass die Figur lediglich die Buchtitel-Sucheinheit a311 und die Autorennamen-Sucheinheit a313 zeigt. Unter der Annahme, dass beispielsweise eine Zeichenkette in der Unterprozedur p2 für das Buchtitel-Suchelement eingegeben wird, wird in diesem Fall die Sucheinheit a311 aufgefordert, nach dem Titel eines Buches zu suchen, das mit der eingegebenen Zeichenkette bezeichnet wurde. Es wird darauf hingewiesen, dass, wenn eine Zeichenkette in der Unterprozedur p2 für einen nicht in dem Fenster W 1 definiertes Suchelement eingegeben wird, sämtliche Suchverfahrenseinheiten, d. h., die Buchtitel-Sucheinheit a311, die Autorennamen-Sucheinheit a313, die Verlags-Sucheinheit a323 und die Schlüsselwort-Sucheinheit a325 aufgefordert werden, eine Suche nach einem Suchelement, das durch die eingegebenen Zeichenketten bezeichnet wurde, durchzuführen.
  • Indem die von der Buchtitel-Sucheinheit a311 durchgeführte Betriebsoperationen beispielhaft beschrieben werden, werden die von sämtlichen Suchverarbeitungseinheiten, d. h. der Buchtitel-Sucheinheit a311, der Autorennamen-Sucheinheit a313, der Verlags-Sucheinheit a323 und der Schlüsselwort-Sucheinheit a325 durchgeführten Suchverarbeitungen beschrieben.
  • Die Verarbeitung beginnt mit der Unterprozedur p3, bei der ein Suchschlüssel für das Buchtitel-Suchelement durch den Nutzer eingegeben wird. Wenn der Nutzer einen Suchschlüssel eingibt, geht der Verarbeitungsablauf über zu der Unterprozedur p3, in der die Buchtitel-Sucheinheit a311 eine Suchverarbeitung durchführt, um den Titel eines Buches zu finden, der durch die als ein Suchschlüssel für das Buchtitel-Suchelement angegebene Zeichenkette bezeichnet wird, wie im Folgenden beschrieben wird.
  • Der Titel des gewünschten Buches wird durch Verweis auf die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel zur Auffindung von Buchsammlungsnummern der Bücher aufgefunden, deren Titel einige oder sämtliche der eingegebenen Zeichenketten beinhaltet. Ein Buch mit dem höchsten Grad an Übergangsübereinstimmung wird dann aus den gefundenen Büchern ausgewählt. Es wird darauf hingewiesen, dass der Grad an Übergangsübereinstimmung (matching) eines Buches typischerweise definiert ist als die Anzahl der Zeichen-zu-Zeichen-Übergängen in dem Titel des Buches, die mit den Zeichen-zu-Zeichen-Übergängen der eingegebenen Zeichenketten übereinstimmen. Alternativ hierzu können alle Bücher, die einen Übergangsübereinstimmungsgrad ungleich Null aufweisen, d. h. alle Bücher mit einem Titel, der einige oder alle der eingegebenen Zeichenketten aufweist, aufgenommen wird.
  • Der Grad an Übergangsübereinstimmung eines Buches wird im Folgenden anhand weiterer Beispiele beschrieben. Bei dem oben genannten Beispiel ist die eingegebene Zeichenkette "
    Figure 00530001
    (interface)". Die Suche unter Verwendung der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel ergibt die Buchsammlungsnummern der Bücher mit Titeln "
    Figure 00530002
    Figure 00530003
    (Design-Technik eines Man-Machine Interface)" und "
    Figure 00530004
    (Marry und Ponterface)" Im Falle des ersten Buches wird die Anzahl an Übergängen von dem japanischen Zeichen
    Figure 00530005
    (i)" zu "
    Figure 00530006
    (ng)", von "
    Figure 00530007
    (ng)" zu "
    Figure 00530008
    (ta)" usw. in dem Wort "
    Figure 00530009
    (interface)" in dessen Buchtitel die mit denen der eingegebenen Zeichenkette "
    Figure 00530010
    (interface)" übereinstimmt, mit 7 bestimmt. Daher ist der Grad an Ü bergangsübereinstimmung mit dem ersten Buch gleich 7. Im Falle des zweiten Buches beträgt die Anzahl an Übergängen von dem japanischen Zeichen "
    Figure 00540001
    (ta)" zu "–(ah)", von "–(ah)", zu "
    Figure 00540002
    (fu)" usw. in dem Wort "
    Figure 00540003
    (ponterface)" in dem Buchtitel, die mit denen der eingegebenen Zeichenkette "
    Figure 00540004
    (interface)" übereinstimmt, 5. Daher ist der Betrag an Übergangsübereinstimmung des zweiten Buches 5. Nebenbei bemerkt weist ein Buch mit dem Buchtitel "
    Figure 00540005
    (Design eines Gartens)" einen Grad an Übergangsübereinstimmung von 0 auf. Daher werden alle Bücher mit einem Grad an Übergangsübereinstimmung ungleich Null aufgenommen, und die Ergebnisse der Suche unter Verwendung von Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel besteht aus Buchsammlungsnummern der Bücher mit den Titeln "
    Figure 00540006
    (Design-Technik eines Man-Machine Interface)" und "
    Figure 00540007
    (Marry und Ponterface)", wie oben beschrieben.
  • Genau genommen wird die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel, die in 31 gezeigt wird, nach Buchsammlungsnummern abgesucht, die mit jeglichen Übergängen eines Zeichens zum nächsten in der Zeichenkette, die als Suchschlüssel eingegeben wurde, verbunden ist. In diesem Fall wird anstelle der Nummern der Zeichen-zu-Zeichen-Übergänge die Anzahl an Buchsammlungsnummern, die während der Suche auftritt, als ein Grad an Übergangsübereinstimmung verwendet und Bücher mit einem hohen Grad an Übergangsübereinstimmung werden aufgenommen. Alternativ hierzu können alle Bücher mit einem Grad an Übergangsübereinstimmung ungleich Null aufgenommen werden, wie oben beschrieben wurde. Beispielsweise soll angenommen wer den, dass eine Zeichenkette, die als Suchschlüssel eingegeben wurde, "
    Figure 00550001
    (shisuno)" ist. Für den Übergang von dem japanischen Zeichen "
    Figure 00550002
    (shi)" zu "
    Figure 00550003
    (su)" in der Zeichenkette werden die in der Figur mit den Bezugszeichen 124 und 125 bezeichneten Sammlungsnummern Bk und Bk + 1 ermittelt. Bezüglich des Übergangs von dem japanischen Zeichen "
    Figure 00550004
    (su)" zu "
    Figure 00550005
    (no)" in der Zeichenkette werden andererseits die in der Figur mit den Bezugszeichen 126 bzw. 127 bezeichneten Buchsammlungsnummern Bk und Bi + 1 ermittelt. Die Anzahl der Zeichen-zu-Zeichen-Übergänge in dem Buchtitel, die mit den Zeichen-zu-Zeichen-Übergängen der eingegebenen Zeichenkette übereinstimmen, beträgt für alle Buchsammlungsnummern BC, Bk + 1 und Bi + 1 gleich 1. Jedoch wird die Anzahl der Buchsammlungsnummern, die während der Suche auftreten, als der Grad an Übergangsübereinstimmung verwendet und die Buchsammlungsnummer BC weist einen Grad an Übergangsübereinstimmung von 2 auf, während die übrigen Buchsammlungsnummern Bk + 1 und Bi + 1 jeweils einen Grad an Übereinstimmung von 1 aufweisen.
  • Nachdem die Buchsammlungsnummern in der oben beschriebenen Weise ausgewählt wurden, übergibt die Buchtitel-Suchverarbeitungseinheit a311 eine Liste an Buchsammlungsnummern, die jeweils für die als Suchschlüssel für Buchtitel eingegebenen Zeichenketten gefunden wurden, gemeinsam mit den entsprechenden Graden an Übergangsübereinstimmung an die Bibliothek-Suchverarbeitungseinheit a310. Der Verarbeitungsablauf geht dann zu den Unterprozeduren p5 und p6 über, während derer die Autorennamen-Suchverarbeitungseinheit a313 aufgefordert wird, eine Verarbeitung anhand einer von dem Nutzer als Suchschlüssel für ein Autorenna men-Suchelement angegebenen Zeichenkette durchzuführen. Wie oben beschrieben wurde, führen die Autorennamen-Suchverarbeitungseinheit a313, die Verlag-Suchverarbeitungseinheit a323 und die Schlüsselwort-Suchverarbeitungseinheit a325 die gleiche Verarbeitung durch, wie die Buchtitel-Suchverarbeitungseinheit a311.
  • Der Verarbeitungsablauf geht dann zu der in 33 gezeigten Unterprozedur p7 über, während derer die Bibliothek-Suchverarbeitungseinheit a310 die Buchsammlungsnummern, die auf der Liste der Buchsammlungsnummern aufgeführt sind, die anhand einer als ein Suchschlüssel eingegebenen Zeichenkette ermittelt wurde, die von der Buchtitel-Suchverarbeitungseinheit a311, der Autorennamen-Suchverarbeitungseinheit a313, der Verlag-Suchverarbeitungseinheit a323 und der Schlüsselwort-Suchverarbeitungseinheit a325 empfangen wurden, in eine Reihenfolge angeordnet, die bestimmt wird durch den Grad an Übergangsübereinstimmung, der für die Buchsammlungsnummern und die Wichtungen, die vorher durch den Nutzer eingegebenen wurden gemeinsam mit den Zeichenketten, ermittelt wurden. Teile der Bibliotheksdaten für die Buchsammlungsnummern werden dann aus der Buchsammlungstabelle a319, der Autorennamentabelle a320, der Verlagstabelle a321 und der Schlüsselworttabelle a327 ausgelesen und auf der Anzeige a302 mittels der Hauptverarbeitungseinheit a305 dargestellt in der gleichen Reihenfolge wie die ungeordneten Buchsammlungsnummern, die in 35 gezeigt sind. Die Umordnung wird typischerweise wie folgt durchgeführt.
  • Beispielsweise wird dann, wenn weder eine Wichtung noch eine Prioritätsreihenfolgenummer festgelegt wurde, und lediglich eine Zei chenkette als ein Suchschlüssel für ein Suchelement eingegeben wurde, die Buchsammlungsnummern in absteigender Reihenfolge des erhaltenen Grades an Übergangsübereinstimmung angeordnet. Wenn weder Wichtung noch Prioritätsreihenfolgenummer vergeben wurde, und N Zeichenketten als Suchschlüssel für lediglich ein Suchelement eingegeben wurden, werden die Buchsammlungsnummern in abnehmender Reihenfolge gemäß bestimmter berechneter Größen angeordnet. Die Größe kann die Summe oder das Produkt von N Graden an Übergangsübereinstimmung für jedes Buch sein. Alternativ hierzu kann die Größe ein Ergebnis von Umwandlungen von N Graden an Übergangsübereinstimmung unter Verwendung einer bestimmten Funktion sein. Wenn weder Wichtung noch Prioritätsreihenfolgenummer festgelegt wurde und M Zeichenketten als Suchschlüssel für jeden von k Suchelementen eingegeben wurde, werden die Buchsammlungsnummern in absteigender Reihenfolge gemäß bestimmter berechneter Größen angeordnet. Die Größe kann die Summe, das Produkt oder das Ergebnis einer anderen Funktions-basierten Umwandlung der k × M Grade an Übergangsübereinstimmung für jedes Buch sein. Bei der Berechnung jeder Größe, gleichgültig ob es sich um die Summe oder ein Ergebnis einer Umwandlung mittels einer Funktion handelt, wird jeder Grad an Übergangsübereinstimmung mit einer Wichtung multipliziert, die durch die Länge der Zeichenkette für den Grad an Übergangsübereinstimmung ermittelt wurde. Dann werden die Buchsammlungsnummern in absteigender Reihenfolge der resultierenden Größen angeordnet.
  • Wenn Zeichenketten festgelegt werden als Suchschlüssel für Buchtitel und Autorennamen-Suchelemente mit Zeichenketten für Buchtitel-Suchelemente, denen eine Prioritätsreihenfolgenummer größer als die des Autorennamen-Suchelements zugewiesen wurde, werden die Buchsammlungsnummern in absteigender Reihenfolge der Grade an Übergangsübereinstimmung angeordnet, die von der Buchtitel-Suchverarbeitungseinheit a311 ermittelt wurde. Falls zwei oder mehr Buchsammlungsnummern einen gleichen Grad an von der Buchtitel-Suchverarbeitungseinheit a311 bestimmten Übergangsübereinstimmung aufweisen, werden die Buchsammlungsnummern in absteigender Reihenfolge gemäß des Grades an Übergangsübereinstimmung angeordnet, der von der Autorennamen-Suchverarbeitungseinheit a312 ermittelt wurde.
  • Die zwei oder mehr Buchsammlungsnummern, die einen gleichen Grad an Übergangsübereinstimmung aufweisen, wie durch die Buchtitel-Suchverarbeitungseinheit a311 ermittelt, haben möglicherweise keinen Grad an Übergangsübereinstimmung, wie von der Autorennamen-Suchverarbeitungseinheit a312 ermittelt. In diesem Falle wird eine solche Buchsammlungsnummer behandelt, als ob die Übergangsübereinstimmung der Buchsammlungsnummer, die von der Autorennamen-Suchverarbeitungseinheit a312 bestimmt wurde, gleich Null betrüge. Auch werden in einem Fall, bei dem eine Mehrzahl an Zeichenketten für jeden Suchpunkt festgelegt werden, die Buchsammlungsnummern in der gleichen Weise umgeordnet unter Verwendung der Grade an Übergangsübereinstimmung und Prioritätenreihenfolgenummern.
  • Nun wird im Folgenden angenommen, dass beispielsweise der Zeichenkette "
    Figure 00580001
    (interface)", die als Suchschlüssel für das Buchtitel-Suchelement festgelegt wurde, eine Wichtung von 2, der Zeichenkette "
    Figure 00580002
    (Design)", die als Suchschlüssel für das Buch titel-Suchelement festgelegt wurde, eine Wichtung von 1 und der Zeichenkette "
    Figure 00590001
    (Yokota)", die als Suchschlüssel für das Autorennamen-Suchelement festgelegt wurde, eine Wichtung von 1 zugewiesen wurde. In diesem Fall werden die gewichteten Grade an Übergangsübereinstimmung ermittelt und dann werden die Buchsammlungsnummern in abnehmender Reihenfolge angeordnet entsprechend der ermittelten gewichteten Grade an Übergangsübereinstimmung unter Verwendung einer im Folgenden beschriebenen Technik.
  • Die Abschnitte i bis v, die im Folgenden beschrieben werden, sind jeweils Buchdaten, die einen Titel eines Buches, die Namen von Autoren des Buches und den Verlag des Buches umfassen, die in einer Reihenfolge aufgelistet sind und gemeinsam damit spezifiziert sind, wie ein gewichteter Grad an Übergangsübereinstimmung für das Buch ermittelt wird.
  • Figure 00590002
  • Figure 00600001
  • Figure 00610001
  • Figure 00620001
  • Figure 00630001
  • Dementsprechend können die Ergebnisse der Suchvorgänge unter Verwendung der Zeichenketten "
    Figure 00630002
    (interface)" "
    Figure 00630003
    (sekkei)" und "
    Figure 00630004
    Yokota)", die von dem Nutzer als Suchschlüssel eingegeben wurden, in absteigender Reihenfolge gemäß dem gewichteten Grad an Übergangsübereinstimmung angezeigt werden, der wie oben beschrieben berechnet wurde.
  • Nebenbei bemerkt können bei der Bibliothek-Suchverarbeitung, wie sie in 33 gezeigt ist, nicht nur die Ergebnisse der Suchvorgänge in der Anzeige a312 angezeigt werden, sondern der Nutzer kann auch ein Buch aus dem dargestellten Ergebnis auswählen und zu sätzlich die Bücherregalanordnungs-Verarbeitungseinheit und die Buchausleih-Verarbeitung des ausgewählten Buches nutzen.
  • Genauer gesagt geht der Verarbeitungsablauf, nachdem das gefundene Buch umgeordnet und angezeigt wurde, zu der Unterprozedur p8 über, um herauszufinden, ob ein spezifisches Buch aus der angezeigten Buchliste ausgewählt wurde. Wenn ein spezifisches Buch aus der dargestellten Buchliste ausgewählt wurde, geht der Verarbeitungsablauf zu der Unterprozedur p9 über, in der die Bücherregalanordnungs-Verarbeitungseinheit a315 aufgefordert wird, eine Bücherregalanordnungs-Anleitungsverarbeitung für das ausgewählte Buch durchzuführen. Als Antwort auf die Aufforderung führt die Bücherregalanordnungs-Verarbeitungseinheit a315 die Bücherregalanordnungs-Anleitungsverarbeitung für das ausgewählte Buch durch. Die Verarbeitung geht dann zu der Unterprozedur p10 über, um herauszufinden, ob eine Anforderung zur Reservierung zur Ausleihe des ausgewählten Buches vorliegt. Wenn eine Anforderung für eine Reservierung zur Ausleihe des ausgewählten Buches, die von dem Nutzer eingegeben wurde, aufgefunden wird, geht der Verarbeitungsablauf zu der Unterprozedur p11 über, in der die Buchausleih-Verarbeitungseinheit a309 aufgefordert wird, eine Buchausleih-Verarbeitung für das ausgewählte Buch durchzuführen. Bei Erhalt der Anforderung führt die Buchausleih-Verarbeitungseinheit a309 die Buchausleihverarbeitung durch. Nachdem die Buchausleihverarbeitung für das ausgewählte Buch abgeschlossen wurde, geht der Verarbeitungsablauf zu der Unterprozedur p12 über, in der die Steuerung an die Bibliothek-Suchverarbeitungseinheit a310 zurückübertragen wird. Es wird darauf hingewiesen, dass, wenn kein spezifisches Buch aus der angezeigten Bücherliste in der Unterpro zedur p8 ausgewählt wird, der Verarbeitungsablauf ebenfalls zu der Unterprozedur p 12 übergeht. Bei der Unterprozedur p 12 empfängt die Bibliothek-Suchverarbeitungseinheit a310 einen Befehl entweder zur Beendigung oder zur Fortsetzung der Suchverarbeitung von dem Nutzer. Nach Erhalt des Befehls beendet die Bibliothek-Suchverarbeitungseinheit a310 die Verarbeitung oder setzt sie fort durch Rückkehr zu der Unterprozedur p2, in der die Verarbeitung wiederholt wird.
  • Ein Ausführungsbeispiel, bei dem ein Bibliothek-Suchsystem implementiert ist, wurde soweit beschrieben.
  • Bei dem oben beschriebenen Ausführungsbeispiel sind für jedes Suchelement, d. h. Buchtitel, Autorennamen, Verlag und Schlüsselwort jeweils eine Suchverarbeitungseinheit und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle vorgesehen. Es ist zudem erwähnenswert, dass obgleich die vorliegende Erfindung unter Bezugnahme auf das veranschaulichende Ausführungsbeispiel beschrieben wurde, diese Beschreibung nicht begrenzend sein soll. Das heißt, dass der Gegenstand der vorliegenden Erfindung nicht auf das Ausführungsbeispiel beschränkt ist. Eine Vielzahl an Änderungen und Modifikationen des Ausführungsbeispiels werden dem Fachmann während des Studiums der Beschreibung gewahr. Beispielsweise können eine Suchverarbeitungseinheit und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für zwei oder mehr Suchelemente bereitgestellt werden. Genauer gesagt können die Kana-Buchstaben einer Zeichenkette als ein Suchschlüssel für ein Suchelement zum Durchsuchen einer Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle, die zwei oder mehreren Suchele menten gemein ist, verwendet werden. Im Ergebnis kann die Größe eines Speichers zur Speicherung einer derartigen Tabelle verringert werden.
  • Insbesondere wird für einen Suchvorgang unter Verwendung eines Schlüssels, für den das Suchelement nicht bekannt ist, eine der beiden folgenden Techniken verwendet: (1) Eine Suchverarbeitungseinheit und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle, die allen Suchelementen gemein ist, werden bereitgestellt. Die Suchverarbeitungseinheit durchsucht die Tabelle nach Daten entsprechend eines Schlüssels, der von dem Nutzer spezifiziert wurde. (2) Eine Suchverarbeitungseinheit und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle werden für jedes Suchelement bereitgestellt. Jede Tabelle wird durch die mit der Tabelle verbundene Einheit durchsucht nach Daten entsprechend einem von dem Nutzer spezifizierten Schlüssel.
  • In beiden Fällen werden die Ergebnisse des Suchvorgangs umgeordnet in abnehmender Reihenfolge des Grads an Übergangsübereinstimmung und Wichtungen oder Prioritätsreihenfolgenummern.
  • Zusätzlich wird jede der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle, d. h. die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Buchtitel, die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Autorennamen, die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Verlage und die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Schlüsselworte wie folgt aufgebaut.
  • Im Falle der Buchdaten für ein westliches Buch, das beispielsweise in Englisch geschrieben ist, wird ein Begrenzer zwischen zwei hintereinanderfolgende Worten verwendet. Daher ist der folgende Aufbau vorteilhaft.
  • Genauer gesagt wird eine Worttabelle, die Einträge enthält, die jeweils eine Verbindung zwischen einer Wortnummer, einem Wort und einer Buchsammlungsnummer eines Buches zeigen, das mit dem Wort verbunden ist, mit einem Aufbau, der dem der Autorennamentabelle a320 oder anderen in 30 gezeigten Tabellen ähnelt, erzeugt. Andererseits enthält eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Worte Einträge, die jeweils die Verbindung zwischen einem Zeichen-zu-Zeichen-Übergang und einer Wortnummer zeigt, mit einem ähnlichen Aufbau wie die in 32 gezeigten Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 für Buchtitel erzeugt. Eine Wortverarbeitungseinheit ist außerdem vorgesehen zur Verwendung von Übergängen von einem Zeichen zum anderen innerhalb einer Zeichenkette, die als Suchschlüssel dient zum Auffinden einer Wortnummer und eines Grads an Übergangsübereinstimmungen aus einer Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Worte. Die aufgefundene Wortnummer wird weiterverwendet zur Auffindung einer Buchsammlungsnummer und eines Grads an Übereinstimmung aus der Worttabelle.
  • Alternativ hierzu können sämtliche Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabellen, d. h. die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Buchtitel, die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Autorennamen, die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Verlage und die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Schlüsselworte ebenfalls mit einem anderen Aufbau erzeugt werden, wie im Folgenden beschrieben wird.
  • Genauer gesagt ist die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a312 derart aufgebaut, dass sie eine Buchtiteltabelle enthält, die Einträge beinhaltet, die jeweils eine Verbindung eines Zeichen-zu-Zeichen-Übergangs für Worte mit einer Buchsammlungsnummer eines Buches mit einem Titel, der einen solchen Übergangs beinhaltet, und eine Zeichen-zu-Zeichen-Übergangswahrscheinlichkeit für Worte aufweist, die Einträge beinhaltet, die jeweils eine Verbindung eines Zeichen-zu-Zeichen-Übergangs mit einem Wort wiedergeben. Die Buchtitel-Suchverarbeitungseinheit a311 wird aufgefordert, eine Wortnummer und einen Grad an Übergangsübereinstimmung von Zeichen-zu-Zeichen-Übergängen in einer Zeichenkette, die als Suchschlüssel verwendet wird, aufzufinden durch Verweis auf eine Zeichen-zu-Zeichen-Übergangstabelle für Worte und eine Buchsammlungsnummer und einen Grad an Übergangsübereinstimmung von Zeichen-zu-Zeichen-Übergängen durch Verweis auf die Buchtiteltabelle aufzufinden. Dieser Aufbau kann ebenfalls für die Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabellen für andere Suchelemente verwendet werden. Es wird darauf hingewiesen, dass eine gemeinsame Worttabelle für alle Suchelemente bereitgestellt werden kann oder eine Worttabelle für jedes Suchelement.
  • Nach dem, was oben beschrieben wurde, werden in jeder der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabellen, d. h. der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Buchtitel, der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Autorennamen, der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Verlage und der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Schlüsselworte, Buchsammlungsnummern direkt katalogisiert. Es wird darauf hingewiesen, dass jedoch die Buchsammlungsnummern aus jeder der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabellen weggelassen werden können. Beispielsweise kann anstelle der Buchsammlungsnummer eines Buches, das von einem Autor geschrieben wurde, dessen Name einen Zeichen-zu-Zeichen-Übergang beinhaltet, die Autorennummer des Autors in der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle a314 für Autoren katalogisiert werden. In diesem Fall wird die Buchsammlungsnummer des Buches in der Autorennamentabelle a320 aufgefunden.
  • Zusätzlich zu dem bislang Beschriebenen können die Anzahl der Zeichenauftritte und die Anzahl der Zeichen-zu-Zeichen-Übergänge, die in jeder der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabellen, d. h. der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Buchtitel, der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Autorennamen, der Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle für Verlage und der Zeichenzu-Zeichen-Übergangswahrscheinlichkeitstabelle für Schlüsselworte, katalogisiert sind, nicht zur Berechnung des Grades an Übergangsübereinstimmung verwendet werden. Das heißt, sozusagen ist die Verwendung der Anzahl an Zeichenauftritten und der Anzahl an Zeichen-zu-Zeichen-Übergängen bei derartigen Berechnungen in der obigen Beschreibung nicht explizit aufgeführt. Es soll jedoch darauf hingewiesen werden, dass beispielsweise die Anzahl der Zeichen-zu-Zeichen-Übergänge wie folgt verwendet werden kann. Angenommen es gibt ein Buch mit einem Titel mit einer geringen Wahrscheinlichkeit einer Zeichen-zu-Zeichen-Übergangsübereinstimmung mit einer spezifizierten als Suchschlüssel verwendeten Zeichenkette. Das heißt, der Zeichen-zu-Zeichen-Übergang in dem Titel des Buches hat eine geringe Anzahl an Zeichen-zu-Zeichen-Übergängen, die in der Buchtitel-Zeichen-zu-Zeichen-Übergangswahrscheinlichkeitstabelle katalogisiert sind. In diesem Fall kann das Buch absichtlich wie ein Buch behandelt werden, das einen hohen Grad an Übergangsübereinstimmung aufweist. Der Grund hierfür liegt darin, dass eine geringe Zeichen-zu-Zeichen-Übergangswahrscheinlichkeit, d. h. ein seltener Zeichen-zu-Zeichen-Übergang, eine charakteristische Besonderheit des Titels des Buches im Vergleich zu einem Zeichen-zu-Zeichen-Übergang mit hoher Wahrscheinlichkeit, d. h. einem allgemeinen Zeichen-zu-Zeichen-Übergang, anzeigt.
  • Auch bei dem vorliegenden Ausführungsbeispiel können Buchdaten mit einem geringgewichteten Grad an Übergangsübereinstimmung aus dem Display weggelassen werden. Alternativ kann nur eine vorbestimmte Anzahl an Teilen von Buchdaten angezeigt werden, beginnend mit solchen, die den höchstgewichteten Grad an Übergangsübereinstimmung aufweisen.
  • Wie oben beschrieben wurde, können bei dem Bibliotheksuchsystem gemäß der vorliegenden Erfindung Ergebnisse eines Suchvorgangs in einer Reihenfolge dargestellt werden, die gemäß der Wichtungen und der Prioritätsreihenfolgenummern erfolgt, die für eine Mehrzahl von Suchschlüsseln festgelegt wurden. Aufgrund dessen kann der Nutzer Ergebnisse eines Suchvorgangs erhalten, die in einem Format angezeigt werden, das mehr der Absicht der Suche entspricht. Wie oben beschrieben wurde, ist es erfindungsgemäß möglich, ein Bibliotheksuchsystem bereitzustellen, das in der Lage ist, einen Suchvorgang auszuführen und die Ergebnisse des Suchvorgangs in einer Art und Weise in einem Format zu präsentieren, das mit der beabsichtigten Suche des Nutzers übereinstimmt.
  • Die folgende Beschreibung erläutert eine Technik zur Ausführung einer Suche, die eine nicht eindeutige, mehrdeutige Eingabe akzeptiert, die später genauer beschrieben wird, in einfacher Weise in einer Muli-Element-Datenbank, die grundsätzlich durch den Nutzer verwendet wird, durch bloße Hinzufügung von Suchelementattributen und einfacher Information auf einem Verfahren für jedes Suchelement. Genauer gesagt wird für jedes Suchelement der Multi-Element-Daten durch den Nutzer spezifiziert: (1) Ob ein Suchvorgang ausgeführt wird, (2) eine Prioritätenreihenfolge unter den Suchelementen und (3) Attribute für jedes Suchelement.
  • Dann erzeugt einallgemeines Suchsystem eine Zeichen-zu-Zeichen-Übergangsindextabelle, die bei der Suche, die eine mehrdeutige Eingabe akzeptiert, verwendet wird, eine Suche, die einen teilweisen Fehler in einer Eingabe von Zeichenketten oder eine Mehrdeutigkeit der Bedeutung der Attribute toleriert. Ein Beispiel der Mehrdeutigkeit der Farbe "
    Figure 00710001
    (blau)" besteht darin, dass das Wort "
    Figure 00710002
    (blau)" "
    Figure 00710003
    (hellblau)" oder "
    Figure 00710004
    (dunkelblau)" bedeuten kann und ein Beispiel der Sachmehrdeutigkeit ist beispielsweise, dass das Wort "
    Figure 00720001
    (Orange)" "
    Figure 00720002
    (Navelorange)" oder "
    Figure 00720003
    (Mandarine)" bedeuten kann. Die vorliegende Erfindung stellt Ausführungsbeispiele zur Ausführung der folgenden drei Arten von Suchen bereit, die eine mehrdeutige Eingabe tolerieren:
    • [1] Eine Suche, die eine mehrdeutige Eingabe toleriert unter Verwendung einer Analogietabelle wie z. B. Thesaurus.
    • [2] Eine Suche, die eine mehrdeutige Eingabe bezüglich Multi-Element-Daten einschließlich nicht textbasierter Daten, wie z. B. Bildern (nach denen nicht gesucht wird), toleriert.
    • [3] Eine Suche, die eine mehrdeutige Eingabe toleriert, unter Verwendung einer Tabelle von Indizes, die jeweils einen Zeichen-zu-Zeichen-Übergang mit einem Wort verbinden.
  • [1] Eine Suche, die eine mehrdeutige Eingabe unter Verwendung eines Thesaurus akzeptiert.
  • Im Falle der vorliegenden Ausführungsform ist es möglich, einen Suchvorgang auszuführen, bei dem es die Verwendung einer Analogietabelle für sämtliche Datenattribute gestattet, dass eine Zweideutigkeit bezüglich der Bedeutung der Attribute toleriert wird. Wie oben beschrieben wurde, besteht ein Beispiel der Zweideutigkeit der Farbe "
    Figure 00720004
    (blau)" darin, dass das Wort "
    Figure 00720005
    (blau)" bedeuten kann "
    Figure 00720006
    (hellblau)" oder "
    Figure 00720007
    (dunkelblau)" und ein Beispiel der Sachmehrdeutigkeit besteht darin, dass das Wort "
    Figure 00720008
    (Orange)" bedeuten kann "
    Figure 00720009
    (Navelorange)" oder "
    Figure 00720010
    (Mandarine)".
  • 36 ist eine Darstellung, die einen Aufbau eines Multi-Element-Datenbanksuchsystems zeigt, das eine mehrdeutige Eingabe toleriert, entsprechend der Implementation durch ein Ausführungsbeispiel der vorliegenden Erfindung. Der Betriebs des Ausführungsbeispiels wird kurz wie folgt beschrieben: Wie in der Figur gezeigt, werden zuerst handschriftliche Striche über das Tablett S001 eingegeben. Dann erkennt eine Zeichenerkennungseinheit S002 die handschriftlichen Striche durch Vergleich mit einem Zeichenerkennungswörterbuch S003. Der Vergleich führt zu Ketten von in Frage kommenden Zeichen. Eine Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004 zerlegt die in Frage kommenden Zeichen, genauer gesagt eine Mehrzahl von Ketten von in Frage kommenden Zeichen in Paare oder zwei aufeinanderfolgende Zeichen oder Zeichen-zu-Zeichen-Übergänge. Jeder der Zeichen-zu-Zeichen-Übergänge wird durch ein Zeichen-zu-Zeichen-Übergangsindexwerkzeug in einer im Voraus erzeugten Zeichen-zu-Zeichen-Übergangsindextabelle S005 gesammelt. Wenn ein Zeichen-zu-Zeichen-Übergang als in der Zeichen-zu-Zeichen-Übergangsindextabelle S005 katalogisiert ermittelt wird, wird der Zeichen-zu-Zeichen-Übergang als ein Teil der in Frage kommenden Zeichenkette ermittelt. Die Datenadresse einschließlich des spezifischen in Frage kommenden Zeichen-zu-Zeichen-Übergangs in einer Multi-Element-Datenbank S006 ist auch in der Zeichen-zu-Zeichen-Übergangsindextabelle S005 katalogisiert, was es gestattet, dass auf die Multi-Element-Datenbank S006, die den in Frage kommende Zeichenkette beinhaltet, schnell zugegriffen werden kann. Bei dem oben beschriebenen Verfahren werden die in Frage kommenden Zeichenketten in Zeichen-zu-Zeichen-Übergänge zerlegt und es wird auf die Zeichen zu-Zeichen-Übergangsindextabelle S005 verwiesen in den Zeichenzu-Zeichen-Übergangseinheiten, sodass im Ergebnis in Frage kommende Zeichenketten resultieren, die im Voraus in der Multi-Element-Datenbank S006 katalogisiert sind. Aufgrund dessen kann in der Multi-Element-Datenbank S006 gesucht werden, selbst wenn ein teilweiser Fehler in der in das Tablett S001 eingegebenen Zeichenkette oder in dem durch die Zeichenerkennungseinheit S002 ausgegebenen Ergebnis vorliegt.
  • Um Daten aufzufinden, die eine ähnliche Bedeutung haben wie die eingegebenen Daten, werden die Trefferdaten der Multi-Element-Datenbank S006 an die Analogiedaten-Schlussfolgerungseinheit S007 übertragen. Jedes Suchelement der Trefferdaten wird in einer Analogietabelle zusammengestellt, die für die Attribute der Suchelemente erzeugt wurde. Der Name einer Analogietabelle, die für die Attribute eines Suchelements erzeugt wurde, ist in einer Attribut-Definitionstabelle katalogisiert. Analoge Daten zu den Trefferdaten, die in der Analogietabelle gefunden wurden, werden an die Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004 übertragen. Auf diese Weise kann auf die Daten der Multi-Element-Datenbank S006 einschließlich der analogen Daten in einfacher Weise zugegriffen werden.
  • Wie oben beschrieben, ist es möglich, die Multi-Element-Datenbank S006 nach Daten einschließlich einer mittels des Tabletts S001 eingegebenen Zeichenkette und analogen Daten, deren Bedeutung denen der Trefferdaten ähnelt, zu durchsuchen. Als Nächstes wird eine Priorität für jedes Teil der aufgefundenen Daten gemäß einer Definition bestimmt, die in einer Datenbank-Prioritätsdefinitionseinheit S001 bereitgestellt wird. Nur Teile der aufgefundenen Daten werden dann auf einer LCD-Anzeige S013 angezeigt, Stück für Stück, beginnend mit einem Stück, das die höchste Priorität aufweist. Die Teile der gefundenen Daten, die angezeigt werden sollen, werden gemäß einer in einer Suchergebnis-Anzeigenbereich-Definitionstabelle S012 bereitgestellten Definition bestimmt. Bei einem Suchvorgang, der eine mehrdeutige Eingabe toleriert, ist die Anzahl an Datenstücken groß, die bei dem Suchvorgang als Treffer ermittelt wurden. Durch Anzeige lediglich einiger Stücke der gefundenen Daten in der Anzeige S013 Stück für Stück, beginnend mit einem Stück, das die höchste Priorität aufweist, kann der Nutzer jedoch die gewünschten Daten aus den Ergebnissen des Suchvorgangs mit Leichtigkeit auswählen.
  • Der Aufbau eines grundsätzlichen Suchsystems, das eine mehrdeutige Eingabe toleriert, und eine Übersicht über dessen Betrieb unter Verwendung einer Analogietabelle, die analoge Daten wie z. B. ein Thesaurus enthält, wurde oben beschrieben.
  • Die 37(a) bis (i) sind Darstellungen, die Ausgestaltungen von Tabellen zeigen, die bei der Konfiguration eines grundsätzlichen Suchsystems, das in 36 gezeigt wird, verwendet werden. Die Inhalte dieser Tabellen werden im Folgenden erläutert.
  • Das in der 37(a) gezeigte Bezugszeichen S003 ist ein Zeichenerkennungswörterbuch. Typischerweise wird die Zeichenerkennungstabelle S003 zum Speichern von Zeichenmustern und deren Zeichencodes verwendet.
  • Bezugszeichen S005 ist die Zeichen-zu-Zeichen-Übergangsindextabelle zur Katalogisierung von Einträgen, die jeweils einen Zeichenzu-Zeichen-Übergang (d. h. ein Paar von zwei hintereinander folgenden Zeichen) und eine Adresse in der Multi-Element-Datenbank S006 zeigen, unter der eine Zeichenkette einschließlich des Zeichenzu-Zeichen-Übergangs im Voraus katalogisiert ist. Die Einträge der Zeichen-zu-Zeichen-Übergangsindextabelle S005 werden jeweils verwendet als ein Index einer in der Multi-Element-Datenbank S006 katalogisierten Zeichenkette, wenn die Multi-Element-Datenbank S006 n ach Zeichenketten durchsucht wird. Es wird darauf hingewiesen, dass die Zeichen-zu-Zeichen-Übergangsindextabelle automatisch erzeugt wird durch ein Suchindex-Erzeugungswerkzeug durch Zerlegung von Multi-Element-Daten, die in der Multi-Element-Datenbank S006 katalogisiert sind, in Zeichen-zu-Zeichen-Übergängen oder Paaren von zwei hintereinander folgenden Zeichen.
  • Bezugszeichen S006 ist ein Beispiel einer Multi-Element-Datenbank. Wie in der Figur gezeigt ist, hat jedes Teil der Daten drei Suchelemente: Suchelemente 1 bis 3, die die Ware, die Größe und den Preis bezeichnen.
  • Bezugszeichen S014 ist eine Suchobjekt-Spezifikationstabelle. Die Suchobjekt-Spezifikationstabelle S014 wird zur Katalogisierung von Suchelementen der Muli-Element-Datenbank S006 verwendet, die als ein Suchobjekt verwendet werden. Der Grund, warum die Suchobjekt-Spezifikationstabelle S014 bereitgestellt wird liegt darin, dass die Multi-Element-Datenbank S006 Daten wie z. B. Bild- oder Musikdaten beinhalten kann oder Objekte, die schwierig zu suchen sind auf der Basis einer Zeichenkette, die eine mehrdeutige Eingabe toleriert. Die Verwendung der Suchobjekt-Spezifikationstabelle S014 gestattet es, Suchelemente deutlich von Nichtsuch-Suchelementen zu trennen. Bei diesem Beispiel stellen die Suchelemente Nr. 1 bis Nr. 3, die die Ware, die Größe und den Preis bezeichnen, alle Objekte dar, nach denen gesucht wird.
  • Bezugszeichen S015 ist eine Attributdefinitionstabelle zur Darstellung welche Attribute, d. h. welche Eigenschaften die Daten der einzelnen Suchelemente der Multi-Element-Datenbank S006 haben. Bei einer eine mehrdeutige Eingabe tolerierenden Suche wird auf eine Analogietabelle für ein Suchelement, das durch einen der Attributdefinitionstabelle S015 angezeigt wird, Bezug genommen, wodurch Daten mit einer ähnlichen Bedeutung (d. h. analoge Daten) zu dem Suchelement gefunden werden können.
  • Bezugszeichen S008 ist ein Beispiel einer Analogietabelle. In dieser Analogietabelle S008 sind Analogien für das Suchelement Größe gezeigt. Genauer gesagt werden in jedem Eintrag der Analogietabelle S008 ein Wert des Suchelements Größe und seinem Referenzwert katalogisiert. Größen mit geringen Unterschieden bezüglich der Referenzwerte werden als analoge Größen betrachtet.
  • Bezugszeichen S009 ist ebenfalls ein Beispiel für eine Analogietabelle. In dieser Analogietabelle S009 werden Analogien für allgemeine Dinge, wie z. B. Waren bezeichnet, durch das Warennamen-Suchelement. Bei diesem Beispiel wird die Analogietabelle S009 durch ein Thesaurus implementiert mit einer repräsentativen Tabelle, um Analogien allgemeiner Dinge auszudrücken. Wie in dem Beispiel der Figur gezeigt ist, weist jede Spalte des Thesaurus einen Gegenstand und eine Liste von Waren auf, die auf den Gegenstand bezogen sind. Die Waren werden in untere und obere hierarchische Ebenen klassifiziert. Die hierarchischen Ebenen sind aufeinandergestapelt, was darauf hinweist, dass je näher die hierarchischen Ebenen zueinander angeordnet sind, desto größer die Analogie zwischen den Waren der entsprechenden Ebenen ist.
  • Wie oben beschrieben wurde, ist die Tabelle S008 eine Größenanalogietabelle, die Analogien für das Suchelement Größe wiedergibt, wohingegen die Tabelle S009 eine Gegenstandsanalogietabelle ist, die Analogien für das Warennamen-Suchelement angibt, wie durch ein Thesaurus implementiert. Andere Analogietabellen beinhalten Tabellen, die Analogien jeglicher Arten von Attributen wiedergeben, wie z. B. Farbe, Helligkeit/Dunkelheit und Feinheit. Eine Farbenanalogietabelle wird in dem nächsten Ausführungsbeispiel erläutert.
  • Die Analogie eines Attributs kann offensichtlich von dem Attribut abhängen. Beispielsweise ist die Analogie eines numerischen Attributs klar. In diesem Fall ist es nicht notwendig, eine spezifische Analogietabelle für die Nummern der Attribute bereitzuhalten. Sozusagen benötigt ein derartiges Attribut keine Analogietabelle.
  • Bezugszeichen S011 ist eine Datenbank-Prioritätsdefinitionstabelle. Die Ergebnisse eines Suchvorgangs können nicht perfekt mit einer Eingabe übereinstimmen. Beispielsweise kann ein Datenstück eine Übereinstimmung bezüglich des Warennamens aufweisen, während ein anderes Datenstück eine übereinstimmende Größe aufweisen kann. Durch Definition von Prioritäten, die eine Reihenfolge anzeigen, welches der Datenstücke, ob mit einem übereinstimmenden Warennamen oder einer übereinstimmenden Größe zuerst angezeigt werden soll, wobei die Daten, die nahe der vom Nutzer gewünschten Information stehen, Vorrang vor den anderen Daten in der Anzeige genießen können.
  • Als Ergebnis einer Suche, die eine mehrdeutige Eingabe toleriert, kann grundsätzlich eine Anzahl an Kandidaten erhalten werden. Es liegt innerhalb der Grenzen der Möglichkeiten, dass es schwierig ist, einen richtigen Kandidaten unter all den möglichen Kandidaten, die aus einer Suche resultieren, auszuwählen, wenn alle Kandidaten zur gleichen Zeit angezeigt werden. Um dieses Problem zu lösen, werden Ergebnisse der Suche in einer Prioritätsreihenfolge Schritt für Schritt angezeigt, beginnend mit einem Schritt, der eine höchste Priorität aufweist, gefolgt von einem Schritt mit einer geringeren Priorität.
  • Bezugszeichen S012 ist ein Beispiel für eine Suchergebnisanzeigebereichs-Definitionstabelle. Bei diesem Beispiel enthält jeder Eintrag der Sucheergebnisanzeigebereich-Definitionstabelle S012 einen Anzeigeschritt und eine Anzahl, die den Grad an Übereinstimmung der Daten, die in dem Schritt angezeigt werden, beinhaltet. Der Grad an Übereinstimmung der Daten ist ein Indikator, der anzeigt, wie viele Daten mit der Eingabe übereinstimmen. Bei diesem Beispiel werden die Anzeigeschritte mittels des Grades an Übereinstimmung klassifiziert. Es wird darauf hingewiesen, dass die Anzeigeschritte auch durch Suchergebniszählung oder den Grad an Unterschiedlichkeit klassifiziert werden können.
  • Die Tabellen, die bei der Suche, die eine mehrdeutige Eingabe tolerieren, verwendet werden, wurden oben unter Bezugnahme auf die 37(a) bis (i) beschrieben. Grundsätzlich definiert der Nutzer die Multi-Element-Datenbank S006, die Suchobjekt-Spezifikationstabelle S014, die Datenbank-Prioritätsdefinitionstabelle S011 und die Attributdefinitionstabelle S015. Andererseits werden die Analogietabellen S008 und S009 im Voraus durch das Suchsystem bereitgestellt. Ein Thesaurus, der heutzutage grundsätzlich verwendet wird, kann in einfacher Weise bei den Suchsystemen angewandt werden.
  • Als Nächstes wird der Verarbeitungsfluss einer Suche, die eine mehrdeutige Eingabe toleriert, unter Bezugnahme auf die 38 beschrieben.
  • Wie in der Figur gezeigt, werden zunächst handschriftliche Zeichen
    Figure 00800001
    (Orange)" über das Tablett S001 eingegeben. Dann erkennt die Zeichenerkennungseinheit S002 die handgeschriebenen Zeichen, gibt eine erste Kette in Frage kommender Zeichen
    Figure 00800002
    (sairenji)" und eine zweite Kette in Frage kommender Zeichen "
    Figure 00800003
    (oshisochi)" aus, die durch das Bezugszeichen S021 als ein Ergebnis der Zeichenerkennung bezeichnet werden. Der Verarbeitungsablauf geht dann zum Schritt S022 über, indem die Ketten in Frage kommender Zeichen in Paare hintereinanderfolgender Zeichen zerlegt werden, was zu Übergängen von einem in Frage kommenden Zeichen zu einem anderen in Frage kommenden Zeichen führt. Der Verarbeitungsablauf geht dann weiter zu Schritt S023, in dem jeder der Übergänge von einem in Frage kommenden Zeichen zu einem anderen in Frage kommenden Zeichen in der Zei chen-zu-Zeichen-Übergangsindextabelle S005 zusammengestellt wird. Wenn ein Übergang von einem in Frage kommenden Zeichen zu einem in Frage kommenden Zeichen als in der Zeichen-zu-Zeichen-Übergangsindextabelle S005 katalogisiert aufgefunden wird, wird eine mit dem katalogisierten Zeichen-zu-Zeichen-Übergang verbundene Adresse abgefragt. Die Adresse ist ein Ort in der Multi-Element-Datenbank S006, wo Daten, die den Zeichen-zu-Zeichen-Übergang enthalten, katalogisiert sind. Im vorliegenden Beispiel sind die Übergänge von einem in Frage kommenden Zeichen zu einem anderen in Frage kommenden Zeichen "
    Figure 00810001
    (o)" zu "
    Figure 00810002
    (re)" und "
    Figure 00810003
    (re)" zu "
    Figure 00810004
    (ng)" beide in der Zeichen-zu-Zeichen-Übergangsindextabelle S005 katalogisiert und die verbundenen Adressen sind beide 003.1. Die gleiche Adresse 003.1, die mit den Übergängen "
    Figure 00810005
    (o)" zu "
    Figure 00810006
    (re)" und "
    Figure 00810007
    (re)" zu "
    Figure 00810008
    (ng)" verbunden sind, wird als Index für eine Adresse 003 in der Multi-Element-Datenbank S006 verwendet, unter der eine mit hoher Wahrscheinlichkeit in Frage kommende Zeichenkette, die durch ein "sandwichartig" dazwischen liegendes Zeichen "
    Figure 00810009
    (re)" verbunden ist, katalogisiert ist.
  • Der Verarbeitungsablauf geht dann über zu Schritt S024 in dem unter Bezugnahme auf die Adresse 003 in der Multi-Element-Datenbank S006 die Daten "
    Figure 00810010
    (Orange), L, 180 yen" in einfacher Weise erhalten werden. Auf diese Weise können die Daten "
    Figure 00810011
    (Orange), L, 180 Yen" nahe den handschriftlich eingegebenen Zeichen "
    Figure 00810012
    (Orange)" erhalten werden. Es wird darauf hingewiesen, dass Daten, die eine ähnliche Bedeutung, wie die handschriftlich eingegebene Zeichenkette "
    Figure 00810013
    (Orange)" aufweisen zudem gefunden werden können. Wie aus der Attributdefinitionstabelle S015 offensichtlich wird, ist die Thesaurusanalogietabelle S009 dem Warennamen-Suchelement zugewiesen. Daher wird der Warennamen "
    Figure 00820001
    (Orange)"-Treffer unter der Adresse 003.1 mit der Thesaurus-Analogietabelle S009 bereitgestellt. Nebenbei bemerkt ist der Warenname "
    Figure 00820002
    (Orange)" als Suchelement in der Thesaurus-Analogietabelle S009 katalogisiert. Als ein Konzept, das in der Hierarchie höher steht als der Warennamr "
    Figure 00820003
    (Orange)", ist "
    Figure 00820004
    (Mandarinenart)" katalogisiert. Nachfolgend wird das Suchelement "
    Figure 00820005
    (Mandarinenart)" gesucht in dem Thesaurus S009, um "
    Figure 00820006
    (Mandarine)" zusätzlich zu "
    Figure 00820007
    (Orange)" aufzufinden ein Konzept, das in der Hierarchie tiefer steht als "
    Figure 00820008
    "(Mandarinenart". Dabei wird "
    Figure 00820009
    (Mandarine)" als ein anderer in Frage kommender Zeichenkettenkandidat genommen. Mittels des gleichen Verfahrens, das bei den Schritten S022 bis S024 verwendet wurde, werden Daten "
    Figure 00820010
    (Mandarine)", M, 160 yen" unter einer Adresse 001 in der Multi-Element-Datenbank S006 abgefragt, die die in Frage kommende Zeichenkette "
    Figure 00820011
    (Mandarine)" enthält.
  • Der Verarbeitungsablauf geht dann über zu einem Schritt S025, in dem ein Grad an Übereinstimmung der handschriftlich eingegebenen Zeichen berechnet wird für jedes Teil der Daten, die aus der Suche resultieren. Der Grad an Übereinstimmung wird aus der Anzahl von Trefferzeichen in den Daten berechnet und der Bedeutungsnähe der eingegebenen Kette. Bei diesem Beispiel weist der Warenname der Daten "
    Figure 00820012
    (Orange), L, 180 yen" unter der Adresse 003 drei Buchstaben auf, die mit der eingegebenen Kette übereinstimmen.
  • Wie aus der Datenbank-Prioritätsdefinitionstabelle S011 ersichtlich ist, hat das den Warennamen betreffende Suchelement die höchste Priorität. Daher wird den Daten "
    Figure 00830001
    (Orange), L, 180" 3*1000 = 3000 Punkte zugewiesen. Andererseits wird den Daten
    Figure 00830002
    (Mandarine), M, 160 yen unter der Adresse 001, die als Daten mit einem Warennamen analog zu der eingegebenen Kette gefunden wurde, S00 Punkte zugewiesen.
  • Der Verarbeitungsablauf geht dann weiter zu Schritt S013, in dem die während der Suche ermittelten Daten angezeigt werden.
  • Gemäß der Suchergebnisanzeigebereich-Definitionstabelle S012 ist ein erster Anzeigeschritt als ein Schritt zur Anzeige von Daten definiert, die einen Betrag an Übereinstimmung gleich oder größer als 1000 Punkte aufweisen, während ein zweiter Anzeigeschritt definiert ist als ein Schritt zur Anzeige von Daten, mit einem Grad an Übereinstimmung gleich oder größer S00 Punkte. Daher werden in Schritt S013 nur die Daten "
    Figure 00830003
    (Orange), L, 180 yen", die unter der Adresse 003 katalogisiert sind, in dem ersten Schritt angezeigt. Wenn der Nutzer es wünscht, dass die nächsten Daten angezeigt werden, fordert der Nutzer eine weitere Anzeige an. In diesem Fall werden die Daten "
    Figure 00830004
    (Mandarine), M, 160 yen", die unter der Adresse 001 katalogisiert sind, im zweiten Schritt angezeigt.
  • Die Anzeige der Ergebnisse der Suche endet mit dem Ablauf der von dem vorliegenden Ausführungsbeispiel ausgeführten Verarbeitung.
  • [2] Suche, die eine mehrdeutige Eingabe von Multi-Item-Daten einschließlich nicht textbasierter Daten, wie z. B. Bildern (nach denen nicht gesucht wird), beinhaltet.
  • Die folgende Beschreibung erläutert ein Suchsystem, das eine mehrdeutige Eingabe zur Suche in einer Multi-Element-Datenbank, die Daten, wie z. B. Bilder beinhaltet, die von der Suche anhand der Zeichenkette ausgeschlossen sind.
  • 39(a) ist eine Darstellung, die ein Beispiel einer Multi-Element-Datenbank S006 zeigt, die nicht textbasierte Daten, wie z. B. Bilder enthält. Grundsätzlich ist eine Multi-Element-Datenbank S006, die nicht textbasierte Daten, wie z. B. Bilder enthält, in einen Textdatenbankabschnitt S006-1 und in einen Nichttext-Datenbankabschnitt S006-2 unterteilt. Der Textdatenbankabschnitt S006-1 ist typischerweise mit dem Nichttext-Datenbankabschnitt S006-2 durch Zeiger verbunden, die auf Bilddaten verweisen.
  • Im Fall der Multi-Element-Datenbank S006 wird die Suchobjekt-Spezifikationstabelle S014 verwendet, um klar die Objekte anzuzeigen, nach denen gesucht werden soll innerhalb der in der Multi-Element-Datenbank S006 katalogisierten Datenstücke. Beispielsweise können die Suchelemente ein Autoname, eine Autofarbe und ein Modelljahr sein, die als Objekte spezifiziert sind, nach denen gesucht wird innerhalb der Stücke an Informationen bezüglich Automobilen, während der Suchelementbilderzeiger als ein Nicht-Suchobjekt behandelt wird. Indem die zu suchenden Objekte auf diese Weise klar bezeichnet werden, ist es möglich, ausschließlich nach Suchelementen zu suchen, die für die Suche anhand einer Zeichenkette geeignet sind, selbst wenn die Multi-Element-Datenbank S006 Daten beinhaltet, die für diese Suche nicht geeignet sind.
  • Ähnlich zu dem, was oben beschrieben wurde, bezeichnet das Bezugszeichen S015 eine Attributsdefinitionstabelle. In der Attributsdefinitionstabelle S015 wird das Suchelement bezüglich des Automobilnamens als allgemeine Zeichenkette behandelt. Ein Farbattribut Farbe und ein Nummernattribut werden der Automobilfarbe und den Modelljahr-Suchelementen zugewiesen.
  • Bezugszeichen S088 ist eine Farbanalogietabelle. Die Farbanalogie ist analog dem, was nicht durch eine eindimensionale Darstellung ausgedrückt werden kann. In diesem Fall ist die Analogie durch eine Darstellung von zwei oder mehr Dimensionen ausgedrückt. Bei diesem Beispiel wird eine Farbe durch Vektorkoordinaten dargestellt, während eine Farbanalogie (oder der Betrag eines Unterschieds) durch einen Unterschied der Vektoren ausgedrückt wird.
  • 40 ist eine Darstellung, die eine Konfiguration eines Suchindex-Erzeugungswerkzeugs zeigt, das wie folgt arbeitet: Zuerst prüft eine automatische Suchschirm-Erzeugungseinheit S031 die Suchobjekt-Spezifikationstabelle S014, um zu verifizieren, welches Suchelement in dem Textdatenbankabschnitt S006-1 der Multi-Element-Datenbank S006 als Suchelement katalogisiert ist. Dann verweist die automatische Suchschirm-Erzeugungseinheit S031 auf die Attributdefinitionstabelle S015, um das Attribut des Suchobjektes zu verifizieren. Die Daten des Suchelements, nach dem gesucht werden soll, werden gemäß dessen Attribut analysiert, um eine Such-(Zeichenzu-Zeichen-Übergangs)indextabelle S005 zu erzeugen. Eine Zeichenzu-Zeichen-Übergangsindextabelle S005-1, S005-2 oder S005-3 kann für jedes Suchelement erzeugt werden, wie in der Figur gezeigt. Alternativ hierzu kann eine Zeichen-zu-Zeichen-Übergangs- indextabelle S005 erzeugt werden, die allen Suchelementen gemein ist.
  • 41(a) bis (c) zeigen Darstellungen von Beispielen der Zeichen-zu-Zeichen-Übergangsindextabelle S005-1, S500-2 und S500-3. Bei diesem Beispiel werden die Daten des Automobilnamens und des Automobilfarbensuchelements in Paare von zwei aufeinanderfolgenden Zeichen zerlegt oder in so genannte Zeichen-zu-Zeichen-Übergänge. Ein Zeichen-zu-Zeichen-Übergang und eine Adresse in der Multi-Element-Datenbank S006 unter der eine Zeichenkette einschließlich eines Übergangs bilden einen Eintrag für eine Zeichenzu-Zeichen-Übergangsindextabelle S005-1 und S500-2, für das Automobilnamensuchelement und das Automobilfarbensuchelement. Da die Attribute des Suchelements bezüglich des Modelljahres eine Zahl darstellen, wird eine Zeichen-zu-Zeichen-Übergangsindextabelle S005-3 für das Suchelement "Modelljahr" erzeugt, wobei deren Zahlabschnitt als ein Index verwendet wird.
  • 42 ist eine Darstellung, die eine Konfiguration eines Suchsystems zur Suche in einer Multi-Element-Datenbank einschließlich nicht-textbasierter Daten wie z. B. Bildern zeigt. Im Folgenden werden ausschließlich Unterschiede zu dem Suchsystem, das in 36 gezeigt wurde, erläutert. Im Falle des vorliegenden Ausführungsbeispiels zeigt die automatische Suchschirm-Erzeugungseinheit S031 automatisch eine Suchpalette an, selbst wenn der Nutzer oder eine Anwendung keinen Suchschirm erzeugen. Zusätzlich wird eine Mehrzahl von Zeichen-zu-Zeichen-Übergangsindextabellen für ein oben beschriebenes Suchelement bereitgestellt. Da eine Zeichen-zu-Zeichen-Übergangsindextabelle für jedes Suchelement bereitgestellt wird, ist auch die Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004 in eine Element-spezifische Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004-1 und eine allgemeine Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004-2 unterteilt. Zusätzlich ist, da die Multi-Element-Datenbank S006 in den Text-Datenbankabschnitt S006-1 und den Nichttext-Datenbankabschnitt S006-2 zur Speicherung von Nichttextdaten, wie z. B. Bildern, wie oben beschrieben, unterteilt ist, wird eine Nichttext-Datenintegrationseinheit S032 bereitgestellt, zum Zusammenfügen von Nichttextdaten, wie z. B. Bildern, des Nichttext-Datenbankabschnitts S006-2 mit Textdaten, die angezeigt werden, nachdem die Suche in dem Text-Datenbankabschnitt S006-1 abgeschlossen wurde.
  • 43 ist eine Darstellung, die ein Beispiel einer Suchschlüsselwort-Eingabepalette S041 zeigt, die durch die automatische Suchschirmerzeugungseinheit S031 erzeugt wurde. Wie in der Figur gezeigt, zeigt die Suchschlüsselwort-Eingabepalette S041 einen Schlüsselworteingaberahmen eines Suchelements der Multi-Element-Datenbank S006 an, das als ein Objekt definiert ist, nach dem gesucht werden soll, auf dem Bildschirm, als ein Eingaberahmen zur Verwendung durch den Nutzer zur Spezifizierung eines Suchelements. Zusätzlich kann ein freier Schlüsselworteingaberahmen ebenfalls angezeigt werden. Dieser freie Schlüsselworteingaberahmen wird zur Spezifizierung einer Eingabe verwendet, die nicht als Suchelement definiert ist. Im Falle einer über den freien Schlüsselworteingaberahmen eingegebenen Zeichenkette wird das eingegebene Schlüsselwort durch eine allgemeine Sucheinheit mit all den Zeichen-zu-Zeichen-Übergangsindextabellen zusammengestellt. Es wird darauf hingewiesen, dass es wünschenswert ist, eine Zeichenkette in einen Schlüsselworteingaberahmen mit einer Zeichenzahl einzugeben, die eine Datenlänge des Suchelements, das mit dem Schlüsselworteingaberahmen verknüpft ist, nicht übersteigt. Wenn das Schlüsselwort nicht in dem Rahmen des Schirms untergebracht werden kann, wird ein Scroll-Balken verwendet.
  • 44 ist eine Darstellung, die ein Beispiel einer Suchergebnisanzeigepalette S043 zeigt, die von der automatischen Suchschirm-Erzeugungseinheit S031 erzeugt wurde. Das Ergebnis einer Suche kann ein Suchelement eines Objektes beinhalten, nach dem nicht gesucht wurde, wie z. B. ein Bild. Alternativ hierzu kann ein Zeiger auf die Bilddaten angezeigt werden, als ob es sich um ein Format eines numerischen Zeichens anstelle der Bilddaten selbst handeln würde.
  • 45 ist eine Darstellung, die ein Beispiel eines Schirms zeigt, der von einem Anwendungsprogramm angezeigt wird. Der Schirm wird von der Anwendung anhand von Ergebnissen der Suche abgeleitet, die von dem Suchsystem empfangen wurden. In diesem Beispiel ist es die Anwendung, die eine Verarbeitung ausführt, an der ein Bild beteiligt ist. Sozusagen kann das Suchsystem teilweise die Führung der Verarbeitung bis zum Ende übernehmen durch ausschließliches Handhaben des Text-Bankabschnitts S006-1.
  • 46 ist eine schematische Darstellung, die einen von der allgemeinen Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004-2 ausgeführten Verarbeitungsablauf zeigt. Die Verarbeitung wird im Folgenden in Kürze erläutert. Wenn ein Schlüsselwort in den freien Schlüsselwortrahmen der Suchschlüsselworteingabepalette S041 eingegeben wird, wird ein Suchvorgang durch Verweis einer Zeichen-zu-Zeichen-Indextabelle, die allen Suchelementen gemein ist, ausgeführt, um Stücke von Daten aufzufinden, die durch das Schlüsselwort bezeichnet werden. Zusätzlich sucht die Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004-1 spezifische Elemente dann, wenn auch Schlüsselworte in den Schlüsselworteingaberahmen für spezifische Suchelemente eingegeben werden, nach Stücken von Daten, die durch die Schlüsselworte bezeichnet werden, und gibt Informationen aus, die aus einer Kombination (oder Ausführung einer ODER-Operation an) der aufgefundenen Datenstücke, die durch das in den freien Schlüsselwortrahmen und den Schlüsselworten, die in den Schlüsselworteingaberahmen für spezifische Elemente eingegeben werden, besteht. Wenn ausschließlich Schlüsselworte in den Schlüsselworteingaberahmen für spezifische Suchelemente eingegeben werden und keine Schlüsselworte in den freien Schlüsselwortrahmen eingegeben werden, sucht andererseits ausschließlich die Erkennungsergebnisoptimierungs- und Datenschlussfolgerungseinheit S004-1 nach Stücken von Daten, die durch die Schlüsselworte bezeichnet werden und gibt die Ergebnisse der Suchvorgänge aus.
  • Bei der obigen Beschreibung wurde ein Suchsystem beschrieben, das eine mehrdeutige Eingabe zur Suche in einer Multi-Element-Datenbank einschließlicht nicht-textbasierter Daten, wie z. B. Bildern toleriert, die von der Suche anhand einer Zeichenkette ausgeschlossen sind.
  • [3] Suche, die eine mehrdeutige Eingabe unter Verwendung einer Indizestabelle toleriert, die einen Zeichen-zu-Zeichen-Übergang mit einem Wort verknüpfen.
  • 47(a) bis (c) sind Darstellungen, die eine Ausgestaltung einer Suche zeigen, die eine mehrdeutige Eingabe toleriert, unter Verwendung einer Tabelle, die Indizes beinhaltet, die jeweils einen Zeichenzu-Zeichen-Übergang mit einem Wort und einem Grad an Analogie bezüglich des Index verknüpft. Wie in der Figur gezeigt ist, ist die Tabelle dadurch gekennzeichnet, dass darin katalogisierte Information jeweils indiziert ist zur Verwendung zur Verknüpfung eines Zeichen-zu-Zeichen-Übergangs mit einem Eintrag der Daten (oder ein Wort), die den Zeichen-zu-Zeichen-Übergang beinhalten, einem Analogiebewertungswert der Daten, einer Nummer der Multi-Element-Daten, die die Daten (das Wort) beinhalten, die in der Multi-Element-Datenbank katalogisiert ist, oder einer Adresse der Multi-Element-Daten in der Multi-Element-Datenbank. Auf diese Weise kann, da jeder Index einen Zeichen-zu-Zeichen-Übergang beinhaltet, eine Suche ausgeführt werden, durch in Kauf nehmen eines kleinen Fehlers wie z. B. eines Unterschiedes zwischen einer Kette japanischer Zeichen "
    Figure 00900001
    (geschrieben um eine Strickjacke zu bezeichnen)" und einer anderen Kette japanischer Zeichen "
    Figure 00900002
    (auch geschrieben um eine Strickjacke zu bezeichnen)", wie im Falle der bislang beschriebenen Ausführungsbeispiele, die eine mehrdeutige Eingabe tolerieren. Es wird darauf hingewiesen, dass Unterschiede in der japanischen Schriftweise zwischen den beiden Zeichenketten durch mehrdeutige Ergebnisse erhalten wird, bei einem Versuch, die Aussprache des englischen Worts 'cardigan' für Strickjacke in japanischen Zeichen zu schrieben. Selbstverständlich kann ein durch einen teilweisen Eingabefehler, der von dem Nutzer gemacht wurde, verursachtes Problem ebenfalls bewältigt werden. Die Tabelle ist darüber hinaus derart aufgebaut, dass jeder Index, der ein in der Multi-Element-Datenbank katalogisiertes Wort beinhaltet und durch Sortierung der Indizes gemäß der Analogie innerhalb der Worte, d. h. in aufsteigender Reihenfolge der Analogiebewertungswerte. Aus diesem Grund können die Daten, die ein Wort beinhalten, das analog zu dem während des Suchvorgangs gefundenen Wortes ist, ebenfalls leicht aufgefunden werden.
  • Bei diesem Beispiel ist "
    Figure 00910001
    (Strickjacke), Größe Nr. 9, (rot), S000 yen" in der Suchschlüsselworteingabepalette als Daten spezifiziert, nach denen gesucht werden soll. Als ein Ergebnis des Suchvorgangs ähnlich zu dem, was von dem Nutzer gewünscht wurde, werden die folgenden ersten Daten erhalten: "
    Figure 00910002
    (Strickjacke), "
    Figure 00910003
    (rot), Größe Nr. 9, 4900 yen". Als Daten analog zu den ersten Daten werden die folgenden zweiten Daten außerdem in leichter Weise erhalten: "
    Figure 00910004
    (Strickjacke), "
    Figure 00910005
    (weinrot), Größe Nr. 9, 4700 yen".
  • In ähnlicher Weise werden die folgenden dritten Daten analog zu den ersten Daten unmittelbar erhalten: "
    Figure 00910006
    (Strickjacke), "
    Figure 00910007
    (pink), Nr. 9, 5400 yen".
  • Die vorstehende Beschreibung skizzierte eine Suche, die eine mehrdeutige Eingabe unter Verwendung einer Tabelle toleriert, die Indizes beinhaltet, die einen Zeichen-zu-Zeichen-Übergang mit einem Wort verknüpft und einen Grad an Analogie bezüglich des Index aufweist.
  • Wie oben beschrieben wurde, können bei der Suche in einer Multi-Element-Datenbank Probleme, die durch einen von dem Nutzer gemachten Eingabefehler und teilweise Unzulänglichkeiten der Multi-Element-Datenbank selbst verursacht werden, gelöst werden. Außerdem kann eine Suche, die eine mehrdeutige Eingabe toleriert, ausgeführt werden, die Daten ergibt, die eine Bedeutung aufweisen, die ähnlich der der Eingabe ist.

Claims (6)

  1. Vorrichtung zum Erkennen von Zeichen mit einer Zeichenerkennungseinrichtung (a3) zum Erkennen von eingegebenen Zeichenketten und einer Anzeigeeinrichtung (a8) zum Anzeigen der erkannten Ergebnisse, wobei die Vorrichtung zum Erkennen von Zeichen umfasst: ein Wörterbuch (a6) zum Speichern von Wortidentifizierungsinformation und Hierarchieinformation zum Einordnen einer Mehrzahl von Worten in eine Hierarchie und zum Erkennen jedes dieser Worte innerhalb der Hierarchie, eine Zeichenumwandlungswahrscheinlichkeitstabelle (a4), um zumindest Wahrscheinlichkeiten von Umwandlungen eines beliebigen Zeichens in ein anderes und solche Stücke der Wortidentifizierungsinformation zu speichern, die Kombinationen von Zeichen entsprechen, die aus diesen Umwandlungen resultieren, eine Optimierungseinrichtung (a5) zur Verwendung der Zeichenumwandlungswahrscheinlichkeitstabelle (a4) bei einer Optimierung von in Frage kommenden Zeichenketten, die durch die Erkennungseinrichtung (a3) erhalten wurden, und Abfragemittel zum Suchen von Worten innerhalb des Wörterbuchs (a6), die durch solche Stücke der Wortidentifizierungsinformation definiert sind, die den optimierten in Frage kommenden Zeichenketten entsprechen, wodurch die gesuchten Worte abgefragt werden, die durch anwendbare Stücke der Hierarchieinformation identifiziert werden und die noch eingegeben werden müssen.
  2. Vorrichtung zur Erkennung von Zeichen nach Anspruch 1, wobei die Hierarchieinformation aus Wortidentifizierungsinformation bezüglich der Worte besteht, die in der Hierarchie höher sind als jedes der Worte des Wörterbuchs (a6).
  3. Vorrichtung zur Erkennung von Zeichen nach Anspruch 2, wobei die Abfrageeinrichtung abfragt, als noch einzugebende Worte, Worte, die in der Hierarchie höher angesiedelt sind als die der optimierten Zeichenketten des Wörterbuchs (a6).
  4. Vorrichtung zur Erkennung von Zeichen nach Anspruch 1, wobei die Erkennungseinrichtung (a3) aus einer Gruppe von in Frage kommenden Zeichenketten, die durch die Erkennungseinrichtung (a3) erhalten wurden, die in Frage kommende Zeichenkette auswählt, in der die Wahrscheinlichkeit von Umwandlungen von einem Zeichen in ein anderes höher ist als bei jeder anderen in Frage kommenden Zeichenkette, wodurch die optimierte in Frage kommende Zeichenkette bestimmt wird.
  5. Vorrichtung zur Erkennung von Zeichen nach Anspruch 1, wobei die Zeichenketten zur Eingabe mit der Hand geschrieben werden.
  6. Vorrichtung zur Erkennung von Zeichen nach Anspruch 1, wobei die Zeichenketten durch Sprache eingegeben werden.
DE69724910T 1996-05-21 1997-05-20 Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung Expired - Fee Related DE69724910T2 (de)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP12536096 1996-05-21
JP12536096A JP3275704B2 (ja) 1996-05-21 1996-05-21 入力文字列推測認識装置
JP22480896 1996-08-27
JP22480896A JPH1063750A (ja) 1996-08-27 1996-08-27 医療検索装置
JP26193696 1996-10-02
JP26193696A JP3205516B2 (ja) 1996-10-02 1996-10-02 検索システム

Publications (2)

Publication Number Publication Date
DE69724910D1 DE69724910D1 (de) 2003-10-23
DE69724910T2 true DE69724910T2 (de) 2004-07-15

Family

ID=27315109

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69724910T Expired - Fee Related DE69724910T2 (de) 1996-05-21 1997-05-20 Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung

Country Status (6)

Country Link
US (2) US6097841A (de)
EP (1) EP0841630B1 (de)
KR (1) KR100475266B1 (de)
CN (1) CN1143240C (de)
DE (1) DE69724910T2 (de)
TW (2) TW421764B (de)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318573B1 (ko) * 1996-10-16 2001-12-28 마찌다 가쯔히꼬 문자 입력 장치 및 문자 입력 프로그램을 기억한 기록 매체
US6572660B1 (en) * 1998-08-20 2003-06-03 Russell I. Okamoto Method and system for creating hyperlinks and hyperlinked documents from the direct manipulation of information (“Drag and link” operation)
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7712053B2 (en) * 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
JP3599180B2 (ja) * 1998-12-15 2004-12-08 松下電器産業株式会社 検索方法、検索装置および記録媒体
JP3958902B2 (ja) * 1999-03-03 2007-08-15 富士通株式会社 文字列入力装置及び方法
ES2202070T3 (es) 1999-03-18 2004-04-01 602531 British Columbia Ltd. Entrada de datos para dispositivos informaticos personales.
US7293231B1 (en) * 1999-03-18 2007-11-06 British Columbia Ltd. Data entry for personal computing devices
JP4280355B2 (ja) * 1999-05-06 2009-06-17 富士通株式会社 文字認識装置
US7143350B2 (en) * 1999-06-30 2006-11-28 Microsoft Corporation Method and system for character sequence checking according to a selected language
JP3480404B2 (ja) * 1999-12-22 2003-12-22 日本電気株式会社 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
MXPA02007011A (es) * 2000-01-17 2003-09-25 Min-Kyum Kim Aparato y metodo para introducir caracteres del alfabeto sobre teclado.
US6847734B2 (en) * 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program
US6944344B2 (en) * 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
US7024042B2 (en) * 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
CA2323856A1 (en) * 2000-10-18 2002-04-18 602531 British Columbia Ltd. Method, system and media for entering data in a personal computing device
GB0115830D0 (en) * 2001-06-28 2001-08-22 Coredata Ltd Data management
JP3907161B2 (ja) * 2001-06-29 2007-04-18 インターナショナル・ビジネス・マシーンズ・コーポレーション キーワード検索方法、キーワード検索端末、コンピュータプログラム
US7158678B2 (en) * 2001-07-19 2007-01-02 Motorola, Inc. Text input method for personal digital assistants and the like
JP3997459B2 (ja) * 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
AUPR824601A0 (en) 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and system (npw004)
US20030138144A1 (en) * 2001-12-18 2003-07-24 Stefan Lynggaard Address matching
US7130470B1 (en) * 2002-03-15 2006-10-31 Oracle International Corporation System and method of context-based sorting of character strings for use in data base applications
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
JP4145603B2 (ja) 2002-08-05 2008-09-03 富士通株式会社 文字列入力装置及び方法
US7490296B2 (en) * 2003-01-31 2009-02-10 Microsoft Corporation Utility object for specialized data entry
AU2003900865A0 (en) 2003-02-26 2003-03-13 Silverbrook Research Pty Ltd Methods, systems and apparatus (NPW010)
CN1303564C (zh) * 2003-06-12 2007-03-07 摩托罗拉公司 改进的电子设备中字符输入的识别方法
US7567239B2 (en) * 2003-06-26 2009-07-28 Motorola, Inc. Method and system for message and note composition on small screen devices
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
US7464331B2 (en) * 2003-08-18 2008-12-09 Microsoft Corporation System and method for validating hierarchically-organized messages
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US8552984B2 (en) * 2005-01-13 2013-10-08 602531 British Columbia Ltd. Method, system, apparatus and computer-readable media for directing input associated with keyboard-type device
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US20060271552A1 (en) * 2005-05-26 2006-11-30 Venture Capital & Consulting Group, Llc. Targeted delivery of content
DE102005031656A1 (de) * 2005-07-06 2007-01-11 Siemens Ag Verfahren zur Auswahl einer Bezeichung
EP2028598A4 (de) * 2006-05-26 2011-06-15 Nec Corp Einrichtung, verfahren und programm zur klassifikation von informationen
JP4893167B2 (ja) * 2006-08-30 2012-03-07 富士通株式会社 認証方法
WO2008104621A1 (es) * 2007-02-28 2008-09-04 Classe Qsl, S.L. Sistema para la recuperación de unidades de información
CA2581824A1 (en) * 2007-03-14 2008-09-14 602531 British Columbia Ltd. System, apparatus and method for data entry using multi-function keys
US7650445B2 (en) * 2007-09-12 2010-01-19 Motorola, Inc. System and method for enabling a mobile device as a portable character input peripheral device
JP2009157482A (ja) * 2007-12-25 2009-07-16 Kyocera Corp 文書編集装置及び文書編集方法
TWI374391B (en) 2008-05-27 2012-10-11 Ind Tech Res Inst Method for recognizing writing motion and trajectory and apparatus for writing and recognizing system
US8645417B2 (en) * 2008-06-18 2014-02-04 Microsoft Corporation Name search using a ranking function
CN101398902B (zh) * 2008-09-27 2012-07-04 宁波新然电子信息科技发展有限公司 一种自然手写阿拉伯字母联机识别方法
US20100153405A1 (en) * 2008-10-14 2010-06-17 Johnson Brian M Systems and methods to search a data source based on a compatability via a specification
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
JP4735726B2 (ja) * 2009-02-18 2011-07-27 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20110060985A1 (en) * 2009-09-08 2011-03-10 ABJK Newco, Inc. System and Method for Collecting a Signature Using a Smart Device
KR101301534B1 (ko) * 2009-12-14 2013-09-04 한국전자통신연구원 이형태 자동 구축 방법 및 장치
US8463731B2 (en) * 2010-02-17 2013-06-11 Google Inc. Translating user interaction with a touch screen into text
CN101894160B (zh) * 2010-07-21 2012-02-08 同方知网(北京)技术有限公司 一种智能检索方法
JP5699570B2 (ja) * 2010-11-30 2015-04-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5807342B2 (ja) * 2011-02-21 2015-11-10 富士ゼロックス株式会社 文字認識装置及びプログラム
US9594539B1 (en) * 2011-02-23 2017-03-14 Amazon Technologies, Inc. Using applications of items in item searches
CN102354350A (zh) * 2011-11-03 2012-02-15 厦门市智业软件工程有限公司 实现快速录入电子病历信息的方法
CN103164388B (zh) * 2011-12-09 2016-07-06 北大方正集团有限公司 一种版式文件中结构化信息获取的方法及装置
KR101222486B1 (ko) 2012-04-13 2013-01-16 주식회사 페타바이 비결정적 유한 오토마타의 비결정성을 선택적으로 제거하기 위한 방법, 서버, 단말 장치 및 컴퓨터 판독 가능한 기록 매체
JP5832980B2 (ja) * 2012-09-25 2015-12-16 株式会社東芝 手書き入力支援装置、方法およびプログラム
US9015195B1 (en) 2013-01-25 2015-04-21 Google Inc. Processing multi-geo intent keywords
US10228819B2 (en) 2013-02-04 2019-03-12 602531 British Cilumbia Ltd. Method, system, and apparatus for executing an action related to user selection
DE112013006764T5 (de) * 2013-03-04 2015-11-19 Mitsubishi Electric Corporation Suchvorrichtung
KR102073102B1 (ko) * 2013-03-21 2020-02-04 삼성전자 주식회사 언어인식을 위한 언어모델 db, 언어인식장치와 언어인식방법, 및 언어인식시스템
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
WO2016074212A1 (en) * 2014-11-14 2016-05-19 Volkswagen China Investment Co., Ltd. Control method and control apparatus for navigation system
CN104571821B (zh) * 2014-12-30 2018-09-04 北京奇虎科技有限公司 一种长句定位方法和装置
CN105468743B (zh) * 2015-11-25 2018-12-28 钟岑 一种智能诊断手术编码检索方法
JP6526608B2 (ja) * 2016-09-06 2019-06-05 株式会社東芝 辞書更新装置およびプログラム
CN106408798A (zh) * 2016-09-22 2017-02-15 上海寰果信息科技有限公司 Pos 机打印方法及打印系统
CN106528605A (zh) * 2016-09-27 2017-03-22 武汉工程大学 一种基于规则的中文地址解析方法
CN107247724B (zh) * 2017-04-27 2018-07-20 腾讯科技(深圳)有限公司 转移概率矩阵更新、信息识别方法及装置、计算机设备
JP2019139592A (ja) * 2018-02-13 2019-08-22 シャープ株式会社 文字認識装置、文字認識方法
CN113590895B (zh) * 2021-07-28 2023-04-25 西华大学 一种字符串检索方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4654875A (en) * 1983-05-23 1987-03-31 The Research Foundation Of State University Of New York System to achieve automatic recognition of linguistic strings
US5067165A (en) * 1989-04-19 1991-11-19 Ricoh Company, Ltd. Character recognition method
JPH02308384A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 住所認識装置
US5020019A (en) * 1989-05-29 1991-05-28 Ricoh Company, Ltd. Document retrieval system
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
US5377281A (en) * 1992-03-18 1994-12-27 At&T Corp. Knowledge-based character recognition
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JPH0793467A (ja) * 1993-09-22 1995-04-07 Toshiba Corp 住所読取システム
US5826260A (en) * 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
US5909510A (en) * 1997-05-19 1999-06-01 Xerox Corporation Method and apparatus for document classification from degraded images

Also Published As

Publication number Publication date
CN1173684A (zh) 1998-02-18
EP0841630B1 (de) 2003-09-17
US6751605B2 (en) 2004-06-15
TW490643B (en) 2002-06-11
US6097841A (en) 2000-08-01
DE69724910D1 (de) 2003-10-23
KR970076347A (ko) 1997-12-12
EP0841630A3 (de) 1999-09-01
US20010028742A1 (en) 2001-10-11
CN1143240C (zh) 2004-03-24
EP0841630A2 (de) 1998-05-13
TW421764B (en) 2001-02-11
KR100475266B1 (ko) 2005-07-11

Similar Documents

Publication Publication Date Title
DE69724910T2 (de) Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung
DE60213409T2 (de) Erstellung von strukturierten daten aus unformatiertem text
DE19952769B4 (de) Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache
DE112020002600T5 (de) Entdecken einer semantischen bedeutung von datenfeldern anhand von profildaten der datenfelder
EP3100174A1 (de) Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text
US20090259670A1 (en) Apparatus and Method for Conditioning Semi-Structured Text for use as a Structured Data Source
WO2003021480A1 (en) Database management system
DE69934195T2 (de) Identifikation einer Wortgruppe durch modifizierte Schlüsselwörter, die aus Transformationen von aufeinanderfolgenden Suffixen erzeugt sind
DE102006040208A1 (de) Patentbezogenes Suchverfahren und -system
EP1783633A1 (de) Suchmaschine für eine ortsbezogene suche
DE112020001874T5 (de) Datenextraktionssystem
Hearst et al. Toward interface defaults for vague modifiers in natural language interfaces for visual analysis
DE69933123T2 (de) Zugriff auf eine semi-strukturierte datenbank
DE60310881T2 (de) Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing
Koppers et al. tosca: Tools for statistical content analysis
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
Heidorn Image retrieval as linguistic and nonlinguistic visual model matching
Antelman et al. Toward a twenty-first century catalog
DE102019108857A1 (de) Automatisiertes maschinelles Lernen auf Basis gespeicherten Daten
EP1064606B1 (de) Datenverarbeitungssystem und verfahren zum automatischen erstellen von inhaltsangaben von textdokumenten
DE112021001743T5 (de) Vektoreinbettungsmodelle für relationale tabellen mit null- oder äquivalenten werten
Anstein Computational approaches to the comparison of regional variety corpora: prototyping a semi-automatic system for German
Campolo et al. From rules to examples: Machine learning's type of authority
WO2012025439A1 (de) Verfahren zum suchen in einer vielzahl von datensätzen und suchmaschine
Swift A Case Study in Indexing and Classification in the Sociology of Education. Development of Ideas Concerning the Organisation of Material for Literature Searching. Report for the Period September 1970-June 1973. Volume One.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee