Suche Bilder Maps Play YouTube News Gmail Drive Mehr »
Anmelden
Nutzer von Screenreadern: Klicke auf diesen Link, um die Bedienungshilfen zu aktivieren. Dieser Modus bietet die gleichen Grundfunktionen, funktioniert aber besser mit deinem Reader.

Patentsuche

  1. Erweiterte Patentsuche
VeröffentlichungsnummerDE602004003361 T2
PublikationstypErteilung
AnmeldenummerDE200460003361
PCT-NummerPCT/EP2004/050409
Veröffentlichungsdatum4. Okt. 2007
Eingetragen1. Apr. 2004
Prioritätsdatum29. Apr. 2003
Auch veröffentlicht unterCN1781100A, CN100405366C, DE602004003361D1, EP1618496A2, EP1618496B1, US7523095, US8037061, US20040220902, US20090125491, WO2004097671A2, WO2004097671A3
Veröffentlichungsnummer0460003361, 200460003361, DE 2004/60003361 T2, DE 602004003361 T2, DE 602004003361T2, DE-T2-602004003361, DE0460003361, DE2004/60003361T2, DE200460003361, DE602004003361 T2, DE602004003361T2, PCT/2004/50409, PCT/EP/2004/050409, PCT/EP/2004/50409, PCT/EP/4/050409, PCT/EP/4/50409, PCT/EP2004/050409, PCT/EP2004/50409, PCT/EP2004050409, PCT/EP200450409, PCT/EP4/050409, PCT/EP4/50409, PCT/EP4050409, PCT/EP450409
ErfinderStephen Redding GATES, Alexander Mount Kisco HOLT, Michael Ridgewood MORAN, Pat Westfield VELDERMAN
AntragstellerInternational Business Machines Corp.
Zitat exportierenBiBTeX, EndNote, RefMan
Externe Links: DPMA, Espacenet
System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
DE 602004003361 T2
Zusammenfassung  auf verfügbar
Ansprüche(17)
  1. Verfahren zum Erzeugen eines Satzes von Kategorien als Reaktion auf eine Suchabfrage, wobei das Verfahren Folgendes umfasst: Erzeugen (14) einer Gruppe von Suchergebnissen als Reaktion auf eine Abfrage; Ermitteln (16) einer Hierarchie von Kategorien, nach der diese Gruppe von Suchergebnissen kategorisiert ist; und wobei das Verfahren Folgendes umfasst: Zuweisen (20) einer Rangstufe zu jeder ermittelten Kategorie, basierend auf einer Anzahl von Suchergebnissen, die in jede ermittelte Kategorie kategorisiert sind; Auswählen (18) eines anfänglichen Satzes von Verfeinerungskategorien aus den ermittelten Kategorien, basierend auf der Rangordnung; Entfernen aller Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und Anzeigen (32) eines resultierenden Satzes von Verfeinerungskategorien auf einer Oberfläche (38), um einem Endbenutzer zu ermöglichen, aus dem resultierenden Satz von Verfeinerungskategorien eine Kategorie auszuwählen und so die Gruppe der Suchergebnisse auf diejenigen Suchergebnisse einzuengen, die zu der ausgewählten Kategorie gehören.
  2. Verfahren nach Anspruch 1, bei dem der Ermittlungsschritt den Schritt der Prüfung von Metadaten in jedem Suchergebnis beinhaltet, um für jedes der Suchergebnisse mindestens eine Kategorie zu ermitteln.
  3. Verfahren nach Anspruch 1, bei dem der anfängliche Satz von Verfeinerungskategorien kleiner als die Gesamtzahl der im Ermittlungsschritt ermittelten Kategorien ist.
  4. Verfahren nach Anspruch 1, bei dem der anfängliche Satz von Verfeinerungskategorien eine vorgegebene Anzahl der am häufigsten ermittelten Kategorien umfasst.
  5. Verfahren nach Anspruch 1, bei dem nach dem Entfernungsschritt für jede während des Entfernungsschrittes entfernte Kategorie dem resultierenden Satz von Verfeinerungskategorien eine neue Kategorie hinzugefügt wird, die sich nicht in dem anfänglichen Satz von Verfeinerungskategorien befand.
  6. Verfahren nach Anspruch 5, bei dem die neue Kategorie eine Kategorie mit der nächsthöchsten Rangstufe ist.
  7. Verfahren nach Anspruch 1, bei dem der Entfernungsschritt für den resultierenden Satz von Verfeinerungskategorien so lange wiederholt wird, bis sich in dem resultierenden Satz von Verfeinerungskategorien keine Kategorien mehr befinden, für die es hierarchische Vorgänger gibt.
  8. Verfahren nach Anspruch 1, bei dem der resultierende Satz von Verfeinerungskategorien eine Zusatzkategorie beinhaltet, die den Zugriff auf ermittelte Kategorien ermöglicht, die sich nicht in dem resultierenden Satz von Verfeinerungskategorien befinden.
  9. Verfahren nach Anspruch 1, bei dem die Ermittlungsschritte den Schritt der Verwendung eines automatisierten Kategorisierungssystems zum Ermitteln der Kategorie beinhalten, zu welcher das Dokument gehört.
  10. System (10) zum Bereitstellen eines Satzes von Verfeinerungskategorien für eine Gruppe von Suchergebnissen, die als Reaktion auf eine Suchabfrage erzeugt wurden, wobei das System Folgendes umfasst: ein Kategorieermittlungssystem (16), das jedes Suchergebnis analysiert und eine Hierarchie von Kategorien ermittelt, nach welcher die Gruppe von Suchergebnissen kategorisiert ist, um so die Liste der ermittelten Kategorien (17) zu liefern; und wobei das System Folgendes umfasst: ein Rangordnungssystem (20), das jeder Kategorie in der Liste der ermittelten Kategorien eine Rangstufe zuweist; und ein Auswahlsystem (18), das aus der Liste der ermittelten Kategorien eine vorgegebene Anzahl von Kategorien mit der höchsten Rangstufe auswählt, um einen anfänglichen Satz von Verfeinerungskategorien zu erzeugen, wobei das Auswahlsystem alle Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien entfernt, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und eine Oberfläche (38), die einem Endbenutzer ermöglicht, aus dem Satz von Verfeinerungskategorien eine Kategorie auszuwählen, um die Gruppe von Suchergebnissen auf diejenigen Suchergebnisse weiter einzuengen, die zu der ausgewählten Kategorie gehören.
  11. System nach Anspruch 10, bei dem das Kategorieermittlungssystem Metadaten von jedem Suchergebnis analysiert, um für das Suchergebnis die mindestens eine Kategorie zu ermitteln.
  12. System nach Anspruch 10, bei dem die vom Auswahlsystem verwendete vorgegebene Anzahl der Kategorien mit der höchsten Rangstufe kleiner als die Gesamtzahl der ermittelten Kategorien ist.
  13. System nach Anspruch 10, bei dem das Auswahlsystem für jede durch das Auswahlsystem entfernte Kategorie dem Satz von Verfeinerungskategorien eine Kategorie mit der nächsthöchsten Rangstufe hinzufügt.
  14. System nach Anspruch 10, bei dem der Satz von Verfeinerungskategorien ferner eine Zusatzkategorie beinhaltet, die den Zugriff auf ermittelte Kategorien ermöglicht, die nicht in dem Satz von Verfeinerungskategorien enthalten sind.
  15. System nach Anspruch 10, bei dem das Rangordnungssystem für alle Suchergebnisse jeder Kategorie eine Rangstufe zuweist, die darauf basiert, wie oft die Kategorie durch das Kategorieermittlungssystem ermittelt wurde.
  16. Datenverarbeitungsprogramm zum Ausführen in einem Datenverarbeitungssystem, wobei das Datenverarbeitungsprogramm Softwarecodeabschnitte zum Ausführen eines Verfahrens nach einem der vorhergehenden Ansprüche 1 bis 9 umfasst, wenn das Programm auf dem Computer ausgeführt wird.
  17. Computerprogrammprodukt, das auf einem vom Computer verwendbaren Medium gespeichert ist, wobei das Computerprogrammprodukt computerlesbare Programmmittel umfasst, um einen Computer zum Ausführen eines Verfahrens nach einem der vorhergehenden Ansprüche 1 bis 9 zu veranlassen, wenn das Programm auf dem Computer ausgeführt wird.
Beschreibung
  • HINTERGRUND DER ERFINDUNG
  • 1. Technisches Gebiet
  • [0001]
    Die vorliegende Erfindung betrifft allgemein das Kategorisieren von Suchergebnissen und insbesondere ein System und ein Verfahren zur Erzeugung von Verfeinerungskategorien für eine Gruppe von Suchergebnissen.
  • 2. Zugrunde liegende Technik
  • [0002]
    Mit dem explosionsartigen Wachstum verteilter Netze wie des Internets und des World Wide Webs ist die Möglichkeit einer effektiven Suche nach elektronischen Informationen immer wichtiger geworden. Die meisten webbasierten Suchmaschinen wie zum Beispiel GOOGLE® ermöglichen einem Benutzer für die Suche nach relevanten Dokumenten die Eingabe einer Abfrage, die aus Schlüsselwörtern besteht. Leider liefert eine typische Suche mit Schlüsselwörtern als Ergebnis oft eine Gruppe mit zig- oder hunderttausenden von „Treffern", d. h. Links zu Webseiten, welche die Schlüsselwörter enthalten. Obwohl die meisten Suchmaschinen versuchen, die relevantesten Dokumente an vorderer Stelle anzuzeigen, ist nicht garantiert, dass der von der Suchmaschine verwendete Algorithmus die für den Benutzer relevantesten Ergebnisse findet.
  • [0003]
    Ein Ansatz zur Lösung dieses Problems wird in der US-Patentschrift 6,363,377 beschrieben. In diesem Dokument wird ein mit einer Suchmaschine für ein Informationsmanagementsystem zu verwendendes Tool beschrieben, das Verfahren zur Verfeinerung, Filterung und Verwaltung von Suchabfragen und Suchergebnissen beinhaltet. Das Tool nutzt einen dynamischen Filter, der einen dynamischen Satz von Datensatz-Token verwendet, um die Ergebnisse einer beliebigen Suchabfrage einzuschränken und so Datensätze selektiv einzuschließen oder auszuschließen, die dem Satz von Datensatz-Token entsprechen. Das Tool beinhaltet auch einen Ergebnisorganizer, der den Benutzer beim Verstehen und Veranschaulichen einer großen Anzahl passender, als Reaktion auf eine Suchabfrage zurückgegebener Dokumente unterstützt, indem er bei der Suche gefundene ähnliche Objekte gruppiert.
  • [0004]
    Ein anderer Ansatz zur Lösung des Problems besteht darin, einen Mechanismus zu schaffen, der dem Benutzer eine weitere Einengung der erhaltenen Ergebnisse erlaubt. Zum Beispiel werden in der US-Patentschrift 5,924,090 mit dem Titel „Method and Apparatus for Searching a Database of Records", am 13. Juli 1999 erteilt an Krellenstein, Suchergebnisse nach verschiedenen Metadatenattributen in einen überschaubaren Satz (z. B. acht bis zehn) hierarchischer Kategorien gegliedert. Der Benutzer kann dann die Suchergebnisse durch Auswählen einer Kategorie filtern. Die Methodik der oben genannten Patentschrift zur Erzeugung von Kategorien für den Endbenutzer weist leider bestimmte Einschränkungen auf. Insbesondere werden die Kategorien mittels eines gewichteten Auswertungsalgorithmus ausgewählt, der oft bewirkt, dass eine Kindkategorie (oder Enkelkategorie) neben ihrer Elternkategorie angezeigt wird. Zum Beispiel kann bei einer Suche nach dem Begriff „disk drive" (Plattenlaufwerk) die Elternkategorie „Hardware" zusammen mit der Kindkategorie „Personal Computer" und der Enkelkategorie „PC Peripherals" (PC-Peripherieeinheiten) angezeigt werden. Ein derartiges Ergebnis hilft dem Benutzer möglicherweise nicht bei der Einengung der Suchergebnisse, da er immer noch mehrere Kategorien durchsuchen muss, um die besten Ergebnisse zu finden.
  • [0005]
    Demzufolge besteht ein Bedarf an einem System und einem Verfahren zur wirksameren Erzeugung von Verfeinerungskategorien als Reaktion auf Abfragen, die an eine Suchmaschine gerichtet werden.
  • ÜBERBLICK ÜBER DIE ERFINDUNG
  • [0006]
    Die vorliegende Erfindung löst die oben erwähnten sowie weitere Probleme, indem sie ein System und ein Verfahren zur Erzeugung von „Verfeinerungs"-Kategorien für eine Gruppe von Suchergebnissen in einer Ergebnisgruppe bereitstellt. Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zur Erzeugung eines Satzes von Verfeinerungskategorien als Reaktion auf eine Suchabfrage bereit, wobei das Verfahren Folgendes umfasst: Erzeugen einer Gruppe von Suchergebnissen als Reaktion auf eine Abfrage; Ermitteln einer Hierarchie von Kategorien, nach der diese Gruppe von Suchergebnissen kategorisiert ist; Zuweisen einer Rangstufe zu jeder ermittelten Kategorie, basierend auf einer Anzahl von Suchergebnissen, die in jede ermittelte Kategorie kategorisiert sind; Auswählen eines anfänglichen Satzes von Verfeinerungskategorien aus den ermittelten Kategorien, basierend auf der Rangordnung; Entfernen aller Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und Anzeigen eines resultierenden Satzes von Verfeinerungskategorien auf einer Oberfläche, um einem Endbenutzer zu ermöglichen, aus dem resultierenden Satz von Verfeinerungskategorien eine Kategorie auszuwählen und so die Gruppe der Suchergebnisse auf diejenigen Suchergebnisse einzuengen, die zu der ausgewählten Kategorie gehören.
  • [0007]
    Gemäß einem zweiten Aspekt schafft die Erfindung ein System zum Bereitstellen eines Satzes von Verfeinerungskategorien für eine Gruppe von Suchergebnissen, die als Reaktion auf eine Suchabfrage erzeugt wurden, wobei das System Folgendes umfasst: ein Kategorieermittlungssystem, das jedes Suchergebnis analysiert und eine Hierarchie von Kategorien ermittelt, nach welcher die Gruppe von Suchergebnissen kategorisiert ist, um so die Liste der ermittelten Kategorien zu liefern; ein Rangordnungssystem, das jeder Kategorie in der Liste der ermittelten Kategorien eine Rangstufe zuweist; und ein Auswahlsystem, das aus der Liste der ermittelten Kategorien eine vorgegebene Anzahl von Kategorien mit der höchsten Rangstufe auswählt, um einen anfänglichen Satz von Verfeinerungskategorien zu erzeugen, wobei das Auswahlsystem alle Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien entfernt, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und eine Oberfläche, die einem Endbenutzer ermöglicht, aus dem Satz von Verfeinerungskategorien eine Kategorie auszuwählen, um eine Gruppe von Suchergebnissen auf diejenigen Suchergebnisse weiter einzuengen, die zu der ausgewählten Kategorie gehören.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • [0008]
    Diese sowie weitere Merkmale dieser Erfindung werden aus der folgenden detaillierten Beschreibung der verschiedenen Aspekte der Erfindung in Verbindung mit den beiliegenden Zeichnungen leichter verständlich, wobei:
  • [0009]
    1 ein Suchverfeinerungssystem gemäß der vorliegenden Erfindung zeigt;
  • [0010]
    2 einen beispielhaften Screenshot einer Gruppe von Suchergebnissen und eines Satzes von Verfeinerungskategorien gemäß der vorliegenden Erfindung zeigt.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • [0011]
    1 stellt ein Suchverfeinerungssystem 10 dar, das eine Suchabfrage 30 annimmt und eine Suchausgabe 32 liefert, welche aus einer Ergebnisgruppe 34 (d. h. einer Liste von gefundenen Dokumenten) und einem Satz von Verfeinerungskategorien 36 besteht. Wenn der Benutzer den Umfang der Suche einengen muss, kann dem Suchverfeinerungssystem 10 eine Verfeinerungskategorieauswahl 38 angeboten werden, um die ursprüngliche Abfrage 30 zu verfeinern.
  • [0012]
    2 zeigt einen beispielhaften Screenshot einer Oberfläche 40, der diese Merkmale darstellt. Die Oberfläche 40 zeigt, dass die eingegebene Abfrage „disk drives" 46 eine Liste von Suchergebnissen 42 zum Thema Plattenlaufwerke und einen Satz von Verfeinerungskategorien in einem Dialogfeld mit Dropdown-Liste 44 liefert. Die Suchmaschine 12 findet für diese spezielle Abfrage 113.453 Dokumente. Der Endbenutzer kann eine der Verfeinerungskategorien, z. B. „Notebooks", auswählen, um die Abfrage weiter einzuengen und dadurch die Anzahl der gefundenen Dokumente zu verringern. Wenn ein Endbenutzer eine Verfeinerungskategorie auswählt, bewirkt das Verfeinerungsanalysesystem 24 (1), dass die ursprüngliche Ergebnisgruppe 34 gefiltert wird, damit diese nur noch Dokumente beinhaltet, die zu der ausgewählten Kategorie (z. B. „Notebooks") gehören. Mechanismen zum Ausführen einer solchen Filteroperation sind in der Technik bekannt und werden deshalb nicht weiter erörtert.
  • [0013]
    Die vorliegende Erfindung löst wie oben erwähnt das Problem der Bereitstellung effektiver Verfeinerungskategorien 36, die für den Endbenutzer von höchstem Wert sind. Das Suchverfeinerungssystem 10 von 1 zeigt eine beispielhafte Ausführungsart zum Erzielen solcher Ergebnisse, wenn die Abfrage 30 in die Suchmaschine 12 eingegeben wird. Die Suchmaschine 12 kann ein beliebiges Datensuchsystem umfassen, das in der Lage ist, anhand einiger eingegebener Kriterien Ergebnisse 14 zu ermitteln. Die Suchmaschine 12 kann lokal in ein Suchverfeinerungssystem 10 integriert sein oder als eine Remote-Anwendung wie beispielsweise GOOGLE genutzt werden, auf die über das Web zugegriffen werden kann. Die Ergebnisse 14 können üblicherweise eine Liste von Dokumenten und deren Standort oder deren Adresse in einem Netzwerk umfassen. Die Ergebnisse 14 können elektronische Informationen in beliebiger Form umfassen, einschließlich Webseiten oder andere Markup-Language-Dokumente, Datenbankeinträge, Dateien, Dokumente oder jede andere Art elektronisch gespeicherter Datensätze usw.
  • [0014]
    Jedes der Ergebnisse 14 kann einige zusätzliche Informationen enthalten, z. B. Metadaten zur weiteren Beschreibung des Ergebnisses. Zum Beispiel können die Metadaten zur Beschreibung der Thematik, der geografischen Zuordnung, des Industriezweigs usw. eines gefundenen Dokuments genutzt werden. Darüber hinaus können die Metadaten nach hierarchischen Taxonomien gegliedert werden, zum Beispiel:
    Weltall/Milchstraße/Sonnensystem/Erde/Nordamerika/Vereinigte Staaten/New York/NYC.
  • [0015]
    Bei der in 1 dargestellten beispielhaften Ausführungsart prüft das Kategorieermittlungssystem 16 die in jedem Ergebnis 14 enthaltenen Metadaten und ermittelt für jedes der Ergebnisse 14 eine oder mehrere entsprechende hierarchische Kategorien oder weist diese dem Ergebnis zu. Im obigen Beispiel würde die ermittelte Kategorie NYC lauten, da diese als der detaillierteste Knoten der Hierarchie angegeben ist. Hierzu ist zu bemerken, dass der Anzahl und/oder der Größe der Hierarchien, die in den Metadaten dargestellt werden können, keine Grenzen gesetzt sind. Zum Beispiel können manche Hierarchien nur einen einzigen, andere hingegen viele hunderte oder tausende Knoten aufweisen. Außerdem können manche Knoten mehreren Hierarchien angehören.
  • [0016]
    Eine alternative Ausführungsart, bei der zum Beispiel keine Metadaten bereitgestellt werden, könnte durch Verwendung anderer Mittel als der Metadaten für jedes Ergebnis hierarchische Kategorien ermitteln. Zum Beispiel könnte das Kategorieermittlungssystem 16 Kategorien ausgehend von einer Analyse anderer Daten in einem Dokument, z. B. der Schlagwörter oder der Häufigkeit von Schlüsselwörtern, zuordnen. Eine beispielhafte Implementierung eines automatisierten Kategorisierungssystems wird in der US-Patentschrift 6,360,227 mit dem Titel „System and Method for Generating Taxonomies With Applications to Content-Based Recommendations", am 19. März 2002 an Aggrawal et al. erteilt, dargelegt, die durch die Bezugnahme Bestandteil dieses Patents ist. Jedem Ergebnis 14 wird ungeachtet der Art der Ermittlung der Kategorien mindestens eine entsprechende hierarchische Kategorie zugeordnet.
  • [0017]
    Nachdem alle Ergebnisse 14 verarbeitet worden sind, gibt das Kategorieermittlungssystem 16 eine Liste ermittelter Kategorien 17 aus (d. h. aller ermittelter Kategorien für alle Ergebnisse 14). Die Anzahl der möglichen Kategorien in der Kategorieliste 17 ist praktisch unbegrenzt und kann zum Beispiel von einer bis zu vielen Tausend Kategorien reichen. Da die Liste derart umfangreich sein kann, muss sie normalerweise auf eine überschaubare Anzahl gekürzt werden, die dem Benutzer vernünftig angezeigt werden kann. Das Auswahlsystem 18 stellt diese Funktion zur Verfügung, indem es die Liste der ermittelten Kategorien 17 analysiert und einen geeigneten Satz von Verfeinerungskategorien 36 auswählt. Zu diesem Zweck beinhaltet das Auswahlsystem 18 ein Rangordnungssystem 20 und ein Kategorieprüfsystem 22, mit deren Hilfe aus der Liste der Kategorien 17 die passendsten Verfeinerungskategorien ermittelt werden können.
  • [0018]
    Das Rangordnungssystem 20 weist jeder Kategorie in der Kategorieliste 17 eine Rangstufe zu. Bei einer Ausführungsart werden die Rangstufen den Kategorien basierend auf der Häufigkeit zugewiesen, d. h. wie oft das Kategorieermittlungssystem 16 ermittelt hat, dass eine Kategorie zu den Suchergebnissen 14 gehört. Mit anderen Worten, das Rangordnungssystem 20 prüft jede Kategorie und bestimmt, wie viele Suchergebnisse 14 zu jeder Kategorie gehören. Dann wird jeder Kategorie, bei der höchsten Rangstufe beginnend und bei der niedrigsten Rangstufe endend, eine Rangstufe zugewiesen (d. h. „nach Rangstufen geordnet"). Es können auch andere Rangordnungen verwendet werden, wie zum Beispiel entsprechend dem Grad der Übereinstimmung mit einem benutzerspezifischen Interessenprofil oder der Position innerhalb einer vorgegebenen Themenontologie.
  • [0019]
    Als hypothetisches Beispiel wird angenommen, die Suchmaschine 12 hat 100.000 Suchergebnisse geliefert und das Kategorieermittlungssystem 16 hat für die 100.000 Ergebnisse eine Liste mit 200 Kategorien ermittelt. Da das Anzeigen der 200 Kategorien für den Endbenutzer zur Einengung der Suche ein unpraktisches Mittel wäre, muss aus den 200 Kategorien eine begrenzte Anzahl anzuzeigender Kategorien ausgewählt werden. Angenommen, die Rangstufen wurden den 200 Kategorien wie folgt zugewiesen, wobei die Kategorie „NYC" die höchste Rangstufe bekommt, da sie für 25,000 der 100,000 Suchergebnisse ermittelt wurde:
  • [0020]
    Aus dieser Rangordnung würde das Auswahlsystem 18 einen anfänglichen Satz von N Kategorien mit der höchsten Rangstufe auswählen, wobei N eine beliebige Zahl von Verfeinerungskategorien ist, die sich zum Anzeigen eignet. Wenn N zum Beispiel gleich 6 ist, würde somit der anfängliche Satz von Kategorien die Begriffe NYC, New York, Unterhaltung, Architektur, Banken und Museen einschließen. Bei einer einfachen Ausführungsart könnten diese Ergebnisse als resultierender Satz von Verfeinerungskategorien 36 angezeigt werden. Die vorliegende Erfindung stellt jedoch ein Kategorieprüfsystem 22 zur weiteren Verbesserung der Ergebnisse durch Prüfung der hierarchischen Beziehungen zwischen den Kategorien bereit.
  • [0021]
    Das Kategorieprüfsystem 22 entfernt insbesondere, sobald der anfängliche Satz von Kategorien ermittelt worden ist, alle Kategorien aus dem anfänglichen Satz, die im anfänglichen Satz eine hierarchische Eltern- oder Vorgängerkategorie haben. Das heißt, die Hierarchie jeder Kategorie wird „schrittweise von unten nach oben durchgeprüft", um zu ermitteln, ob es im anfänglichen Satz von Kategorien eine umfassendere Kategorie gibt. Um dies zu erreichen, wird die Vorgängerhierarchie für jede ermittelte Kategorie zur Verfügung gestellt, zum Beispiel durch Speicherung der Vorgängerhierarchie innerhalb des Dokumentes zusammen mit der Kategorie selbst, oder durch Speicherung der Hierarchieinformation an anderer Stelle innerhalb des Suchverfeinerungssystems 10. Zum Beispiel wurde oben erwähnt, dass der Begriff NYC innerhalb der Metadatenhierarchie Weltall/Milchstraße/Sonnensystem/Erde/Nordamerika/Vereinigte Staaten/New York/NYC dargestellt wurde. Da es für NYC im anfänglichen Satz eine Elternkategorie New York gibt, würde NYC dementsprechend aus dem anfänglichen Satz entfernt werden. Dasselbe gilt für die Annahme, dass die Kategorie „Museen" in der Hierarchie Unterhaltung/Kunst & Kultur/Museen steht, sodass die Kategorie Museen ebenfalls entfernt würde, da es für sie im anfänglichen Satz den Vorgänger (d. h. die Großelternkategorie) Unterhaltung gibt.
  • [0022]
    Es sollte klar sein, dass zum Entfernen von Kategorien ebenso jede andere Art Ausscheidungskriterium herangezogen werden könnte. Zum Beispiel kann das Ausscheidungskriterium auf anderen hierarchischen Beziehungen zwischen Knoten einer Taxonomie im anfänglichen Satz von Verfeinerungskategorien beruhen. Alternativ kann das Ausscheidungskriterium auf einem Interessenprofil des Benutzers beruhen.
  • [0023]
    Nachdem alle Kategorien mit hierarchischen Vorgängern entfernt worden sind, kann für jede aus der Kategorieliste 17 entfernte Kategorie eine Kategorie mit der nächsthöchsten Rangstufe in die anfängliche Liste eingefügt werden. Da im oben angeführten Beispiel zwei Kategorien entfernt wurden, würden die beiden Kategorien mit der nächsthöchsten Rangstufe hinzugefügt werden, in diesem Falle Reisen und Import/Export. Der neu gebildete Satz von Verfeinerungskategorien kann erneut auf hierarchische Vorgänger überprüft werden, und der Prozess des Entfernens und Hinzufügens von Kategorien kann so lange wiederholt werden, bis es für die Kategorien im anfänglichen Satz keine hierarchischen Vorgänger mehr gibt.
  • [0024]
    Wenn keine weiteren Ersetzungen mehr erforderlich sind, kann zum Schluss eine Zusatzkategorie, z. B. „Sonstige", an die Liste angehängt werden, um den resultierenden Satz von Verfeinerungskategorien 36 zu erstellen. Die Kategorie „Sonstige" ermöglicht den Zugriff auf alle anderen im Satz von Verfeinerungskategorien 36 nicht aufgeführten Kategorien.
  • [0025]
    Im Folgenden wird ein exemplarischer Algorithmus zur Implementierung der vorliegenden Erfindung vorgestellt, der einen Algorithmus zum Auswählen von Kategorien beinhaltet, wenn der Benutzer die Zusatzkategorie „Sonstige" ausgewählt hat.
  • I. Anfängliche Auswahl von Kategorien nach der Häufigkeit
    • 1. Entscheiden, wie viele Kategorien angezeigt werden sollen – im Folgenden als Anzahl d bezeichnet.
    • 2. Sortieren der Kategorieliste nach der Häufigkeit in absteigender Reihenfolge.
    • 3. Fortsetzen mit Schritt 8, wenn die Anzahl Kategorien kleiner als oder gleich d ist.
    • 4. Auswählen der obersten d – 1 Kategorien.
    • 5. Entfernen aller Kindkategorien (Enkelkategorien usw.) aus der Auswahl.
    • 6. Fortsetzen mit Schritt 7, wenn die aktuelle Auswahl d – 1 Kategorien enthält. Andernfalls Kategorien aus der sortierten Liste hinzufügen und mit Schritt 5 fortsetzen.
    • 7. Anhängen einer Kategorie „Sonstige".
    • 8. Anzeigen der Auswahl.
  • II. Ermitteln der Kategorien in der Kategorie „Sonstige"
    • 1. Wenn die Kategorie „Sonstige" ausgewählt wird, wird mit derselben Abfrage eine erneute Suche durchgeführt, von der jedoch die vorherige Liste der Kategorien und ihrer Kindkategorien (Enkelkategorien usw.) ausgeschlossen ist.
    • 2. Entfernen aller Kindkategorien (Enkelkategorien, usw.) aus der aktuellen Liste der Kategorien.
    • 3. Fortsetzen mit Schritt 6, wenn die Anzahl der Kategorien kleiner als d ist.
    • 4. Auswählen der ersten Kategorie, Hinzufügen von deren Elternkategorie, wenn diese nicht den Stammknoten darstellt, und Entfernen der Kindkategorie aus der aktuellen Liste, andernfalls:
    • 5. Entfernen aller Kindkategorien aus der gesamten Liste, Fortsetzen mit Schritt 3.
    • 6. Anzeigen der Auswahl.
  • [0026]
    Offensichtlich können zahlreiche Varianten des obigen Algorithmus verwendet werden, die innerhalb des Geltungsbereichs der Erfindung liegen.
  • [0027]
    Es versteht sich, dass die hier beschriebenen Systeme, Funktionen, Mechanismen, Verfahren und Module in Form von Hardware, Software oder einer Kombination aus Hardware und Software implementiert sein können. Diese können durch eine beliebige Art von Computersystem oder eine andere Vorrichtung implementiert werden, die dafür ausgelegt ist, die hierin beschriebenen Verfahren auszuführen. Eine typische Kombination aus Hardware und Software kann ein Universalcomputersystem mit einem Computerprogramm sein, das, wenn es geladen und ausgeführt wird, das Computersystem so steuert, dass dieses die im vorliegenden Dokument beschriebenen Verfahren ausführt. Alternativ kann ein Spezialrechner verwendet werden, der eine spezialisierte Hardware zum Ausführen einer oder mehrerer der Funktionsaufgaben der Erfindung enthält. Die vorliegende Erfindung kann auch in ein Computerprogrammprodukt eingebettet sein, das alle Merkmale umfasst, die das Implementieren der im vorliegenden Dokument beschriebenen Verfahren und Funktionen ermöglichen, und – wenn es in ein Computersystem geladen wird – in der Lage ist, diese Verfahren und Funktionen auszuführen. Unter einem Computerprogramm, Softwareprogramm, Programm, Programmprodukt oder einer Software ist im vorliegenden Zusammenhang ein beliebiger Ausdruck in einer beliebigen Sprache, einem beliebigen Code oder einer beliebigen Notation eines Satzes von Anweisungen zu verstehen, die dafür vorgesehen sind, ein System mit einer Informationsverarbeitungsfunktionalität zu veranlassen, eine bestimmte Funktion entweder direkt oder nach einem oder beiden der folgenden Schritte auszuführen: (a) Umwandeln in eine andere Sprache, einen anderen Code oder eine andere Notation; und/oder (b) Wiedergabe in einer anderen materiellen Form.
  • [0028]
    Die obige Beschreibung der bevorzugten Ausführungsarten der Erfindung dient der Veranschaulichung und Beschreibung. Die obigen Ausführungsarten sind nicht als erschöpfend anzusehen und sollen nicht die Erfindung auf genau die dargelegte Form beschränken, sodass angesichts der obigen Darlegungen offensichtlich viele Modifikationen und Varianten möglich sind. Solche dem Fachmann geläufigen Modifikationen und Varianten sind im Geltungsbereich der vorliegenden Erfindung enthalten, der durch die beiliegenden Ansprüche definiert wird.
Klassifizierungen
Internationale KlassifikationG06F17/30, G06F7/00
UnternehmensklassifikationG06F17/30864, Y10S707/99935, Y10S707/99933
Europäische KlassifikationG06F17/30W1
Juristische Ereignisse
DatumCodeEreignisBeschreibung
13. Dez. 20078364No opposition during term of opposition
2. Juli 20098320Willingness to grant licenses declared (paragraph 23)