DE102010041148A1 - Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database - Google Patents

Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database Download PDF

Info

Publication number
DE102010041148A1
DE102010041148A1 DE102010041148A DE102010041148A DE102010041148A1 DE 102010041148 A1 DE102010041148 A1 DE 102010041148A1 DE 102010041148 A DE102010041148 A DE 102010041148A DE 102010041148 A DE102010041148 A DE 102010041148A DE 102010041148 A1 DE102010041148 A1 DE 102010041148A1
Authority
DE
Germany
Prior art keywords
hits
search
database
quality level
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102010041148A
Other languages
German (de)
Inventor
Joachim Wermter
Stefan Augustin
Kai Tödter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102010041148A priority Critical patent/DE102010041148A1/en
Publication of DE102010041148A1 publication Critical patent/DE102010041148A1/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A search query (2) of a user is recorded with an input unit. The criteria are defined for each of the quality levels (41-44), according to which to-be-determined data (5) is acquired from the database. The criteria of respective quality level for the data are satisfied, by determining results in the database corresponding to the search query. The portion of data determined for the selected quality level is retrieved from the database, for transmitting to the user through an output unit. Independent claims are included for the following: (1) machine-readable data carrier storing computing program for optimizing search results; and (2) search engine.

Description

Suchmaschinen wie Google® sind allgemein bekannt und verarbeiten Suchanfragen, welche ein Benutzer eingibt. Hierbei kommen unterschiedliche Algorithmen zum Einsatz, welche eine Reihenfolge von zurückgelieferten Treffern, beispielsweise Dokumenten oder Webseiten, beeinflussen. Die Bestimmung der Reihenfolge wird im Englischen wie im Deutschen als ”Ranking” bezeichnet. Ziel des Rankings ist es, dem Benutzer für seine Suchanfrage, welche in der Regel aus mehreren Suchtermen (etwa mehreren Wörtern) besteht, die relevantesten Treffer an oberster Stelle zurückzuliefern.Search engines like Google® are well known and process queries that a user types. Here, different algorithms are used, which influence an order of returned hits, such as documents or web pages. The determination of the order is called "Ranking" in English and German. The aim of the ranking is to return the most relevant hits to the user for his search query, which usually consists of several search terms (such as several words).

Als Treffer werden z. B. Volltext-Dokumente, elektronische Akten oder Karteikarten, Bilder oder sonstige Datensätze zurückgeliefert, oder (wie von Google® bekannt) kurze Zusammenfassungen oder Ausschnitte einer Webseite, welche mit einem Hyperlink auf die vollständige Webseite versehen sind. Im Folgenden wird der Begriff ”Treffer” wahlweise für alle der genannten Daten verwendet.As a hit z. For example, full text documents, electronic files or index cards, images or other records returned, or (as known by Google ® ) short summaries or sections of a web page, which are provided with a hyperlink to the full website. In the following, the term "hit" is optionally used for all of the mentioned data.

Suchmaschinen greifen auf eine Datenbasis zu, welche sie durchsuchen und welche je nach Anwendung unterschiedlich ausgestaltet sein kann. So kann es sich bei der Datenbasis um eine gängige Datenbank handeln, welche Dokumente, elektronische Akten oder Karteikarten, Bilder oder andere Arten von Datensätzen enthält. Bei einer Internet- oder Intranet-Suchmaschine besteht die Datenbasis in erster Linie aus einem Index, welcher durchsuchte Webseiten des Internet oder Intranet repräsentiert. Im weiteren Sinne liegt hier als Datenbasis jedoch das gesamte Internet bzw. Intranet, ggf. in einem Cache zwischengespeichert, zugrunde. Im Folgenden wird der Begriff ”Datenbasis” wahlweise für eine Datenbank, einen Index, einen Cache oder das gesamte Internet bzw. Intranet verwendet.Search engines access a database, which they search and which can be designed differently depending on the application. Thus, the database may be a common database containing documents, electronic files or index cards, pictures or other types of records. In an internet or intranet search engine, the database consists primarily of an index representing browsing web pages of the internet or intranet. In a broader sense, however, the basis here as a database is the entire Internet or intranet, possibly cached in a cache. In the following, the term "database" is used optionally for a database, an index, a cache or the entire Internet or intranet.

Ein erstes Merkmal gängiger Suchmaschinen besteht darin, dass bei dem Ranking zuerst Treffer aufgeführt werden, welche alle geforderten Suchterme enthalten.A first feature of popular search engines is that in the ranking first hits are listed, which contain all the required search terms.

Fortgeschrittene Suchmaschinen berücksichtigen als zweites Merkmal auch eine Nähe der einzelnen Suchterme zueinander in den Treffern und gewichten diejenigen Treffer beim Ranking höher, in denen die Suchterme näher zueinander stehen.Advanced search engines consider as a second feature also a proximity of the individual search terms to each other in the hits and weight those hits in the ranking higher, in which the search terms are closer to each other.

Dies hat jedoch den Nachteil, dass es – je nach Suchanfrage und Umfang der durchsuchten Datenbasis – gegebenenfalls nur wenige oder gar keine Treffer gibt, bei denen die Suchterme nah beieinander liegen. In diesem Fall werden Treffer zurückgeliefert, die für den Benutzer wenig oder überhaupt nicht relevant sind. Dies geschieht zwar seltener bei großen Internet-Suchmaschinen wie z. B. Google®, da diese auf eine sehr große Masse von indexierten Webseiten zugreifen. Bei Unternehmens- oder Intranet-Suchmaschinen ist dieser Sachverhalt jedoch weitaus häufiger anzutreffen, da solche Suchmaschinen über weitaus weniger Dokumente in ihrem Index verfügen.However, this has the disadvantage that - depending on the search query and the scope of the searched database - there may be few or no hits where the search terms are close to each other. In this case, hits are returned that are of little or no relevance to the user. Although this happens less frequently in major Internet search engines such. Google ® , as they access a very large mass of indexed web pages. In corporate or intranet search engines, however, this issue is much more common, since such search engines have far fewer documents in their index.

Da außerdem häufig große Treffermengen an den Benutzer zurückgeliefert werden, ist es für diesen schwer festzustellen, wie viele Treffer der großen Treffermenge gute Treffer sind und wie gut die Suchanfrage durch die Suchmaschine tatsächlich beantwortet wurde.In addition, since large amounts of hits are often returned to the user, it is difficult for them to determine how many hits of the large number of hits are good hits and how well the query was actually answered by the search engine.

Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Suchmaschine zur Optimierung eines Suchergebnisses anzugeben, welche den Benutzer bei der Bewertung bzw. Auswertung des Suchergebnisses besser unterstützen.The invention is therefore based on the object to provide a method and a search engine for optimizing a search result, which better support the user in the evaluation or evaluation of the search result.

Diese Aufgabe wird erfindungsgemäß dadurch gelöst, dass eine Suchanfrage eines Benutzers rechnergestützt mit einem Eingabemittel erfasst wird. Für jede aus einer Mehrzahl von Qualitätsstufen sind Kriterien definiert, nach denen Treffer in einer Datenbasis zu ermitteln sind. Für jede aus der Mehrzahl von Qualitätsstufen werden Treffer in der Datenbasis für die Suchanfrage ermittelt, wobei die Kriterien der jeweiligen Qualitätsstufe für die ermittelten Treffer erfüllt sein müssen. Der Benutzer wählt eine der Qualitätsstufen aus, woraufhin die für die ausgewählte Qualitätsstufe ermittelten Treffer zumindest teilweise aus der Datenbasis abgerufen und mit einem Ausgabemittel an den Benutzer ausgegeben werden.This object is achieved in that a search request of a user is computer-aided with an input means detected. For each of a plurality of quality levels, criteria are defined according to which hits are to be determined in a database. For each of the plurality of quality levels, hits in the database for the search query are determined, whereby the criteria of the respective quality level for the determined hits must be fulfilled. The user selects one of the quality levels, whereupon the hits determined for the selected quality level are at least partially retrieved from the database and output with an output means to the user.

Die Suchmaschine zur Optimierung eines Suchergebnisses weist ein Eingabemittel auf, welches zur rechnergestützten Erfassung einer Suchanfrage und einer ausgewählten Qualitätsstufe von einem Benutzer eingerichtet ist. Sie beinhaltet ferner einen Speicher, der eine Datenbasis enthält und in dem für jede aus einer Mehrzahl von Qualitätsstufen Kriterien abgespeichert sind, nach denen Treffer in der Datenbasis zu ermitteln sind. Außerdem beinhaltet die Suchmaschine einen Mikroprozessor, welcher zur Ermittlung von Treffern für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage programmiert ist, wobei die Kriterien der jeweiligen Qualitätsstufe für die ermittelten Treffer erfüllt sein müssen. Weiterhin ist der Mikroprozessor programmiert, zumindest einen Teil der für die ausgewählte Qualitätsstufe ermittelten Treffer aus der Datenbasis abzurufen. Außerdem beinhaltet die Suchmaschine ein Ausgabemittel, welches zur Ausgabe der für die ausgewählte Qualitätsstufe abgerufenen Treffer an den Benutzer eingerichtet ist.The search engine for optimizing a search result has an input means which is set up for the computer-aided recording of a search query and a selected quality level by a user. It also includes a memory containing a database and in which criteria for each of a plurality of quality levels are stored, according to which hits in the database are to be determined. In addition, the search engine includes a microprocessor which is programmed to determine hits for each of the plurality of quality levels in the database for the search query, wherein the criteria of the respective quality level for the determined hits must be met. Furthermore, the microprocessor is programmed to retrieve at least a portion of the determined for the selected quality level hits from the database. In addition, the search engine includes an output means adapted for outputting to the user the hits retrieved for the selected quality level.

Bekannte Suchmaschinen nehmen die Treffer nur in eine lange Liste auf und überlassen es dem Benutzer, die wirklich relevanten Treffer zu lokalisieren. Das Verfahren und die Suchmaschine bieten demgegenüber den Vorteil, dass der Benutzer die Qualität der zurückgelieferten Treffer bestimmen kann, da die Treffer entsprechend den Qualitätsstufen in verschiedene Partitionen unterteilt werden. Somit erhält der Benutzer eine Qualitätsaussage über die zurückgelieferten Treffer und den Erfolgsgrad seiner Suchanfrage. Die Qualitätsaussage ist für den Benutzer klar erkennbar und zeigt ihm die Relevanz der zurückgelieferten Treffer. Durch die qualitative Einteilung der Treffer in unterschiedliche Qualitätsstufen, welche jeweils eine abnehmende Relevanz in Bezug auf die Suchanfrage haben, kann der Benutzer sofort sehen, ob genügend Treffer mit ausreichender Qualität zurückgeliefert wurden, oder ob er die Suchanfrage ggf. anders formulieren muss.Known search engines only include the hits in a long list, leaving the user to get the relevant hits locate. In contrast, the method and the search engine offer the advantage that the user can determine the quality of the returned hits, since the hits are subdivided according to the quality levels into different partitions. Thus, the user receives a quality statement about the returned hits and the degree of success of his search. The quality statement is clearly recognizable to the user and shows him the relevance of the returned hits. Due to the qualitative classification of the hits into different quality levels, which each have a decreasing relevance in relation to the search query, the user can see immediately whether enough hits with sufficient quality have been returned, or if he must possibly formulate the search query differently.

In einer Weiterbildung wird für jede Qualitätsstufe die Anzahl der ermittelten Treffer an den Benutzer mit dem Ausgabemittel ausgegeben, bevor der Benutzer eine der Qualitätsstufen auswählt.In a development, the number of hits determined for each quality level is output to the user with the output means before the user selects one of the quality levels.

Diese Weiterbildung hat den Vorteil, dass der Benutzer eine Qualitätsaussage erhält, ob und wie viele qualitativ hochwertige (d. h. für seine Suchanfrage besonders relevante) Treffer er zu erwarten hat. Dies ist ein wichtiger Unterschied zu gängigen Suchmaschinen, da diese generell zu viele Ergebnisse liefern und keine Aussage für die Gesamtmenge der Treffer machen. Der Vorteil dieser Weiterbildung liegt demgegenüber darin, dass sie aufschlüsselt, wie viele Treffer wirklich gut sind bzw. wie viele Treffer auf die jeweiligen Qualitätsstufen entfallen. Hieraus kann der Benutzer entnehmen, wie gut die von ihm formulierte Suchanfrage durch die Suchmaschine beantwortet werden konnte. Die qualitative Einteilung der Treffer in die Qualitätsstufen und die Ausgabe der Anzahl für jede Qualitätsstufe ermöglicht es dem Benutzer, auf einen Blick zu sehen, ob seine Suchanfrage zu viele oder ggf. gar keine qualitativ hochwertigen Treffer zurückliefert.This development has the advantage that the user receives a quality statement as to whether and how many high-quality (that is to say, those that are particularly relevant for his search request) he has to expect. This is an important difference to popular search engines, as they generally give too many results and do not tell the total number of hits. The advantage of this development is in contrast to the fact that it encrypts how many hits are really good or how many hits account for the respective quality levels. From this, the user can see how well the query formulated by him could be answered by the search engine. The qualitative classification of the hits into the quality levels and the output of the number for each quality level enables the user to see at a glance whether his query returns too many or possibly no high-quality hits.

In einer anderen Weiterbildung geben die Kriterien für jede Qualitätsstufe an, wie nah zueinander mehrere Suchterme aus der Suchanfrage in einem Treffer vorkommen müssen. Alternativ geben die Kriterien für jede Qualitätsstufe ein anderes Maß an, das für die Suchanfrage in einem Treffer erfüllt sein muss.In another development, the criteria for each quality level indicate how close to each other several search terms from the search query must occur in one hit. Alternatively, the criteria for each quality level specify a different level that must be met for the search query in a hit.

Gemäß einer Ausführungsform werden die Treffer für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage ermittelt, indem mehrere Teilsuchanfragen rechnergestützt generiert werden, welche jeweils auf eine Qualitätsstufe zugeschnitten sind. Alternativ werden die Treffer für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage ermittelt, indem eine Suchmaschine dazu programmiert ist, dies parallel für alle Qualitätsstufen durchzuführen.According to one embodiment, the hits for each of the plurality of quality levels in the search query database are determined by computationally generating a plurality of partial search queries, each tailored to a quality level. Alternatively, the hits for each of the plurality of quality levels in the database for the search query are determined by programming a search engine to do so in parallel for all quality levels.

Die Erfindung umfasst ferner einen computerlesbaren Datenträger, auf dem ein Computerprogramm gespeichert ist, welches das Verfahren ausführt, wenn es in einem Computer abgearbeitet wird. Weiterhin umfasst die Erfindung ein Computerprogramm, welches in einem Computer abgearbeitet wird und dabei das Verfahren ausführt.The invention further comprises a computer readable medium having stored thereon a computer program which executes the method when executed in a computer. Furthermore, the invention comprises a computer program which is executed in a computer and thereby carries out the method.

Im Folgenden werden Ausführungsbeispiele der Erfindung anhand von Figuren näher erläutert. Es zeigen:In the following, embodiments of the invention will be explained in more detail with reference to figures. Show it:

1 eine Benutzeroberfläche für eine Suchmaschine gemäß dem Stand der Technik 1 a user interface for a search engine according to the prior art

2 eine schematische Darstellung einer Optimierung eines Suchergebnisses 2 a schematic representation of an optimization of a search result

3 eine Benutzeroberfläche zur Optimierung eines Suchergebnisses. 3 A user interface for optimizing a search result.

1 zeigt eine Benutzeroberfläche für eine Suchmaschine gemäß dem Stand der Technik. Gezeigt ist eine Suchzeile 10, in der ein Benutzer eine Suchanfrage 2 beispielsweise mithilfe einer Tastatur eingibt. Über einen Such-Knopf 11 schickt der Benutzer die Suchanfrage 2 ab. Eine Suchmaschine ermittelt anschließend Treffer 5, die wie in 1 gezeigt in einer Liste zurückgeliefert werden. Hierbei enthält die Liste eine Überschrift, in der eine Information 20 angibt, wie viele Treffer 5 insgesamt ermittelt wurden, in diesem Fall 19.931. Von den ermittelten Treffern 5 werden lediglich die ersten 20 aus einer Datenbasis abgerufen und in der Liste angezeigt. 1 shows a user interface for a search engine according to the prior art. Shown is a search line 10 in which a user makes a search query 2 for example, using a keyboard. Via a search button 11 the user sends the search query 2 from. A search engine then determines hits 5 that like in 1 shown in a list. In this case, the list contains a heading in which information 20 indicates how many hits 5 total, in this case 19,931. From the determined hits 5 become only the first 20 retrieved from a database and displayed in the list.

Die Suchanfrage 2 liefert in 1 also fast 20.000 Treffer 5 zurück, wobei es dem Benutzer überlassen bleibt, herauszufinden, ob, wie viele und welche dieser Treffer 5 für die Suchanfrage 2 wirklich relevant sind.The search query 2 delivers in 1 So almost 20,000 hits 5 back, leaving it to the user to figure out if, how many and which of those hits 5 for the search query 2 really relevant.

2 zeigt eine schematische Darstellung einer Optimierung eines Suchergebnisses. Ein Benutzer 1 gibt mithilfe eines Eingabemittels 6, in 2 als Maus dargestellt, eine Suchanfrage 2 für eine Suchmaschine ein. Die Suchmaschine ermittelt für mehrere Qualitätsstufen 4 in einer Datenbasis 3 Treffer 5 für die Suchanfrage 2, wobei Kriterien der jeweiligen Qualitätsstufe 4 für die Treffer 5 erfüllt sein müssen. Die Kriterien sind vorab für jede der Qualitätsstufen 4 definiert. Der Benutzer 1 wählt eine der Qualitätsstufen 4 mit dem Eingabemittel 6 aus, woraufhin zumindest ein Teil der für diese ausgewählte Qualitätsstufe 4 ermittelten Treffer 5 aus der Datenbasis 3 abgerufen und mit einem Ausgabemittel 7 an den Benutzer 1 ausgegeben werden. 2 shows a schematic representation of an optimization of a search result. A user 1 gives by using an input means 6 , in 2 displayed as a mouse, a search query 2 for a search engine. The search engine determines for several quality levels 4 in a database 3 hit 5 for the search query 2 , where criteria of the respective quality level 4 for the hits 5 must be fulfilled. The criteria are in advance for each of the quality levels 4 Are defined. The user 1 choose one of the quality levels 4 with the input means 6 off, whereupon at least part of the quality level selected for this 4 determined hits 5 from the database 3 retrieved and with an output means 7 to the user 1 be issued.

2 zeigt hierbei den Fall, dass der Benutzer 1 die obere Qualitätsstufe 4 auswählt, woraufhin die zu dieser Qualitätsstufe 4 gehörenden Treffer 5 über das Ausgabemittel 7 an den Benutzer 1 ausgegeben werden. 2 shows here the case that the user 1 the upper quality level 4 selects, which leads to this quality level 4 belonging hits 5 via the output means 7 to the user 1 be issued.

Anhand der Qualitätsstufen 4 werden also unterschiedliche Partitionen für die Treffer 5 gebildet, welche die Treffer 5 nach absteigender Relevanz klassifizieren. Die Qualitätsstufen 4 basieren auf dem oben beschriebenen ersten Merkmal, dass alle Suchterme der Suchanfrage 2 in den ermittelten Treffern 5 vorkommen müssen, und auf dem zweiten Merkmal, dass Treffer 5, in denen die Suchterme näher beieinander stehen, im Ranking bevorzugt werden.Based on the quality levels 4 will be different partitions for the hits 5 formed the hits 5 classify by descending relevance. The quality levels 4 are based on the first feature described above, that all search terms of the search query 2 in the determined hits 5 must happen, and on the second feature that hits 5 , in which the search terms are closer to each other, are preferred in the ranking.

Hierzu werden geforderte Wortabstände zwischen den Suchtermen in den Treffern 5 gemäß dem zweiten Merkmal in den einzelnen Qualitätsstufen 4 so berechnet, dass sich z. B. drei verschiedene Partitionen für die Treffer 5 ergeben. Abweichend von 2 können auch zwei, vier oder mehr Qualitätsstufen verwendet werden, wobei die Anzahl der Partitionen der Anzahl der Qualitätsstufen entspricht.These are required word intervals between the search terms in the hits 5 according to the second feature in the individual quality levels 4 calculated so that z. For example, three different partitions for the hits 5 result. Deviating from 2 You can also use two, four, or more quality levels, where the number of partitions equals the number of quality levels.

Die Ermittlung der Treffer 5 kann wahlweise erfolgen, indem die Suchanfrage 2 in mehrere Teil-Suchanfragen unterteilt wird, welche jeweils auf eine Qualitätsstufe 4 zugeschnitten sind und Treffer 5 für diese Qualitätsstufe 4 ermitteln. Die Teil-Suchanfragen werden dann nacheinander automatisiert durch die Suchmaschine abgearbeitet und dem Benutzer 1 gegebenenfalls erst anschließend sukzessive präsentiert.The determination of the hits 5 can optionally be done by the search query 2 is subdivided into several sub-searches, each one on a quality level 4 are tailored and hit 5 for this quality level 4 determine. The partial search queries are then successively processed automatically by the search engine and the user 1 possibly only then presented successively.

Alternativ kann das Verfahren auch direkt in einem Suchmaschinen-Kern implantiert sein, der dann dazu programmiert ist, die Treffer 5 für alle Qualitätsstufen 4 parallel in der Datenbasis 3 zu ermitteln.Alternatively, the method may also be implanted directly into a search engine core that is then programmed to hit 5 for all quality levels 4 parallel in the database 3 to investigate.

3 zeigt eine Benutzeroberfläche zur Optimierung eines Suchergebnisses und bezieht sich auf die für 2 erläuterte Optimierung. Gezeigt ist erneut eine Suchzeile 10, in welcher der Benutzer eine Suchanfrage 2 eingeben kann. Die zuletzt eingegebene Suchanfrage 2 wird unter der Suchzeile 10 angezeigt. Der Benutzer kann die Suchzeile 10 auch verwenden, um die bisherige Suchanfrage 2 durch eine neue Suchanfrage zu ersetzen oder durch zusätzliche Suchterme zu verfeinern. Mithilfe eines Löschen-Knopfs 12 kann der Benutzer die Suchanfrage 2 löschen. Nach Bearbeitung der Suchanfrage 2 drückt der Benutzer einen Such-Knopf 11 und startet damit die Suche. 3 shows a user interface for optimizing a search result and refers to the for 2 explained optimization. Shown again is a search line 10 in which the user searches 2 can enter. The last search query entered 2 will be under the search line 10 displayed. The user can search the line 10 also use the previous query 2 to replace it with a new search query or to refine it with additional search terms. Using a delete button 12 the user can do the search 2 Clear. After processing the search query 2 the user presses a search button 11 and start the search.

3 zeigt weiterhin vier Qualitätsstufen, welche auf der Benutzeroberfläche nebeneinander in einer Reihe dargestellt sind. Hierbei bezeichnet eine erste Qualitätsstufe 41, welche z. B. durch grüne Darstellung hervorgehoben ist, 59 Treffer 5 mit höchster Qualität. Die erste Qualitätsstufe 41 mit 59 Treffern 5 ist also diejenige mit den qualitativ hochwertigsten Ergebnissen. Eine zweite Qualitätsstufe 42 ist in der Farbe hellgrün gehalten und enthält in 3 lediglich 2 Treffer, welche für die zweite Qualitätsstufe 42 ermittelt wurden. Eine dritte Qualitätsstufe 43 ist in der Farbe gelb dargestellt und enthält 400 Treffer, die für die dritte Qualitätsstufe 43 ermittelt wurden. Eine vierte Qualitätsstufe 44 ganz rechts ist beispielsweise in orange dargestellt, da ihre Qualität am schlechtesten ist. Sie enthält 5733 Treffer. 3 also shows four levels of quality, which are shown next to each other in a row on the user interface. This refers to a first quality level 41 which z. B. highlighted by green representation, 59 hits 5 with the highest quality. The first quality level 41 with 59 hits 5 is the one with the highest quality results. A second quality level 42 is held in the color light green and contains in 3 only 2 hits, which for the second quality level 42 were determined. A third quality level 43 is shown in yellow and contains 400 hits for the third quality level 43 were determined. A fourth quality level 44 For example, the far right is in orange because its quality is worst. It contains 5733 hits.

Die erste Qualitätsstufe 41 mit 59 Treffern ist aktuell durch den Benutzer ausgewählt und wird auch über der Liste der Treffer 5 in der Information 20 erneut dargestellt. Die Information 20 zeigt ferner, dass von diesen Treffern 5 mit höchster Qualität die ersten 10 auf der Benutzeroberfläche ausgegeben werden. Die erste Qualitätsstufe 41 ist durch Kriterien definiert, welche fordern, dass maximal eine Position Wortabstand zwischen den einzelnen Suchtermen der Suchanfrage 2 in den Treffern 5 vorliegen darf. Dies bedeutet, dass sich zwischen den einzelnen Suchtermen höchstens ein zusätzliches Wort befinden darf. Innerhalb der Treffer 5 für die erste Qualitätsstufe 41 wird weiterhin noch eine für den Benutzer unsichtbare Unterscheidung beim Ranking getroffen, ob die Suchterme in der gleichen Reihenfolge wie in der Suchanfrage 2 auftreten. Falls dies so ist, werden die entsprechenden Treffer 5 beim Ranking bevorzugt.The first quality level 41 with 59 hits is currently selected by the user and will also be above the list of hits 5 in the information 20 shown again. The information 20 further shows that from these hits 5 With the highest quality the first 10 will be spent on the user interface. The first quality level 41 is defined by criteria that require a maximum of one position word spacing between each search term of the search query 2 in the matches 5 may be present. This means that there can be at most one additional word between the individual search terms. Within the hits 5 for the first quality level 41 is still made a distinction invisible to the user in the ranking, whether the search terms in the same order as in the search 2 occur. If so, the corresponding hits 5 preferred in the ranking.

Die zweite Qualitätsstufe 42 enthält 2 Treffer. Hier wird ein Wortabstand von zwei Positionen zwischen den Suchtermen gefordert.The second quality level 42 contains 2 hits. Here a word spacing of two positions between the search terms is required.

Die dritte Qualitätsstufe 43 mit 400 Treffern fordert mit ihren Kriterien einen Wortabstand zwischen den Suchtermen von drei bis 120 Positionen. Hierbei werden im Ranking solche Treffer, bei denen die Suchterme lediglich einen Abstand von drei Positionen aufweisen, höher eingestuft als solche, bei denen der Abstand beispielsweise 100 Positionen beträgt.The third quality level 43 with 400 hits requires with their criteria a word spacing between the search terms of three to 120 positions. In this case, those hits in which the search terms only have a distance of three positions rank higher in the ranking than those in which the distance is, for example, 100 positions.

Die vierte Qualitätsstufe 44 enthält alle restlichen Treffer, bei denen die Suchterme einen Wortabstand von mindestens 121 Positionen aufweisen. Damit enthält die Qualitätsstufe 4 nur noch solche Treffer, welche zwar formal korrekt, aber inhaltlich für den Benutzer als belanglos zu bewerten sind.The fourth quality level 44 contains all remaining hits where the search terms have a word spacing of at least 121 positions. This contains the quality level 4 only those hits that are formally correct, but content-wise for the user to be considered as irrelevant.

Die Implementierung des beschriebenen Verfahrens wird durch den Umstand vereinfacht, dass im Suchindex heutiger Suchmaschinen neben den Wörtern der einzelnen Dokumente auch die Positionen der Wörter abgelegt werden. Somit kann auf diese Information einfach zugegriffen werden. Anstelle der Wortabstände der Suchterme können auch beliebige andere Parameter, welche heutige Suchmaschinen auswerten, verwendet werden, um die Qualitätsstufen und damit die Treffer zu unterteilen.The implementation of the described method is simplified by the fact that in the search index of today's search engines in addition to the words of the individual documents and the positions of the words are stored. Thus, this information can be easily accessed. Instead of the word spacing of the search terms, any other parameters that evaluate today's search engines can be used to subdivide the quality levels and thus the hits.

Die beschriebenen Ausführungsbeispiele, Weiterbildungen, Varianten und Ausführungsformen lassen sich frei miteinander kombinieren.The described embodiments, developments, variants and embodiments can be freely combined with each other.

Claims (7)

Verfahren zur Optimierung eines Suchergebnisses, – bei dem eine Suchanfrage (2) eines Benutzers (1) rechnergestützt mit einem Eingabemittel (6) erfasst wird, – bei dem für jede aus einer Mehrzahl von Qualitätsstufen (4) Kriterien definiert sind, nach denen Treffer (5) in einer Datenbasis (3) zu ermitteln sind, – bei dem für jede aus der Mehrzahl von Qualitätsstufen (4) Treffer (5) in der Datenbasis (3) für die Suchanfrage (2) ermittelt werden, wobei die Kriterien der jeweiligen Qualitätsstufe (4) für die Treffer (5) erfüllt sein müssen, und – bei dem der Benutzer (1) rechnergestützt eine der Qualitätsstufen (4) auswählt, woraufhin zumindest ein Teil der für die ausgewählte Qualitätsstufe ermittelten Treffer (5) aus der Datenbasis (3) abgerufen und mit einem Ausgabemittel (7) an den Benutzer (1) ausgegeben werden.Method for optimizing a search result, - in which a search request ( 2 ) of a user ( 1 ) computer-aided with an input means ( 6 ), - for each of a number of quality levels ( 4 ) Criteria are defined according to which hits ( 5 ) in a database ( 3 ), - for each of the majority of quality levels ( 4 ) Hits ( 5 ) in the database ( 3 ) for the search query ( 2 ), whereby the criteria of the respective quality level ( 4 ) for the hits ( 5 ), and - where the user ( 1 ) computer-aided one of the quality levels ( 4 ), whereupon at least a portion of the hits determined for the selected quality level ( 5 ) from the database ( 3 ) and with an output means ( 7 ) to the user ( 1 ). Verfahren nach Anspruch 1, – bei dem für jede Qualitätsstufe (4) die Anzahl der ermittelten Treffer (5) an den Benutzer (1) mit dem Ausgabemittel (7) ausgegeben wird, bevor der Benutzer (1) eine der Qualitätsstufen (4) auswählt.Method according to claim 1, - in which for each quality level ( 4 ) the number of hits ( 5 ) to the user ( 1 ) with the output means ( 7 ) is output before the user ( 1 ) one of the quality levels ( 4 ) selects. Verfahren nach einem der vorangegangenen Ansprüche, – bei dem die Kriterien für jede Qualitätsstufe (4) angeben, wie nah zueinander mehrere Suchterme aus der Suchanfrage (2) in einem Treffer (5) vorkommen müssen, oder – bei dem die Kriterien für jede Qualitätsstufe (4) ein anderes Maß angeben, das für die Suchanfrage (2) in einem Treffer (5) erfüllt sein muss.Method according to one of the preceding claims, - in which the criteria for each quality level ( 4 ) specify how close to each other several search terms from the search query ( 2 ) in a hit ( 5 ), or - where the criteria for each quality level ( 4 ) specify a different measure for the search query ( 2 ) in a hit ( 5 ) must be fulfilled. Verfahren nach einem der vorangegangenen Ansprüche, – bei dem die Treffer (5) für jede aus der Mehrzahl von Qualitätsstufen (4) in der Datenbasis (3) für die Suchanfrage (2) ermittelt werden, indem mehrere Teilsuchanfragen rechnergestützt generiert werden, welche jeweils auf eine Qualitätsstufe zugeschnitten sind, oder – bei dem die Treffer (5) für jede aus der Mehrzahl von Qualitätsstufen (4) in der Datenbasis (3) für die Suchanfrage (2) ermittelt werden, indem eine Suchmaschine dazu programmiert ist, dies parallel für alle Qualitätsstufen (4) durchzuführen.Method according to one of the preceding claims, - in which the hits ( 5 ) for each of the plurality of quality levels ( 4 ) in the database ( 3 ) for the search query ( 2 ) can be determined by computer-aided generation of a number of partial search queries, which are each tailored to a quality level, or - in which the hits ( 5 ) for each of the plurality of quality levels ( 4 ) in the database ( 3 ) for the search query ( 2 ) by programming a search engine to do this in parallel for all quality levels ( 4 ). Computerlesbarer Datenträger, – auf dem ein Computerprogramm gespeichert ist, welches das Verfahren nach einem der vorangegangenen Ansprüche ausführt, wenn es in einem Computer abgearbeitet wird.Computer readable medium, - On which a computer program is stored, which executes the method according to any one of the preceding claims, when it is processed in a computer. Computerprogramm, – welches in einem Computer abgearbeitet wird und dabei das Verfahren nach einem der Ansprüche 1 bis 4 ausführt.Computer program - Which is processed in a computer and thereby carries out the method according to one of claims 1 to 4. Suchmaschine zur Optimierung eines Suchergebnisses, – mit einem Eingabemittel (6) zur rechnergestützten Erfassung einer Suchanfrage (2) und einer ausgewählten Qualitätsstufe von einem Benutzer (1), – mit einem Speicher, der eine Datenbasis (3) enthält und in dem für jede aus einer Mehrzahl von Qualitätsstufen (4) Kriterien abgespeichert sind, nach denen Treffer (5) in der Datenbasis (3) zu ermitteln sind, – mit einem Mikroprozessor, programmiert zur Ermittlung von Treffern (5) für jede aus der Mehrzahl von Qualitätsstufen (4) in der Datenbasis (3) für die Suchanfrage (2), wobei die Kriterien der jeweiligen Qualitätsstufe (4) für die Treffer (5) erfüllt sein müssen, und programmiert zum Abruf zumindest eines Teils der für die ausgewählte Qualitätsstufe ermittelten Treffer (5), und – mit einem Ausgabemittel (7), eingerichtet zur Ausgabe der für die ausgewählte Qualitätsstufe abgerufenen Treffer (5) an den Benutzer (1).Search engine for optimizing a search result, - with an input means ( 6 ) for the computer-aided recording of a search query ( 2 ) and a selected quality level from a user ( 1 ), - with a memory containing a database ( 3 ) and for each of a plurality of quality levels ( 4 ) Criteria are stored, after which hits ( 5 ) in the database ( 3 ), - with a microprocessor programmed to detect hits ( 5 ) for each of the plurality of quality levels ( 4 ) in the database ( 3 ) for the search query ( 2 ), whereby the criteria of the respective quality level ( 4 ) for the hits ( 5 ) and programmed to retrieve at least part of the hits determined for the selected quality level ( 5 ), and - with an output means ( 7 ) arranged to output the hits retrieved for the selected quality level ( 5 ) to the user ( 1 ).
DE102010041148A 2010-09-21 2010-09-21 Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database Ceased DE102010041148A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102010041148A DE102010041148A1 (en) 2010-09-21 2010-09-21 Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102010041148A DE102010041148A1 (en) 2010-09-21 2010-09-21 Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database

Publications (1)

Publication Number Publication Date
DE102010041148A1 true DE102010041148A1 (en) 2012-03-22

Family

ID=45768805

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102010041148A Ceased DE102010041148A1 (en) 2010-09-21 2010-09-21 Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database

Country Status (1)

Country Link
DE (1) DE102010041148A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363377B1 (en) * 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
US7657522B1 (en) * 2006-01-12 2010-02-02 Recommind, Inc. System and method for providing information navigation and filtration

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363377B1 (en) * 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
US7657522B1 (en) * 2006-01-12 2010-02-02 Recommind, Inc. System and method for providing information navigation and filtration

Similar Documents

Publication Publication Date Title
DE60004687T2 (en) METHOD FOR THE THEMATIC CLASSIFICATION OF DOCUMENTS, MODULE FOR THE THEMATIC CLASSIFICATION AND A SEARCH ENGINE CONTAINING SUCH A MODULE
DE69917250T2 (en) CHARACTER TRANSMISSION OVER HYPERLINKS
DE69731142T2 (en) System for retrieving documents
DE69433165T2 (en) ASSOCIATIVE TEXT SEARCH AND REINFORCEMENT SYSTEM
DE60118973T2 (en) METHOD FOR INQUIRING A STRUCTURE OF COMPRESSED DATA
DE1499182A1 (en) Electrical data processing system
DE102007037646A1 (en) System and method for indexing, searching and retrieving databases
DE10215495A1 (en) Computer system and method for research, statistical evaluation and analysis of documents
EP1975821A2 (en) Method for digital storing of data on a data storage device with limited available space
WO2007042245A1 (en) Search engine for carrying out a location-dependent search
DE112012003249T5 (en) System, method and program for retrieving information
DE10028624B4 (en) Method and device for document procurement
DE112010002620T5 (en) ONTOLOGY USE FOR THE ORDER OF DATA RECORDS NACHRELEVANZ
EP1620810B1 (en) Method and arrangement for establishing and updating a user surface used for accessing data pages in a data network
DE10048478C2 (en) Method of accessing a storage unit when searching for substrings
WO2012130430A2 (en) Method for collecting information, computer programme product and business model therefor
DE102010041148A1 (en) Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database
EP1783631A1 (en) Search result ranking by means of relevance feedback
WO2011044865A1 (en) Method for determining a similarity of objects
DE10057634C2 (en) Process for processing text in a computer unit and computer unit
DE19952630A1 (en) Method for generating a selection mask for the retrieval of data from a database using programmable information objects
DE102006043158A1 (en) Method for determining elements of search results assigned to query in priority, involves comparing elements of data base with search criterion set comprising search criterion and assigned to updated query
DE102006014348A1 (en) Dataset searching method for use in data processing system, involves determining array portion by search input in computerized manner, and implementing search of datasets in database by portion or array selection that is made for search
DE102018128048A1 (en) Method and device for storing data and their relationships
WO2021043956A1 (en) Method for data-matching a webpage

Legal Events

Date Code Title Description
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final

Effective date: 20120628