DE102010041148A1 - Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database - Google Patents
Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database Download PDFInfo
- Publication number
- DE102010041148A1 DE102010041148A1 DE102010041148A DE102010041148A DE102010041148A1 DE 102010041148 A1 DE102010041148 A1 DE 102010041148A1 DE 102010041148 A DE102010041148 A DE 102010041148A DE 102010041148 A DE102010041148 A DE 102010041148A DE 102010041148 A1 DE102010041148 A1 DE 102010041148A1
- Authority
- DE
- Germany
- Prior art keywords
- hits
- search
- database
- quality level
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Suchmaschinen wie Google® sind allgemein bekannt und verarbeiten Suchanfragen, welche ein Benutzer eingibt. Hierbei kommen unterschiedliche Algorithmen zum Einsatz, welche eine Reihenfolge von zurückgelieferten Treffern, beispielsweise Dokumenten oder Webseiten, beeinflussen. Die Bestimmung der Reihenfolge wird im Englischen wie im Deutschen als ”Ranking” bezeichnet. Ziel des Rankings ist es, dem Benutzer für seine Suchanfrage, welche in der Regel aus mehreren Suchtermen (etwa mehreren Wörtern) besteht, die relevantesten Treffer an oberster Stelle zurückzuliefern.Search engines like Google® are well known and process queries that a user types. Here, different algorithms are used, which influence an order of returned hits, such as documents or web pages. The determination of the order is called "Ranking" in English and German. The aim of the ranking is to return the most relevant hits to the user for his search query, which usually consists of several search terms (such as several words).
Als Treffer werden z. B. Volltext-Dokumente, elektronische Akten oder Karteikarten, Bilder oder sonstige Datensätze zurückgeliefert, oder (wie von Google® bekannt) kurze Zusammenfassungen oder Ausschnitte einer Webseite, welche mit einem Hyperlink auf die vollständige Webseite versehen sind. Im Folgenden wird der Begriff ”Treffer” wahlweise für alle der genannten Daten verwendet.As a hit z. For example, full text documents, electronic files or index cards, images or other records returned, or (as known by Google ® ) short summaries or sections of a web page, which are provided with a hyperlink to the full website. In the following, the term "hit" is optionally used for all of the mentioned data.
Suchmaschinen greifen auf eine Datenbasis zu, welche sie durchsuchen und welche je nach Anwendung unterschiedlich ausgestaltet sein kann. So kann es sich bei der Datenbasis um eine gängige Datenbank handeln, welche Dokumente, elektronische Akten oder Karteikarten, Bilder oder andere Arten von Datensätzen enthält. Bei einer Internet- oder Intranet-Suchmaschine besteht die Datenbasis in erster Linie aus einem Index, welcher durchsuchte Webseiten des Internet oder Intranet repräsentiert. Im weiteren Sinne liegt hier als Datenbasis jedoch das gesamte Internet bzw. Intranet, ggf. in einem Cache zwischengespeichert, zugrunde. Im Folgenden wird der Begriff ”Datenbasis” wahlweise für eine Datenbank, einen Index, einen Cache oder das gesamte Internet bzw. Intranet verwendet.Search engines access a database, which they search and which can be designed differently depending on the application. Thus, the database may be a common database containing documents, electronic files or index cards, pictures or other types of records. In an internet or intranet search engine, the database consists primarily of an index representing browsing web pages of the internet or intranet. In a broader sense, however, the basis here as a database is the entire Internet or intranet, possibly cached in a cache. In the following, the term "database" is used optionally for a database, an index, a cache or the entire Internet or intranet.
Ein erstes Merkmal gängiger Suchmaschinen besteht darin, dass bei dem Ranking zuerst Treffer aufgeführt werden, welche alle geforderten Suchterme enthalten.A first feature of popular search engines is that in the ranking first hits are listed, which contain all the required search terms.
Fortgeschrittene Suchmaschinen berücksichtigen als zweites Merkmal auch eine Nähe der einzelnen Suchterme zueinander in den Treffern und gewichten diejenigen Treffer beim Ranking höher, in denen die Suchterme näher zueinander stehen.Advanced search engines consider as a second feature also a proximity of the individual search terms to each other in the hits and weight those hits in the ranking higher, in which the search terms are closer to each other.
Dies hat jedoch den Nachteil, dass es – je nach Suchanfrage und Umfang der durchsuchten Datenbasis – gegebenenfalls nur wenige oder gar keine Treffer gibt, bei denen die Suchterme nah beieinander liegen. In diesem Fall werden Treffer zurückgeliefert, die für den Benutzer wenig oder überhaupt nicht relevant sind. Dies geschieht zwar seltener bei großen Internet-Suchmaschinen wie z. B. Google®, da diese auf eine sehr große Masse von indexierten Webseiten zugreifen. Bei Unternehmens- oder Intranet-Suchmaschinen ist dieser Sachverhalt jedoch weitaus häufiger anzutreffen, da solche Suchmaschinen über weitaus weniger Dokumente in ihrem Index verfügen.However, this has the disadvantage that - depending on the search query and the scope of the searched database - there may be few or no hits where the search terms are close to each other. In this case, hits are returned that are of little or no relevance to the user. Although this happens less frequently in major Internet search engines such. Google ® , as they access a very large mass of indexed web pages. In corporate or intranet search engines, however, this issue is much more common, since such search engines have far fewer documents in their index.
Da außerdem häufig große Treffermengen an den Benutzer zurückgeliefert werden, ist es für diesen schwer festzustellen, wie viele Treffer der großen Treffermenge gute Treffer sind und wie gut die Suchanfrage durch die Suchmaschine tatsächlich beantwortet wurde.In addition, since large amounts of hits are often returned to the user, it is difficult for them to determine how many hits of the large number of hits are good hits and how well the query was actually answered by the search engine.
Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Suchmaschine zur Optimierung eines Suchergebnisses anzugeben, welche den Benutzer bei der Bewertung bzw. Auswertung des Suchergebnisses besser unterstützen.The invention is therefore based on the object to provide a method and a search engine for optimizing a search result, which better support the user in the evaluation or evaluation of the search result.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, dass eine Suchanfrage eines Benutzers rechnergestützt mit einem Eingabemittel erfasst wird. Für jede aus einer Mehrzahl von Qualitätsstufen sind Kriterien definiert, nach denen Treffer in einer Datenbasis zu ermitteln sind. Für jede aus der Mehrzahl von Qualitätsstufen werden Treffer in der Datenbasis für die Suchanfrage ermittelt, wobei die Kriterien der jeweiligen Qualitätsstufe für die ermittelten Treffer erfüllt sein müssen. Der Benutzer wählt eine der Qualitätsstufen aus, woraufhin die für die ausgewählte Qualitätsstufe ermittelten Treffer zumindest teilweise aus der Datenbasis abgerufen und mit einem Ausgabemittel an den Benutzer ausgegeben werden.This object is achieved in that a search request of a user is computer-aided with an input means detected. For each of a plurality of quality levels, criteria are defined according to which hits are to be determined in a database. For each of the plurality of quality levels, hits in the database for the search query are determined, whereby the criteria of the respective quality level for the determined hits must be fulfilled. The user selects one of the quality levels, whereupon the hits determined for the selected quality level are at least partially retrieved from the database and output with an output means to the user.
Die Suchmaschine zur Optimierung eines Suchergebnisses weist ein Eingabemittel auf, welches zur rechnergestützten Erfassung einer Suchanfrage und einer ausgewählten Qualitätsstufe von einem Benutzer eingerichtet ist. Sie beinhaltet ferner einen Speicher, der eine Datenbasis enthält und in dem für jede aus einer Mehrzahl von Qualitätsstufen Kriterien abgespeichert sind, nach denen Treffer in der Datenbasis zu ermitteln sind. Außerdem beinhaltet die Suchmaschine einen Mikroprozessor, welcher zur Ermittlung von Treffern für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage programmiert ist, wobei die Kriterien der jeweiligen Qualitätsstufe für die ermittelten Treffer erfüllt sein müssen. Weiterhin ist der Mikroprozessor programmiert, zumindest einen Teil der für die ausgewählte Qualitätsstufe ermittelten Treffer aus der Datenbasis abzurufen. Außerdem beinhaltet die Suchmaschine ein Ausgabemittel, welches zur Ausgabe der für die ausgewählte Qualitätsstufe abgerufenen Treffer an den Benutzer eingerichtet ist.The search engine for optimizing a search result has an input means which is set up for the computer-aided recording of a search query and a selected quality level by a user. It also includes a memory containing a database and in which criteria for each of a plurality of quality levels are stored, according to which hits in the database are to be determined. In addition, the search engine includes a microprocessor which is programmed to determine hits for each of the plurality of quality levels in the database for the search query, wherein the criteria of the respective quality level for the determined hits must be met. Furthermore, the microprocessor is programmed to retrieve at least a portion of the determined for the selected quality level hits from the database. In addition, the search engine includes an output means adapted for outputting to the user the hits retrieved for the selected quality level.
Bekannte Suchmaschinen nehmen die Treffer nur in eine lange Liste auf und überlassen es dem Benutzer, die wirklich relevanten Treffer zu lokalisieren. Das Verfahren und die Suchmaschine bieten demgegenüber den Vorteil, dass der Benutzer die Qualität der zurückgelieferten Treffer bestimmen kann, da die Treffer entsprechend den Qualitätsstufen in verschiedene Partitionen unterteilt werden. Somit erhält der Benutzer eine Qualitätsaussage über die zurückgelieferten Treffer und den Erfolgsgrad seiner Suchanfrage. Die Qualitätsaussage ist für den Benutzer klar erkennbar und zeigt ihm die Relevanz der zurückgelieferten Treffer. Durch die qualitative Einteilung der Treffer in unterschiedliche Qualitätsstufen, welche jeweils eine abnehmende Relevanz in Bezug auf die Suchanfrage haben, kann der Benutzer sofort sehen, ob genügend Treffer mit ausreichender Qualität zurückgeliefert wurden, oder ob er die Suchanfrage ggf. anders formulieren muss.Known search engines only include the hits in a long list, leaving the user to get the relevant hits locate. In contrast, the method and the search engine offer the advantage that the user can determine the quality of the returned hits, since the hits are subdivided according to the quality levels into different partitions. Thus, the user receives a quality statement about the returned hits and the degree of success of his search. The quality statement is clearly recognizable to the user and shows him the relevance of the returned hits. Due to the qualitative classification of the hits into different quality levels, which each have a decreasing relevance in relation to the search query, the user can see immediately whether enough hits with sufficient quality have been returned, or if he must possibly formulate the search query differently.
In einer Weiterbildung wird für jede Qualitätsstufe die Anzahl der ermittelten Treffer an den Benutzer mit dem Ausgabemittel ausgegeben, bevor der Benutzer eine der Qualitätsstufen auswählt.In a development, the number of hits determined for each quality level is output to the user with the output means before the user selects one of the quality levels.
Diese Weiterbildung hat den Vorteil, dass der Benutzer eine Qualitätsaussage erhält, ob und wie viele qualitativ hochwertige (d. h. für seine Suchanfrage besonders relevante) Treffer er zu erwarten hat. Dies ist ein wichtiger Unterschied zu gängigen Suchmaschinen, da diese generell zu viele Ergebnisse liefern und keine Aussage für die Gesamtmenge der Treffer machen. Der Vorteil dieser Weiterbildung liegt demgegenüber darin, dass sie aufschlüsselt, wie viele Treffer wirklich gut sind bzw. wie viele Treffer auf die jeweiligen Qualitätsstufen entfallen. Hieraus kann der Benutzer entnehmen, wie gut die von ihm formulierte Suchanfrage durch die Suchmaschine beantwortet werden konnte. Die qualitative Einteilung der Treffer in die Qualitätsstufen und die Ausgabe der Anzahl für jede Qualitätsstufe ermöglicht es dem Benutzer, auf einen Blick zu sehen, ob seine Suchanfrage zu viele oder ggf. gar keine qualitativ hochwertigen Treffer zurückliefert.This development has the advantage that the user receives a quality statement as to whether and how many high-quality (that is to say, those that are particularly relevant for his search request) he has to expect. This is an important difference to popular search engines, as they generally give too many results and do not tell the total number of hits. The advantage of this development is in contrast to the fact that it encrypts how many hits are really good or how many hits account for the respective quality levels. From this, the user can see how well the query formulated by him could be answered by the search engine. The qualitative classification of the hits into the quality levels and the output of the number for each quality level enables the user to see at a glance whether his query returns too many or possibly no high-quality hits.
In einer anderen Weiterbildung geben die Kriterien für jede Qualitätsstufe an, wie nah zueinander mehrere Suchterme aus der Suchanfrage in einem Treffer vorkommen müssen. Alternativ geben die Kriterien für jede Qualitätsstufe ein anderes Maß an, das für die Suchanfrage in einem Treffer erfüllt sein muss.In another development, the criteria for each quality level indicate how close to each other several search terms from the search query must occur in one hit. Alternatively, the criteria for each quality level specify a different level that must be met for the search query in a hit.
Gemäß einer Ausführungsform werden die Treffer für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage ermittelt, indem mehrere Teilsuchanfragen rechnergestützt generiert werden, welche jeweils auf eine Qualitätsstufe zugeschnitten sind. Alternativ werden die Treffer für jede aus der Mehrzahl von Qualitätsstufen in der Datenbasis für die Suchanfrage ermittelt, indem eine Suchmaschine dazu programmiert ist, dies parallel für alle Qualitätsstufen durchzuführen.According to one embodiment, the hits for each of the plurality of quality levels in the search query database are determined by computationally generating a plurality of partial search queries, each tailored to a quality level. Alternatively, the hits for each of the plurality of quality levels in the database for the search query are determined by programming a search engine to do so in parallel for all quality levels.
Die Erfindung umfasst ferner einen computerlesbaren Datenträger, auf dem ein Computerprogramm gespeichert ist, welches das Verfahren ausführt, wenn es in einem Computer abgearbeitet wird. Weiterhin umfasst die Erfindung ein Computerprogramm, welches in einem Computer abgearbeitet wird und dabei das Verfahren ausführt.The invention further comprises a computer readable medium having stored thereon a computer program which executes the method when executed in a computer. Furthermore, the invention comprises a computer program which is executed in a computer and thereby carries out the method.
Im Folgenden werden Ausführungsbeispiele der Erfindung anhand von Figuren näher erläutert. Es zeigen:In the following, embodiments of the invention will be explained in more detail with reference to figures. Show it:
Die Suchanfrage
Anhand der Qualitätsstufen
Hierzu werden geforderte Wortabstände zwischen den Suchtermen in den Treffern
Die Ermittlung der Treffer
Alternativ kann das Verfahren auch direkt in einem Suchmaschinen-Kern implantiert sein, der dann dazu programmiert ist, die Treffer
Die erste Qualitätsstufe
Die zweite Qualitätsstufe
Die dritte Qualitätsstufe
Die vierte Qualitätsstufe
Die Implementierung des beschriebenen Verfahrens wird durch den Umstand vereinfacht, dass im Suchindex heutiger Suchmaschinen neben den Wörtern der einzelnen Dokumente auch die Positionen der Wörter abgelegt werden. Somit kann auf diese Information einfach zugegriffen werden. Anstelle der Wortabstände der Suchterme können auch beliebige andere Parameter, welche heutige Suchmaschinen auswerten, verwendet werden, um die Qualitätsstufen und damit die Treffer zu unterteilen.The implementation of the described method is simplified by the fact that in the search index of today's search engines in addition to the words of the individual documents and the positions of the words are stored. Thus, this information can be easily accessed. Instead of the word spacing of the search terms, any other parameters that evaluate today's search engines can be used to subdivide the quality levels and thus the hits.
Die beschriebenen Ausführungsbeispiele, Weiterbildungen, Varianten und Ausführungsformen lassen sich frei miteinander kombinieren.The described embodiments, developments, variants and embodiments can be freely combined with each other.
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010041148A DE102010041148A1 (en) | 2010-09-21 | 2010-09-21 | Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010041148A DE102010041148A1 (en) | 2010-09-21 | 2010-09-21 | Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102010041148A1 true DE102010041148A1 (en) | 2012-03-22 |
Family
ID=45768805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102010041148A Ceased DE102010041148A1 (en) | 2010-09-21 | 2010-09-21 | Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102010041148A1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6363377B1 (en) * | 1998-07-30 | 2002-03-26 | Sarnoff Corporation | Search data processor |
US7657522B1 (en) * | 2006-01-12 | 2010-02-02 | Recommind, Inc. | System and method for providing information navigation and filtration |
-
2010
- 2010-09-21 DE DE102010041148A patent/DE102010041148A1/en not_active Ceased
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6363377B1 (en) * | 1998-07-30 | 2002-03-26 | Sarnoff Corporation | Search data processor |
US7657522B1 (en) * | 2006-01-12 | 2010-02-02 | Recommind, Inc. | System and method for providing information navigation and filtration |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60004687T2 (en) | METHOD FOR THE THEMATIC CLASSIFICATION OF DOCUMENTS, MODULE FOR THE THEMATIC CLASSIFICATION AND A SEARCH ENGINE CONTAINING SUCH A MODULE | |
DE69917250T2 (en) | CHARACTER TRANSMISSION OVER HYPERLINKS | |
DE69731142T2 (en) | System for retrieving documents | |
DE69433165T2 (en) | ASSOCIATIVE TEXT SEARCH AND REINFORCEMENT SYSTEM | |
DE60118973T2 (en) | METHOD FOR INQUIRING A STRUCTURE OF COMPRESSED DATA | |
DE1499182A1 (en) | Electrical data processing system | |
DE102007037646A1 (en) | System and method for indexing, searching and retrieving databases | |
DE10215495A1 (en) | Computer system and method for research, statistical evaluation and analysis of documents | |
EP1975821A2 (en) | Method for digital storing of data on a data storage device with limited available space | |
WO2007042245A1 (en) | Search engine for carrying out a location-dependent search | |
DE112012003249T5 (en) | System, method and program for retrieving information | |
DE10028624B4 (en) | Method and device for document procurement | |
DE112010002620T5 (en) | ONTOLOGY USE FOR THE ORDER OF DATA RECORDS NACHRELEVANZ | |
EP1620810B1 (en) | Method and arrangement for establishing and updating a user surface used for accessing data pages in a data network | |
DE10048478C2 (en) | Method of accessing a storage unit when searching for substrings | |
WO2012130430A2 (en) | Method for collecting information, computer programme product and business model therefor | |
DE102010041148A1 (en) | Method for optimizing search results obtained through search engine, involves transmitting portion of data determined for selected quality level defined with criteria, that is retrieved from database | |
EP1783631A1 (en) | Search result ranking by means of relevance feedback | |
WO2011044865A1 (en) | Method for determining a similarity of objects | |
DE10057634C2 (en) | Process for processing text in a computer unit and computer unit | |
DE19952630A1 (en) | Method for generating a selection mask for the retrieval of data from a database using programmable information objects | |
DE102006043158A1 (en) | Method for determining elements of search results assigned to query in priority, involves comparing elements of data base with search criterion set comprising search criterion and assigned to updated query | |
DE102006014348A1 (en) | Dataset searching method for use in data processing system, involves determining array portion by search input in computerized manner, and implementing search of datasets in database by portion or array selection that is made for search | |
DE102018128048A1 (en) | Method and device for storing data and their relationships | |
WO2021043956A1 (en) | Method for data-matching a webpage |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |
Effective date: 20120628 |