WO2004086251A1 - Search system and method for determining information from a databank, especially the worldwide web - Google Patents

Search system and method for determining information from a databank, especially the worldwide web Download PDF

Info

Publication number
WO2004086251A1
WO2004086251A1 PCT/EP2004/002915 EP2004002915W WO2004086251A1 WO 2004086251 A1 WO2004086251 A1 WO 2004086251A1 EP 2004002915 W EP2004002915 W EP 2004002915W WO 2004086251 A1 WO2004086251 A1 WO 2004086251A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
module
result data
relevance
data
Prior art date
Application number
PCT/EP2004/002915
Other languages
German (de)
French (fr)
Inventor
Frank Meltke
Original Assignee
Frank Meltke
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Frank Meltke filed Critical Frank Meltke
Priority to EP04721889A priority Critical patent/EP1642211A1/en
Publication of WO2004086251A1 publication Critical patent/WO2004086251A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Definitions

  • the invention relates to a search system for determining ⁇ information from a database using a plurality of
  • search engines are used, especially when it comes to obtaining information from the World Wide Web
  • the 0 user is usually provided with an inquiry window via an input / output module, via which specific search or research terms can be specified.
  • the search engine searches the information base 3 of the database or the World Wide Web for suitable key words or key words.
  • the response data records found thereupon are usually 5 categorized by the respective search engine with regard to their relevance for the specified search order and made available to the user in the manner of a hit list in 7 order arranged according to their relevance. 8 9
  • a large number of such search engines have been established that 0 can differ from each other in terms of their performance, reliability and / or the 1 information base taken into account in the manner of a thematic specialization 2. Precisely because of the large number of 1 information offered during operation, for example on the World Wide Web
  • the invention is therefore based on the object of a research system for the ⁇ determination of information from a database, in particular from the world
  • the invention is based on the consideration that, in order to achieve consistently high research qualities, a plurality of alternative search engines should in principle be used, so that quality defects dependent on search questions can be compensated for alternately.
  • a plurality of search engines for a search query, it can be expected that a large number of search hits or result data sets will be generated by the whole of the search engines.
  • a relevance identifier common to all results should be assigned, so that for the user 1 understandably a systematic order of all
  • Search results can be carried out according to predefined relevance criteria.
  • the 2 prioritization parameters are advantageously selected as a function of the respective 3 search engine, so that, for example, the prioritization characteristic value stored for a specific 4 search engine can be used to determine 5 that a result data record supplied by this search engine is provided with a 6 comparatively high relevance characteristic value , 7 8
  • the user can specify the type and scope of a specific prioritization when considering the 9 search engines.
  • the so-called 1 internal prioritization can then take place on the basis of the prioritization already delivered by the 2 search engine. This will be discussed in more or an alternative advantageous embodiment of the relevance characteristic for the respective result data record, taking into account an output relevance characteristic provided by the respective search engine, determined by the integration module.
  • a normalization of output relevance parameters already supplied by the respective search engines in which the result data record considered most relevant by the respective search engine is provided with a provisional relevance parameter of, for example, 100%, the of The respective search engine already has other results data sets that are classified as comparatively less relevant, with a correspondingly graduated relevance characteristic value be that a search engine already during normalization, i.e. when forming the reference variable for the result data record considered most relevant by the respective search engine
  • a specific characteristic value is also specified, by means of which the relevance characteristic value of the result data record considered most relevant by the respective search engine is specified in a search engine-specific manner.
  • Such a search engine-specific specification makes relative weightings between individual search engines possible, in which, in particular, empirical values about the general reliability of the respective search engine and / or also subject-related or search query-dependent findings about the respective search engine can also be incorporated.
  • the integration module is designed for the joint evaluation of the result data sets supplied by the different search engines, with first converting the individual result data sets into a common and thus jointly evaluable data format.
  • the integration module is designed for the specific, from the Evaluate the respective search engine used syntax or its data format
  • the search engine-specific ⁇ data conversion can then be carried out.
  • a distribution module which has a common data format
  • the buffer memory module expediently contains
  • 25 order characteristic identification data for example an identification
  • the 9 integration module makes it possible to unambiguously assign the result 1 data records to the respective search request in the 9 integration module by using the 0 characteristic data stored in the buffer memory, so that a consolidated and 2 consistent evaluation of the incoming results is possible.
  • the distribution module is advantageously specifically designed for the incoming search order on the data side into one for the respective search engines
  • the distribution module is also advantageously connected to the second memory module, in which syntax data for the search engines are stored.
  • the distribution module 3 is connected on the input side 3 via a filter module to an input / output module, via which individual search requests can be specified by the 4 user.
  • the filter module 5 can in particular be designed to completely suppress certain search queries on the basis of adjustable or individually specifiable 6 filter criteria or, for example, to add country-specific or customer-specific individual specifications. In particular, it can also be provided to specifically use the type of request to specify individual search engines that are identified as particularly suitable for the subsequent processing of the search order.
  • the filter module can thus in particular also be designed to make a preliminary or rough selection of the search engines to be used depending on the respective search query or their thematic focus and thus to specify a rough strategy for the subsequent strategy.
  • the distribution module and the integration module can be designed as independent units, for example on a software or hardware basis.
  • a particularly compact and therefore inexpensive construction can be achieved by advantageously integrating the distribution module with the integration module into a common unit. 1 It is widespread practice, especially when doing research in the
  • an advertising material database also referred to as an “ad server”
  • results randomly selected from the banners stored there
  • the distribution and integration modules are now connected on the data side to 4 an advertising material database which, as a response data record to an incoming search query, supplies a data record which has been adapted to the search query with regard to an identification signal.
  • Advertising media database enables a targeted selection of advertising data records that are particularly suitable with regard to the identification signal, that is to say, for example, with regard to the topic being processed. Through such a targeted assignment of the advertising material data sets provided as a response signal, it is thus possible to achieve a significantly higher level of user awareness of the advertising materials used.
  • the above-mentioned object is achieved by using the above-mentioned search system by converting the result data supplied by the search engines, each of which comprises a plurality of result data sets, into a common data format, whereby 1 then using a memory module
  • the integration module thus provides for
  • the prioritization parameters are advantageously selected as a function of the respective search engine, the relevance parameter being determined in an alternative 1 or additional advantageous development for the respective result data record 2, taking into account an output relevance parameter 3 provided by the respective search engine.
  • a search request received in the common data format is advantageously converted for each selected search engine into its specific data format and then output to it.
  • a search request specified via an input / output module is subjected to filtering before it is processed further.
  • a search request is advantageously output to an advertising material database, an answer data record coming from the latter being assigned to the respective search query by means of an identification signal.
  • the identification signal makes it possible, in particular, to adapt the response data record to the respective search query with regard to predefinable criteria, for example with regard to the content or topics used, so that the user is offered a suitable advertising medium together with his search results.
  • search engine-specific data such as, for example, syntax data
  • a targeted addressing of different types of search engines with a common 1 search query is made possible, whereby a consolidated common evaluation of the results 3 provided by the addressed search engines 3 is also possible, taking into account their specific syntax.
  • Fig. 1 shows schematically a search system for determining
  • FIG. 2 shows a conceptual illustration of the search system according to FIG. 1,
  • FIG. 3 shows a schematic list of the processes running in the search system according to FIG. 1,
  • FIG. 4 shows an alternative representation for the overall system according to FIG. 1,
  • FIG. 5 schematically shows the structure of the administration of the search system according to FIG. 1,
  • FIG. 6 shows a diagram for a request to a plurality of search engines
  • 7 shows a diagram for a distributed query and merging of the results
  • FIG. 8 shows a diagram for different search modes in the search system according to FIG. 1,
  • FIG. 10 shows a schematic representation of the modules used in the search system according to FIG. 1,
  • FIG. 11 schematically shows the structure of a filter / interpreter module
  • 16 is a flowchart for processing a search request
  • Fig. 17 is a flowchart for the preparation of adapters for a search request.
  • FIG. 18 shows a diagram for an admin application of the search system according to FIG. 1.
  • the research system 1 according to FIG. 1 is used to determine information from a complex database, in particular from the Internet, the World Wide Web or another index, designed with particularly high search quality.
  • the search system 1 is connected on the data side to a plurality of search engines 2, as are currently widely used for targeted searches of the Internet.
  • the search system 1 comprises, in a central evaluation unit 4, an integration module 6 to which the hit lists or result data supplied by the search engines 2 can be supplied in the form of result data records E.
  • the integration module 6 ensures that a common, consistently prioritized evaluation of the result data records E provided by the different search engines 2 is made possible.
  • the integration module 6 is designed to first convert the incoming result data records E into a common data format, so that a consolidated evaluation is possible.
  • the consolidated prioritization and relevance identification of the individual result data records E is provided, whereby according to predefined relevance criteria, all result data records E are assigned comparable relevance characteristic values.
  • the integration module 6 is connected to a memory module 8 in which prioritization parameters P relevant for the assignment of the relevance parameters are stored.
  • the search engines 2 selected according to the specifications by a user or by an operator are fundamentally provided with a comparatively high prioritization and thus a comparatively high relevance value.
  • the prioritization parameters are selected as a function of the respective search engine 2.
  • the result data records E supplied by a search engine 2 can be provided in terms of their normalization in the manner of a normalization 1 first of all to standardize the relevance parameter on the result data record E,
  • a relative prioritization of the result data records E 1 of different search engines 2 takes place essentially on the basis of their relative 2 relevance with regard to the result data record E 4 most relevant by the respective search engine 2.
  • a search engine-specific characteristic value can also be stored in the prioritization parameters P, which parameter generally or as a function of the respective search query assigns an s reliability characteristic value to the respective search engine 2.
  • the evaluation unit 4 further comprises a distribution module 10, which communicates with the integration module 6 via a buffer memory 12.
  • the distribution module 10 is also connected to a second memory module 14, in which data records characteristic of the search engines 2, in particular characteristic of their data format or syntax, are stored.
  • the distribution module 10 is connected via a filter module 16 to an input / output module 18, which in turn is connected to the integration module 6 on the input side.
  • the input / output module 18 can in particular be designed as a conventional operating unit, comprising a keyboard and an output means such as a screen.
  • this query is first filtered in the 1 filter module 16. For example, the elimination of search queries
  • the search query 2 filtered in this way is then fed to the 0 distribution module 10, which, using the search engine-specific information stored in the second 1 storage module and 2 in particular syntax parameters, converts the respective search query into a multitude of 3 individualized search queries in the data formats suitable for the selected search engines 2 4 implements.
  • the distribution module 10 s then forwards the individualized search inquiries to the selected search engines 2, 6, a profile of the search query being stored in the buffer memory 12 in the manner of logging and to simplify administration, together with an identifier identifying it.
  • the search engines 2 started by supplying the individualized search query then complete their search program on the World Wide Web and provide their response signals, for example in the form of hit lists, in which the result data found are listed as result data records E according to the relevance recognized by the respective search engine 2 are. Based on the characteristic identification data for the respective search query, the result data records E are then reassigned to the respective search query in the integration module 6, so that a targeted evaluation is made possible even in the case of time-overlapping searches.
  • the integration module 6 also converts the result data records E into the common data format, possibly also using the syntax information stored in the second memory module 14. 1 Then takes place using the ones stored in the memory module 8
  • 11 can also be one of the respective
  • Search engine 2 provided output relevance parameter taken into account
  • the research system 1 is connected on the data side to an advertising material database 20.
  • the advertising media database too
  • advertising server advertising elements are stored in the form of so-called “banners”, which are processed by the advertising material database 20 in response to
  • the search system 1 is designed such that the
  • FIG. 2 illustrates the components and actuators involved in relation to the (sub) system limits.
  • Customer "Customer” is any user who can start a search.
  • TSC Filtermanager The role of "TSC Filtermanager" describes the group of employees in whose area of responsibility the filter definitions are located. This group of employees also evaluates the statistical logging of the research system.
  • TSC Admin The role of the "Admin” describes the group of employees who are responsible for the operation of the research system. They administer the configuration file (tsc.cfg) of the research system and monitor the error logs (tsc_error.log).
  • the search results of the Pay4Performance (P4P) server are provided here.
  • the interface of the GoTo search center is included via HTTP request (included
  • results are delivered in XML format.
  • the interface of the FAST search center is addressed via HTTP request (including parameters).
  • the results are delivered in XML format.
  • the ad server delivers an advertising component that is incorporated into the overall presentation of the search results.
  • TSC configuration The configuration of the search system is controlled via parameters that are stored in a separate file.
  • This configuration file is in XML format stored in the file system of the search center. It can be edited using a standard editor.
  • the changed configuration can only be achieved with the restart of the "TSC search" processes.
  • TSC configuration describes the necessary steps for the administration of the configuration file of the research system.
  • TSC exclusion filter 0
  • the TSC exclusion filter defines words and phrases for which a search string, 1 if it is contained in it, is blocked for certain channels. These 2 closures are country-specific and can be defined depending on the time. 3
  • the filters are usually maintained using a separate application (the TSC Admin 4 application).
  • the file of the TSC exclusion filter is the 5 product of an export from the "Filter DB" and is available in CSV format. This 6 file can be edited with a standard editor if necessary. 7
  • the modified filter can only be activated with the restart the "TSC s Search" processes. The following steps are defined for the "Maintain TSC exclusion filter" process:
  • the "TSC Restart” process can be started manually or automatically by other scripts, such as in the context of filter activation.
  • the "Process TSC search query” process is the central process that is implemented by the research system.
  • the statistics file can be viewed using a text editor or imported into other programs because the file is in CSV format. Evaluation of TSC error log
  • the error log can be viewed using a text editor.
  • FIG. 4 describes the rough relationships between the actors and use cases involved in the search system (TSC).
  • TSC configuration "TSC Admin" has the option of viewing and changing the configuration of the search center stored in an XML file. To do this, he uses the Admin Tool, which runs on a separate computer that is not part of the productive environment. In order for a changed configuration to take effect, the individual processes must be restarted.
  • the administration of the research system shown schematically in FIG. 5 contains various actions. This includes changing the exclusion filter and activating the changes. To activate it, a script is started that copies the current configuration to the computers of the production system. In the diagram, the computers of the production system are at the lower right corner 1 to see. The administrator himself appears as a "worker" and appears here on the left
  • TSC Filtermanager maintains the words that should be excluded from the search. These words can be defined per country (portal) as well as restricted in time.
  • the search system (TSC) ⁇ After changing the exclusion filter, the search system (TSC) ⁇ must be restarted so that the changes can take effect.
  • TSC Restart 5 The search center is restarted using the admin tool. All processes on all computers involved in the search center are terminated and restarted in an orderly manner. A restart is necessary for changes to the exclusion filter or the configuration to take effect.
  • Use case Edit search query
  • the "customer" enters his search expression in the search mask of the input / output system. This can consist of several words linked with AND, OR and NOT operators.
  • This search expression is sent to the server Engine interpreted by this, adapted to the requirements of the various (sometimes external) search engines and sent to them themselves, taking into account configurable timeouts, the various search results are then integrated into an overall view and returned to the customer's browser.
  • the "TSC Filter Manager” can use a text editor to view the search terms and processing times.
  • the evaluator should be provided with options that are still subject to an ad hoc standard evaluation
  • the "TSC Admin" can view the error messages stored in a text file using a text editor.
  • FIG. 7 shows schematically the sequence of a distributed query with subsequent
  • search engine incoming search results.
  • a search result must be within
  • Error handling takes over the logging of error states in a 4 error file.
  • 5 "Prioritize” weights the 6 results provided by the different search engines according to certain business rules.
  • 7 Error-treated and prioritized search results are "integrated into results page 8" converted into the desired output format.
  • the user / customer has two search options. With “simple searches” the user can enter one or more search terms and possibly search operators, which must correspond to the FAST-CGI syntax.
  • search the user can first select the type of web content they are looking for (website, image, music, etc.). Depending on the content type, customized search options are then available.
  • the filter or interpreter shown schematically in FIG. 9 receives the current "query string" in addition to the configuration data.
  • This character string contains parameters and the search query of the user.
  • the search query is modified in accordance with the filter rules of the respective system (search engine).
  • search engine Another step is built a complete URL for the search engine from the respective "query strings” and some parameters. This URL is in the above. Diagram identifiable as "target_URL”.
  • Adapter classes exist in the interpreter and integrator, each of which is tailored to exactly one target system. All adapter classes have a static and a dynamic part. The static part is represented by configuration data. The dynamic part depends on the search query.
  • the BRISBANE interpreter module contains, as shown in FIG. 11, classes which serve to filter and otherwise prepare the search queries. In general it can be said that the interpreter provides the basic data for the integrator. The functionality of the filtering is strongly dependent on the target system (search engine) and is hidden in the corresponding adapter classes. 2 module integrator
  • Request class An instance of the Request class is generated for each request to a target system. 0
  • These objects represent the communication interface between the search center and 1 target systems. 2
  • Communication with the target systems is managed by RequestManager 3. However, he is not responsible for the presentation of the results.
  • Server Engine module This module, shown in FIG. 13 by its classes, represents the main process of the search center. It has an instance of the "Configuration" class, which enables access to all configuration data. Within the process, configuration data is stored in different structures, such as AdapterMap. The server engine is also for instantiating the interpreter and integrator as well as the orderly one Ending the process (when a signal arrives) The Logging class is responsible for logging errors and statistical data.
  • FIG. 14 shows the dynamic behavior of the individual components and the flow of information between them.
  • the query is adapted to the syntax of the search engines involved.
  • the modified search terms are now sent to the search engines e.
  • the format of the returned results may be
  • the channels correspond to the previously mentioned channels and represent a very specific target system.
  • Each individual adapter s modifies the original search query using the corresponding filter rules. This query and other parameters are for generating
  • the Fast-CGI program contains a function "main ()". This is called by the web server. A prerequisite for the proper functioning of the program is correct initialization and entry into the waiting loop. The configuration is kept in a file The complete path of this file is specified via an environment variable.
  • the search center is configured using a single file (tsc.cfg). This file is located on a separate computer that is not used as a production computer.
  • the configuration file serves as a template for all configuration files per computer in the production environment. If the configuration changes (eg: Modification of the directory for the statistical files), the configuration file is modified on the computer outside the production system and copied to all computers in the production system using a script. 1 Format of the filter table
  • This filter file has entries line by line, within a line the values e are separated by a semicolon.
  • a line is structured as follows (values in Q are optional): ⁇ country code; word or phrase to be filtered; [Start date]; time of day
  • the configuration and filter table are activated by starting scripts.
  • the name of the statistics file is specified in the configuration file (tsc.cfg), e.g. B. tsc_statistics_ ⁇ PID>. ⁇ PID> is then replaced by the process ID during operation. Since several processes are running at the same time, there are accordingly many log files.
  • All statistics files are in a central directory. These statistics files are saved in CSV format. There is a separate process for evaluation, which is due to the large data volume a specially set up server should run.
  • the search processes either write their data directly to the evaluation server or the evaluation process collects the statistical data of all search processes at regular intervals.
  • the statistics file consists of 4 basic columns and another 4 columns are added for each real channel.
  • the XSL stylesheets are used within the search center to convert the 4 responses in XML form into an HTML page in accordance with the current 5 layout specifications.
  • the data for a website are transferred to the 6 stylesheets in XML or through stylesheet parameters.
  • the ⁇ search results are prepared in HTML and the links for scrolling forward and back 9 are generated. According to the default settings, the appropriate tab structure created above the search results and the advertising banners or the form for the new search.

Abstract

The aim of the invention is to create a search system and a method for determining information from a databank, especially the worldwide web, which are particularly suitable for obtaining a constantly high search quality. Said aim is achieved by jointly and/or simultaneously using a plurality of search engines (2), an integration module (6) converting the result data that is supplied by the search engines (2) and comprises a plurality of sets of result data (E) into a common data format while a relevant parameter is assigned to each set of result data (E) in said integration module (6) by reverting to prioritizing parameters (P) stored in a memory module (14).

Description

Beschreibung description
Recherchensystem und Verfahren zur Ermittlung von Informationen aus einerResearch system and method for determining information from a
5 Datenbank, insbesondere aus dem World-Wide-Web5 Database, in particular from the World Wide Web
66
7 Die Erfindung bezieht sich auf ein Recherchensystem zur Ermittlung von β Informationen aus einer Datenbank unter Nutzung einer Mehrzahl vonThe invention relates to a search system for determining β information from a database using a plurality of
9 Suchmaschinen. Sie betrifft weiter ein Verfahren zur Ermittlung von Informationen9 search engines. It also relates to a method for determining information
10 aus einer Datenbank, insbesondere aus dem World-Wide-Web, unter Nutzung10 from a database, in particular from the World Wide Web, using
11 eines derartigen Recherchensystems.11 of such a research system.
1212
13 In komplexen Datenbanken oder auch im weltumspannenden Computemetz u („World-Wide-Web") wird eine enorme Menge an Informationen bereitgehalten,13 An enormous amount of information is available in complex databases or in the global computer network u ("World Wide Web"),
15 die ein Benutzer zu Recherchezwecken mehr oder weniger gezielt abrufen kann.15 which a user can access more or less specifically for research purposes.
16 Um dabei Informationen aus der großen Informationsmenge heraus gezielt16 In order to target information from the large amount of information
17 nutzbar machen zu können, kommen so genannte Suchmaschinen zum Einsatz, is die gerade bei der Informationsbeschaffung aus dem World-Wide-Web teilweiseIn order to be able to make use of it, so-called search engines are used, especially when it comes to obtaining information from the World Wide Web
19 erhebliche Verbreitung erfahren haben. Bei derartigen Suchmaschinen wird dem 0 Benutzer üblicherweise über ein Ein-/Ausgabemodul ein Anfragenfenster zur Ver- 1 fügung gestellt, über das gezielte Such- oder Recherchebegriffe vorgegeben wer- 2 den können. Anschließend durchsucht die Suchmaschine die Informationsbasis 3 der Datenbank bzw. des World-Wide-Web nach geeigneten Schlüssel- oder Key- Wörtern. Die daraufhin aufgefundenen Antwortdatensätze werden üblicherweise 5 von der jeweiligen Suchmaschine hinsichtlich ihrer Relevanz für den vorgegebe- 5 nen Suchauftrag kategorisiert und dem Benutzer in der Art einer Trefferliste in 7 nach ihrer Relevanz geordneter Reihenfolge zur Verfügung gestellt. 8 9 Zwischenzeitlich haben sich eine Vielzahl derartiger Suchmaschinen etabliert, die 0 sich hinsichtlich ihrer Leistungsfähigkeit, Zuverlässigkeit und/oder der 1 berücksichtigten Informationsbasis in der Art einer thematischen Spezialisierung 2 voneinander unterscheiden können. Gerade weil aber aufgrund der Vielzahl der 1 beispielsweise im World-Wide-Web angebotenen Informationen beim Betrieb19 have experienced considerable distribution. In such search engines, the 0 user is usually provided with an inquiry window via an input / output module, via which specific search or research terms can be specified. The search engine then searches the information base 3 of the database or the World Wide Web for suitable key words or key words. The response data records found thereupon are usually 5 categorized by the respective search engine with regard to their relevance for the specified search order and made available to the user in the manner of a hit list in 7 order arranged according to their relevance. 8 9 In the meantime, a large number of such search engines have been established that 0 can differ from each other in terms of their performance, reliability and / or the 1 information base taken into account in the manner of a thematic specialization 2. Precisely because of the large number of 1 information offered during operation, for example on the World Wide Web
2 einer derartigen Suchmaschine eine gewisse Schwerpunktbildung oder 2 such a search engine a certain focus or
3 Spezialisierung einzelner Suchmaschinen erforderlich sein kann, kann die Qualität 3 Specialization of individual search engines may be necessary, the quality
4 der Suchergebnisse abhängig von der vorgegebenen Suchanfrage für einzelne s Suchmaschinen in gewissen Bandbreiten variieren.4 of the search results vary depending on the given search query for individual s search engines within certain ranges.
66
7 Der Erfindung liegt daher die Aufgabe zugrunde, ein Recherchensystem zur β Ermittlung von Informationen aus einer Datenbank, insbesondere aus dem World-7 The invention is therefore based on the object of a research system for the β determination of information from a database, in particular from the world
9 Wide-Web, anzugeben, das zur Erzielung einer gleichbleibend hohen 0 Recherchequalität im besonderem Maße zur gemeinsamen und/oder 1 gleichzeitigen Nutzung einer Mehrzahl von Suchmaschinen besonders geeignet 2 ist. Des Weiteren soll ein Verfahren zur Ermittlung von Informationen aus einer 3 Datenbank, insbesondere aus dem World-Wide-Web, unter Nutzung eines 4 derartigen Recherchensystems angegeben werden. 5 6 Bezüglich des Recherchensystems wird diese Aufgabe erfindungsgemäß gelöst mit einem Integrationsmodul, das die von den Suchmaschinen gelieferten, jeweils eine Mehrzahl von Ergebnisdatensätzen umfassenden Ergebnisdaten in ein gemeinsames Datenformat konvertiert und anschließend unter Rückgriff auf in einem im Speichermodul hinterlegte Priorisierungsparameter jedem Ergebnisdatensatz einen Relevanzkennwert zuordnet.9 Wide-Web, to be specified, which is particularly suitable for achieving a consistently high search quality, 0 particularly suitable for the common and / or 1 simultaneous use of a plurality of search engines 2. Furthermore, a method for determining information from a 3 database, in particular from the World Wide Web, is to be specified using a 4 such research system. With regard to the research system, this object is achieved according to the invention with an integration module which converts the result data supplied by the search engines, each comprising a plurality of result data records, into a common data format and then assigns a relevance characteristic value to each result data record using a prioritization parameter stored in the memory module.
Die Erfindung geht dabei von der Überlegung aus, dass zur Erreichung gleichbleibend hoher Recherchequalitäten grundsätzlich eine Mehrzahl von alternativen Suchmaschinen eingesetzt werden sollte, so dass suchfragenabhängige Qualitätsmängel wechselweise ausgeglichen werden können. Gerade beim Einsatz einer Mehrzahl von Suchmaschinen für eine Suchanfrage ist jedoch damit zu rechnen, dass eine große Vielzahl an Recherchetreffern oder Ergebnisdatensätzen von der Gesamtheit der Suchmaschinen generiert wird. Für eine benutzerfreundliche und gezielte Auswertung dieser Ergebnisse sollte eine allen Ergebnissen gemeinsame Relevanzkennung vergeben werden, so dass in für den Benutzer 1 nachvollziehbarerweise eine systematische Ordnung sämtlicherThe invention is based on the consideration that, in order to achieve consistently high research qualities, a plurality of alternative search engines should in principle be used, so that quality defects dependent on search questions can be compensated for alternately. However, especially when using a plurality of search engines for a search query, it can be expected that a large number of search hits or result data sets will be generated by the whole of the search engines. For a user-friendly and targeted evaluation of these results, a relevance identifier common to all results should be assigned, so that for the user 1 understandably a systematic order of all
2 Rechercheergebnisse nach vorgegebenen Relevanzkriterien erfolgen kann.2 Search results can be carried out according to predefined relevance criteria.
3 Insbesondere sollte dabei ermöglicht sein, die nach vorgegebenen Kriterien als3 In particular, it should be possible to use the
4 relevantes! erachteten Ergebnisse zuerst zu präsentieren, so dass der Benutzer s sich auf die wesentlichen Rechercheergebnisse konzentrieren kann. Um dies zu β ermöglichen, ist zunächst die Konvertierung der eingehenden Datensätze in ein gemeinsames Datenformat vorgesehen, so dass eine gemeinsame s Datenauswertung und -strukturierung ermöglicht wird. Anschließend ist die4 relevant! present the considered results first, so that the user can concentrate on the essential research results. In order to make this possible, the conversion of the incoming data records into a common data format is initially provided, so that a common data evaluation and structuring is made possible. Then the
9 Gliederung der aufgefundenen Ergebnisdatensätze im Sinne einer gemeinsamen9 Structure of the found result data records in the sense of a common
10 Relevanzstruktur vorgesehen. Diese Funktion der Zusammenfügung und Konso-10 relevance structure provided. This function of merging and conso-
11 lidierung von Ergebnisdatensätzen aus verschiedenen Quellen wird durch das11 Validation of result data records from different sources is supported by the
12 Integrationsmodul erfüllt.12 Integration module fulfilled.
1313
14 Die hierarchische Kategorisierung der aufgefundenen Ergebnisdatensätze durch is Zuordnung eines spezifischen Relevanzkennwerts kann dabei nach vom Benutzer14 The hierarchical categorization of the found result data sets by assigning a specific relevance characteristic can be done by the user
16 oder einem Betreiber vorgegebenen Priorisierungskriterien erfolgen. Insbesondere16 or prioritization criteria given to an operator. In particular
17 könnte vorgesehen sein, bei der Auswertung der gelieferten Ergebnisse bestimmte ten Suchmaschinen generell und standardisiert eine erhöhte Relevanz zuzuord-17 it could be provided that certain search engines are generally and standardizedly assigned a higher relevance when evaluating the results delivered.
19 nen, beispielsweise weil für einen bestimmten Typus einer Suchanfrage bekannt19 NEN, for example because it is known for a certain type of search query
20 ist, dass bestimmte Suchmaschinen in der Regel vergleichsweise hohe20 is that certain search engines tend to be comparatively high
21 Recherchequalität liefern. Um dies zu ermöglichen, sind die 2 Priorisierungsparameter vorteilhafterweise abhängig von der jeweiligen 3 Suchmaschine gewählt, so dass beispielsweise anhand des für eine bestimmte 4 Suchmaschine hinterlegten Priorisierungskennwerts festgestellt werden kann, 5 dass ein von dieser Suchmaschine gelieferter Ergebnisdatensatz mit einem 6 vergleichsweise hohen Relevanzkennwert versehen wird. 7 8 Die Vorgabe einer spezifischen Priorisierung bei der Berücksichtigung der 9 Suchmaschinen kann dabei vom Benutzer nach Art und Umfang vorgegeben sein. 0 Innerhalb der von einer Suchmaschine gelieferten Ergebnisdatensätze kann die 1 so genannte interne Priorisierung anschließend auf der Grundlage der von der 2 Suchmaschine bereits gelieferten Priorisierung erfolgen. Dazu wird in weiterer oder alternativer vorteilhafter Ausgestaltung der Relevanzkennwert für den je- weiligen Ergebnisdatensatz unter Berücksichtigung eines von der jeweiligen Suchmaschine bereitgestellten Ausgangsrelevanzkennwerts vom Integrationsmodul ermittelt.21 Deliver search quality. To make this possible, the 2 prioritization parameters are advantageously selected as a function of the respective 3 search engine, so that, for example, the prioritization characteristic value stored for a specific 4 search engine can be used to determine 5 that a result data record supplied by this search engine is provided with a 6 comparatively high relevance characteristic value , 7 8 The user can specify the type and scope of a specific prioritization when considering the 9 search engines. 0 Within the result data records delivered by a search engine, the so-called 1 internal prioritization can then take place on the basis of the prioritization already delivered by the 2 search engine. This will be discussed in more or an alternative advantageous embodiment of the relevance characteristic for the respective result data record, taking into account an output relevance characteristic provided by the respective search engine, determined by the integration module.
Dabei kann insbesondere in der Art einer „dynamischen Priorisierung" eine Nor- malisierung von den jeweiligen Suchmaschinen bereits mitgelieferter Ausgangsrelevanzkennwerte vorgesehen sein, bei der der von der jeweiligen Suchmaschine als relevantest angesehene Ergebnisdatensatz mit einem vorläufigen Relevanzkennwert von beispielsweise 100 % versehen wird, wobei die von der jeweiligen Suchmaschine bereits als vergleichsweise weniger relevant eingestuften weiteren Ergebnisdatensätze mit einem entsprechend abgestuften Relevanzkennwert versehen werden. Bei dieser Art der Auswertung und Priorisierung ist somit in der Art einer Gleichberechtigung sämtlicher eingesetzter Suchmaschinen ein direkter Quervergleich einzelner Ergebnisdatensätze ermöglicht. Zusätzlich oder alternativ kann aber auch vorgesehen sein, dass bereits bei der Normalisierung, also bei der Bildung der Bezugsgröße für den von der jeweiligen Suchmaschine als relevantest angesehenen Ergebnisdatensatz, ein suchmaschinenspezifischer Kennwert mit vorgegeben wird, durch den der Relevanzkennwert des von der jeweiligen Suchmaschine als relevantest angesehenen Ergebnisdatensatzes suchmaschinenspezifisch vorgegeben wird. Durch eine derartige suchmaschinenspezifische Vorgabe sind somit Relativwichtungen zwischen einzelnen Suchmaschinen möglich, in die insbesondere auch Erfahrungswerte über die generelle Zuverlässigkeit der jeweiligen Suchmaschine und/oder auch themen- oder suchanfragenabhängige Erkenntnisse über die jeweilige Suchmaschine mit einfließen können.In this case, in particular in the manner of a “dynamic prioritization”, a normalization of output relevance parameters already supplied by the respective search engines can be provided, in which the result data record considered most relevant by the respective search engine is provided with a provisional relevance parameter of, for example, 100%, the of The respective search engine already has other results data sets that are classified as comparatively less relevant, with a correspondingly graduated relevance characteristic value be that a search engine already during normalization, i.e. when forming the reference variable for the result data record considered most relevant by the respective search engine A specific characteristic value is also specified, by means of which the relevance characteristic value of the result data record considered most relevant by the respective search engine is specified in a search engine-specific manner. Such a search engine-specific specification makes relative weightings between individual search engines possible, in which, in particular, empirical values about the general reliability of the respective search engine and / or also subject-related or search query-dependent findings about the respective search engine can also be incorporated.
Das Integrationsmodul ist zur gemeinsamen Auswertung der von den verschiedenen Suchmaschinen gelieferten Ergebnisdatensätzen ausgelegt, wobei zunächst eine Konvertierung der einzelnen Ergebnisdatensätze in ein gemeinsames und somit gemeinsam auswertbares Datenformat vorgesehen ist. Dazu ist das Integrationsmodul dafür ausgelegt, die spezifische, von der 1 jeweiligen Suchmaschine eingesetzte Syntax oder deren Datenformat auswertenThe integration module is designed for the joint evaluation of the result data sets supplied by the different search engines, with first converting the individual result data sets into a common and thus jointly evaluable data format. For this purpose, the integration module is designed for the specific, from the Evaluate the respective search engine used syntax or its data format
2 und gegebenenfalls umwandeln zu können. Um dies zu ermöglichen, ist das2 and convert if necessary. To make this possible
3 Integrationsmodul vorteilhafterweise mit einem zweiten Speichermodul3 integration module advantageously with a second memory module
4 verbunden, in dem Syntaxdaten für die einzelnen Suchmaschinen hinterlegt sind.4 connected in which syntax data for the individual search engines are stored.
5 Anhand dieser Syntaxdaten kann sodann die suchmaschinenspezifische β Datenkonvertierung vorgenommen werden. 5 Using this syntax data, the search engine-specific β data conversion can then be carried out.
77
8 In weiterer vorteilhafter Ausgestaltung ist zusätzlich zum Integrationsmodul auch8 In a further advantageous embodiment, in addition to the integration module
9 ein Distributionsmodul vorgesehen, das einen im gemeinsamen Datenformat9 a distribution module is provided, which has a common data format
10 eingehenden Suchauftrag geeignet auf die einzelnen zum Einsatz vorgesehenen10 incoming search order suitable for the individual intended for use
11 Suchmaschinen aufteilt. Dazu ist das Distributionsmodul, das zweckmäßigerweise11 search engines split. This is the distribution module, which is convenient
12 über ein gemeinsames Pufferspeichermodul mit dem Integrationsmodul12 via a common buffer memory module with the integration module
13 kommuniziert, vorteilhafterweise dafür ausgelegt, den jeweiligen Suchauftrag13 communicates, advantageously designed for the respective search order
14 geeignet in eine für die jeweilige Suchmaschine verarbeitbare Syntax oder ein is entsprechendes Datenformat umzuwandeln.14 suitable for converting into a syntax that can be processed for the respective search engine or an appropriate data format.
1616
17 Um eine zuverlässige Zuordnung der gelieferten Ergebnisse zum jeweiligen Such- ιβ auftrag auch dann zu ermöglichen, wenn in enger zeitlicher Reihenfolge eine ver-17 In order to enable a reliable assignment of the delivered results to the respective search order even if a
19 gleichsweise große Vielzahl an Suchaufträgen zu bearbeiten ist, was insbesonde-19 equally large number of search orders has to be processed, which in particular
20 re bei unterschiedlichen Reaktionszeiten der Suchmaschine zu unterschiedlichen20 re with different response times of the search engine to different
21 Wartezeiten auf die Ergebnisse und somit zu zeitlichem Überlapp zwischen ver-21 waiting times for the results and thus overlap in time between different
22 schiedenen Suchaufträgen führen könnte, ist dem Integrationsmodul und dem22 different search requests could be the integration module and the
23 Distributionsmodul vorteilhafterweise ein gemeinsames Pufferspeichermodul zu- 4 geordnet. Im Pufferspeichermodul werden zweckmäßigerweise für jeden Such-23 distribution module advantageously assigned a common buffer memory module. The buffer memory module expediently contains
25 auftrag charakteristische Identifikationsdaten, beispielsweise eine Identifikations-25 order characteristic identification data, for example an identification
26 kennummer, hinterlegt, wobei die einzelnen, an die Suchmaschinen direkt ausge- gebenen spezifizierten Suchaufträge mit einer entsprechenden Kennnummer ver- β sehen sind. Bei den von den Suchmaschinen gelieferten Antworten ist dann im 9 Integrationsmodul durch einen Rückgriff auf die im Pufferspeicher hinterlegten 0 charakteristischen Identifikationsdaten eine eindeutige Zuordnung der Ergebnis- 1 datensätze zum jeweiligen Suchauftrag ermöglicht, so dass eine konsolidierte und 2 konsistente Auswertung der eingehenden Ergebnisse ermöglicht ist. Das Distributionsmodul ist vorteilhafterweise spezifisch dafür ausgelegt, den eingehenden Suchauftrag datenseitig in eine für die jeweiligen Suchmaschinen26 ID number, deposited, whereby the individual specified search orders directly output to the search engines are provided with a corresponding ID number. In the answers provided by the search engines, the 9 integration module then makes it possible to unambiguously assign the result 1 data records to the respective search request in the 9 integration module by using the 0 characteristic data stored in the buffer memory, so that a consolidated and 2 consistent evaluation of the incoming results is possible. The distribution module is advantageously specifically designed for the incoming search order on the data side into one for the respective search engines
4 verarbeitbares Datenformat oder eine Syntax zu konvertieren. Dazu ist auch das s Distributionsmodul vorteilhafterweise mit dem zweiten Speichermodul verbunden, e in dem Syntaxdaten für die Suchmaschinen hinterlegt sind. Durch gezielte4 convertible data format or syntax to convert. For this purpose, the distribution module is also advantageously connected to the second memory module, in which syntax data for the search engines are stored. Through targeted
7 Wartung und Pflege des zweiten Speichermoduls ist somit auf besondere Weise β ermöglicht, gegebenenfalls Aktualisierungen der von den Suchmaschinen7 Maintenance and care of the second memory module is thus made possible in a special way, possibly updates by the search engines
9 verwendeten Syntax oder auch die Hinzufügung oder Löschung vollständiger 0 Suchmaschinen auf besonders einfache Weise vorzunehmen. 1 2 In weiterer vorteilhafter Ausgestaltung ist das Distributionsmodul eingangsseitig 3 über ein Filtermodul mit einem Ein-/Ausgabemodul verbunden, über das vom 4 Benutzer einzelne Suchaufträge vorgebbar sind. Das Filtermodul kann dabei 5 insbesondere dafür ausgelegt sein, anhand einstellbarer oder individuell 6 vorgebbarer Filterkriterien bestimmte Suchanfragen ganz zu unterdrücken oder beispielsweise länder- oder kundenspezifische Individualvorgaben hinzuzufügen. Dabei kann insbesondere auch vorgesehen sein, anhand der Art der Anfrage gezielt einzelne, als besonders geeignet erkannte Suchmaschinen für die nachfolgende Bearbeitung des Suchauftrags vorzugeben. Das Filtermodul kann somit insbesondere auch dafür ausgelegt sein, abhängig von der jeweiligen Suchanfrage oder von deren thematischem Schwerpunkt eine Vor- oder Grobauswahl der einzusetzenden Suchmaschinen zu treffen und somit eine Grobstrategie für die nachfolgende Strategie vorzugeben.9 used syntax or the addition or deletion of complete 0 search engines in a particularly simple manner. 1 2 In a further advantageous embodiment, the distribution module 3 is connected on the input side 3 via a filter module to an input / output module, via which individual search requests can be specified by the 4 user. The filter module 5 can in particular be designed to completely suppress certain search queries on the basis of adjustable or individually specifiable 6 filter criteria or, for example, to add country-specific or customer-specific individual specifications. In particular, it can also be provided to specifically use the type of request to specify individual search engines that are identified as particularly suitable for the subsequent processing of the search order. The filter module can thus in particular also be designed to make a preliminary or rough selection of the search engines to be used depending on the respective search query or their thematic focus and thus to specify a rough strategy for the subsequent strategy.
Grundsätzlich können das Distributionsmodul und das Integrationsmodul als eigenständige Einheiten, beispielsweise auf Software- oder auf Hardwarebasis, ausgeführt sein. Eine besonders kompakte und somit günstige Bauweise ist dabei erreichbar, indem das Distributionsmodul vorteilhafterweise mit dem Integrationsmodul in eine gemeinsame Einheit integriert ist. 1 Es ist weit verbreitete Praxis, gerade bei der Durchführung von Recherchen imIn principle, the distribution module and the integration module can be designed as independent units, for example on a software or hardware basis. A particularly compact and therefore inexpensive construction can be achieved by advantageously integrating the distribution module with the integration module into a common unit. 1 It is widespread practice, especially when doing research in the
2 Internet oder World-Wide-Web, dass dem Benutzer gemeinsam mit den auf seine2 Internet or World-Wide-Web that the user shares with those on his
3 Suchanfrage hin generierten Trefferlisten Werbeanzeigen, so genannte3 search results for hit lists generated advertisements, so-called
4 „Banners", mit angezeigt werden. Dabei werden in Reaktion auf eine Suchanfrage4 "banners" appear with. In response to a search query
5 von einem auch als „Ad-Server" bezeichneten Werbemitteldatenbank gemeinsam e mit den Ergebnissen zufällig aus den dort hinterlegten Banners ausgewählte5 from an advertising material database, also referred to as an “ad server”, together with the results, randomly selected from the banners stored there
7 Datensätze mit übermittelt, die anschließend auf dem Ein-/Ausgabemodul zur s Anzeige gebracht werden. Bei einem derartigen System erfolgt die Hinzufügung7 data records are also transmitted, which are then displayed on the input / output module. With such a system, the addition is made
9 der individuellen Banners jedoch üblicherweise unspezifiziert und insbesondere 0 ohne Bezug auf das vom Benutzer durch die Suchanfrage vorgegebene Thema, 1 so dass das Benutzerinteresse am jeweiligen Werbemittel nur vergleichsweise 2 gering ist. In besonders vorteilhafter Weiterbildung des oben genannten Systems 3 sind jedoch nunmehr das Distributions- und das Integrationsmodul datenseitig mit 4 einer Werbemitteldatenbank verbunden, die als Antwortdatensatz auf eine s eingehende Suchanfrage einen hinsichtlich eines Kennungssignals an die Suchanfrage angepassten Datensatz liefert. Mit anderen Worten: Aufgrund der ohnehin vorgesehenen, vergleichsweise qualifizierten Auswertung der vorgegebenen Suchanfrage, die über die entsprechende Konvertierung im Distributionsmodul ermöglicht wird, ist nunmehr die Erzeugung einer beispielsweise inhalts- oder themenbezogenen Kennung für die Suchanfrage ermöglicht, die bei einer Weiterleitung der Suchanfrage auf die Werbemitteldatenbank eine gezielte Selektion von hinsichtlich des Kennungssignals, also beispielsweise hinsichtlich des bearbeiteten Themas, besonders geeigneten Werbedatensatzes ermöglicht. Durch eine derartige gezielte Zuordnung der als Antwortsignal mitgegebenen Werbemitteldatensätze ist somit eine deutlich erhöhte Aufmerksamkeit beim Benutzer gegenüber der eingesetzten Werbemittel erreichbar.9 of the individual banners, however, usually unspecified and in particular 0 without reference to the topic specified by the user through the search query, 1 so that the user interest in the respective advertising medium is only comparatively low 2. In a particularly advantageous development of the above-mentioned system 3, however, the distribution and integration modules are now connected on the data side to 4 an advertising material database which, as a response data record to an incoming search query, supplies a data record which has been adapted to the search query with regard to an identification signal. In other words: Due to the already provided, comparatively qualified evaluation of the given search query, which is made possible by the corresponding conversion in the distribution module, it is now possible to generate, for example, a content-related or subject-related identifier for the search query, which is forwarded to the query when the search query is forwarded Advertising media database enables a targeted selection of advertising data records that are particularly suitable with regard to the identification signal, that is to say, for example, with regard to the topic being processed. Through such a targeted assignment of the advertising material data sets provided as a response signal, it is thus possible to achieve a significantly higher level of user awareness of the advertising materials used.
Bezüglich des Verfahrens wird die genannte Aufgabe unter Nutzung des genannten Recherchensystems gelöst, indem die von den Suchmaschinen gelieferten, jeweils eine Mehrzahl von Ergebnisdatensätzen umfassenden Ergebnisdaten in ein gemeinsames Datenformat konvertiert werden, wobei 1 anschließend unter Rückgriff auf in einem Speichermodul hinterlegteWith regard to the method, the above-mentioned object is achieved by using the above-mentioned search system by converting the result data supplied by the search engines, each of which comprises a plurality of result data sets, into a common data format, whereby 1 then using a memory module
2 Priorisierungsparameter jedem Ergebnisdatensatz ein Relevanzkenn wert2 prioritization parameters each result data set a relevance value
3 zugeordnet wird. Über das Integrationsmodul ist somit vorgesehen, für die3 is assigned. The integration module thus provides for
4 gelieferten Ergebnisdatensätze ein konsolidiertes und konsistentes s Relevanzsystem zu erzeugen, in dem die einzelnen Ergebnisdatensätze relativ e zueinander im Hinblick auf vorgegebene Relevanzkriterien geeignet positioniert sind.4 delivered result data sets to generate a consolidated and consistent s relevance system in which the individual result data sets are suitably positioned relative to one another with regard to predefined relevance criteria.
88th
9 Vorteilhafterweise werden die Priorisierungsparameter dabei abhängig von der 0 jeweiligen Suchmaschine gewählt, wobei der Relevanzkennwert in alternativer 1 oder zusätzlicher vorteilhafter Weiterbildung für den jeweiligen Ergebnisdatensatz 2 unter Berücksichtigung eines von der jeweiligen Suchmaschine bereitgestellten 3 Ausgangsrelevanzkennwerts ermittelt wird. 4 s Vorteilhafterweise wird ein im gemeinsamen Datenformat eingehender Suchauftrag für jede ausgewählte Suchmaschine in deren spezifisches Datenformat umgewandelt und anschließend an diese ausgegeben. In alternativer oder zusätzlicher vorteilhafter Ausgestaltung wird ein über ein Ein-/Ausgabemodul vorgegebener Suchauftrag vor seiner weiteren Bearbeitung einer Filterung unterzogen.9 The prioritization parameters are advantageously selected as a function of the respective search engine, the relevance parameter being determined in an alternative 1 or additional advantageous development for the respective result data record 2, taking into account an output relevance parameter 3 provided by the respective search engine. 4 s A search request received in the common data format is advantageously converted for each selected search engine into its specific data format and then output to it. In an alternative or additional advantageous embodiment, a search request specified via an input / output module is subjected to filtering before it is processed further.
Vorteilhafterweise wird ein Suchauftrag zusätzlich zu den Suchmaschinen an eine Werbemitteldatenbank ausgegeben, wobei ein von dieser eingehender Antwortdatensatz mittels eines Kennungssignals der jeweiligen Suchanfrage zugeordnet wird. Durch das Kennungssignal ist dabei insbesondere ermöglicht, den Antwortdatensatz hinsichtlich vorgebbarer Kriterien, beispielsweise hinsichtlich verwendeter Inhalte oder Themen, an die jeweilige Suchanfrage anzupassen, so dass im Ergebnis dem Benutzer gemeinsam mit seinen Suchergebnissen ein thematisch zur Suchanfrage passender Werbeträger angeboten wird. 1 Die mit der Erfindung erzielten Vorteile bestehen insbesondere darin, dass durchIn addition to the search engines, a search request is advantageously output to an advertising material database, an answer data record coming from the latter being assigned to the respective search query by means of an identification signal. The identification signal makes it possible, in particular, to adapt the response data record to the respective search query with regard to predefinable criteria, for example with regard to the content or topics used, so that the user is offered a suitable advertising medium together with his search results. 1 The advantages achieved by the invention are in particular that
2 die Verwendung des Integrationsmoduls, dass eingehende Ergebnisdatensätze 2 the use of the integration module that incoming result records
3 auf ein gemeinsames Datenformat konvertiert und anschließend eine relative3 converted to a common data format and then a relative one
4 Gewichtung und Priorisierung der Ergebnisdatensätze untereinander durch4 Weighting and prioritization of the result data sets among themselves
5 Vergabe eines „globalen" Relevanzkennwerts eine konsistente gemeinsame e Nutzung einer Mehrzahl von Suchmaschinen ermöglicht ist. Durch das mit dem5 Allocation of a "global" relevance characteristic enables consistent, shared use by a number of search engines
7 Integrationsmodul kommunizierende Distributionsmodul ist weiterhin s gewährleistet, dass unter Rückgriff auf im Speichermodul hinterlegte,7 distribution module communicating with the integration module, it is also guaranteed that, using the data stored in the memory module,
9 suchmaschinenspezifische Daten wie beispielsweise Syntaxdaten eine gezielte 0 Ansprache verschiedenartiger Suchmaschinen mit einer gemeinsamen 1 Suchanfrage ermöglicht ist, wobei ebenso eine konsolidierte gemeinsame 2 Auswertung der von den angesprochenen Suchmaschinen gelieferten Ergebnisse 3 unter Berücksichtigung von deren spezifischer Syntax ermöglicht ist.9 search engine-specific data such as, for example, syntax data, a targeted addressing of different types of search engines with a common 1 search query is made possible, whereby a consolidated common evaluation of the results 3 provided by the addressed search engines 3 is also possible, taking into account their specific syntax.
Ein Ausführungsbeispiel der Erfindung wird anhand einer Zeichnung näher erläutert. Darin zeigen:An embodiment of the invention is explained in more detail with reference to a drawing. In it show:
Fig. 1 schematisch ein Recherchensystem zur Ermittlung vonFig. 1 shows schematically a search system for determining
Informationen aus einer Datenbank,Information from a database,
Fig. 2 eine konzeptionelle Darstellung des Recherchensystems nach Fig. 1 ,2 shows a conceptual illustration of the search system according to FIG. 1,
Fig. 3 eine schematische Aufstellung der im Recherchensystem nach Fig. 1 ablaufenden Prozesse,3 shows a schematic list of the processes running in the search system according to FIG. 1,
Fig. 4 eine alternative Darstellung für das Gesamtsystem nach Fig. 1 ,4 shows an alternative representation for the overall system according to FIG. 1,
Fig. 5 schematisch die Struktur der Administration des Recherchensystems nach Fig. 1 ,5 schematically shows the structure of the administration of the search system according to FIG. 1,
Fig. 6 ein Schema für eine Antrage an eine Mehrzahl von Suchmaschinen, Fig. 7 ein Schema für eine verteilte Abfrage und Zusammenführung der Ergebnisse,6 shows a diagram for a request to a plurality of search engines, 7 shows a diagram for a distributed query and merging of the results,
Fig. 8 ein Schema für verschiedene Suchmodi im Recherchensystem nach Fig. 1 ,8 shows a diagram for different search modes in the search system according to FIG. 1,
Fig. 9 ein Schema für eine Filterung von Suchanfragen,9 shows a scheme for filtering search queries,
Fig. 10 eine schematische Darstellung der im Recherchensystem nach Fig. 1 verwendeten Module,10 shows a schematic representation of the modules used in the search system according to FIG. 1,
Fig. 11 schematisch eine Darstellung der Struktur eines Filter- /Interpretermoduls,11 schematically shows the structure of a filter / interpreter module,
Fig. 12 schematisch eine Struktur eines Integrationsmoduls,12 schematically shows a structure of an integration module,
Fig. 13 schematisch die Struktur eines Server-Engine-Moduls,13 schematically shows the structure of a server engine module,
Fig. 14 schematisch ein dynamisches Model für einen Suchprozess,14 schematically shows a dynamic model for a search process,
Fig. 15 ein Ablaufschema für eine Initialisierung einer Server-Engine,15 shows a flow chart for an initialization of a server engine,
Fig. 16 ein Ablaufschema für die Bearbeitung einer Suchanfrage,16 is a flowchart for processing a search request,
Fig. 17 ein Ablaufschema für die Vorbereitung von Adaptern für eine Suchanfrage, undFig. 17 is a flowchart for the preparation of adapters for a search request, and
Fig. 18 ein Schema für eine Admin-Anwendung des Recherchensystems nach Fig. 1.18 shows a diagram for an admin application of the search system according to FIG. 1.
Das Recherchensystem 1 gemäß Fig. 1 ist zur Ermittlung von Informationen aus einer komplexen Datenbank, insbesondere aus dem Internet, dem World-Wide- Web oder einem anderen Index, mit besonders hoher Recherchenqualität ausgelegt. Dazu ist das Recherchensystem 1 datenseitig mit einer Mehrzahl von Suchmaschinen 2 verbunden, wie die derzeit zur gezielten Durchsuchung des Internets weit verbreitet im Einsatz sind.The research system 1 according to FIG. 1 is used to determine information from a complex database, in particular from the Internet, the World Wide Web or another index, designed with particularly high search quality. For this purpose, the search system 1 is connected on the data side to a plurality of search engines 2, as are currently widely used for targeted searches of the Internet.
Um dabei den gleichzeitigen und gemeinsamen Einsatz einer Mehrzahl von Such- maschinen 2 zu ermöglichen, umfasst das Recherchensystem 1 in einer zentralen Auswerteeinheit 4 ein Integrationsmodul 6, dem die von den Suchmaschinen 2 gelieferten Trefferlisten oder Ergebnisdaten in Form von Ergebnisdatensätzen E zuführbar sind. Das Integrationsmodul 6 stellt dabei sicher, dass eine gemeinsame, konsistent priorisierte Auswertung der von den verschiedenen Suchmaschinen 2 gelieferten Ergebnisdatensätze E ermöglicht ist.In order to enable the simultaneous and joint use of a plurality of search engines 2, the search system 1 comprises, in a central evaluation unit 4, an integration module 6 to which the hit lists or result data supplied by the search engines 2 can be supplied in the form of result data records E. The integration module 6 ensures that a common, consistently prioritized evaluation of the result data records E provided by the different search engines 2 is made possible.
Dazu ist das Integrationsmodul 6 dazu ausgelegt, die eintreffende Ergebnisdatensätze E zunächst in ein gemeinsames Datenformat zu konvertieren, so dass eine konsolidierte Auswertung ermöglicht ist. Um dem Benutzer dabei eine gezielte Auswertung der möglicherweise großen Anzahl von Informationen zu ermöglichen, ist die konsolidierte Priorisierung und Relevanzkennung der einzelnen Ergebnisdatensätze E vorgesehen, wobei nach vorgegebenen Relevanzkriterien sämtlichen Ergebnisdatensätzen E untereinander vergleichbare Relevanzkennwerte zugeordnet werden. Um dies zu ermöglichen, ist das Integrationsmodul 6 mit einem Speichermodul 8 verbunden, in dem für die Zuweisung der Relevanzkennwerte relevante Priorisierungsparameter P hinterlegt sind.For this purpose, the integration module 6 is designed to first convert the incoming result data records E into a common data format, so that a consolidated evaluation is possible. In order to enable the user to specifically evaluate the possibly large amount of information, the consolidated prioritization and relevance identification of the individual result data records E is provided, whereby according to predefined relevance criteria, all result data records E are assigned comparable relevance characteristic values. To make this possible, the integration module 6 is connected to a memory module 8 in which prioritization parameters P relevant for the assignment of the relevance parameters are stored.
Bei der Priorisierung kann insbesondere vorgesehen sein, die nach Vorgabe durch einen Benutzer oder durch einen Betreiber ausgewählte Suchmaschinen 2 grundsätzlich mit einer vergleichsweise hohen Priorisierung und somit einem vergleichsweise hohen Relevanzkennwert zu versehen. In diesem Fall erfolgt die Wahl der Priorisierungsparameter abhängig von der jeweiligen Suchmaschine 2. Alternativ oder zusätzlich kann vorgesehen sein, in der Art einer Normalisierung die von einer Suchmaschine 2 gelieferten Ergebnisdatensätze E hinsichtlich ihres 1 Relevanzkennwerts zunächst auf denjenigen Ergebnisdatensatz E zu normieren,In the prioritization, it can in particular be provided that the search engines 2 selected according to the specifications by a user or by an operator are fundamentally provided with a comparatively high prioritization and thus a comparatively high relevance value. In this case, the prioritization parameters are selected as a function of the respective search engine 2. Alternatively or additionally, the result data records E supplied by a search engine 2 can be provided in terms of their normalization in the manner of a normalization 1 first of all to standardize the relevance parameter on the result data record E,
2 der bereits von der jeweiligen Suchmaschine 2 aus mit dem höchsten2 the one with the highest search engine 2
3 Relevanzkennwert versehen wurde. In der Art einer prozentualen Darstellung3 relevance parameter was provided. In the manner of a percentage
4 könnte dies somit bedeuten, dass der von der jeweiligen Suchmaschine 2 als am s relevantesten erkannte Ergebnisdatensatz E mit einem vorläufigen Relevanzkenn- s wert von 100 % versehen wird, wobei die anderen Ergebnisdatensätze E dieser4, this could thus mean that the s value is provided of 100% of the respective engine 2 as at the relevantesten s recognized result data set E with a preliminary Relevanzkenn-, the other result records E of this
7 Suchmaschine 2 entsprechend ihrem von der Suchmaschine 2 zugewiesenen β Ausgangsrelevanzkennwert einen entsprechend abgestaffelten Relevanzkennwert7 Search engine 2, according to its β output relevance characteristic value assigned by the search engine 2, a correspondingly graduated relevance characteristic value
9 erhalten. Wenn dies für sämtliche Suchmaschinen 2 gleichgewichtig durchgeführt 0 wird, erfolgt somit eine relative Priorisierung der Ergebnisdatensätze E 1 unterschiedlicher Suchmaschinen 2 im Wesentlichen anhand ihrer relativen 2 Relevanz im Hinblick auf den von der jeweiligen Suchmaschine 2 als am 3 relevantesten eingestuften Ergebnisdatensatz E. 4 5 Zusätzlich kann bei den Priorisierungsparametern P aber auch ein 6 suchmaschinenspezifischer Kennwert hinterlegt sein, der allgemein oder abhängig von der jeweiligen Suchanfrage der jeweiligen Suchmaschine 2 einen s Verlässlichkeitskennwert zuordnet.9 received. If this is carried out equally for all search engines 2, a relative prioritization of the result data records E 1 of different search engines 2 takes place essentially on the basis of their relative 2 relevance with regard to the result data record E 4 most relevant by the respective search engine 2. 4 5 In addition 6, however, a search engine-specific characteristic value can also be stored in the prioritization parameters P, which parameter generally or as a function of the respective search query assigns an s reliability characteristic value to the respective search engine 2.
Die Auswerteeinheit 4 umfasst weiterhin ein Distributionsmodul 10, das über einen Pufferspeicher 12 mit dem Integrationsmodul 6 kommuniziert. Das Distributionsmodul 10 ist weiterhin mit einem zweiten Speichermodul 14 verbunden, in dem für die Suchmaschinen 2 charakteristische Datensätze, insbesondere charakteristisch für deren Datenformat oder Syntax, hinterlegt sind. Eingangsseitig ist das Distributionsmodul 10 über ein Filtermodul 16 mit einem Ein-/Ausgabemodul 18 verbunden, das seinerseits eingangsseitig mit dem Integrationsmodul 6 verbunden ist. Das Ein-/Ausgabemodul 18 kann dabei insbesondere als herkömmliche Bedieneinheit, umfassend eine Tastatur und ein Ausgabemittel wie einen Bildschirm, ausgestaltet sein.The evaluation unit 4 further comprises a distribution module 10, which communicates with the integration module 6 via a buffer memory 12. The distribution module 10 is also connected to a second memory module 14, in which data records characteristic of the search engines 2, in particular characteristic of their data format or syntax, are stored. On the input side, the distribution module 10 is connected via a filter module 16 to an input / output module 18, which in turn is connected to the integration module 6 on the input side. The input / output module 18 can in particular be designed as a conventional operating unit, comprising a keyboard and an output means such as a screen.
Bei der Bearbeitung einer vom Benutzer über das Ein-/Ausgabemodul 18 vorgegebenen Suchanfrage erfolgt zunächst eine Filterung dieser Anfrage im 1 Filterbaustein 16. Dabei kann beispielsweise die Eliminination von SuchanfragenWhen a search query specified by the user via the input / output module 18 is processed, this query is first filtered in the 1 filter module 16. For example, the elimination of search queries
2 eines bestimmten Kriterium vorgesehen sein oder es können beispielsweise2 of a certain criterion can be provided, or for example
3 länder- oder regionenspezifische Vorgaben für die Bearbeitung der Suchanfrage3 country or region-specific requirements for processing the search query
4 berücksichtigt werden. Des Weiteren erfolgt im Filtermodul 16 eine Vorauswahl4 are taken into account. Furthermore, a pre-selection takes place in the filter module 16
5 der für die jeweiligen Suchanfragen als geeignet erkannten Suchmaschinen 2, so e dass das Filtermodul 16 in der Art einer Grobstrategie bereits die mit der5 of the search engines 2 recognized as suitable for the respective search queries, so that the filter module 16 already acts in the manner of a rough strategy with the
7 Suchanfrage endgültig zu betrauenden Suchmaschinen 2 mit vorgibt.7 Search query to be entrusted to search engines 2.
8 g Die solchermaßen gefilterte Suchanfrage 2 wird anschließend dem 0 Distributionsmodul 10 zugeführt, das unter Rückgriff auf die im zweiten 1 Speichermodul hinterlegten suchmaschinenspezifischen Informationen und 2 insbesondere Syntaxkennwerte die jeweilige Suchanfrage in eine Vielzahl 3 individualisierter Suchanfragen in den für die ausgewählten Suchmaschinen 2 4 passenden Datenformate umsetzt. Anschließend gibt das Distributionsmodul 10 s die individualisierten Suchanfragen an die ausgewählten Suchmaschinen 2 weiter, 6 wobei in der Art einer Protokollierung und zur Verwaltungserleichterung im Pufferspeicher 12 ein Profil der Suchanfrage gemeinsam mit einer diese identifizierenden Kennung hinterlegt wird.8 g The search query 2 filtered in this way is then fed to the 0 distribution module 10, which, using the search engine-specific information stored in the second 1 storage module and 2 in particular syntax parameters, converts the respective search query into a multitude of 3 individualized search queries in the data formats suitable for the selected search engines 2 4 implements. The distribution module 10 s then forwards the individualized search inquiries to the selected search engines 2, 6, a profile of the search query being stored in the buffer memory 12 in the manner of logging and to simplify administration, together with an identifier identifying it.
Die durch die Zuführung der individualisierten Suchanfrage gestarteten Suchmaschinen 2 absolvieren anschließend ihr Suchprogramm im World-Wide- Web und stellen ihre Antwortsignale, beispielsweise in Form von Trefferlisten, in denen die aufgefundenen Ergebnisdaten als Ergebnisdatensätze E nach der durch die jeweilige Suchmaschine 2 erkannten Relevanz geordnet aufgelistet sind. Anhand der charakteristischen Identifikationsdaten für die jeweilige Suchanfrage werden die Ergebnisdatensätze E sodann im Integrationsmodul 6 der jeweiligen Suchanfrage wieder zugeordnet, so dass eine gezielte Auswertung auch bei zeitlich sich überschneidenden Suchvorgängen ermöglicht ist.The search engines 2 started by supplying the individualized search query then complete their search program on the World Wide Web and provide their response signals, for example in the form of hit lists, in which the result data found are listed as result data records E according to the relevance recognized by the respective search engine 2 are. Based on the characteristic identification data for the respective search query, the result data records E are then reassigned to the respective search query in the integration module 6, so that a targeted evaluation is made possible even in the case of time-overlapping searches.
Im Integrationsmodul 6 erfolgt zudem, gegebenenfalls ebenfalls unter Rückgriff auf die im zweiten Speichermodul 14 hinterlegten Syntaxinformationen, eine Konvertierung der Ergebnisdatensätze E in das gemeinsame Datenformat. 1 Anschließend erfolgt unter Rückgriff auf die im Speichermodul 8 hinterlegtenThe integration module 6 also converts the result data records E into the common data format, possibly also using the syntax information stored in the second memory module 14. 1 Then takes place using the ones stored in the memory module 8
2 Priorisierungsparameter P die Erzeugung eines Relevanzkennwerts für jeden 2 prioritization parameters P the generation of a relevance parameter for each
3 Ergebnisdatensatz E, wobei die solchermaßen erzeugten Relevanzkennwerte3 result data set E, the relevance parameters generated in this way
4 dazu dienen sollen, eine konsolidierte und konsistente Ergebnishierarchie s zwischen den Ergebnisdatensätzen E herzustellen. Im Ergebnis wird somit dem e Benutzer eine homogenisierte Ergebnis- oder Trefferliste erzeugt, bei der die als4 should serve to create a consolidated and consistent result hierarchy s between the result data records E. As a result, a homogenized result or hit list is generated for the user, in which the as
7 relevantest erkannten Ergebnisdatensätze E zuerst gelistet sind. Die Zuordnung a des jeweiligen Relevanzkennwerts unter Rückgriff auf die Priorisierungsparameter7 most relevant recognized result data records E are listed first. The assignment a of the relevant relevance parameter using the prioritization parameters
9 P kann dabei insbesondere im Hinblick auf die jeweilige Suchmaschine 2 erfolgen,9 P can take place in particular with regard to the respective search engine 2,
10 die den betroffenen Ergebnisdatensatz E geliefert hat. Alternativ oder zusätzlich10 which has delivered the relevant result data record E. Alternatively or additionally
11 kann bei der Zuordnung des Relevanzkennwerts auch ein von der jeweiligenWhen assigning the relevance parameter, 11 can also be one of the respective
12 Suchmaschine 2 bereitgestellter Ausgangsrelevanzkennwert mit berücksichtigt12 Search engine 2 provided output relevance parameter taken into account
13 werden.13 will be.
14 is Zusätzlich zu den Suchmaschinen 2 ist das Recherchensystem 1 datenseitig mit ιe einer Werbemitteldatenbank 20 verbunden. In der Werbemitteldatenbank, auchIn addition to the search engines 2, the research system 1 is connected on the data side to an advertising material database 20. In the advertising media database, too
1 als „Ad-Server" bezeichnet, sind in Form von so genannten „Banners" ιa Werbeelemente hinterlegt, die von der Werbemitteldatenbank 20 in Reaktion auf1 referred to as “ad server”, advertising elements are stored in the form of so-called “banners”, which are processed by the advertising material database 20 in response to
19 eine eingehende Suchanfrage an das Recherchensystem 1 zurückgeliefert19 an incoming search query is returned to the research system 1
20 werden. Das Recherchensystem 1 ist dabei derart ausgestaltet, dass dieTo be 20. The search system 1 is designed such that the
21 Werbemitteldatenbank 20 ausgewählte und spezifizierte Werbeelemente als21 advertising material database 20 selected and specified advertising elements as
22 Antwortdatensatz auf eine eingehende Suchanfrage zurücksendet, wobei die22 Returns the response record to an incoming search request, the
23 Auswahl und Spezifikation inhalts- oder themenbezogen angepasst an die23 Selection and specification adapted to the content or topic
24 jeweilige Suchanfrage erfolgt. Die Auswahl der zurückgesandten Werbeelemente24 respective search queries occurred. The selection of the returned advertising elements
25 erfolgt dabei dahingehend, dass das jeweilige Werbeelement inhaltlich oder25 takes place in such a way that the respective advertising element or
26 thematisch einen Bezug zur Suchanfrage aufweist, so dass mit einem26 thematically related to the search query, so that with a
27 vergleichsweise erhöhtem Interesse des Benutzers an dem jeweiligen27 comparatively increased interest of the user in the respective
∑β Werbeelement gerechnet werden kann. Zu diesem Zweck übermittelt das∑β advertising element can be expected. For this purpose, the
29 Recherchensystem 1 die jeweilige Suchanfrage gemeinsam mit einem29 Research system 1 together with a search query
30 Kennungssignal an die Werbemitteldatenbank 20, wobei anhand des30 identifier signal to the advertising material database 20, based on the
31 mitgelieferten Kennungssignals die Auswahl möglicherweise für den31 supplied identification signal the selection for the
32 Antwortdatensatz geeigneter Werbeelemente vorgenommen wird. Fig. 2 verdeutlicht die beteiligten Komponenten und Aktoren im Bezug auf die (Sub)Systemgrenzen.32 response data record suitable advertising elements. Fig. 2 illustrates the components and actuators involved in relation to the (sub) system limits.
Rollenbeschreibungrole Description
Kunde „Kunde" ist jeder Benutzer, der eine Suchanfrage starten kann.Customer "Customer" is any user who can start a search.
TSC Filtermanager Die Rolle „TSC Filtermanager" beschreibt den Mitarbeiterkreis, in dessen Verantwortungsbereich die Filterdefinitionen liegen. Dieser Mitarbeiterkreis wertet außerdem die Statistikprotokollierung des Recherchensystems aus.TSC Filtermanager The role of "TSC Filtermanager" describes the group of employees in whose area of responsibility the filter definitions are located. This group of employees also evaluates the statistical logging of the research system.
TSC Admin Die Rolle des „Admin" beschreibt den Mitarbeiterkreis, der für den Betrieb des Recherchensystems verantwortlich ist. Er administriert die Konfigurationsdatei (tsc.cfg) des Recherchensystems und überwacht die Fehlerprotokolle (tsc_error.log).TSC Admin The role of the "Admin" describes the group of employees who are responsible for the operation of the research system. They administer the configuration file (tsc.cfg) of the research system and monitor the error logs (tsc_error.log).
Beschreibung der externen SystemeDescription of the external systems
Inhalte Kurzbeschreibung Hier werden Suchergebnisse bereitgestellt, die auf private und Business-Homepa- ges zeigen. Schnittstelle Die Schnittstelle ist analog zur WWW-Suche mit Fast. P4P-ServerContents Brief description Here, search results are provided that point to private and business homepages. Interface The interface is analogous to the WWW search with Fast. P4P server
KurzbeschreibungSummary
Die Suchergebnisse des Pay4Performance(P4P)-Servers werden hier bereitgestellt.The search results of the Pay4Performance (P4P) server are provided here.
Schnittstelleinterface
Die Schnittstelle des GoTo-Suchcenters wird per HTTP-Request (inklusiveThe interface of the GoTo search center is included via HTTP request (included
Parameter) angesprochen. Die Ergebnisse werden in XML-Format geliefert.Parameters) addressed. The results are delivered in XML format.
FAST SuchcenterFAST search center
Kurzbeschreibung Hier werden internet-weite Suchergebnisse bereitgestellt, die mittels der Suchmaschine „AIITheWeb" gefunden wurden.Brief description Internet-wide search results are provided here, which were found using the "AIITheWeb" search engine.
Schnittstelle Die Schnittstelle des FAST-Suchcenters wird per HTTP-Request (inklusive Parameter) angesprochen. Die Ergebnisse werden in XML-Format geliefert.Interface The interface of the FAST search center is addressed via HTTP request (including parameters). The results are delivered in XML format.
Ad-ServerAd Server
Kurzbeschreibung Der Ad-Server liefert entsprechend der Suchanfrage eine Werbe-Komponente, die in die Gesamtdarstellung der Suchergebnisse einfließt.Brief description According to the search query, the ad server delivers an advertising component that is incorporated into the overall presentation of the search results.
Recherchensystem ProzesseResearch system processes
In Fig. 3 werden die Prozesse des Recherchensystem in der Übersicht dargestellt und der Prozessdurchlauf im „Gut"-Fall beschrieben.In Fig. 3, the processes of the search system are shown in an overview and the process run in the "good" case is described.
TSC Konfiguration Die Konfiguration des Recherchensystem wird über Parameter gesteuert, die in einer eigenen Datei abgelegt sind. Diese Konfigurationsdatei wird im XML-Format im Dateisystem des Suchcenters abgelegt. Sie kann mit Hilfe eines Standard-Editors bearbeitet werden.TSC configuration The configuration of the search system is controlled via parameters that are stored in a separate file. This configuration file is in XML format stored in the file system of the search center. It can be edited using a standard editor.
Die geänderte Konfiguration kann nur mit Hilfe des Restarts der „TSC Suche" Prozesse erreicht werden.The changed configuration can only be achieved with the restart of the "TSC search" processes.
Der Prozess „TSC Konfiguration" beschreibt die notwendigen Arbeitsschritte für die Administration der Konfigurationsdatei des Recherchensystem.The process "TSC configuration" describes the necessary steps for the administration of the configuration file of the research system.
Rolle AktivitätenRole activities
1. Konfiguration (tsc.cfg) editieren1. Edit the configuration (tsc.cfg)
E α 2. Konfiguration (tsc.cfg) auf alle Produktionssysteme verteilen <E α 2. Distribute configuration (tsc.cfg) to all production systems <
OO
3. „TSC Restart" Prozess durchführen3. Carry out the "TSC restart" process
I-I-
g TSC Ausschlussfilter pflegen 0 Die TSC Ausschlussfilter definieren Worte und Phrasen für die ein Suchstring, 1 wenn sie in diesem enthalten sind, für bestimmte Kanäle gesperrt wird. Diese 2 Sperrungen sind landesspezifisch und können zeitabhängig definiert werden. 3 Gewöhnlich werden die Filter mit Hilfe einer eigenen Anwendung (der TSC Admin 4 Anwendung) gepflegt. Letztendlich ist die Datei der TSC Ausschlussfilter das 5 Produkt eines Exports aus der „Filter DB" und liegt im CSV-Format vor. Diese 6 Datei kann ggf. mit einem Standardeditor bearbeitet werden. 7 Die Aktivierung der geänderten Filter kann nur mit Hilfe des Restart der „TSC s Suche" Prozesse erreicht. Folgende Arbeitsschritte werden für den Prozess „TSC Ausschlussfilter pflegen" definiert:
Figure imgf000020_0001
g Maintain TSC exclusion filter 0 The TSC exclusion filter defines words and phrases for which a search string, 1 if it is contained in it, is blocked for certain channels. These 2 closures are country-specific and can be defined depending on the time. 3 The filters are usually maintained using a separate application (the TSC Admin 4 application). Ultimately, the file of the TSC exclusion filter is the 5 product of an export from the "Filter DB" and is available in CSV format. This 6 file can be edited with a standard editor if necessary. 7 The modified filter can only be activated with the restart the "TSC s Search" processes. The following steps are defined for the "Maintain TSC exclusion filter" process:
Figure imgf000020_0001
TSC RestartTSC restart
Der „TSC Restart" Prozess kann manuell oder automatisch durch andere Skripte, wie z. B. im Kontext der Filteraktivierung, gestartet werden.The "TSC Restart" process can be started manually or automatically by other scripts, such as in the context of filter activation.
Rolle AktivitätenRole activities
1. tsc_restart.sh starten ω1. Start tsc_restart.sh ω
03 a. Starten des tsc_restart.sh auf allen Produktionssystemen c o03 a. Start tsc_restart.sh on all production systems c o
E i. Ermitteln der PIDs aller Prozesse „TSC Suche"E i. Determination of the PIDs of all processes "TSC search"
E ωE ω
-o •=-o • =
< u- ii. Sukzessive, zeitversetztes Senden des kill Signals an<u- ii. Successive, time-delayed sending of the kill signal to
O OO O
U) V) alle ProzesseU) V) all processes
I- r-I- r-
Die „fast-cgi" Umgebung des Apache Web-Servers sorgt automatisch für das Neustarten der vorkonfigurierten Anzahl „TSC Suche" Prozesse. TSC Suchanfrage bearbeitenThe "fast-cgi" environment of the Apache web server automatically restarts the preconfigured number of "TSC search" processes. Edit TSC search query
Der Prozess „TSC Suchanfrage bearbeiten" ist der zentrale Prozess, der durch das Recherchensystem realisiert wird.The "Process TSC search query" process is the central process that is implemented by the research system.
Der folgende Ablauf skizziert diesen Prozesses auf hoher Ebene. Detailliert wird dieser Ablauf später im Dokument.The following procedure outlines this process at a high level. This process will be detailed later in the document.
Figure imgf000021_0001
Figure imgf000021_0001
Auswertung TSC StatistikEvaluation of TSC statistics
Die Statistikdatei kann mittels eines Texteditors eingesehen werden oder in andere Programme importiert werden, da die Datei im CSV-Format vorliegt. Auswertung TSC FehlerprotokollThe statistics file can be viewed using a text editor or imported into other programs because the file is in CSV format. Evaluation of TSC error log
Mittels eines Texteditors kann das Fehlerprotokoll eingesehen werden.The error log can be viewed using a text editor.
Figure imgf000022_0001
Figure imgf000022_0001
TSC PlattformAnalysemodellTSC platform analysis model
Use-Case-Diagramm, GrobanalyseUse case diagram, rough analysis
Fig. 4 beschreibt die groben Zusammenhänge der am Recherchensystem (TSC) beteiligten Akteure und Anwendungsfälle.FIG. 4 describes the rough relationships between the actors and use cases involved in the search system (TSC).
Use-Case: TSC Konfiguration Der „TSC Admin" erhält die Möglichkeit, die in einer XML-Datei abgelegte Konfiguration des Suchcenters einzusehen und zu verändern. Dazu bedient er das Admin-Tool, das auf einem separaten, nicht zur Produktivumgebung gehörenden Rechner läuft. Damit eine geänderte Konfiguration wirksam wird, ist ein Neustart der einzelnen Prozesse notwendig.Use case: TSC configuration "TSC Admin" has the option of viewing and changing the configuration of the search center stored in an XML file. To do this, he uses the Admin Tool, which runs on a separate computer that is not part of the productive environment. In order for a changed configuration to take effect, the individual processes must be restarted.
Business Process DiagrammBusiness process diagram
Die in Fig. 5 schematisch dargestellte Administration des Recherchensystems be- inhaltet verschiedene Aktionen. Dazu zählen die Änderungen der Ausschlussfilter und das Aktivieren der Änderungen. Zur Aktivierung wird ein Script angestoßen, das die aktuelle Konfiguration auf die Rechner des Produktivsystems kopiert. Im Diagramm sind die Rechner des Produktivsystems an der unteren rechten Ecke 1 zu sehen. Der Administrator selbst tritt als „worker" auf und erscheint hier linksThe administration of the research system shown schematically in FIG. 5 contains various actions. This includes changing the exclusion filter and activating the changes. To activate it, a script is started that copies the current configuration to the computers of the production system. In the diagram, the computers of the production system are at the lower right corner 1 to see. The administrator himself appears as a "worker" and appears here on the left
2 oben im Diagramm.2 at the top of the diagram.
3 Use-Case: TSC Ausschlussfilter pflegen 3 Use case: Maintain TSC exclusion filter
4 Der „TSC Filtermanager" pflegt die Wörter, die von der Suche ausgeschlossen s werden sollen. Diese Wörter können pro Land (Portal) als auch zeitlich e eingeschränkt definiert werden.4 The "TSC Filtermanager" maintains the words that should be excluded from the search. These words can be defined per country (portal) as well as restricted in time.
7 Nach Änderung der Ausschlussfilter ist jeweils das Recherchensystem (TSC) β neuzustarten, damit die Änderungen aktiv werden können.7 After changing the exclusion filter, the search system (TSC) β must be restarted so that the changes can take effect.
9 Use-Case: Konfiguration und Filter aktivieren 0 Die Konfiguration wird mit Hilfe des Admin-Tools vom Admin-Rechner auf alle am 1 Suchcenter beteiligten Rechner übertragen und dann ein Neustart des Systems 2 durchgeführt. Durch einen Neustart werden u. a. neue Prozesse gestartet, die 3 während ihrer Initialisierung die aktuelle Konfiguration und die Filtertabellen laden. 9 Use case: Activate configuration and filter 0 The configuration is transferred from the admin computer to all computers involved in the 1 search center using the admin tool and system 2 is then restarted. Restarting starts, among other things, new processes that 3 load the current configuration and the filter tables during their initialization.
4 Use-Case: TSC Restart 5 Das Suchcenter wird mit Hilfe des Admin-Tools neu gestartet. Dabei werden alle Prozesse auf allen am Suchcenter beteiligten Rechnern geordnet beendet und neugestartet. Ein Neustart ist notwendig, damit Änderungen der Ausschlussfilter oder der Konfiguration wirksam werden.4 Use case: TSC Restart 5 The search center is restarted using the admin tool. All processes on all computers involved in the search center are terminated and restarted in an orderly manner. A restart is necessary for changes to the exclusion filter or the configuration to take effect.
Use-Case: Suchanfrage bearbeiten Der „Kunde" gibt in der Suchmaske des Ein-/Ausgabesystems seinen Suchausdruck ein. Dieser kann aus mehreren mit UND-, ODER- und NICHT- Operatoren verknüpften Wörtern bestehen. Dieser Suchausdruck wird nach Absenden an die Server-Engine von dieser interpretiert, an die Anforderungen der verschiedenen (z. T. externen) Suchmaschinen angepasst und an diese selbst geschickt. Unter Berücksichtigung von konfigurierbaren Timeouts werden die verschiedenen Suchergebnisse dann zu einer Gesamtansicht integriert und zum Browser des Kunden zurückgeliefert. Use-Case: Auswertung StatistikUse case: Edit search query The "customer" enters his search expression in the search mask of the input / output system. This can consist of several words linked with AND, OR and NOT operators. This search expression is sent to the server Engine interpreted by this, adapted to the requirements of the various (sometimes external) search engines and sent to them themselves, taking into account configurable timeouts, the various search results are then integrated into an overall view and returned to the customer's browser. Use case: evaluation of statistics
Der „TSC Filtermanager" kann über einen Texteditor die Suchbegriffe und Verarbeitungszeiten einsehen. Zusätzlich sollen dem Auswerter Möglichkeiten bereitgestellt werden, die eine Ad-hoc-Sfandardauswertung nach noch zuThe "TSC Filter Manager" can use a text editor to view the search terms and processing times. In addition, the evaluator should be provided with options that are still subject to an ad hoc standard evaluation
5 definierenden Kriterien ermöglicht.5 defining criteria.
Use-Case: Auswertung FehlerprotokollUse case: evaluation of error log
7 Der „TSC Admin" kann über einen Texteditor die in einer Textdatei abgelegten s Fehlermeldungen einsehen.7 The "TSC Admin" can view the error messages stored in a text file using a text editor.
10 Use-Case-Diagramme, Feinanalyse10 use case diagrams, detailed analysis
11 In Fig. 6 ist der Ablauf einer Anfrage an die Suchmaschinen schematisch11 The sequence of a query to the search engines is schematic in FIG. 6
12 dargestellt. „Interpretierte Anfrage senden" bearbeitet den eintreffenden12 shown. "Send interpreted request" processes the incoming one
13 Suchauftrag, passt diesen an die Syntax der beteiligten externen Suchmaschinen13 Search request, this adapts to the syntax of the external search engines involved
14 an und sendet ihn an diese weiter.14 and sends it to them.
15 „Ergebnisse Integrieren" empfängt die Suchergebnisse der Suchmaschinen und15 "Integrate results" receives the search results of the search engines and
16 präsentiert sie dem Nutzer im gewünschten Format.16 presents them to the user in the desired format.
17 ιβ Fig. 7 zeigt schematisch den Ablauf einer verteilten Abfrage mit anschließendem17 ιβ Fig. 7 shows schematically the sequence of a distributed query with subsequent
19 Zusammenführen der Ergebnisse. „Ergebnisse sammeln" akkumuliert die von den19 Merging the Results. "Collect results" accumulates those of the
20 Suchmaschinen eintreffenden Suchergebnisse. Ein Suchergebnis muss innerhalb20 search engine incoming search results. A search result must be within
21 eines konfigurierbaren Zeitlimits (Timeout) eintreffen. Ist dem nicht so, wird dies 2 als Fehler interpretiert. 3 „Errorhandling" übernimmt das Protokollieren von Fehlerzuständen in eine 4 Fehlerdatei. 5 „Priorisieren" wichtet die von den verschiedenen Suchmaschinen gelieferten 6 Ergebnisse nach bestimmten Geschäftsregeln. 7 Fehlerbehandelte und priorisierte Suchergebnisse werden „in Ergebnisseite 8 integrieren" in das gewünschte Ausgabeformat überführt. Der Nutzer/Kunde hat, wie in Fig. 8 dargestellt, zwei Möglichkeiten der Suche. Bei „einfach Suchen" kann der Nutzer einen oder mehrere Suchbegriffe und even- tuell Suchoperatoren eingeben, die der FAST-CGI Syntax entsprechen müssen.21 of a configurable time limit. If this is not the case, this is interpreted 2 as an error. 3 "Error handling" takes over the logging of error states in a 4 error file. 5 "Prioritize" weights the 6 results provided by the different search engines according to certain business rules. 7 Error-treated and prioritized search results are "integrated into results page 8" converted into the desired output format. As shown in FIG. 8, the user / customer has two search options. With "simple searches" the user can enter one or more search terms and possibly search operators, which must correspond to the FAST-CGI syntax.
Bei „erweiterter Suche" kann der Nutzer zuerst den Typ des gesuchten Webinhalts auswählen ( Webseite, Bild, Musik etc.). Je nach Inhaltstyp stehen dann angepasste Suchoptionen zur Verfügung.With "advanced search", the user can first select the type of web content they are looking for (website, image, music, etc.). Depending on the content type, customized search options are then available.
Der in Fig. 9 schematisch dargestellte Filter oder Interpreter bekommt zusätzlich zu den Konfigurationsdaten den aktuellen „query string". Diese Zeichenkette enthält Parameter und die Suchanfrage des Nutzers. Die Suchanfrage wird entsprechend der Filterregeln des jeweiligen Systems (Suchmaschine) modifiziert. Ein weiterer Schritt baut aus den jeweiligen „query strings" und einigen Parametern eine komplette URL für die Suchmaschine. Diese URL ist im o. g. Diagramm als „Ziel_URL" identifizierbar.The filter or interpreter shown schematically in FIG. 9 receives the current "query string" in addition to the configuration data. This character string contains parameters and the search query of the user. The search query is modified in accordance with the filter rules of the respective system (search engine). Another step is built a complete URL for the search engine from the respective "query strings" and some parameters. This URL is in the above. Diagram identifiable as "target_URL".
ModulüberblickModule overview
Das Gesamtsystem unterteilt sich, wie in Fig. 10 gezeigt, im wesentlichen in drei Module. Diese werden im Folgenden näher beschrieben. In Interpreter und Inte- grator existieren Adapterklassen, die jeweils auf genau ein Zielsystem zugeschnit- ten sind. Alle Adapterklassen besitzen einen statischen und einen dynamischen Teil. Der statische Teil wird durch Konfigurationsdaten repräsentiert. Der dynamische Teil hängt von der jeweiligen Suchanfrage ab.As shown in FIG. 10, the overall system is essentially divided into three modules. These are described in more detail below. Adapter classes exist in the interpreter and integrator, each of which is tailored to exactly one target system. All adapter classes have a static and a dynamic part. The static part is represented by configuration data. The dynamic part depends on the search query.
Modul Interpreter Das Modul BRISBANE-Interpreter enthält, wie in Fig. 11 gezeigt, Klassen, die der Filterung und sonstiger Aufbereitung der Suchanfragen dienen. Allgemein kann man sagen, dass der Interpreter die Basisdaten für den Integrator bereitstellt. Die Funktionalität der Filterung ist stark vom Zielsystem (Suchmaschine) abhängig und verbirgt sich in den entsprechenden Adapterklassen. 2 Modul IntegratorInterpreter module The BRISBANE interpreter module contains, as shown in FIG. 11, classes which serve to filter and otherwise prepare the search queries. In general it can be said that the interpreter provides the basic data for the integrator. The functionality of the filtering is strongly dependent on the target system (search engine) and is hidden in the corresponding adapter classes. 2 module integrator
3 Die in Fig. 12 gezeigten Klassen im Modul Integrator sind verantwortlich für 3 The classes in the module integrator shown in Fig. 12 are responsible for
4 Weiterleifung der modifizierten Suchanfragen an die Zielsysteme. Weitere s Aufgaben des Integrators sind das Zusammenstellen der Suchergebnisse und e deren Konvertierung von XML in HTML, das Darstellen der Ergebnisseite, sowie die Bereitstellung der Statistikdaten.4 Forwarding the modified search queries to the target systems. Further tasks of the integrator are the compilation of the search results and their conversion from XML to HTML, the display of the results page and the provision of the statistical data.
88th
9 Für jede Anfrage an ein Zielsystem wird eine Instanz der Klasse Request erzeugt. 0 Diese Objekte stellen die Kommunikationsschnittstelle zwischen Suchcenter und 1 Zielsystemen dar. 2 Die Kommunikation mit den Zielsystemen wird durch den RequestManager 3 verwaltet. Er ist jedoch nicht für die Darstellung der Ergebnisse verantwortlich.9 An instance of the Request class is generated for each request to a target system. 0 These objects represent the communication interface between the search center and 1 target systems. 2 Communication with the target systems is managed by RequestManager 3. However, he is not responsible for the presentation of the results.
Modul Server-Engine Dieses in Fig. 13 anhand seiner Klassen gezeigte Modul repräsentiert den Hauptprozess des Suchcenters. Er besitzt eine Instanz der Klasse „Configuration", die den Zugriff auf alle Konfigurationsdaten ermöglicht. Innerhalb des Prozesses werden Konfigurationsdaten in unterschiedlichen Strukturen wie z. B. AdapterMap abgelegt. Die Server-Engine ist auch für das Instanziieren von Interpreter und Integrator sowie das geordnete Beenden des Prozesse ( bei Eintreffen eines Signals) verantwortlich. Die Klasse Logging ist für die Protokollierung von Fehlern und Statistikdaten verantwortlich.Server Engine module This module, shown in FIG. 13 by its classes, represents the main process of the search center. It has an instance of the "Configuration" class, which enables access to all configuration data. Within the process, configuration data is stored in different structures, such as AdapterMap. The server engine is also for instantiating the interpreter and integrator as well as the orderly one Ending the process (when a signal arrives) The Logging class is responsible for logging errors and statistical data.
Dynamisches Modell In Fig. 14 ist das dynamische Verhalten der einzelnen Komponenten und der Informationsfluss zwischen ihnen dargestellt.Dynamic model FIG. 14 shows the dynamic behavior of the individual components and the flow of information between them.
Nach dem Start der Suchcenter-Software wird die Konfiguration ausgelesen. Je nach Konfiguration werden dann entsprechende Ausschlussfilter und eine 1 länderspezifische XSL-Datei geladen. Der Prozess wartet nun auf eineAfter starting the search center software, the configuration is read out. Depending on the configuration, corresponding exclusion filters and a 1 country-specific XSL file loaded. The process is now waiting for one
2 Suchanfrage. Wenn diese eintrifft, wird der Suchausdruck interpretiert. In 2 search query. If this arrives, the search expression is interpreted. In
3 Ausschlussfiltern vorkommende Wörter werden aus der Suchanfrage entfernt.3 Words that are excluded are removed from the search query.
4 Zusätzlich wird die Anfrage an die Syntax der beteiligten Suchmaschinen s angepasst. Die modifizierten Suchausdrücke werden nun an die Suchmaschinen e gesendet. Abhängig vom Format der zurückgelieferten Ergebnisse ist eventuell4 In addition, the query is adapted to the syntax of the search engines involved. The modified search terms are now sent to the search engines e. Depending on the format of the returned results may be
7 eine Transformation in das HTML- Format notwendig (wenn beispielsweise die s Ergebnisse im XML- Format vorliegen). Die Ergebnisse werden an den Browser s des Kunden gesendet. 0 Der Prozess geht wieder in Warteposition, bis der nächste Request eintrifft. 1 Die einzelnen Suchanfragen werden mit Suchausdruck, Zeitstempel und Dauer 2 der Verarbeitung in der Statistikdatei „tsc_statistics" abgelegt. Zudem werden 3 Fehlerzustände während des gesamten Verlaufs in der Datei „tsc_errorJog" 4 eingetragen.7 a transformation into HTML format is necessary (if, for example, the results are in XML format). The results are sent to the customer's browser. 0 The process returns to the waiting position until the next request arrives. 1 The individual search queries are stored with the search expression, time stamp and duration 2 of the processing in the statistics file "tsc_statistics". In addition, 3 error states are entered in the file "tsc_errorJog" 4 during the entire process.
6 Modul Server Engine6 Server Engine module
Initialisierungsphaseinitialization
Während der Initialisierung werden, wie in Fig. 15 gezeigt, abhängig von aktiven Kanälen, Konfigurationsobjekte und Instanzen aller Adapter erzeugt. Die Kanäle entsprechen den vorher angesprochenen Channels und repräsentieren ein ganz bestimmtes Zielsystem.During the initialization, as shown in Fig. 15, depending on active channels, configuration objects and instances of all adapters are created. The channels correspond to the previously mentioned channels and represent a very specific target system.
Verarbeitung einer Suchanfrage Bei Eintreffen eines Requests werden, wie in Fig. 16 dargestellt, Instanzen von Interpreter und Integrator angelegt. Alle notwendigen Informationen für die Intanzen werden von der Server-Engine bereitgestellt. Der Interpreter bereitet nun die Modifikationen der Suchanfrage vor, der Integrator sendet diese an die Zielsysteme und liefert die formatierten Suchergebnisse zurück. Die Instanzen von Interpreter und Integrator werden anschließend zerstört. 1 Modul InterpreterProcessing a search query When a request arrives, as shown in Fig. 16, instances of interpreter and integrator are created. All necessary information for the instances is provided by the server engine. The interpreter now prepares the modifications to the search query, the integrator sends them to the target systems and returns the formatted search results. The interpreter and integrator instances are then destroyed. 1 interpreter module
22
3 Der Interpreter veranlasst, wie in Fig. 17 gezeigt, alle für den Request benötigten3 As shown in Fig. 17, the interpreter initiates all that are required for the request
4 Adapter, jeweils ein AdapterResult zu erzeugen. Jeder einzelne Adapter s modifiziert die originale Suchanfrage unter Zuhilfenahme der entsprechenden e Filterregeln. Diese Suchanfrage und weitere Parameter sind für das Erzeugen4 adapters, one adapter result each. Each individual adapter s modifies the original search query using the corresponding filter rules. This query and other parameters are for generating
7 eines AdapterResult-Objektes notwendig. Das erzeugte AdapterResult-Objekt s wird dem Interpreter zurückgegeben, der es einer Liste hinzufügt.7 of an AdapterResult object is necessary. The generated AdapterResult object s is returned to the interpreter, who adds it to a list.
9 Modul Integrator9 Module integrator
0 Nach Erzeugung der Integrator-Instanz befindet diese sich in einem initialen 1 Zustand. Die Verarbeitung der Requests erfolgt durch den Aufruf der Methode 2 „doRequestsQ".0 After the integrator instance has been created, it is in an initial 1 state. The requests are processed by calling method 2 "doRequestsQ".
Main des fast- ProgrammsMain of the fast program
Das Fast-CGI Programm enthält eine Funktion ,,main()". Dieses wird vom Webser- ver aufgerufen. Voraussetzung für das ordnungsgemäße Arbeiten des Programms ist die korrekte Initialisierung und das Eintreten in die Warteschleife. Die Konfigu- ration wird in einer Datei gehalten. Die Angabe des kompletten Pfades dieser Da- tei erfolgt über eine Umgebungsvariable.The Fast-CGI program contains a function "main ()". This is called by the web server. A prerequisite for the proper functioning of the program is correct initialization and entry into the waiting loop. The configuration is kept in a file The complete path of this file is specified via an environment variable.
Konfiguration des RecherchensystemConfiguration of the research system
Das Suchcenter wird über eine einzige Datei konfiguriert (tsc.cfg). Diese Datei be- findet sich auf einem separaten Rechner, der nicht als Produktivrechner verwen- det wird. Die Konfigurationsdatei dient als Vorlage für alle Konfigurationsdateien pro Rechner in der Produktionsumgebung. Bei Änderungen der Konfiguration (z. B.: Modifikation des Verzeichnisses für die Statistikdateien) wird die Konfigura- tionsdatei auf dem außerhalb des Produktivsystems befindlichen Rechner modifi- ziert und per Script auf alle Rechner im Produktivsystem kopiert. 1 Format der FiltertabelleThe search center is configured using a single file (tsc.cfg). This file is located on a separate computer that is not used as a production computer. The configuration file serves as a template for all configuration files per computer in the production environment. If the configuration changes (eg: Modification of the directory for the statistical files), the configuration file is modified on the computer outside the production system and copied to all computers in the production system using a script. 1 Format of the filter table
2 Auf Anforderung im Admintool wird aus der Datenbank (mysql) eine aktuelle2 Upon request in the admin tool, the database (mysql) becomes a current one
3 Filterdatei erstellt, die über die Verteilmechanismen an die Suchcenter-Rechner3 Filter file created, which is distributed to the search center computer
4 übertragen wird. s Diese Filterdatei hat zeilenweise Einträge, innerhalb einer Zeile sind die Werte e durch Semikolon getrennt.4 is transmitted. s This filter file has entries line by line, within a line the values e are separated by a semicolon.
7 Eine Zeile ist folgendermaßen sematisch aufgebaut (Werte in Q sind optional.): β Ländercode; zu filterndes Wort oder Phrase; [Datum Beginn]; Uhrzeit7 A line is structured as follows (values in Q are optional): β country code; word or phrase to be filtered; [Start date]; time of day
9 Beginn; [Datum Ende]; Uhrzeit Ende; Kanal 1 ; Kanal 2; ...;Kanal n 0 z. B. 1 DE;Neu;2000-10-10;12:00:00;2001-12-31 ;23:35:00;WWW;;;;; 2 DE;verboten;2001 -10-20;01 :00:00;2001 -12- 3 31 ;20:00:00;WWW;P4P;BRISBANE;PHP;SP;AD 4 UK;Bier;;00:00:00;;00:00:00;WWW;;BRISBANE;;SP; 5 CH;Alkohol;2001-09-30;15:00:00;;00:00:00;WWW;;BRISBANE;PHP;; 69 beginning; [End date]; Time end; Channel 1; Channel 2; ...; channel n 0 z. B. 1 DE; New; 2000-10-10; 12: 00: 00; 2001-12-31; 23: 35: 00; WWW ;;;;; 2 DE; prohibited; 2001 -10-20; 01: 00: 00; 2001 -12- 3 31; 20: 00: 00; WWW; P4P; BRISBANE; PHP; SP; AD 4 UK; beer ;; 00: 00 : 00 ;; 00: 00: 00; WWW ;; BRISBANE ;; SP; 5 CH; Alcohol; 2001-09-30; 15: 00: 00 ;; 00: 00: 00; WWW ;; BRISBANE; PHP ;; 6
Aktivierung von Konfiguration und FiltertabelleActivation of configuration and filter table
Die Aktivierung von Konfiguration und Filtertabelle erfolgt durch das Starten von Scripts.The configuration and filter table are activated by starting scripts.
Format der ProtokolldateiFormat of the log file
Der Name der Statistikdatei wird in der Konfigurationsdatei (tsc.cfg) angegeben, z. B. tsc_statistics_<PID>. <PID> wird dann im Betrieb durch die Prozess-ID ersetzt. Da gleichzeitig mehrere Prozesse laufen, gibt es auch dementsprechend viele Protokolldateien.The name of the statistics file is specified in the configuration file (tsc.cfg), e.g. B. tsc_statistics_ <PID>. <PID> is then replaced by the process ID during operation. Since several processes are running at the same time, there are accordingly many log files.
Alle Statistikdateien liegen in einem zentralen Verzeichnis. Diese Statistik-Dateien werden im CSV-Format gespeichert. Zur Auswertung existiert ein separater Prozess, der aufgrund des großen Datenvolumens auf einem eigens dafür eingerichteten Server laufen sollte. Die Such-Prozesse schreiben entweder ihre Daten direkt auf den Auswertungsserver oder der Auswertungsprozess sammelt in regelmäßigen Abständen die Statistik-Daten aller Such-Prozesse ein.All statistics files are in a central directory. These statistics files are saved in CSV format. There is a separate process for evaluation, which is due to the large data volume a specially set up server should run. The search processes either write their data directly to the evaluation server or the evaluation process collects the statistical data of all search processes at regular intervals.
Aufbau der DateiStructure of the file
Die Statistik-Datei besteht aus 4 Grundspalten und pro realem Kanal kommen weitere 4 Spalten hinzu.The statistics file consists of 4 basic columns and another 4 columns are added for each real channel.
Grundspalten:Basic columns:
1. Eingegebene Suchbegriffe1. Entered search terms
2. Uhrzeit der Suche2. Time of the search
3. Suchmodus3. Search mode
4. Gesamtzeit in ms oder Timeout4. Total time in ms or timeout
Spalten pro Kanal:Columns per channel:
1. Name1. Name
2. verwendete Suchbegriffe2. Search terms used
3. Zeitdauer in ms oder Timeout3. Duration in ms or timeout
4. Anzahl der Ergebnisse4. Number of results
MengengerüstQuantity structure
Grundspalten ca. 50 Byte Kanalspalten je ca. 50 ByteBasic columns approx. 50 bytes Channel columns approx. 50 bytes each
Maximallast 500 Anfragen pro Sekunden, ca. 250 Byte pro Anfrage:Maximum load 500 requests per second, approx. 250 bytes per request:
-> 125 KByte pro Sekunde - 450 MByte pro Stunde - 10,8 GByte pro Tag Format der Fehlerprotokollierung-> 125 KB per second - 450 MB per hour - 10.8 GB per day Error log format
2 Der Name der Fehlerprotokolldatei wird in der Konfigurationsdatei (tsc.cfg)2 The name of the error log file is stored in the configuration file (tsc.cfg)
3 angegeben, z. B. tsc_err_<PID>. <PID> wird dann im Betrieb durch die Prozess-3 specified, e.g. B. tsc_err_ <PID>. <PID> is then used in operation by the process
4 ID ersetzt. Da gleichzeitig mehrere Prozesse laufen, gibt es auch4 ID replaced. Since there are several processes running at the same time, there are also
5 dementsprechend viele Fehlerprotokolldateien.5 correspondingly many error log files.
6 Einträge in das Fehlerprotokoll geschehen zeilenweise. Innerhalb eines Eintrages6 entries in the error log are made line by line. Within an entry
7 sind die Werte kommasepariert und hat folgende sematische Bedeutung β Uhrzeit, Original-URL, angepasste URL, Zeit für den reinen Request, Anzahl 9 Treffer, Beschreibung des aufgetretenen Fehlers 0 z. B.: 1 12.10.2001 09:41 :35,http://192.168.70.42:80/fast- 2 cgi/ubrtsc?lang=any&q=test&start=0&num=10&context=wwwcSιtype=allcStPort 3 alLanguage=deStContext=www,http://66.77.74.21 :8075/max_xml_b00?hits= 4 10&query=test&offset=0,HTTP-Call:145 ms,Total Hits:15737604,ERROR in 5 Brisbaneintegrator: :getQueryResults() 'ghttp_process () failed,Error: 6 getQueryResults 7 s Wenn ein allgemeiner Fehler auftritt, wird dieser in der Form, Uhrzeit, 9 Beschreibung des aufgetretenen Fehlers protokolliert, z. B. 0 12.10.2001 09:41 :35,ERROR in Brisbanelntegrator::initXSLT() "mpXMLStyleptr: 1 xmIParseMemory error'.Error: can't initialize xslt-process. Process Exit7 the values are comma-separated and have the following sematical meaning β time, original URL, adapted URL, time for the pure request, number of 9 hits, description of the error that occurred 0 z. B .: 1 12.10.2001 09:41:35, http: //192.168.70.42: 80 / fast- 2 cgi / ubrtsc? Lang = any & q = test & start = 0 & num = 10 & context = wwwcSιtype = allcStPort 3 alLanguage = deStContext = www, http://66.77.74.21: 8075 / max_xml_b00? hits = 4 10 & query = test & offset = 0, HTTP-Call: 145 ms, Total Hits: 15737604, ERROR in 5 Brisban integrator:: getQueryResults () 'ghttp_process () failed, Error: 6 getQueryResults 7 s If a general error occurs, it is logged in the form, time, 9 description of the error that occurred, e.g. B. 0 12.10.2001 09:41:35, ERROR in Brisbanelntegrator :: initXSLT () "mpXMLStyleptr: 1 xmIParseMemory error'.Error: can't initialize xslt-process. Process Exit
2 Beschreibung der Stylesheets2 Description of the style sheets
3 Die XSL-Stylesheets dienen innerhalb des Suchcenters dazu, die gesammelten 4 Antworten in XML-Form zu einer HTML-Seite entsprechend der aktuellen 5 Layoutvorgaben umzusetzen. Die Daten für eine Webseite werden dem 6 Stylesheet im XML, bzw. durch Stylesheetparameter übergeben. Pro Sprache 7 existiert im Suchcenter ein Stylesheet. Innerhalb des Stylesheets werden die β Suchergebnisse in HTML aufbereitet sowie die Links für das Vor- und 9 Zurückblättern erzeugt. Entsprechend den Voreinstellungen wird dann noch die entsprechende Reiterstruktur über den Suchergebnissen und die Werbebanner bzw. die Formular für die neue Suche erstellt.3 The XSL stylesheets are used within the search center to convert the 4 responses in XML form into an HTML page in accordance with the current 5 layout specifications. The data for a website are transferred to the 6 stylesheets in XML or through stylesheet parameters. There is a stylesheet for each language 7 in the search center. Within the style sheet, the β search results are prepared in HTML and the links for scrolling forward and back 9 are generated. According to the default settings, the appropriate tab structure created above the search results and the advertising banners or the form for the new search.
Administration der FiltertabelleAdministration of the filter table
Kontext Der Kontext der Admin Anwendung ist in Fig. 18 dargestellt. Context The context of the admin application is shown in Fig. 18.
BezugszeichenlisteLIST OF REFERENCE NUMBERS
1 Recherchensystem1 research system
2 Suchmaschinen2 search engines
4 zentrale Auswerteeinheit4 central evaluation unit
6 Integrationsmodul6 integration module
8 Speichermodul8 memory module
10 Distributionsmodul10 distribution module
12 Pufferspeicher12 buffer tanks
14 Speichermodul14 memory module
16 Filtermodul16 filter module
18 Ein-/Ausgabemodul18 input / output module
20 Werbemitteldatenbank20 Advertising media database
E ErgebnisdatensätzeE Result records
P Priorisierungsparameter P prioritization parameters

Claims

Ansprüche Expectations
1. Recherchensystem (1 ) zur Ermittlung von Informationen aus einer Datenbank unter 5 Nutzung einer Mehrzahl von Suchmaschinen (2) mit einem Integrationsmodul (6), das die von den Suchmaschinen (2) gelieferten, jeweils eine Mehrzahl von Ergebnisdatensätzen (E) umfassenden Ergebnisdaten in ein gemeinsames Datenformat konvertiert und anschließend unter Rückgriff auf in einem Speichermodul (8) hinterlegte Priorisierungsparameter (P) jedem 0 Ergebnisdatensatz (E) einen Relevanzkennwert zuordnet.1. Research system (1) for determining information from a database using 5 a plurality of search engines (2) with an integration module (6) that contains the result data supplied by the search engines (2), each comprising a plurality of result data records (E) converted into a common data format and then using a prioritization parameter (P) stored in a memory module (8), assigns a relevance characteristic value to each result data record (E).
2. Recherchensystem (1 ) nach Anspruch 1 , bei dem die Priorisierungsparameter (P) abhängig von der jeweiligen Suchmaschine (2) gewählt sind.2. Search system (1) according to claim 1, in which the prioritization parameters (P) are selected as a function of the respective search engine (2).
5 3. Recherchensystem (1) nach Anspruch 1 oder 2, dessen Integrationsmodul (6) den Relevanzkennwert für den jeweiligen Ergebnisdatensatz (E) unter Berücksichtigung eines von der jeweiligen Suchmaschine (2) bereitgestellten Ausgangsrelevanzkennwerts ermittelt.5 3. Search system (1) according to claim 1 or 2, the integration module (6) of which determines the relevance parameter for the respective result data record (E) taking into account an output relevance parameter provided by the respective search engine (2).
o 4. Recherchensystem (1) nach einem der Ansprüche 1 bis 3, dessen4. Search system (1) according to one of claims 1 to 3, the
Integrationsmodul (6) über ein gemeinsames Pufferspeichermodul (12) mit einem Distributionsmodul (10) kommuniziert, das einen im gemeinsamen Datenformat eingehenden Suchauftrag für jede ausgewählte Suchmaschine (2) in deren spezifisches Datenformat umwandelt und anschließend an diese ausgibt. 5Integration module (6) communicates via a common buffer memory module (12) with a distribution module (10), which converts a search request received in the common data format for each selected search engine (2) into its specific data format and then outputs it to it. 5
5. Recherchensystem (1) nach Anspruch 4, dessen Distributionsmodul (10) mit einem zweiten Speichermodul (14) verbunden ist, in dem Syntaxdaten für die Suchmaschinen (2) hinterlegt sind.5. Search system (1) according to claim 4, whose distribution module (10) is connected to a second memory module (14) in which syntax data for the search engines (2) are stored.
0 6. Recherchensystem (1 ) nach Anspruch 4 oder 5, in dessen Pufferspeichermodul (12) für einzelne Suchaufträge charakteristische Identifikationsdaten hinterlegbar sind. 6. Research system (1) according to claim 4 or 5, in the buffer memory module (12) of which characteristic identification data can be stored for individual search orders.
7. Recherchensystem (1 ) nach einem der Ansprüche 4 bis 6, dessen Distributionsmodul (10) eingangsseitig über ein Filtermodul (16) mit einem Ein- /Ausgabemodul (18) verbunden ist.7. search system (1) according to one of claims 4 to 6, the distribution module (10) on the input side via a filter module (16) is connected to an input / output module (18).
8. Recherchensystem (1 ) nach einem der Ansprüche 4 bis 7, dessen8. search system (1) according to any one of claims 4 to 7, the
Distributionsmodul (10) mit dem Integrationsmodul (6) in eine gemeinsame Einheit integriert ist.Distribution module (10) with the integration module (6) is integrated into a common unit.
9. Recherchensystem (1 ) nach einem der Ansprüche 4 bis 8, bei dem das Distributions- und das Integrationsmodul (6) datenseitig mit einer9. search system (1) according to one of claims 4 to 8, in which the distribution and the integration module (6) on the data side with a
Werbemitteldatenbank (20) verbunden sind, die als Antwortdatensatz auf eine eingehende Suchanfrage einen hinsichtlich eines Kennungssignals an die Suchanfrage angepassten Datensatz liefert.Advertising media database (20) are connected which, as a response data record to an incoming search query, delivers a data record adapted to the search query with regard to an identification signal.
10. Verfahren zur Ermittlung von Informationen aus einer Datenbank, insbesondere aus dem World-Wide-Web, unter Nutzung eines Recherchensystems (1 ) nach einem der Ansprüche 1 bis 9, bei dem die von den Suchmaschinen (2) gelieferten, jeweils eine Mehrzahl von Ergebnisdatensätzen (E) umfassenden Ergebnisdaten in ein gemeinsames Datenformat konvertiert werden, wobei anschließend unter Rückgriff auf in einem Speichermodul (8) hinterlegte Priorisierungsparameter (P) jedem Ergebnisdatensatz (E) einen Relevanzkennwert zugeordnet wird.10. A method for determining information from a database, in particular from the World Wide Web, using a search system (1) according to one of claims 1 to 9, in which the search engines (2) each provide a plurality of Result data sets (E) comprising result data sets are converted into a common data format, with each result data set (E) then being assigned a relevance characteristic value using the prioritization parameters (P) stored in a memory module (8).
11. Verfahren nach Anspruch 10, bei dem die Priorisierungsparameter (P) abhängig von der jeweiligen Suchmaschine (2) gewählt werden.11. The method according to claim 10, in which the prioritization parameters (P) are selected as a function of the respective search engine (2).
12. Verfahren nach Anspruch 10 oder 11 , bei dem der Relevanzkennwert für den jeweiligen Ergebnisdatensatz (E) unter Berücksichtigung eines von der jeweiligen Suchmaschine (2) bereitgestellten Ausgangsrelevanzkennwerts ermittelt wird.12. The method according to claim 10 or 11, in which the relevance characteristic value for the respective result data record (E) is determined taking into account an output relevance characteristic value provided by the respective search engine (2).
13. Verfahren nach einem der Ansprüche 10 bis 12, bei dem ein im gemeinsamen13. The method according to any one of claims 10 to 12, in which a jointly
Datenformat eingehender Suchauftrag für jede ausgewählte Suchmaschine (2) in deren spezifisches Datenformat umgewandelt und anschließend an diese ausgegeben wird. Data format incoming search order for each selected search engine (2) converted into their specific data format and then output to this.
14. Verfahren nach einem der Ansprüche 10 bis 13, bei dem ein über ein Ein- /Ausgabemodul (18) vorgegebener Suchauftrag vor seiner weiteren Bearbeitung einer Filterung unterzogen wird.14. The method according to any one of claims 10 to 13, in which a search order specified via an input / output module (18) is subjected to a filtering before it is processed further.
15. Verfahren nach einem der Ansprüche 10 bis 14, bei dem ein Suchauftrag zusätzlich an eine Werbemitteldatenbank (20) ausgegeben wird, wobei ein von dieser eingehender Antwortdatensatz mittels eines Kennungssignals der jeweiligen Suchanfrage zugeordnet wird. 15. The method according to any one of claims 10 to 14, in which a search request is additionally output to an advertising material database (20), an incoming response data record being assigned to the respective search query by means of an identification signal.
PCT/EP2004/002915 2003-03-25 2004-03-19 Search system and method for determining information from a databank, especially the worldwide web WO2004086251A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP04721889A EP1642211A1 (en) 2003-03-25 2004-03-19 Search system and method for determining information from a databank, especially the worldwide web

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10313420.4 2003-03-25
DE10313420A DE10313420A1 (en) 2003-03-25 2003-03-25 Research system and method for determining information from a database, in particular from the World Wide Web

Publications (1)

Publication Number Publication Date
WO2004086251A1 true WO2004086251A1 (en) 2004-10-07

Family

ID=33038760

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2004/002915 WO2004086251A1 (en) 2003-03-25 2004-03-19 Search system and method for determining information from a databank, especially the worldwide web

Country Status (4)

Country Link
EP (1) EP1642211A1 (en)
KR (1) KR20060017489A (en)
DE (1) DE10313420A1 (en)
WO (1) WO2004086251A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2006562B1 (en) 2007-06-21 2010-08-11 LuK Lamellen und Kupplungsbau Beteiligungs KG Coupling with readjustment device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6102969A (en) * 1996-09-20 2000-08-15 Netbot, Inc. Method and system using information written in a wrapper description language to execute query on a network
EP1050830A2 (en) * 1999-05-05 2000-11-08 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles
WO2001063484A2 (en) * 2000-02-24 2001-08-30 Inktomi Corporation Delivering non-default items in association with search results
US20020049756A1 (en) * 2000-10-11 2002-04-25 Microsoft Corporation System and method for searching multiple disparate search engines
DE10056681A1 (en) * 2000-11-15 2002-05-23 Hewlett Packard Co Method for running with a Meta search engine adapting to a new search response display processes a search response delivered by a primary search engine in a search response display.
US6430553B1 (en) * 2000-03-22 2002-08-06 Exactone.Com, Inc. Method and apparatus for parsing data
US20020143744A1 (en) * 2000-12-28 2002-10-03 Teng Albert Y. Method and apparatus to search for information

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6370527B1 (en) * 1998-12-29 2002-04-09 At&T Corp. Method and apparatus for searching distributed networks using a plurality of search devices
US6523029B1 (en) * 2000-03-24 2003-02-18 Bitmobile Technologies System and method for embedded information retrieval in a distributed free-text application environment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6102969A (en) * 1996-09-20 2000-08-15 Netbot, Inc. Method and system using information written in a wrapper description language to execute query on a network
EP1050830A2 (en) * 1999-05-05 2000-11-08 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles
WO2001063484A2 (en) * 2000-02-24 2001-08-30 Inktomi Corporation Delivering non-default items in association with search results
US6430553B1 (en) * 2000-03-22 2002-08-06 Exactone.Com, Inc. Method and apparatus for parsing data
US20020049756A1 (en) * 2000-10-11 2002-04-25 Microsoft Corporation System and method for searching multiple disparate search engines
DE10056681A1 (en) * 2000-11-15 2002-05-23 Hewlett Packard Co Method for running with a Meta search engine adapting to a new search response display processes a search response delivered by a primary search engine in a search response display.
US20020143744A1 (en) * 2000-12-28 2002-10-03 Teng Albert Y. Method and apparatus to search for information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GRAVANO L ET AL: "STARTS: STANFORD PROPOSAL FOR INTERNET META-SEARCHING", SIGMOD RECORD, ASSOCIATION FOR COMPUTING MACHINERY, NEW YORK, US, vol. 26, no. 2, 1 June 1997 (1997-06-01), pages 207 - 218, XP000730508 *

Also Published As

Publication number Publication date
EP1642211A1 (en) 2006-04-05
DE10313420A1 (en) 2004-10-28
KR20060017489A (en) 2006-02-23

Similar Documents

Publication Publication Date Title
DE69531599T2 (en) Method and device for finding and obtaining personalized information
DE69729926T2 (en) Network Browser
EP0910829B1 (en) Database system
DE60016772T2 (en) METHOD AND SYSTEM FOR THE PUBLICATION AND REVISION OF HIERARCHICALLY ORGANIZED SETS OF STATIC INTRANET AND INTERNET PAGES
DE102013017085A1 (en) System for deep linking and search engine support for websites integrating a third-party application and components
DE19955718A1 (en) Definition for central system databank enabling parallel databank support for workflow management system, contained within configuration specification for work flow management system
DE202011110873U1 (en) Scalable rendering of large spatial databases
DE69633373T2 (en) Method and apparatus for programming a task ticket in a document processing system
EP1620810A2 (en) Method and arrangement for establishing and updating a user surface used for accessing data pages in a data network
EP2601594A1 (en) Method and apparatus for automatically processing data in a cell format
EP1642211A1 (en) Search system and method for determining information from a databank, especially the worldwide web
EP1783631A1 (en) Search result ranking by means of relevance feedback
WO2009030248A1 (en) Detecting correlations between data representing information
EP1094405A2 (en) Method to create a dynamical database retrieval interface
DE10221860A1 (en) System and method for providing intelligence to network devices
DE10108564A1 (en) Method for searching for data currently or previously stored in a distributed system or data containing data, taking into account the time of their availability
DE602004002450T2 (en) Spend Data Management
DE102005008519A1 (en) A method of monitoring a directory in a computer system, computer program product, and computer system for performing this method
EP4235452A1 (en) Method and system arrangement for efficient querying of a database system
DE10139761B4 (en) Computer arrangement in the form of a client / server system with a file of a markup language for the parameterization of an automatic query and corresponding method
EP3531300A1 (en) Computer-implemented method for acquiring information
EP1239377A1 (en) Data management system and method of data structure management and synchronisation
WO2024067920A1 (en) Database of a computer
DE102006037968B4 (en) Universal and extensible data management with observation and inter-process communication mechanisms
EP2518644A1 (en) Method for controlling the implementation of pre-defined rules and/or incoming data of a data stream

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1020057018038

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2004721889

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020057018038

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 2004721889

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2004721889

Country of ref document: EP