DE2619014A1 - Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction - Google Patents

Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction

Info

Publication number
DE2619014A1
DE2619014A1 DE19762619014 DE2619014A DE2619014A1 DE 2619014 A1 DE2619014 A1 DE 2619014A1 DE 19762619014 DE19762619014 DE 19762619014 DE 2619014 A DE2619014 A DE 2619014A DE 2619014 A1 DE2619014 A1 DE 2619014A1
Authority
DE
Germany
Prior art keywords
polynomials
picture element
individual
features
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19762619014
Other languages
German (de)
Inventor
Paul Dipl Ing Hauff
Rainer Dipl Ing Ott
Juergen Dr Ing Schuermann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Licentia Patent Verwaltungs GmbH
Oce Document Technologies GmbH
Original Assignee
Licentia Patent Verwaltungs GmbH
Computer Gesellschaft Konstanz mbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Licentia Patent Verwaltungs GmbH, Computer Gesellschaft Konstanz mbH filed Critical Licentia Patent Verwaltungs GmbH
Priority to DE19762619014 priority Critical patent/DE2619014A1/en
Priority to SE7704668A priority patent/SE7704668L/en
Priority to IT22995/77A priority patent/IT1076729B/en
Publication of DE2619014A1 publication Critical patent/DE2619014A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2453Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier

Abstract

The character recognition method for information processing systems employs a scanner (1) and associated store (2) in which characteristic vectors for the raster composition are held. Individual characteristic values of the vectors are calculated (5) and undergo transformation (6) for coordinate reduction. These are stored (3). In a three-stage classifier calculator (7) the estimated polynomials for the reduced number of factors are computed and undergo squaring. The magnitude of the polynomial coefficients is used as an indicator for the order of importance of individual and combined picture elements (8, 9). The indicator is calculated from the sum of the squares of the individual weighting factors associated with the respective elements or combinations of elements. The selected values are stored (10).

Description

Verfahren für die maschinelle Zeichen- Procedure for machine drawing

erkennung mittels Schätzwert-Polynomen Die Erfindung bezieht sich auf ein Verfahren für die maschinelle Zeichenerkennung zur Auswahl von Bildelementen und Bildelementkombinationen innerhalb eines Zeichenfensters, in Polynomen dienen, welche die als mit Gewichtungskoeffizienten zu versehende Argumente / Klassenzugehörigkeits-Schätzwerte bestimmen, bei dem vorgegebene, entsprechend ihrer Klassenzugehörigkeit gekenn--zeichnete Zeichenmuster ("Stichproben") abgetastet werden, anhand der Abtastergebnisse den Mustern zugeordnete Merkmalsgesamtheiten registriert werden und die Anzahl der Merkmale dieser Merkmalsgesamtheiten mit einer rechnerischen Transformation reduziert wird. detection by means of estimated value polynomials The invention relates to to a method for machine character recognition for the selection of picture elements and picture element combinations within a character window, used in polynomials, which are the arguments / class membership estimates to be provided with weighting coefficients determine where the specified, labeled according to their class Character patterns ("samples") are scanned, based on the scanning results Characteristic groups assigned to patterns are registered and the number of characteristics of these sets of characteristics is reduced with a computational transformation.

Es ist das Zeichenerkennungsverfahren bekannt, vgl. etwa die deutschen Offenlegungsschriften 2 262 873 und 2 341 387, das darin besteht, zu Zeichen, die in der Erkennungsmaschine in einem in Rasterelemente aufgeteilten Zeichenfenster gelesen werden, die jeweilige Klassenzugehörigkeit des gelesenen Zeichens durch Klassenzugehörigkeits-schätzwerte d, zu ermitteln, die für alle Zeichenklassen k des Zichenvorrats durch jeweils die Formel errechnet werden, wobei die Argumente x. entweder jeweils ein einzelnes Bildelement in dem Raster des nldfensters sein können (lineares Glied des Polynoms, wobei Xi = 1 wenn zum Zeichen gehörig und x. = 0 wenn nicht zum Zeichen gehörig) oder aber auch das Produkt aus zwei solchen Bildelementen, welches ebenfalls O oder 1 ist (quadratisches Glied). Die aik-Verte sind Gewichtungs-Koeffizienten.The character recognition process is known, cf. for example German Offenlegungsschriften 2 262 873 and 2 341 387, which consists in determining the respective class affiliation of the read character by means of class affiliation estimated values for characters that are read in the recognition engine in a character window divided into grid elements d, to determine the for all character classes k of the character set by means of the formula can be calculated, with the arguments x. can either be a single picture element in the grid of the nld window (linear term of the polynomial, where Xi = 1 if belonging to the symbol and x. = 0 if not belonging to the symbol) or the product of two such picture elements, which is also O or 1 (square member). The aik values are weighting coefficients.

Bei der Bildung der Glieder derartiger Polynomklassifikatoren können auch höhere Potenzen, d.i. Kombinationen von mehr als zwei Bildelementen berücksichtigt werden. Bei der Kombinationsbildung ist stets die Kombination eines Elements mit sich selbst eingeschlossen. Die Koeffizienten aik können durch ein Optimi.erungsverfahren auf der Basis VOll mit ihrer Klassenzugehörigkeit gekennzeichneten Lernstichproben eingestellt werden (Adaption des Erkennungssystems), vgl. "Die Adaption von Zeichenerkennungssystemen mit Hilfe der Regressionsanalyse" in "lektronisce Rechenanlagen" 11 (1969) 5. 21 - 28.When forming the terms of such polynomial classifiers, also higher potencies, i.e. Combinations of more than two picture elements are taken into account will. When creating a combination, an element is always combined with included himself. The coefficients aik can be determined by an optimization process on the basis of full learning samples marked with their class affiliation (adaptation of the recognition system), see "The adaptation of character recognition systems with the help of regression analysis "in" lektronisce Rechenanlagen "11 (1969) 5. 21 - 28.

Schwierigkeiten bereitet jedoch der Ansatz der zugrunde zu legenden Polynomstruktur. Im Fall eines quadratischen Klassifikators mit etwa 200 Bildelementen liegt die Anzahl der möglichen Merkmalspaare bei 20 000, jedoch kann man bei der Adaption aus Gründen des Aufwands bzw. der Berechnungszeit keine längeren Polvnomansätze als etwa 1200 zulassen. Bei willkürlicher Auswahl von nur 1200 Elementen aus z.B. etwa 20 000 möglichen muß damit gerechnet werden, daß die Leistungsfähigkeit des Xlassifikators unangemessen beschränkt wird. However, the approach of the underlying polynomial structure presents difficulties. In the case of a quadratic classifier with around 200 picture elements, the number of possible pairs of features is 20,000, but for reasons of complexity and calculation time, no longer polvnom approaches than around 1200 can be allowed for the adaptation. If only 1200 elements are arbitrarily selected from, for example, about 20,000 possible elements, it must be expected that the performance of the classifier will be inappropriately restricted.

Aufgabe der vorliegenden Erfindung ist die Schaffung eines Merkmalsauswahlverfahrens, das die Auswahl an die zu erkennenden Zeichen eines vorgegebenen Zeichenvorrats angepaßt so durchführt, daß die Schätzwertberechnungen in einfacher Weise, insbesondere nur mit Binäradditionen (wie bei den weiter oben genannten deutschen Offenlegungsschriften) durchgeführt werden können.The object of the present invention is to create a feature selection method, the selection of the characters to be recognized from a given character set adapted so that the estimated value calculations in a simple manner, in particular only with binary additions (as with the German Offenlegungsschriften mentioned above) can be carried out.

Es ist bereits bekannt - vgl. den Aufsatz "Zum Problem der Merknialsreduzierung ei der Zeichenerkennung" in 18Wissenschaftliche Berichte AEG-Telefunken" 47 (1974), S. 100 - 110 -, zum Zwecke der Merknialsreduktion von entsprechend ihrer Klassenzugehörigkeit gekennzeichneten vorgegebenen Zeichenmustern (Stichproben) ausgehend anhand der Abtastergebnisse den einzelnen Mustern zugeordnete Merkmalsgesamtheiten (Merkmalsvektoren) zu ermitteln, bei denen alle im Zeichenfenster abtastbaren einzelnen Bildelemente berücksichtigt sind, und dann, verbunden mit einer Koordinatentransformation, insbesondere Hauptachsentransformation, eine (Vektor-)Koordinaten-"Verstümmelung" durch Auswahl einer geringeren Anzahl von Koordinaten vorzunehmen. Die Auswahl soll nach Maßgabe der Größe der Eigenlferte 2 i der Eigenvektoren b i der Kovarianzmatrix g getroffen werden, die sich nach der ohne Riicksicht auf die Klassenzugehörigkeit der Muster berechneten Formel bestimmt, wobei, wenn mit {V} die Menge der vorgenannten Merkmalsvektoren bezeichnet ist, daraus der Erwartungswert und daraus g zu bestimmen ist.It is already known - see the essay "On the problem of Merknialsreduzierung ei of character recognition "in 18 Scientific Reports AEG-Telefunken" 47 (1974), P. 100 - 110 -, for the purpose of reducing the number of characteristics according to their class marked predetermined character patterns (random samples) based on the Characteristic groups assigned to the individual patterns (characteristic vectors) to determine in which all the individual picture elements that can be scanned in the drawing window are taken into account, and then, associated with a coordinate transformation, in particular Major axis transformation, a (vector) coordinate "mutilation" by selection a smaller number of coordinates. The selection should be based on the requirements the size of the eigenvalues 2 i of the eigenvectors b i of the covariance matrix g which are based on the pattern regardless of the class calculated formula, where, if with {V}, the set of the aforementioned feature vectors is designated, from this the expected value and from this g is to be determined.

Erfindungsgemäß wird ein Verfahren der eingangs genannten Art in der Weise durchgeführt, daß 1) die Abtastergebnisse in einem Rechenwerk ausgewertet werden, das a) zu der reduzierten Anzahl von Merkinalen für alle Zeichenklassen je ein Schätzwert-Polynom unter Verwendung nur dieser Merkmale und ihrer Kombinationen mindestens der Potenz 2 ermittelt, b) diese Polynome dann umrechnet in solche, denen alle im Zeichenfenster abtastbaren Bildelemente nebst deren Kombinationen mindestens der Potenz 2 zugrunde gelegt sind, c) zu den einzelnen Bildelementen und Bildelementkombinationen jeweils einen Wichtigkeitswert aus den zugehörigen Gewichtungskoeffizienten sämtlicher Polynome berechnet, daß 2) aus den Wichtigkeitswerten eine Teilmenge abgrenzbar gemacht wird, deren einzelne Mitlieder dem Betrage nach größer sind als die der Restmenge, und daß 3) diejenigen Bildelemente und Bildelementkombinationen, die den einzelnen Mitgliedern der Teilmenge zugeordnet sind, in einen Speicher zur Registrierung übermittelt werden.According to the invention, a method of the type mentioned in the Way carried out that 1) the sampling results are evaluated in an arithmetic unit that a) to the reduced number of characters for all character classes an estimate polynomial each using only these features and their combinations at least the power of 2 is determined, b) these polynomials are then converted into those, which all picture elements that can be scanned in the drawing window together with their combinations at least are based on the power of 2, c) the individual picture elements and picture element combinations one importance value each from the associated weighting coefficients of all Polynomials calculates that 2) a subset can be delimited from the importance values is made whose individual members are larger in amount than those of the Remainder, and that 3) those picture elements and picture element combinations which assigned to the individual members of the subset in a memory for registration be transmitted.

Vorzugsweise ist dabei vorgesehen, daß als Wichtigkeitswerte die Summe der Quadrate der einzelnen Gewichtungskoeffizienten ermittelt wird, die jeweils zu demselben Bildelement bzw.It is preferably provided that the importance values are the sum the squares of the individual weighting coefficients is determined, each to the same picture element or

derselben Bildelementkombination gehören.belong to the same picture element combination.

Anhand der Zeichnungen wird ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens nachfolgend näher erläutert.Based on the drawings, an embodiment of the invention Procedure explained in more detail below.

Fig. 1 zeigt Einrichtungen, mit denen das erfindungsgemäße Verfahren durchgeführt wird, in schematischer Darstellung, Figuren 2 und 3 zeigen Diagramme zu Rechenvorgängen.Fig. 1 shows devices with which the inventive method is carried out, in a schematic representation, Figures 2 and 3 show diagrams to arithmetic operations.

In Fig. 1 ist 1 ein optischer Abtaster z.B. einer Zeichenerkennungsmaschine, der z.B. eine Fotodiodenzeile enthält und durchlaufende Zeichen je in einem Zeichenfenster abtastet, das in z.B. 12x18 Rasterquadrate aufgeteilt sein kann, deren jedes eines der vorgenannten Bildelemente ergibt.In Fig. 1, 1 is an optical scanner of, for example, a character recognition machine, which e.g. contains a line of photodiodes and scrolling characters each in a character window that can be divided into e.g. 12x18 grid squares, each of which has one of the aforementioned picture elements results.

Es werden zunächst Zeichenmuster des später zu lesenden Zeichenergebnisse numerisch vorrats abgetastet und die Abtast- / (durch die Rasterquadratnummer und zugehörigen "schwarz" oder "weiß" Vermerk) nebst den Kennzeichnungen der jeweiligen Zeichenklasse-in einem Speicher 2 gespeichert. Die Merkmalsgesamtheiten der einzelnen Muster, nämlich "Schwarz" (=1) oder "Weiß" (=O) Beschreibungen der einzelnen (hier 216) Rasterelemente, können wie bekannt als Merkmalsvektoren aufgefaßt werden.First there are character patterns of the character results to be read later numerically sampled stock and the sampling / (by the grid square number and associated "black" or "white" note) together with the identification of the respective Character class - stored in a memory 2. The totality of characteristics of the individual Pattern, namely "black" (= 1) or "white" (= O) descriptions of the individual (here 216) Raster elements, as is known, can be understood as feature vectors.

Vom Inhalt des Speichers 2 abgeleitet wird in einem Speicher 3 eine gleiche Menge von den einzelnen Mustern zugeordneten Merkmalsgesamtheiten~eingetragrn, deren jeweilige Merkmalsanzahl, m.a.W. Merkmalsvektor-Dimßnsion, gegenüber der des Speichers 2 nach dem Vorgehen des weiter oben genannten Aufsatzes über Merkmalsreduzierung vermindert ist. Dies geschieht dadurch, daß mittels eines Rechenwerks 4 im Wege des bereits weiter nach der Reduktion verbliebenen vorgenannten, Merkmale und möglichen Merkmalspaarungen berücksichtigen. Die Berechnung der Koeffizienten kann nach dem bekannten Vorgehen der Quadratmitteladaption ausgeführt werden1 wie es in dem eingangs genannten, die Adaption von Zeichenerkennungssystemen behandelnden Aufsatz angegeben ist.A memory 3 is derived from the content of the memory 2 the same amount of characteristic groups assigned to the individual patterns ~ entered, their respective number of features, m.a.W. Feature vector dimension, compared to that of the Memory 2 according to the procedure of the above-mentioned article on feature reduction is decreased. This is done by means of an arithmetic unit 4 in the way des already continues the aforementioned remaining after the reduction, Consider features and possible pairings of features. The calculation of the coefficients can be carried out according to the known procedure of square mean adaptation1 like it in the one mentioned at the beginning, which deals with the adaptation of character recognition systems Essay is indicated.

Bei der zugrunde gelegten reduzierten Merkmalsanzahl von ca. With the underlying reduced number of features of approx.

40 ist diese Berechnung mit vertretbarem Aufwand durchführbar. 40 this calculation can be carried out with a reasonable amount of effort.

Jedoch würde die Gewinnung von Klassenzugehörigkeits-Schätz werten auf dieser Basis außer der Tranformation echte Multipli kationen erfordern, da die transformierten Merkmale nicht mehr einfache Binärverte 0 oder 1 sind. However, obtaining class membership estimates would be of value on this basis, apart from the transformation, require real multipliers, since the transformed characteristics are no longer simple binary 0 or 1.

oben angegebenen Rechenverfahrens über die Kovarianzmatrix die Eigenwerte /|i von Merkmalsvektoren bi berechnet und dann durch eine Auswahl einrichtung 5 die z.B. 40 größten Eigenwerte herausgesucht und mit den zugehörigen Eigenvektoren bi in einem Transformationsrechenwerk 6 die Menge der Merkmalsvektoren aus Speicher 2 in die der genannten koordinatenreduzierten, z.B. 40-dimensionalen tierkmalsvektoren im Speicher 3 umgesetzt wird.Calculation method given above using the covariance matrix, the eigenvalues / | i is calculated from feature vectors bi and then by a selection device 5 the 40 largest eigenvalues, for example, picked out and with the associated eigenvectors bi in a transformation arithmetic unit 6 the set of feature vectors from memory 2 into the coordinate-reduced, e.g. 40-dimensional animal feature vectors mentioned is implemented in memory 3.

Auf der Grundlage der nach dem bekannten Verfahren erhaltenen Merkmalsvektoren des Speichers 3, die sich nach wie vor auf die vorgegebenen Lern-Muster beziehen, d.h. deren Merkmale - wenn auch in unvollständiger Form - wiedergeben, wird nunmehr in einem Rechenwerk 7 (Arbeitsstufe a) ein sog.On the basis of the feature vectors obtained by the known method of the memory 3, which still refer to the given learning pattern, i.e. their characteristics - even if in incomplete form - are now reproduced in an arithmetic unit 7 (work stage a) a so-called.

"zweistufiger" (weil nicht unmittelbar auf die Bildelemente des Speichers 2 bezogener) Klassifikator, nämlich die Gesamtheit der Schätzwert-Polynome berechnet, deren Glieder alle wie vorstehend angegeben anschließend Die / erhaltene Polynomgesamtheit wird daherin dem Rechenwerk 7 (Arbeitsstufe b) umgerechnet in einen "einstufigen", nämlich wieder auf alle Bildelement-Merkmale des Speichers 2 direkt bezogenen Elassifikator, also eine Polynomgesamtheit, deren Polynome bei Benjcksichtigung aller einzelnen Merkmale und möglichen Merkmalspaarungen jeweils aus ca. 20.000 Gliedern bestehen."two-stage" classifier (because it is not directly related to the picture elements of the memory 2), namely the totality of the estimated value polynomials is calculated, the terms of which are then all calculated as indicated above The / obtained polynomial population is therefore converted in the arithmetic unit 7 (work stage b) into a "single-stage", namely once again directly related to all picture element features of the memory 2, i.e. a polynomial population whose polynomials each take into account all individual features and possible feature pairings there are around 20,000 members.

Wenn die Vektordimension der Merkmalsgesamtheiten im Speicher 2 gleich n und die reduzierte Vektordimension der Merkmalsgesamtheiten im Speicher 3 gleich m ist, wobei mn, und der reduzierte (transformierte) m-dimensionale Merkmalsvektor wie in dem genannten Aufsatz mit « bezeichnet wird, W = (w1 w2 ..... wm)T , (3) und der inW vollständig quadratische Polynomansatz mit so hat dieser, wenn m = 40 vorgesehen ist, insgesamt 861 Komponenten. Mit diesem wird in der Rechnerstufe 7a die Schätzgleichung (vgl. Gleichung 5 des o.a. Aufsatzes) und der Polynombildung nach Gleichung (5) mit (4). Da beide Schritte eindeutig beschrieben sind, kann man das System in ein äquivalentes einstufiges System umrechnen. Es ergibt sich damit, also in der Arbeitsstufe b des Rechenwerks 7, ein in den urspriinglichen Merkmalen w gebildet und im quadratischen Mittel adaptiert, so daß also A ind. die anhand der abgetasteten Muster ermittelte Koeffizientenmatrix der auf der Basis der reduzierten Merkmalsgesamtheiten gebildeten Schätzpolynome ist.If the vector dimension of the feature populations in memory 2 is equal to n and the reduced vector dimension of the feature populations in memory 3 is equal to m, where mn, and the reduced (transformed) m-dimensional feature vector is denoted by «as in the article mentioned, W = (w1 w2 ..... wm) T, (3) and the inW fully quadratic polynomial approach with then, if m = 40 is provided, this has a total of 861 components. With this, the estimating equation is created in the computer stage 7a (cf. equation 5 of the above article) and the polynomial formation according to equation (5) with (4). Since both steps are clearly described, the system can be converted into an equivalent one-step system. Thus, in working stage b of arithmetic logic unit 7, there is a formed in the original features w and adapted in the quadratic mean, so that A ind. is the coefficient matrix of the estimation polynomials formed on the basis of the reduced sets of features, determined on the basis of the sampled patterns.

Der aus diesen Polynomen bestehende vollständig quadratische Klassifikator entsteht aus der Aufeinanderfolge zweier Berechnungsstufen, nämlich der Transformation /vollstandlger quaurallscner niassiriKator, wobei die Ansatziange den Betrag von 23436 Merkmalen und Merkmalspaarungen annimmt.The fully quadratic classifier made up of these polynomials arises from the succession of two calculation stages, namely the transformation / Complete quaurall scner niassirator, where the approach is the amount of 23436 features and pairings of features.

Der Rechenweg ist folgender: Wenn K Zeichenklassen vorhanden sind, hat der Schätzvektori K Komponenten, nämlich die eingangs bereits genannten K skalaren Schätzfunktionen nach Gleichung (1), und entsprechend zerfällt auch die KoeffizientenmatrixAind in K Spaltenvektoren (klassenweise Zerlegung), also und muß sich daher als quadratische Form in (1 WT) schreiben lassen Der Unterschied zwischen den beiden Schreibweisen G1.(9) und Gl.(io) liegt im wesentlichen in der Anordnung der Koeffizienten des Polynoms. In Gl.(9) sind sie in Form eines Spaltenvektors angeordnet, in Gl.(lo) in Form einer symmetrischen Matrix Die überführung der eindimensionalen Darstellung CLind,k in die zweidimensionale Ak* geschieht in zwei leicht nachvollziehbaren Schritten.The calculation method is as follows: If there are K character classes, the estimation vector has K components, namely the K scalar estimation functions already mentioned at the beginning according to equation (1), and accordingly the coefficient matrix Aind also breaks down into K column vectors (class-wise decomposition), i.e. and must therefore be able to be written as a square form in (1 WT) The difference between the two notations Eq. (9) and Eq. (Io) lies essentially in the arrangement of the coefficients of the polynomial. In equation (9) they are arranged in the form of a column vector, in equation (lo) in the form of a symmetrical matrix The conversion of the one-dimensional representation CLind, k into the two-dimensional Ak * takes place in two easily comprehensible steps.

Man schreibt den Spaltenvektor aind,k zunächst abschnittsweise in die untere Hälfte einer Dreiecksmatrix, so daß die ersten m+1 Glieder die erste Spalte, die nächsten m Glieder die zweite Spalte bilden und fährt entsprechend fort, bis das letzte Glied aus cLind,k in das Hauptdiagonalelement der (m+1)-ten Spalte eingetragen ist. Die entstandene Dreiecksmatrix, Fig. 2, wird dann in einem zweiten Schritt halbiert und die eine Hälfte nach Transponierung auf die andere addiert. The column vector aind, k is first written in sections in the lower half of a triangular matrix so that the first m + 1 terms are the first Column, the next m members form the second column and continue accordingly, until the last link from cLind, k into the main diagonal element of the (m + 1) -th column is registered. The resulting triangular matrix, Fig. 2, is then used in a second Step halved and one half added to the other after transposition.

Jede der K skalaren Schätzfunktionen dk(V) aus dem Schätzvektor d = (d1 d2 ... dK)T (8) ist nach den Gleichungen (4) und ( 5) ein vollständig quadratisches Polynom in AN Der transformierte Merkmalsvektor kr geht nacn Cl.t6) durch eine lineare Transformation aus dem Vektor y der direkt gemessenen Zeichenmerkmale hervor. Daher läßt sich der in Gl.(10) gebrauchte Vektor (1 wT) ausdrücken durch Zur Vereinfachung der Schreibweise wird die Matrix dieser linearen Abbildung abgekürzt durch Damit kann Gl.(12) geschrieben werden als Überträgt man die Schreibweise von Gl. (14) in die Gleichung der quadratischen Form, Gl.(10), dann ergibt sich die zur Klasse k gehörende skalare Schätzfunktion als quadratische Form in (1 VT) Die wieder symmetrische Matrix dieser quadratischen Form ist Sie enthält in zweidimensionaler Anordnung sämtliche Koeffizienten des vollständig quadratischen Polynoms in den direkt gemessenen Zeichenmerkmalen. Diese Art der Darstellung kann in die gestrekte Form zurücküberführt werden, Die Komponenten der nach Gleichung (13) in dem Ausdruck enthaltenen Transformationmatrix 8, vgl. hierzu Gleichung (6), bei werdender Berechnung der Transformationsstufe 6 entnommen.Each of the K scalar estimation functions dk (V) from the estimation vector d = (d1 d2 ... dK) T (8) is a fully quadratic polynomial in AN according to equations (4) and (5) .t6) by a linear transformation from the vector y of the directly measured character features. Therefore, the vector (1 wT) used in Eq. (10) can be expressed by To simplify the notation, the matrix of this linear mapping is abbreviated as Thus, Eq. (12) can be written as If the notation of Eq. (14) into the equation of the quadratic form, Eq. (10), then the scalar estimator belonging to class k results as a quadratic form in (1 VT) The again symmetrical matrix of this square shape is It contains all the coefficients of the fully quadratic polynomial in the directly measured character features in a two-dimensional arrangement. This type of representation can be transferred back to the stretched form, The components of the transformation matrix 8 contained in the expression according to equation (13), cf. equation (6), taken from the transformation stage 6 when the calculation is made.

Lu beachten ist dabei, daß die Zeichenmerkmale v. binäre Variable sind, und daher die Koeffizienten der rein quadratischen Terme mit denen der linearen zusammengefaßt werden müssen. Abgesehen von dieser Besonderheit sind jedoch im wesentlichen nur die Operationen rückgängig zu machen, die aind,k aus der gestreckten Form in die Matrixdarstellung Ak* überführt haben.Lu note that the character features v. binary variable are, and therefore the coefficients of the purely quadratic terms with those of the linear ones need to be summarized. Apart from this peculiarity, however, are essentially only to undo the operations that aind, k from the stretched form in have transferred the matrix representation Ak *.

Fig. 3a, b, c Die notwendigen Operationen vollziehen sich in drei Teilschritten, vgl. / Im ersten Schritt werden sämtliche Elemente der oberen Dreiecksmatrix aus Ck* den symmetrisch korrespondierenden Elementen der unteren Dreiecksmatrix zugeschlagen. Da Ck* symmetrisch ist, läuft das darauf hinaus, die Werte in den Positionen der unteren Dreiecksmatrix - jedoch ohnedie Hauptdiagonale - zu verdoppeln. Im zweiten Schritt werden die Werte sämtlicher Hauptdiagonalelemente unter Ausschluß des ersten Hauptdiagonalelementes in die korrespondierenden Positionen der ersten Spalte hineinaddiert. Dadurch vereinigen sich die Koeffizienten bei Polynomgliedern v2i mit den Koeffizienten bei den linearen Polynomgliedern vi. Durch 1 1 diese Maßnahmen haben sich im ursprünglich gegebenen Zahlenschema obere Dreiecksmatrix und Hauptdiagonale - jedoch nicht das erste Hauptdiagonalelement - entleert. Übrig geblieben ist eine untere Dreiecksmatrix ohne Hauptdiagonale - abgesehen vom ersten Hauptdiagonalelement. In einem dritten Verarbeitungsschritt werden schlieBlich die Spaltenvektoren dieses Restschemas nacheinander in den Spaltenvektor Q äqu k übertragen. Fig. 3a, b, c The necessary operations take place in three Sub-steps, see / In the first step, all elements of the upper triangular matrix from Ck * the symmetrically corresponding elements of the lower triangular matrix slammed. Since Ck * is symmetrical, this boils down to the values in the Positions of the lower triangular matrix - but without the main diagonal - to be doubled. In the second step, the values of all main diagonal elements are excluded of the first main diagonal element in the corresponding positions of the first Column added into it. This unites the coefficients in polynomial terms v2i with the coefficients for the linear polynomial terms vi. By 1 1 of these measures have the upper triangular matrix and main diagonal in the originally given number scheme - but not the first main diagonal element - emptied. What is left is one lower triangular matrix without main diagonal - apart from the first main diagonal element. In a third processing step, the column vectors finally become this Transfer residual schemes one after the other into the column vector Q equ k.

Dabei entstehen aus der ersten Spalte die ersten n+ 1 Elemente von aäqu,k, aus der zweiten Spalte die nächsten n-1 Elemente, bis schließlich das eine Element der vorletzten Spalte zum letzten Glied in wird.The first n + 1 elements of result from the first column aäqu, k, from the second column the next n-1 elements, until finally the one Element of the penultimate column becomes the last link in.

äqu,k Der auf diese Weise entstandene Koeffizientenvektor 0Lä.qu,k ist Spaltenvektor aus der Koeffizientenmatrix Aäqu eines vollständig quadratischen Klassifikators mit direktem Polynomansatz der genau dieselben Schätzungen erzeugt wie der vollständig quadratische Klassifikator mit indirektem Polynomansatz, der als Ausgangspunkt benutzt wurde, mit Man erhält die Koeffizientenmatrix 1A.. dieses Klassifikators, aqu indem man die beschriebenen Operationen nacheinander auf die K Spaltenvektoren der Koeffizientenmatrix A inds Gleichung (7), anwendet. Die so errechneten Koeffizienten werden nachfolgend wieder mit aik bezeichnet.equ, k The coefficient vector 0Lä.qu, k created in this way is a column vector from the coefficient matrix Aäqu of a fully quadratic classifier with a direct polynomial approach which produces exactly the same estimates as the fully quadratic classifier with indirect polynomial approach that was used as a starting point, with The coefficient matrix 1A .. of this classifier is obtained by applying the operations described in succession to the K column vectors of the coefficient matrix A in equation (7). The coefficients calculated in this way are again referred to below as aik.

Nach Vorliegen der so ermittelten Schätzpolynomgesamtheit werden nun in dem Rechenwerk 7, Rechenstufe c, aus sämtlichen Polynomen die Koeffizienten aik zusammengestellt und einzeln quadriert, die jeweils zu demselben Bildelement bzw. derselben Bildelementpaarung gehören, und diese jeweils zu demselben Bildelement bzw. demselben Bildelementpaar gehörenden Quadrate werden jeweils zusammenaddiert zu einer Summe Si, wobei also Es werden nun die Beträge der Polynomkoeffizienten als Indikatoren für die Wichtigkeit der zugehörigen Polynomglieder verwendet. Zu diesem Zweck werden in einer Bewertungsstufe 8 die Größen der Beträge S. - in dem die Koeffizienten, weil quadriert, immer positiv kumuliert sind (man könnte statt dessen auch die absoluten Beträge der jeweiligen aik kumulieren) - bewertet durch Zusammenstellung in absteigender Reihenfolge, so daß eine Teilmenge von z.B. N Si-Werten abgrenzbar wird, die alle größer sind als die der Restmenge.Once the total estimated polynomial population has been determined, the arithmetic logic unit 7, arithmetic stage c, compiles the coefficients aik from all polynomials and squares them individually, each belonging to the same picture element or the same picture element pairing, and these respective squares belonging to the same picture element or the same picture element pair are each added together to form a sum Si, where The amounts of the polynomial coefficients are now used as indicators for the importance of the associated polynomial members. For this purpose, the sizes of the amounts S. - in which the coefficients, because squared, are always positively accumulated (you could also accumulate the absolute amounts of the respective aik instead) - are assessed by compiling them in descending order, see above that a subset of, for example, N Si values can be delimited, all of which are greater than those of the remainder.

Zu jedem 5 ist das zugehörige Bildelement bzw. Bildelementpaar ebenfalls in der Bewertungsstufe 8 gespeichert.The associated picture element or picture element pair is also for each 5 stored in evaluation level 8.

Um Schätzpolynome mit jeweils N Gliedern1 z.B. wie eingangs genannt 1.200 Gliedern, für eine endgültige Adaptierlng anhand der vorgegebenen Muster zwecks einstufiger Klassifizierungen von Zeichen des Fonts zu gewinnen, werden schließlich durch eine Auswahleinrichtung 9 diejenigen Bildelemente bzw. Bildelementpaarungen selektiert und einem Speicher 10 zur Registrierung zugeführt, die zu den N größten Si-Werten gehören, was also z.B. durch serielle Zuführung in der vorgenannten Reihenfolge mit Abzählung durch einen Zähler der Auswahleinrichtung durchgeführt werden kann.To estimate polynomials each with N terms1 e.g. as mentioned at the beginning 1,200 links, for a final adaptation based on the given pattern One-level classifications of characters of the font will eventually be gained by a selection device 9 those picture elements or picture element pairs selected and fed to a memory 10 for registration, the N largest Si values belong, for example, by serial feeding in the above-mentioned order can be carried out with counting by a counter of the selection device.

LeerseiteBlank page

Claims (2)

P a t e n t a n 5 p r ü c h e Verfahren für die maschinelle Zeichenerkennung zur Auswahl von Bildelementen und Bildelementkombinationen innerhalb eines Zeichenfensters, die als mit Gewichtungs koeffizienten zu versehende Argumente in Polynomen dienen, welche Klassenzugehörigkeits-Schätzwerte bestimmen, bei dem Zeichenmuster ("Stichproben") abgetastet werden, anhand der Abtastergebnisse den Mustern zugeordnete Merkmalsgesamtheiten registriert werden und die Anzahl der Merkmale dieser Merkmalsgesamtheiten mit einer rechnerischen Transformation reduziert wird, dadurch gekennzeichnet, daß i) die Abtastergebnisse in einem Rechenwerk (7) ausgewertet werden, das a) zu der reduzierten Anzahl von Merkmalen für alle Zeichenklassen je ein Schätzlfert-Polynom unter Verwendung nur dieser Merkmale und ihrer Kombinationen mindestens der Potenz 2 ermittelt, b) diese Polynome dann umrechnet in solche, denen alle im Zeichenfenster abtastbaren Bildelemente nebst deren Kombinationen mindestens der Potenz 2 zugrunde gelegt sind, c) zu den einzelnen Bildelementen und Bildelementkombinationen jeweils einen Wichtigkeitswert aus den zugehörigen Gewichtungskoeffizienten sämtlicher Polynome berechnet, daß 2) aus den Wichtigkeitswerten eine Teilmenge abgrenzbar gemacht wird, deren einzelne Mitglieder dem Betrage nach größer sind als die der Restmenge (Bewertungsstufe 8), und daß 3) diejenigen Bildelemente und Bildelementkombinationen, die den einzelnen Mitgliedern der Teilmenge zugeordnet sind, in einen Speicher (10) zur Registrierung übermittelt werden (Auswahlstufe 9). P a t e n t a n 5 p r ü c h e Process for machine character recognition for the selection of picture elements and picture element combinations within a drawing window, which serve as arguments to be provided with weighting coefficients in polynomials, determine which estimated class membership values for the character pattern ("samples") are scanned, on the basis of the scanning results associated with the patterns feature populations are registered and the number of features of these sets of features with a computational transformation is reduced, characterized in that i) the Sampling results are evaluated in an arithmetic unit (7), which a) to the reduced Number of features for all character classes each using an estimator polynomial only these features and their combinations are determined at least to the power of 2, b) these polynomials are then converted into those that can all be scanned in the drawing window Image elements and their combinations are based on at least the power of 2, c) an importance value for each of the individual picture elements and picture element combinations calculated from the associated weighting coefficients of all polynomials that 2) a subset is made delimitable from the importance values, the individual Members are larger in amount than the remaining amount (evaluation level 8), and that 3) those picture elements and picture element combinations which make up the individual Members of the subset are assigned to a memory (10) for registration transmitted (selection level 9). 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß als Wichtigkeitswerte die Summen der Quadrate der einzelnen Gewichtungskoeffizienten ermittelt werden, die jeweils zu demselben Bildelement bzw. derselben Bildelementkombination gehören.2. The method according to claim 1, characterized in that the importance values the sums of the squares of the individual weighting coefficients are determined, which each belong to the same picture element or the same picture element combination.
DE19762619014 1976-04-30 1976-04-30 Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction Ceased DE2619014A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE19762619014 DE2619014A1 (en) 1976-04-30 1976-04-30 Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction
SE7704668A SE7704668L (en) 1976-04-30 1977-04-22 MACHINE IDENTIFICATION PROCEDURE BY NERMEVERDE-POLYNOM
IT22995/77A IT1076729B (en) 1976-04-30 1977-04-29 DEVICE FOR AUTOMATIC RECOGNITION OF WRITING CHARACTERS USING ESTIMATE POLYNOMES

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19762619014 DE2619014A1 (en) 1976-04-30 1976-04-30 Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction

Publications (1)

Publication Number Publication Date
DE2619014A1 true DE2619014A1 (en) 1977-11-10

Family

ID=5976686

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762619014 Ceased DE2619014A1 (en) 1976-04-30 1976-04-30 Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction

Country Status (3)

Country Link
DE (1) DE2619014A1 (en)
IT (1) IT1076729B (en)
SE (1) SE7704668L (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2817341A1 (en) * 1978-04-20 1979-10-25 Computer Ges Konstanz OPTICAL HAND READER FOR MACHINE CHARACTER RECOGNITION

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2817341A1 (en) * 1978-04-20 1979-10-25 Computer Ges Konstanz OPTICAL HAND READER FOR MACHINE CHARACTER RECOGNITION
US4246570A (en) * 1978-04-20 1981-01-20 Computer Gesellschaft Konstanz Mbh Optical wand for mechanical character recognition

Also Published As

Publication number Publication date
SE7704668L (en) 1977-10-31
IT1076729B (en) 1985-04-27

Similar Documents

Publication Publication Date Title
DE2909153C2 (en) Device for the digital analysis of image or drawing patterns
DE2934971C2 (en) Central processor working according to the assembly line principle
DE2835689A1 (en) ARRANGEMENT FOR CHANGING THE RESOLUTION FOR IMAGE DATA ACQUISITION AND TRANSFER
DE19623033C1 (en) Pattern recognition method using statistical process
DE3520014A1 (en) DATA CORRELATION ARRANGEMENT AND METHOD FOR DETERMINING ADJUSTMENTS BY PSEUDOCORRELATION VALUES
DE1217670B (en) Learnable distinction matrix for groups of analog signals
DE102017220307A1 (en) Device and method for recognizing traffic signs
DE4217832A1 (en) PATTERN RECOGNITION AND PATTERN LEARNING DEVICE
DE1915819A1 (en) Method and arrangement for adaptive character recognition
DE112017002766T5 (en) CHARACTERISTIC SCALING DEVICE, CHARACTERISTIC POSITIONING ASSESSMENT SYSTEM, CHARACTERISTIC POSITIONING METHOD AND CHARACTERISTIC POSITIONING PROGRAM
DE2623861A1 (en) METHOD OF RECOGNIZING CHARACTERS
DE2064602A1 (en) Procedure and arrangement for character separation in machine character recognition
DE2263757C2 (en) Analog-to-digital converter with reduced quantization noise
DE2813157C2 (en) Device for automatic, position-independent pattern recognition
DE2838185C2 (en) Correlation device in a radar device for detecting a radar signal from the noise
DE1294074B (en) Character recognition device with column-by-column scanning
DE2619014A1 (en) Information processing character recognition - uses estimated polynomials for weighting factor determination and coordinate reduction
DE102013225768A1 (en) Method and apparatus for determining a LOLIMOT model
DE10234086A1 (en) Procedure to evaluate signal of electronic image sensor during pattern recognition of image content of test piece, by forming characteristics, making fuzzy, interference, making defuzzy and deciding class membership
EP0600569B1 (en) Method for evaluating a number of linguistic rules
DE102021118734A1 (en) Image identification device, method for performing semantic segregation and program
DE1284127B (en) Function generator for special autocorrelation functions
CH646805A5 (en) OPTICAL HAND READER FOR MECHANICAL CHARACTER RECOGNITION.
DE60106735T2 (en) METHOD FOR EFFICIENT CODING OF FORMALLY DESCRIBED PARAMETERS
DE102007025620A1 (en) Device for determining an object and / or existence probability of a search object in a read-out window of an image, method and computer program

Legal Events

Date Code Title Description
8131 Rejection