DE69734831T2

DE69734831T2 - Adaptive steuerung der datenrate für digitale videokompression

Info

Publication number: DE69734831T2
Application number: DE69734831T
Authority: DE
Inventors: T. Donald PIAN; U. Chong LEE
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 1996-10-11
Filing date: 1997-10-09
Publication date: 2006-08-31
Anticipated expiration: 2017-10-10
Also published as: BR9714301A; EP0931417B1; JP4698772B2; ATE312477T1; US20060126732A1; CN1190083C; WO1998017065A1; CA2268408C; US6366614B1; JP2009005365A; US20020021754A1; EP0931417A1; US7023915B2; US7675969B2; JP4824726B2; CN1251725A; ID28372A; CA2268408A1; JP2001524270A; AU735938B2

Description

Hintergrund der Erfindung
I. Gebiet der Erfindung
Die vorliegende Erfindung betrifft eine Bildverarbeitung. Insbesondere betrifft die vorliegende Erfindung ein neues und verbessertes System und ein Verfahren zum adaptiven Steuern der digitalen Bitrate einer Kompression bzw. Kompremierung in einer Video-Codiereinrichtung.
II. Beschreibung der verwandten Technik
In dem Gebiet einer Übertragung und eines Empfangs von Fernsehsignalen werden verschiedene Verbesserungen an dem NTSC-System (National Television Systems Committee) gemacht. Entwicklungen in dem Gebiet des Fernsehens sind im Allgemeinen auf die SDTV(standard definition television)-Systeme und HDTV(high definition television)-Systeme gerichtet.
Viele der vorgeschlagenen SDTV- und HDTV-Systeme verwenden digitale Codiertechniken. Digital codiertes Video bietet viele Vorteile gegenüber einer analogen Modulation. Eine digitale Codierung liefert eine Robustheit der Kommunikationsverbindung gegenüber Beeinträchtigungen wie Mehrwege und Störung. Ferner erleichtern digitale Techniken eine Signalverschlüsselung, die für das Militär und viele Broadcast-Anwendungen erforderlich ist.
Als es anfangs vorgeschlagen wurde, erschien HDTV aufgrund von übermäßigen Bandbreiteanforderungen unpraktisch. Jedoch wurde realisiert, dass eine Kompression von digitalen HDTV-Signalen bis zu einem Grad erreicht werden kann, der eine Übertragung bei Bandbreiten ermöglicht, die vergleichbar sind mit den von analogen NTSC-Formaten. Ein derartiger Grad einer Signalkompression verbunden mit einer digitalen Übertragung des Sig nals ermöglicht einem HDTV-System, mit weniger Leistung und größerer Immunität gegenüber Kanalbeeinträchtigungen zu übertragen.
Eine Kompressionstechnik, die eine signifikante Kompression bieten kann unter Beibehaltung der Qualität von SDTV- und HDTV-Signalen verwendet adaptiv große Blöcke und Teilblöcke von codierten diskrete Kosinus-Transformations(DCT – discrete cosine transform)-Koeffizientendaten. Die Technik wird offenbart in dem U.S.-Patent Nr. 5,021,891 mit dem Titel „A-DAPTIVE BLOCK SIZE IMAGE COMPRESSION METHOD AND SYSTEM", das der Anmelderin der vorliegenden Erfindung erteilt wurde. DCT-Techniken werden auch offenbart in dem U.S.-Patent Nr. 5,107,345 mit dem Titel „ADAPTIVE BLOCK SIZE IMAGE COMPRESSION METHOD AND SYSTEM", das der Anmelderin der vorliegenden Erfindung erteilt wurde und durch Bezugnahme aufgenommen ist. Ferner ist das U.S.-Patent Nr. 5,452,104 mit dem Titel „ADAPTIVE BLOCK SIZE IMAGE COMPRESSION METHOD AND SYSTEM" ebenfalls der Anmelderin der vorliegenden Erfindung erteilt worden.
Techniken, die einen wesentlichen Grad an Kompression bieten, verwenden oft Codierschemata mit variabler Länge. Bei einer Codierung mit variabler Länge werden verschiedene Abtastwerte (samples) eines Signals unter Verwendung unterschiedlicher Längen von Codewörtern quantisiert. Der Codierer ist im Allgemeinen basierend auf den theoretischen oder gemessenen Statistiken eines Bildes ausgebildet, um den Gesamtrekonstruktionsfehler zu minimieren. Durch Ausnutzen der Wahrscheinlichkeitsverteilung der Charakteristiken in einem Bild sind hohe Kompressionsverhältnisse möglich.
Obwohl eine Codierung mit variabler Länge hohe Kompressionsverhältnisse liefern kann, verursacht es auch eine Komplikation aufgrund einer nicht- konstant codierten Datenrate. Eine Codierung mit variabler Länge erzeugt im Allgemeinen lange Codewörter für Bildbereiche mit vielen Details und kurze Codewörter für Bildbereiche mit wenig Details. Wenn eine Codierung mit variabler Länge zur Codierung von Video verwendet wird, können unterschied liche Rahmen des Videos mit unterschiedlichen Längen von Codewörtern codiert werden. Diese Codewörter müssen über einen Kommunikationskanal mit einer vorgegebenen Bitrate übertragen werden. Ferner müssen die Codewörter in Anwendungen wie SDTV- und HDTV-Systemen an den Decoder mit einer Rate übertragen werden, die eine Rekonstruktion der Rahmen des Videos ohne Fluktuationen in der Rahmenrate ermöglicht.
Ein Ratenpuffer wurde verwendet, um die Übertragungsrate der codierten Datenbits beizubehalten. Jedoch löst die Verwendung eines Puffers nicht an sich das Problem von Fluktuationen in der decodierten Rahmenrate. Ferner kann ein Pufferüberlauf entstehen, wenn ein Videorahmen mit langen Codewörtern codiert wurde, welche die Kapazität des Puffers übersteigen, was zu dem Verlust von Information führt. Folglich ist eine Ratensteuerung für die Videokompression erforderlich. Diese Probleme und Unzulänglichkeiten sind in der Technik bekannt und werden durch die vorliegende Erfindung auf die im Folgenden beschriebene Weise gelöst.
Zusammenfassung der Erfindung
Die vorliegende Erfindung ist ein neues und verbessertes System und ein Verfahren zum Steuern der codierten Datenrate in einem Videokompressionsverfahren. Wenn Video komprimiert wird, können unterschiedliche Segmente des Videos mit unterschiedlichen Längen von Codewörtern codiert werden. Um die Codewörter über einen Kommunikationskanal mit einer konstanten Rate zu übertragen, unter Beibehaltung der Zuverlässigkeit des Codierers, ist eine Steuerung der codierten Bitrate erforderlich. Das vorliegende System und das Verfahren erreicht eine Ratensteuerung durch Aufbau alternativer codierter Bitströme für jedes Segment des Videos und Auswahl der Alternative, die eine Bitrate am nächsten zu einer vorgegebenen Zielbitrate erzeugen würde. Die Zielbitrate wird basierend auf dem Ratenpufferstatus gewählt.
Gemäß der vorliegenden Erfindung ist eine adaptive Datenrate-Steuereinrichtung offenbart, die eine Vielzahl von Quantisierern aufweist. Die Raten-Steuereinrichtung empfängt als Eingang einen Block von Videodaten und derselbe Block von Videodaten wird an jeden der Quantisierer geliefert. Jeder Quantisierer quantisiert die Abtastwerte der Eingabe gemäß einer anderen Gewichtungsmaskenfunktion, um einen Block von quantisierten Koeffizienten zu erzeugen. Jede Gewichtungsmaskenfunktion wird von einem Quantisierungsindex identifiziert. Eine Gewichtungsmaskenfunktion ist ausgebildet, bestimmte Abtastwerte (samples) der Eingabe zu betonen (emphasize) und andere Abtastwerte abzuschwächen bzw. zu deakzentuieren (deemphasize) durch unterschiedliches Gewichten der Abtastwerte. Somit können die entsprechenden quantisierten Abtastwerte der verschiedenen Blöcke von quantisierten Koeffizienten als Ergebnis einer unterschiedlichen Gewichtung unterschiedliche Werte aufweisen.
Die adaptive Ratensteuereinrichtung weist auch eine Vielzahl von Codierern auf. Jeder Codierer empfängt einen der Blöcke von quantisierten Koeffizienten und erzeugt einen Strom von mit variabler Länge codierten Koeffizienten. Da jeder Block der quantisierten Koeffizienten von einer anderen Gewichtungsfunktion verarbeitet wurde, können die Abtastwerte jedes Blocks mit unterschiedlichen Längen von Codewörtern codiert werden. Als ein Ergebnis kann jeder Strom von mit variabler Länge codierten Koeffizienten eine Codelänge aufweisen, die von den anderen verschieden ist.
Die mit variabler Länge codierten Ströme werden an eine Auswahlvorrichtung bzw. an einen Selektor geliefert, während die Gesamtbitraten, die zur Übertragung jedes der mit variabler Länge codierten Ströme erforderlich sind, bestimmt werden und an einen Vergleicher bzw. Komparator geliefert werden. Die Gesamtbitraten sind proportional zu der Summe der Codelängen der codierten Ströme. Der Komparator vergleicht jede der Gesamtbitraten mit einer vorgegebenen Zielbitrate, um die Rate zu bestimmen, die dem Ziel am nächsten ist. Der Selektor wählt dann den mit variabler Länge codierten Strom, der eine Bitrate am nächsten zu dem vorgegebenen Ziel lie fert, und liefert diesen Strom an einen Ratenpuffer zur Vorbereitung einer Übertragung.
Nachdem der aktuelle Block des Videosignals verarbeitet wurde, bereitet sich die Ratensteuereinrichtung vor, den nächsten Block des Videosignals zu verarbeiten durch Aktualisieren der Gewichtungsmaskenfunktionen. Ein Quantisierungsindex-Aktualisierungselement wählt einen neuen Satz von Quantisierungsindizes, aus denen die Gewichtungsmaskenfunktionen abgeleitet werden. Die neuen Quantisierungsindizes werden basierend auf einem Modell der Rate im Verhältnis zu dem Quantisierungsindex und einer aktualisierten Zielbitrate gewählt.
Ein Modellelement leitet das Modell der Rate im Verhältnis zu dem Quantisierungsindex ab. Das Modell wird abgeleitet aus den Raten- und Quantisierungsindexdaten aus dem aktuellen Block des Videosignals. Somit werden die Quantisierungsindizes, die für den aktuellen Block des Videos verwendet werden, und die entsprechenden Bitraten verwendet, um das Modell abzuleiten. Die aktualisierte Zielbitrate wird von einem Zielbitrate-Aktualisierungselement basierend auf dem Ratenpufferfüllpegel nach Verarbeitung des aktuellen Blocks der Videoeingabe abgeleitet. Die aktualisierte Zielbitrate wird so gewählt, um einen konstanten Strom von Daten durch den Ratenpuffer beizubehalten sowie einen Ratenpufferüberlauf zu verhindern. Basierend auf dem Modell und der aktualisierten Zielbitrate ist ein neuer Quantisierungsindex der Index, der die aktualisierte Zielbitrate wie von dem Modell angezeigt liefern würde. Andere neue Quantisierungsindizes sind im Allgemeinen Funktionen des bereits bestimmten neuen Quantisierungsindexes.
Nachdem die Gewichtungsmaskenfunktionen aktualisiert sind, beginnt die adaptive Ratensteuereinrichtung der vorliegenden Erfindung die Verarbeitung des nächsten Blocks der Videoeingabe.
Kurze Beschreibung der Zeichnungen
Die Merkmale, Aufgaben und Vorteile der vorliegenden Erfindung werden offensichtlicher aus der im Folgenden dargelegten detaillierten Beschreibung in Verbindung mit den Zeichnungen, in denen gleiche Bezugszeichen Entsprechendes identifizieren und wobei:
1 eine Blockdarstellung ist, die ein beispielhaftes Codierungssystem darstellt, in dem eine Ratensteuereinrichtung verwendet wird;
2 eine Blockdarstellung ist, die einen beispielhaften Pre-Prozessor darstellt, der Koeffizienten für den Codierer erzeugt;
3 eine Blockdarstellung ist, welche die Verarbeitungselemente des Codierers und die Ratensteuereinrichtung darstellt;
4 ein Graph ist, der ein exponentielles Modell eines Quantisierungsindexes im Verhältnis zu der Bitrate darstellt;
5a–5c Blockdarstellungen sind, welche die Verarbeitungselemente darstellen, welche die Raten-gesteuerten Datenkomponenten eines Farbsignals zur Übertragung wählen;
6 eine Blockdarstellung ist, welche die Verarbeitungselemente darstellt, welche die Quantisierungsindizes ableiten, die zur Quantisierung eines empfangenen Farbvideosignals verwendet werden; und
7a–7c Serien von Graphen sind, die Modelle eines Quantisierungsindexes im Verhältnis zur Bitrate für jede der Farbkomponenten eines Farbsignals darstellen; und
7d ein Graph ist, der ein Verbundmodell eines Quantisierungsindexes im Verhältnis zur Bitrate für alle Komponenten eines Farbsignals darstellt.
Detaillierte Beschreibung der bevorzugten Ausführungsbeispiele
Ein beispielhaftes Datenkompressionssystem, das die Ratensteuereinrichtung der vorliegenden Erfindung enthält, wird in 1 dargestellt. Das in 1 gezeigte System kann verwendet werden, um ein Videosignal zur Übertragung zu komprimieren. Zum Beispiel kann das in 1 gezeigte System verwendet werden, um ein HDTV- oder SDTV-Signal zu komprimieren, obwohl es offensichtlich ist, dass jeder andere Typ von Videosignal oder sogar Audio von diesem Kompressionssystem einen Vorteil haben kann.
Wie in 1 gezeigt, wird ein Videosignal zuerst einem Pre-Prozessor bzw. Vorprozessor 10als Vorbereitung für eine Kompression präsentiert. Der Pre-Prozessor 10 kann einer Vielzahl von Zwecken dienen oder kann ganz aus dem System ausgeschlossen sein. Der Pre-Prozessor 10 kann zum Beispiel das Videosignal in Komponenten formatieren, die von dem Kompressionssystem einfacher verarbeitet werden können. Die Ausgabe des Pre-Prozessors 10 wird einem Codierer 12 präsentiert. Der Codierer 12 quantisiert die Daten, die er empfangen hat, und komprimiert dann die quantisierten Koeffizienten. Das durchgeführte Quantisierungsschema ist abhängig von den Rückkopplungsquantisierungsparametern von einer Ratensteuereinrichtung 14. Die Ratensteuereinrichtung 14 verwendet Statistiken, die das aktuell codierte Videosegment charakterisieren, um die Quantisierungsparameter zur Codierung des nächsten Videosegments adaptiv zu setzen. Die Ratensteuereinrichtung 14 präsentiert die Raten-gesteuerten codierten Daten auch einem Formatierer 16. Der Formatierer 16 nimmt die Ratengesteuerten Daten und assembliert die Daten in einen formatierten Bitstrom zur Übertragung auf einem Kommunikationskanal.
Eine mögliche Implementierung des Pre-Prozessors 10 wird in 2 dargestellt. Wie in 2 gezeigt wird, weist der Pre-Prozessor 10 einen zweidimensionalen diskreten Kosinus-Transformations(DCT – discrete cosine transform)-Operator 18 auf. Ein Segment eines Videosignals, im Allgemeinen ein NxN-Block von Zeit-abgetasteten Pixels, wird einem DCT-Operator 18 als Eingabe präsentiert. Aus dem Block der Zeit-abgetasteten Pixels erzeugt der DCT-Operator 18 einen Block von DCT-Koeffizienten.
Der DCT-Operator 18 ist ein Verfahren zum Konvertieren eines Zeitabgetasteten Signals in eine Frequenzdarstellung desselben Signals. Durch Konvertieren in eine Frequenzdarstellung zeigten die DCT-Techniken, dass sie einen sehr hohen Grad an Kompression ermöglichen, da Quantisierer gestaltet werden können, einen Vorteil aus den Frequenzverteilungscharakteristiken eines Bildes zu ziehen. Ein Kompressionssystem, das DCT-Transformationen verwendet, wird in den oben erwähnten U.S.-Patenten Nr. 5,021,891; 5,107,345 und 5,452,104 beschrieben.
Der Block von DCT-Koeffizienten wird dem Codierer 12 präsentiert, wobei die codierte Bitrate von der Ratensteuereinrichtung 14 gesteuert wird. In einem beispielhaften Ausführungsbeispiel werden der Codierer 12 und die Ratensteuereinrichtung 14 in einem Mikroprozessor oder digitalen Signalprozessor implementiert, die programmiert sind, die Funktionen wie beschrieben vorzusehen.
Unter Bezugnahme nun auf 3 werden die Details des Codierers 12 und der Ratensteuereinrichtung 14 gezeigt. Zum Zweck der Darstellung wird 3 hinsichtlich einer Verarbeitung eines Luminanzvideosignals beschrieben. Eine Verarbeitung eines Farbvideosignals wird später beschrieben. Der Codierer 12 weist eine Vielzahl von Quantisierern 20a–20c und eine entsprechende Vielzahl von Codierern 22a–22c mit variabler Länge auf. Drei Sätze von Quantisierern 20a–20c und Codierern 22a–22c mit variabler Länge werden gezeigt, obwohl anzumerken ist, dass stattdessen eine andere Anzahl von Elementen verwendet werden kann.
Jeder der drei Quantisierer 20a–20c empfängt denselben Block von DCT-Koeffizienten, als F bezeichnet, als Eingabe. Jeder Quantisierer 20a–20c empfängt von der Ratensteuereinrichtung 14 auch ein Signal eines Rückkopplungsquantisierungsindexes, mit q₁–q₃ bezeichnet. In 3 stellen die drei Quantisierer 20a–20c drei Quantisierungseinstellungen oder drei Arten zum Quantisieren desselben Eingangssignals dar. Die Ausgaben der Quantisierer 20a–20c sind Blöcke von quantisierten DCT-Koeffizienten, in 3 als QC1–QC3 bezeichnet.
In einem bevorzugten Ausführungsbeispiel ist die Quantisierungseinstellung, die von jedem Quantisierer 20a–20c zur Quantisierung des Eingangssignals verwendet wird, eine Gewichtungsmaskenfunktion, die in der Technik auch als Quantisierungsmatrix bekannt ist. Jede Gewichtungsmaskenfunktion wird abgeleitet durch Multiplizieren einer ausgewählten Quantisierungsschrittgröße (qss_i) mit den Koeffizienten einer Tabelle von Frequenzgewichtungen. Die qss_i ist eine Funktion des Quantisierungsindexes q_i derart, dass qssi = f(qi). (1)In einem bevorzugten Ausführungsbeispiel ist qssi = 2(qi). (2)
Eine Tabelle von Frequenzgewichtungen mit denselben Dimensionen wie der Block von eingegebenen DCT-Koeffizienten wird verwendet, um unterschiedliche Gewichtungen auf die verschiedenen DCT-Koeffizienten anzuwenden. Die Gewichtungen sind derart gestaltet, die eingegebenen Abtastwerte mit einem Frequenzinhalt, auf den das menschliche visuelle System empfindlicher ist, zu betonen und die Abtastwerte mit einem Frequenzinhalt, auf den das visuelle System weniger empfindlich ist, abzuschwächen. Die Gewichtungen werden basierend auf empirischen Daten gewählt. Ein Verfahren zur Gestaltung der Gewichtungsmasken für 8 × 8 DCT-Koeffizienten wird offenbart in ISO/IEC JTC1 CD 10918 „Digital compression and encoding of continuous-tone still images – part 1: Requirements and guidelines", International Standards Organization, 1994.
Somit wird der Quantisierungsindex q₁ multipliziert mit der Tabelle von Frequenzgewichtungsmasken, um eine erste Gewichtungsmaskenfunktion zu erzeugen. Die DCT-Koeffizienten werden mit entsprechenden Koeffizienten der ersten Gewichtungsmaskenfunktion multipliziert, um einen ersten Block von quantisierten Koeffizienten, als QC1 bezeichnet, zu erzeugen. Ähnlich werden die Quantisierungsindizes q₂ und q₃ jeweils mit derselben Tabelle von Frequenzgewichtungsmasken multipliziert, um zweite und dritte Gewichtungsmaskenfunktionen jeweils in den Quantisierern 20b und 20c zu erzeugen. Dann werden die DCT-Koeffizienten mit den entsprechenden Koeffizienten der zweiten Gewichtungsmaskenfunktion multipliziert, um einen zweiten Block von quantisierten Koeffizienten zu erzeugen, als QC2 bezeichnet. Die DCT-Koeffizienten werden auch mit den entsprechenden Koeffizienten der dritten Gewichtungsmaskenfunktion multipliziert, um einen dritten Block von quantisierten Koeffizienten zu erzeugen, als QC3 bezeichnet. Die Beschriftung (k, l) betrifft die Position eines Koeffizienten in einem Block und FWM (frequency weighting mask) betrifft die Tabelle von Frequenzgewichtungsmasken, wobei die Operationen der Quantisierer 20a–20c von den folgenden Gleichungen beschrieben werden können: QC1(k,l) = F(k,l) × FWM(k,l) × qss1; (3) QC2(k,l) = F(k,l) × FWM(k,l) × qss2; (4) QC3(k,l) = F(k,l) × FWM(k,l) × qss3; (5)
Die Signale QC1–QC3 werden jeweils in die Codierer 22a–22c mit variabler Länge eingegeben. Die quantisierten DCT-Koeffizientenwerte werden jeweils codiert unter Verwendung von Codierern mit variabler Länge, um die Datenrate zu minimieren. Die drei in 3 gezeigten Codierer 22a–22c mit variabler Länge können alle dasselbe Codierschema mit variabler Länge implementieren oder unterschiedliche Codieralgorithmen mit variabler Länge implementieren. Die Ausgaben der Codierer 22a–22c mit variabler Länge sind Signale von serialisierten Strömen mit variabler Länge codierter Koeffizienten und werden als VC1–VC3 bezeichnet.
Eine Technik zur Implementierung von Codierern 22a–22c mit variabler Länge verwendet eine Lauflängen(run length)-Codierung mit Nullen nach einer Zickzack-Bildabtastung (scanning) gefolgt von einer Huffman-Codierung. Diese Technik wird in den oben erwähnten U.S.-Patenten Nr. 5,021,831; 5,107,345 und 5,452,104 detailliert diskutiert und hier zusammengefasst. Ein Lauflängen-Codierer nimmt die quantisierten Signale, in diesem Fall QC1–QC3, und trennt die Null-Koeffizienten von den von Null verschiedenen Koeffizienten. Die Null-Werte werden als Lauflängen-Werte bezeichnet und werden Huffman-codiert. Die von Null verschiedenen Werte werden getrennt Huffman-codiert.
Huffman-Codes werden entweder aufgrund von den gemessenen oder den theoretischen Statistiken eine Bildes gestaltet. Es wurde beobachtet, dass die meisten natürlichen Bilder aus leeren oder relativ langsam variierenden Bereichen und aus lebhaften Bereichen bestehen, wie Objektgrenzen und kontrastreiche Textur. Huffman-Codierer mit Frequenzbereichs-Transformationen, wie der DCT, nutzen diese Merkmale aus durch Zuweisen von mehr Bits an die lebhaften Bereiche und weniger Bits an die leeren Bereiche.
Unter Bezugnahme weiterhin auf 3 ist zu sehen, dass die Signale VC1–VC3 in entsprechende Ratenmessvorrichtungen 24a–24c eingegeben werden. Jede der Ratenmessvorrichtungen 24a–24c bestimmt die Bitrate, die erforderlich ist zur Übertragung der jeweiligen mit variabler Länge codierten Koeffizienten der Signale VC1–VC3. Die Ausgabe aus jeder Ratenmessvorrichtung 24a–24c ist ein Signal mit einem einzelnen Wert, der die Bitrate des Blocks von DCT-Koeffizienten anzeigt. Die Bitrate ist proportional zu der Anzahl von erforderlichen Bits, um den Block von DCT-Koeffizienten mit variabler Länge zu codieren. Die Signale, die den Ausgaben von den Ratenmessvorrichtungen 24a–24c entsprechen, werden jeweils als r₁–r₃ bezeichnet.
Zwei Sätze von Signalen werden von dem Codierer 12 an die Ratensteuervorrichtung 14 ausgegeben. Die Ratensteuervorrichtung 14 empfängt die Signale der mit variabler Länge codierten Koeffizienten, VC1–VC3. Einer der VC1–VC3 wird von der Ratensteuervorrichtung 14 zur Übertragung ausgewählt. Die Ratensteuervorrichtung 14 empfängt auch die Signale r₁–r₃, welche die Bitraten der mit variabler Länge codierten Koeffizienten VC1–VC3 darstellen. Die Rateninformation hilft bei der Auswahl der mit variabler Länge codierten Koeffizienten. Die Ratensteuervorrichtung 14 erzeugt auch unter Verwendung der Rateninformation aktualisierte Quantisierungsindizes, die von den Quantisierern 20a–20c bei der Quantisierung des nächsten Segments der Videoeingabe verwendet werden. Die aktualisierten Indizes werden gebildet, um die Bitrate des nächsten Segments der Videoeingabe zu steuern.
Wie in 3 gezeigt, werden Signale, welche die mit variabler Länge codierten Koeffizienten VC1–VC3 anzeigen, in einen Selektor 28 der Ratensteuervorrichtung 14 eingegeben, während Signale, welche die Raten r₁–r₃ anzeigen, in einen Komparator 30 und ein Modellelement 32 der Ratensteuervorrichtung 14 eingegeben werden. Der Komparator 30 vergleicht die drei Raten r₁–r₃ mit einer gewünschten Bitrate, um die am nächsten zu der gewünschten Rate liegende Rate auszuwählen. Basierend auf der gewählten Rate liefert der Komparator 30 ein Signal an den Selektor 28, das anzeigt, welcher der Ströme der mit variabler Länge codierten Koeffizienten VC1, VC2 oder VC3 zur Übertragung gewählt wurde. Die Funktion des Modellelements 32 wird später beschrieben.
Mehrere Auswahlalgorithmen können verwendet werden, um den Strom von mit variabler Länge codierten Koeffizienten zur Übertragung zu wählen. Ein bevorzugtes Ausführungsbeispiel wählt den Strom, der den absoluten codierten Ratenfehler minimiert. Dieses Verfahren vergleicht eine vorgegebene Zielbitrate mit jeder Raten r₁, r₂ und r₃ gemäß der Gleichung: min |T – ri| (6) wobei T die Zielbitrate ist und r_i für i = 1, 2, 3 sich jeweils auf die Raten r₁–r₃ bezieht. In einem alternativen Ausführungsbeispiel wählt der Selektor 28 den mit variabler Länge codierten Strom, der den Ratenfehler minimiert und der eine Rate hat, die geringer als die Zielrate ist. In einem zweiten alternativen Ausführungsbeispiel wählt der Selektor 28 den Strom, der die Minimumrate erzeugt.
Der Selektor 28 liefert das Signal des Stroms der mit variabler Länge codierten Koeffizienten, das zur Übertragung gewählt wurde, an eine Ratenpuffer 34, um auf die Übertragung durch den Kommunikationskanal zu warten. Das gewählte Signal stellt ein Raten-gesteuertes Videosignal dar. Dann wird, unter Bezugnahme zurück zu 1, das Raten-gesteuerte Datensignal an den Formatierer 16 geliefert, der das Datensignal mit Steuerungs- und Identifizierungssignalen zur Vorbereitung auf die Übertragung formatiert. Signale, die den Beginn eines Blocks, den Beginn eines Rahmens, die Blocknummer, die Rahmennummer und eine Quantisierungsinformation anzeigen, sind einige der Signale, die von dem Formatierer 16 an das Datensignal angehängt werden.
An diesem Punkt ist das aktuelle Segment der Videoeingabe verarbeitet zur Übertragung. Es ist nun erforderlich, das System zu aktualisieren, um das nächste Segment von Video Raten-gesteuert zu codieren und das nächste Segment zur Übertragung vorzubereiten. Wenn die Ratensteuereinrichtung 14 die codierte Bitrate anpasst durch Auswahl zwischen drei Strömen von codierten Koeffizienten für jedes Segment von Video, muss ein neuer Satz von drei Quantisierungsindizes abgeleitet werden.
Die neuen Quantisierungsindizes werden abgeleitet durch ein in 3 gezeigtes Quantisierungsindex-Aktualisierungselement 36. Das Quantisierungsindex-Aktualisierungselement 36 leitet die Indizes basierend auf Eingangssignalen von dem Modellelement 32 und einem Zielbitrate-Aktualisierungselement 38 ab. Das Modellelement 32 leitet ein Modell einer codierten Bitra te im Verhältnis zu einem Quantisierungsindex ab. Das Zielbitrate-Aktualisierungselement 38 leitet eine aktualisierte Zielbitrate für das nächste Segment einer Videoeingabe ab. Basierend auf der aktualisierten Zielbitrate und dem Modell der codierten Bitrate im Verhältnis zu dem Quantisierungsindex werden drei aktualisierte Quantisierungsindizes zur Quantisierung des nächsten Segments von Video gewählt.
Das Modellelement 32 leitet ein Modell des Quantisierungsindexes im Verhältnis zu der Bitrate für das nächste Videosegment basierend auf den Daten der Quantisierungsindizes und Raten von dem aktuellen Videosegment ab. Noch immer unter Bezugnahme auf 3 ist zu sehen, dass das Modellelement 32 als Eingabe Signale empfängt, welche die drei Quantisierungsindizes q₁–q₃ anzeigen, die zur Verarbeitung des aktuellen Videosegments verwendet werden. Das Modellelement 32 empfängt als Eingabe auch Signale der drei Raten r₁–r₃, die den Raten der aktuellen drei Ströme der mit variabler Länge codierten Koeffizienten VC1–VC3 entsprechen. Aus den drei Sätzen von Datenpunkten (q₁, r₁), (q₂, r₂) und (q₃, r₃) wird ein Modell abgeleitet durch Anpassen (fitting) einer Kurve durch die drei Datenpunkte. In dem bevorzugten Ausführungsbeispiel wird ein exponentielles Modell für die Kurvenanpassung verwendet.
Das exponentielle Modell wird gemäß der Gleichung definiert:
wobei x_i den Quantisierungsindex bezeichnet, der einen Bereich von 0 bis 31 in einem bevorzugten Ausführungsbeispiel hat, obwohl anzumerken ist, dass stattdessen ein anderer Bereich von Quantisierungsindizes verwendet werden kann. Die entsprechende codierte Rate wird mit rate_i(y_i) bezeichnet. Die Parameter b, m des exponentiellen Modells können bestimmt werden, indem erkannt wird, dass: ln ratei = ln yi = ln b + xi ln m (8)
Wenn A den Satz von n (n = 3) Quantisierungsindizes bezeichnet, die verwendet werden, um den aktuellen Datenrahmen zu codieren, kann die Lösung der kleinsten Fehlerquadrate für das Modell definiert werden als:
Eine Darstellung eines beispielhaften exponentiellen Modells wird in 4 gezeigt. Das in 4 gezeigte exponentielle Modell wird von den drei Paaren von Datenpunkten (q₁, r₁), (q₂, r₂) und (q₃, r₃) abgeleitet bzw. aus diesen gewonnen. Signale der Parameter b und m werden in das Quantisierungsindex-Aktualisierungselement 36 eingegeben.
Wie oben erwähnt, empfängt das Quantisierungsindex-Aktualisierungselement 36 als Eingabe auch Signale einer aktualisierten Zielbitrate von dem Zielbitrate-Aktualisierungselement 38. Unter Bezugnahme zurück zu 3 wird die aktualisierte Zielbitrate von dem Zielbitrate-Aktualisierungselement 38 bestimmt basierend auf dem Ratepufferstatus oder dem Ratepufferfüllpegel nach der Verarbeitung des aktuellen Segments der Videoeingabe. Eine Ratepufferstatus-Anzeigevorrichtung 40, die mit dem Ratepuffer 34 verbunden ist, bestimmt den Ratepufferstatus oder Füllpegel und sendet ein den Status anzeigendes Signal an das Zielbitrate-Aktualisierungselement 38.
BF soll den Ratepufferstatus bezeichnen. Die Ratepufferstatus-Anzeigevorrichtung 40 bestimmt den Ratepufferstatus nach der Verarbeitung des aktuellen Segments der Videoeingabe (BF_k) wie folgt: BFk = BFk-1 + Rk – M (11)wobei BF_k-1 der Ratepufferstatus vor der Verarbeitung des aktuellen Segments ist, R_k die Datenbitrate für das aktuelle Segment ist und M die feste Übertragungsbitrate ist.
Das Zielbitrate-Aktualisierungselement 38 bestimmt dann die aktualisierte Zielrate NT_k gemäß folgender Gleichung: NTk = M – α(BFk – yBFmax). (12)wobei M wiederum die fese Übertragungsrate ist, BF_max die Größe des Ratenpuffers ist, α eine Konstante ist, die bestimmt, wie schnell sich der Ratenpuffer dem gewünschten Ratepuffertüllpegel nähert, und y (0.0 ≤ y ≤ 1.0) der gewünschte Ratepufferfüllpegel ist.
In einem bevorzugten Ausführungsbeispiel kann, um die Antwort des Ratensteuerungssystems zu verlangsamen, um Fluktuationen in der Bitrate zu verhindern, eine „geglättete" (smoothed) aktualisierte Zielrate, SNT_k, wie folgt abgeleitet werden: SNTk = βNTk + (1 – β)SNTk-1 (13)SNT_k kann statt NT_kin dem Auswahlvorgang verwendet werden. In einem bevorzugten Ausführungsbeispiel ist α auf 0.2 gesetzt und β auf 0.4 gesetzt.
Ein Signal, das die aktualisierte Zielbitrate NT_k anzeigt, wird dem Komparator 30 präsentiert zur Verwendung bei der Verarbeitung des nächsten Segments der Videoeingabe. Ein Signal, das die aktualisierte Zielbitrate NT_k anzeigt, wird auch dem Quantisierungsindex-Aktualisierungselement 38 präsentiert zur Verwendung bei der Auswahl eines Satzes von drei aktualisierten Quantisierungsindizes (q₁'–q₃'), der von den Quantisierern 20a–20c zur Verarbeitung des nächsten Segments der Videoeingabe verwendet wird.
Sobald das Quantisierungsindex-Aktualisierungselement 36 die Signale empfangen hat, welche die aktualisierte Zielbitrate NT_k und die Parameter b und m des „Rate im Verhältnis zu Quantisierungsindex"-Modells anzeigen, kann ein aktualisierter Satz von Quantisierungsindizes (q₁'–q₃') zur Quantisierung des nächsten Segments der Videoeingabe gewählt werden.
Das Quantisierungsindex-Aktualisierungselement 36 kann eine Anzahl von Verfahren verwenden, um den aktualisierten Satz von Quantisierungsindizes q₁'–q₃' auszuwählen. Ein bevorzugtes Ausführungsbeispiel wählt zuerst den Quantisierungsindex q₂'. Er wird gemäß der Gleichung bestimmt:
wobei der Wert NT_k die aktualisierte Zielbitrate ist und die Werte b und m die Parameter des oben beschriebenen exponentiellen Modells sind.
Die beiden anderen Quantisierungsindizes q₁' und q₃' können entweder gemäß dem Ein-Anker(one anchor)- oder dem Zwei-Anker(two anchor)-Aktualisierungsverfahren aktualisiert werden. Diese Verfahren definieren, dass eine Spreizung (spread) der minimale Unterschied der Quantisierungsindizes zwischen jedem der drei Quantisierungsindizes q₁', q₂' und q₃' ist. Die Spreizung ist im Allgemeinen für eine Luminanz-HDTV-Signaleingabe auf 5 eingestellt. Die Spreizung ist abhängig von dem Abstand zwischen den Indizes.
Das Ein-Anker-Verfahren definiert einen Ankerindex als A1. Ebenso definiert es q_max als den maximalen Quantisierungsindex, der gleich 31 ist. Ange nommen, 0 ≤ Spreizung ≤ A1 und 0 ≤ Spreizung ≤ |q_max – A1|, dann setzt das Ein-Anker-Verfahren q₃' gleich zu A1, außer A1 ist innerhalb der Spreizung von q₂'. In diesem Fall wird q₃' auf einen Index gesetzt, der von q₂' weggespreizt ist. Der Ein-Anker-Aktualisierungsalgorithmus wird wie folgt definiert:
Wenn |q₂' – A1| < Spreizung, dann q₁' = q₂'– Spreizung und q₃' = q₁'+ Spreizung.
Wenn q₂' ≥ A1 + Spreizung und q₂' ≤ q_max –Spreizung, dann q₁' = q₂' + Spreizung und q3' = A1.
Wenn q₂' ≤ A1 – Spreizung und q₂' ≥ Spreizung, dann q₁' = q₂' – Spreizung und q₃' = A1.
Wenn q2' ≥ A1 + Spreizung und q₂' > q_max – Spreizung, dann q₁' = q₂' – Spreizung und q₃' = A1.
Wenn q₂' ≤ A1 – Spreizung und q₂' < Spreizung, dann q₁' = q₂' + Spreizung und q₃' = A1.
Wenn q₂' = A1 und q_max – A1 < Spreizung, dann q₁' = q₂' – 2· Spreizung und q₃' = q₂' – Spreizung.
Wenn q₂' ≤ q_max – Spreizung und q_max – A1 < Spreizung, dann q₁' = q₂' – Spreizung und q₃' = q₂' + Spreizung.
Wenn q₂' = A1 und A1 < Spreizung, dann q₁' = q₃' + Spreizung und q3' = q₂' + 2· Spreizung.
Das Zwei-Anker-Verfahren definiert zwei feste Anker A1 und A2, wobei A1 < A2. Das Zwei-Anker-Verfahren stellt sicher, dass Überschwingungen (overshoots) und Unterschreitungen (undershoots) der Bitraten auf akzeptable Pegel reduziert werden. Es ist zu beachten, dass die Spreizung der Minimumunterschied der Quantisierungsindizes zwischen jedem der drei Quantisierungsindizes q₁', q₂' und q₃' ist. Es sei angenommen, dass 2 · Spreizung ≤ A2 – A1, Spreizung ≤ A1 und Spreizung ≤ |q_max – A2|. Das Zwei-Anker-Verfahren setzt q₁' auf A1 und setzt q₃' auf A2, außer A1 oder A2 befinden sich in der Spreizung von q₂'. In diesen Fällen wird entweder q₁' oder q₃' auf einen von q₂' weggespreizten Index gesetzt. Der Zwei-Anker-Aktualisierungsalgorithmus wird wie folgt definiert:
Wenn |q₂' – A1| < Spreizung und q₂' ≥ Spreizung, dann q₁' = q₂'– Spreizung und q₃' = A2.
Wenn |q₂' – A1| < Spreizung und q₂' < Spreizung, dann q₁' = q₂' + Spreizung und q₃' = A2.
Wenn |q₂' – A2| < Spreizung und q₂' ≤ q_max – Spreizung, dann q₁' = A1 und q₃' = q₂' + Spreizung.
Wenn |q₂' – A2| < Spreizung und q₂' > q_max – Spreizung, dann q₁' = A1 und q₃' = q₂' – Spreizung.
Wenn |q₂' – A1| ≥ Spreizung und |q₂' – A2| ≥ Spreizung, dann q₁' = A1 und q₃' = A2.
In einem bevorzugten Ausführungsbeispiel werden, wenn der mittlere Quantisierungsindex q₂' zu viele Bits erzeugt, alle Quantisierungsindizes für den nächsten Rahmen erhöht, wodurch die Bitrate für den nächsten Datenblock verringert wird. Wenn der mittlere Quantisierungsindex q₂' zu wenig Bits erzeugt, werden alle Quantisierungsindizes für den nächsten Rahmen verringert, wodurch die Bitrate für den nächsten Datenblock erhöht wird.
Es sollte angemerkt werden, dass statt der Wahl von drei Quantisierungsindizes zur Verarbeitung jedes Blocks der Dateneingabe eine andere Anzahl von Indizes stattdessen verwendet werden kann. Wie oben erwähnt, kann die Anzahl von Quantisierern eine von drei verschiedene Anzahl sein. In diesem Fall ist eine entsprechende Anzahl von Codierern mit variabler Länge erforderlich, um die quantisierten Koeffizienten zu codieren, die an den Selektor geliefert werden, der dann das Raten-gesteuerte Signal aus allen codierten Koeffizienten wählt. Ebenso bestimmt eine entsprechende Anzahl von Ratenmessvorrichtungen die Datenbitraten der codierten Koeffizienten. Die Raten werden an den Komparator geliefert, der alle Raten mit der vorgegebenen Zielrate vergleicht, um dem Vorgang der Auswahl des Ratengesteuerten Signals zu unterstützen. Die Raten werden auch an das Modellelement geliefert, das den Quantisierungsindex im Verhältnis zu dem Bitratenmodell ableitet. Die erforderliche Anzahl von Quantisierungsindizes wer den aus dem Modell gewählt. Somit kann der gewünschte codierte Bitstrom aus einer vorgegebenen beliebigen Vielzahl von codierten Bitströmen gewählt werden.
Obwohl die vorliegende Erfindung bisher in erster Linie in Bezug auf Luminanz-Videosignale beschrieben wurde, ist anzumerken, dass die vorliegende Erfindung genauso auf Farbsignale anwendbar ist. Eine Technik zur Verarbeitung von Farbsignalen ist, zuerst das Signal von dem RGB-Raum in einen YC₁C₂-Raum zu konvertieren, wobei Y die Luminanz- oder Helligkeitskomponente ist und C₁ und C₂ die Chrominanz- oder Farbkomponenten sind. Aufgrund der geringen räumlichen Empfindlichkeit des Auges auf Farbe, tasten (sub-sample) die meisten Forscher die C₁- und C₂-Komponenten um einen Faktor vier in den horizontalen und vertikalen Richtungen ab. Zwei mögliche YC₁C₂-Darstellungen sind die YIQ-Darstellung und die YUV-Darstellung, die beide in der Technik weithin bekannt sind. Unter Bezugnahme auf 1 können sowohl die RGB- zu YC₁C₂-Umwandlung (nicht gezeigt) als auch das Unter-Abtasten (nicht gezeigt) von dem Pre-Prozessor 10 durchgeführt werden.
In einem bevorzugten Ausführungsbeispiel zur Verarbeitung von Farbvideo werden vier Luminanzkomponenten (im Folgenden als Y1–Y4 bezeichnet) und zwei Chrominanzkomponenten (im Folgenden als C₁ und C₂ bezeichnet) verwendet werden, um jedes Segment einer Videoeingabe darzustellen. Es gibt vier Luminanzkomponenten für jede Chrominanzkomponente, da jede Chrominanzkomponente mit vier unter-abgetastet wird. Für jede der sechs Komponenten werden drei Quantisierungsindizes gewählt, um drei Blöcke von quantisierten Koeffizienten für jede Komponente zu erzeugen. Ferner werden drei Ströme von mit variabler Länge codierter Koeffizienten aus jedem Satz von drei Blöcken von quantisierten Koeffizienten erzeugt. Die Ratensteuervorrichtung 14 muss einen aus jedem Satz von drei Strömen zur Übertragung auswählen.
Die 5a–5c stellen die Elemente der Ratensteuervorrichtung 14 dar, welche die Auswahl der Ströme von mit variabler Länge codierter Koeffizienten für die Eingaben Y1–Y4, C₁ und C₂ durchführen. Wie in der obigen Beschreibung zur Verarbeitung eines nur-Luminanzsignals zeigen die 5a–5c, dass drei alternative codierte Signale verwendet werden, um jedes Ratengesteuerte Signal zu wählen. Es sollte jedoch angemerkt werden, dass die vorliegende Erfindung gleichermaßen in Systemen anwendbar ist, die eine andere Anzahl von alternativen codierten Signalen erzeugen, woraus das Raten-gesteuerte Signal gewählt wird.
In dem dargestellten Ausführungsbeispiel von 5a–5c wurde jede der vier Luminanzeingaben Y1–Y4 basierend auf denselben Quantisierungsindizes (q₁–q₃) quantisiert, um q₁(Y1)–q₁(Y4), q₂(Y1)–q₂(Y4) und q₃(Y1)–q₃(Y4) zu erzeugen. Es sollte jedoch angemerkt werden, dass die verschiedenen Luminanzkomponenten Y1–Y4 basierend auf unterschiedlichen Quantisierungsindizes quantisiert werden können. Die Quantisierung wird von Quantisierern durchgeführt, wie den in 3 gezeigten Quantisierern 20a–20c. Ferner wird jede quantisierte Komponente codiert unter Verwendung einer Codierung mit variabler Länge, wodurch Signale erzeugt werden, die in 5a als VC[q₁(Y1)]–VC[q₁(Y4)], VC[q₂(Y1)]–VC[q₂(Y4)] und VC[q₃(Y1)]–VC[q₃(Y4)] bezeichnet werden. Die Codierung mit variabler Länge wird von Codierern mit variabler Länge durchgeführt, wie den Codierern 22a–22c mit variabler Länge in 3.
Die Chrominanzeingaben C₁ und C₂ werden ebenfalls quantisiert und mit variabler Länge codiert. Die Quantisierungsindizes für die C₁- und C₂-Komponenten sind nicht unbedingt dieselben, aber können dieselben sein wie die für Y1 – Y4 verwendeten. In den 5b und 5c werden die codierten C₁- und C₂-Komponenten als VC[q₁(C1)], VC[q₂(C1)] und VC[q₃(C1)] und VC[q₁(C2)], VC[q₂(C2)] und VC[q₃(C2)] bezeichnet. Die Codierung mit variabler Länge wird von Codierern mit variabler Länge durchgeführt, wie den Codierern 22a–22c mit variabler Länge in 3. Genauso wie für die Luminanzkomponenten wird die Quantisierung der Chrominanzkomponeten von Quantisierern durchgeführt, wie den Quantisierern 20a–20c von 3, und die Codierung mit variabler Länge wird von Elementen durchgeführt, wie den Codierern 22a–22c mit variabler Länge in 3.
Bei der Verarbeitung der Luminanzkomponenten werden die mit variabler Länge codierten Komponenten, die basierend auf demselben Quantisierungsindex quantisiert wurden, in dieselbe Ratenmessvorrichtung eingegeben. Wie in 5a gezeigt, werden die Signale VC[q₁(Y1)]–VC[q₁(Y4)] in die Ratenmessvorrichtung 42a eingegeben, die Signale VC[q₂(Y1)]–VC[q₂(Y4)] werden in die Ratenmessvorrichtung 42b eingegeben und die Signale VC[q₃(Y1)]–VC[q₃(Y4)] werden in die Ratenmessvorrichtung 42c eingegeben. Demgemäß wird eine Gesamtrate für alle Luminanzkomponenten entsprechend einem bestimmten Quantisierungsindex bestimmt. Signale von Raten, die von den Ratenmessvorrichtungen 42a, 42b und 42c bestimmt werden, werden jeweils als r₁(Y), r₂(Y) und r₃(Y) bezeichnet und r₁(Y)–r₃(Y) werden in den Komparator 44 eingegeben. Der Komparator 44 empfängt als Eingabe auch ein Signal mit einer vorgegebenen Zielbitrate. In einem bevorzugten Ausführungsbeispiel verwendet der Komparator 44 dann das Auswahlkriterium des minimalen absoluten Ratenfehlers, wie in der Gleichung (6) oben beschrieben, um die Raten r₁(Y), r₂(Y) und r₃(Y) mit der Zielbitrate zu vergleichen, um die die am nächsten zur Zielbitrate liegende Rate zu wählen, und ein Signal des Quantisierungsindexes entsprechend der gewählten Rate wird an den Selektor 46 geliefert. Der Selektor 46 empfängt als Eingabe auch die mit variabler Länge codierten Koeffizienten VC[q₁(Y1–Y4)], VC[q₂(Y1–Y4)] und VC[q₃(Y1–Y4)]. Der Selektor 46 wählt dann die vier Komponenten der Luminanzeingabe, die von dem ausgewählten Quantisierungsindex quantisiert wurden, und präsentiert diese vier Komponenten dem Ratenpuffer 48 zur Übertragung.
Unter Bezugnahme auf 5b ist zu sehen, dass die C₁-Chrominanzkomponente auf eine ähnliche Weise verarbeitet wird wie die Luminanzkomponenten, außer dass jede der Ratenmessvorrichtungen 50a – 50c nur die Datenrate einer einzelnen C₁-Komponente bestimmen muss, nicht vier Luminanz komponenten. Die Ratenmessvorrichtung 50a empfängt als Eingabe die mit variabler Länge codierten Koeffizienten VC[q₁(C₁)], die dem Quantisierungsindex q₁ entsprechen, und erzeugt die Datenrate r₁(C₁) als Ausgabe. Ähnlich empfangen die Ratenmessvorrichtungen 50b und 50c als Eingaben die variable-Längen-Koeffizienten VC[q₂(C₁)] und VC[q₃(C₁)], die jeweils den Quantisierungsindizes q₂ und q₃ entsprechen, und erzeugen die Datenraten r₂(C₁) und r₃(C₁) als Ausgabe. Die Raten r₁(C₁)–r₃(C₁) anzeigenden Signale werden an einen Komparator 52 eingegeben. Der Komparator 52 kann wiederum das Auswahlkriterium des minimalen absoluten Ratenfehlers der obigen Gleichung (6) verwenden, um die die am nächsten zur Zielbitrate liegende Rate zu wählen, und dem Selektor 54 ein Signal des Quantisierungsindexes entsprechend der gewählten Rate zu präsentieren. Der Selektor 54 wählt dann aus den drei C₁-Komponenten VC[q₁(C₁)]–VC[q₃(C₁)] die eine C₁-Komponente, die von dem gewählten Quantisierungsindex quantisiert wurde, um sie dem Ratenpuffer 56 zur Übertragung zu präsentieren.
Unter Bezugnahme nun auf 5c ist zu sehen, dass die C₂-Komponente ebenfalls auf eine zu der C₁-Komponente ähnlichen Weise verarbeitet wird. Wiederum bestimmt jede Ratenmessvorrichtung 58a–58c die Datenrate, die zu jedem der drei mit variabler Länge codierten Ströme VC[q₁(C₂)], VC[q₂(C₂)] und VC[q₃(C₂)] gehört. Die Raten, als r₁(C₂)–r₃(C₂) bezeichnet, werden in einen Komparator 60 eingegeben. In einem bevorzugten Ausführungsbeispiel wählt der Komparator 60 aus den Raten r₁(C₂) – r₃(C₂) die am nächsten zur Zielbitrate liegende Rate basierend auf dem Auswahlkriterium des absoluten Ratenfehlers der obigen Gleichung (6) und präsentiert einem Selektor 62 ein Signal des Quantisierungsindexes entsprechend der gewählten Rate. Der Selektor 62 wählt die mit variabler Länge codierten Koeffizienten, die gemäß des gewählten Quantisierungsindexes erzeugt wurden, und präsentiert das Signal der gewählten Koeffizienten dem Ratenpuffer 64 zur Übertragung.
Es sollte angemerkt werden, dass, obwohl die 5a–5c die Komparatoren 44, 52 und 60 als drei getrennte Blöcke zeigen, die drei Blöcke kombiniert werden können, so dass ein einziger Komparator als Eingabe alle Signale r₁(Y)–r₃(Y), r₁(C₁)–r₃(C₁) und r₁(C₂)–r₃(C₂) empfängt. Der einzelne Komparator empfängt als Eingabe auch eine Gesamtzielbitrate. Ähnlich können die Selektoren 46, 54 und 62 als ein einziger Selektor kombiniert werden, der als Eingabe alle Koeffizienten mit variabler Länge VC[q₁(Y1)]–VC[q₁(Y4)], VC[q₁(C₁)]–VC[q₃(C₁)] und VC[q₁(C₂)]–VC[q₃(C₂)] empfängt. Zusätzlich kann der einzelne Selektor alle ausgewählten Komponenten an einen kombinierten Ratenpuffer statt die drei Ratenpuffer 48, 56 und 64 senden.
Der einzelne Komparator und der einzelne Selektor können eine Anzahl von Entscheidungsregeln verwenden, um die Ströme von Koeffizienten mit variabler Länge zur Übertragung zu wählen. In einem bevorzugten Ausführungsbeispiel werden die 27 möglichen Kombinationen der Summe r_i(Y) + r_j(C₁) + r_k(C₂), (1 ≤ i ≤ 3, 1 ≤ j ≤ 3, 1 ≤ k ≤ 3) jeweils verglichen mit der Gesamtzielbitrate. Die Summe, die der Gesamtzielbitrate am nächsten ist oder den absoluten codierten Ratenfehler minimiert, wird bestimmt. Dann wird ein Signal, das entsprechend der Summe die drei Quantisierungsindizes anzeigt, an den einzelnen Selektor geliefert, der die Komponenten auswählt, die von den drei Quantisierungsindizes quantisiert wurden, und präsentiert diese Komponenten dem Ratenpuffer in Vorbereitung einer Übertragung. Als ein Beispiel können sich die Raten r₂(Y), r₁(C₁) und r₁(C₂) zu einem Wert summieren, der am nächsten zu der Gesamtzielbitrate liegt. Der einzelne Komparator präsentiert somit die Quantisierungsindizes q₂ für die Y-Komponenten, q₁ für die C₁-Komponente und q₁ für die C₂-Komponente dem einzelnen Selektor. Der einzelne Selektor wählt dann die Signale VC[q₂(Y1-Y4)], VC[q₁(C₁)] und VC[q₁(C₂)] und präsentiert diese Signale dem Ratenpuffer zur Übertragung.
Genauso wie für das Luminanzvideo muss eine Ratensteuereinrichtung zur Verarbeitung eines Farbvideos die Quantisierungsindizes zur Verarbeitung des nächsten Videosegments aktualisieren. Wiederum basieren die aktualisierten Indizes auf einem Modell eines Quantisierungsindexes im Verhältnis zur Rate, abgeleitet aus dem Quantisierungsindex und Ratendaten des ak tuellen Videosegments. Unter Bezugnahme nun auf 6 erzeugt ein Quantisierungsindex-Aktualisierungselement 66 Quantisierungsindizes q₁'–q₃' für das nächste Videosegment basierend auf zwei Eingaben. Eine Eingabe ist ein Signal der aktualisierten Zielbitrate. In einem bevorzugten Ausführungsbeispiel ist die Zielbitrate eine Gesamtzielbitrate für alle Luminanz- und Chrominanz-Komponenten, die von einem Gesamtzielbitrate-Aktualisierungselement 68 erzeugt wird. Eine weitere Eingabe ist ein Signal der Parameter (b und m) des Modells der Rate im Verhältnis zu dem Quantisierungsindex, abgeleitet von einem Modellelement 70. In dem bevorzugten Ausführungsbeispiel leitet das Modellelement 70 ein zusammengesetztes Modell für alle Luminanz- und Chrominanz-Komponenten ab.
Die Operation des bevorzugten Ausführungsbeispiels des Modellelements 70 kann unter Bezugnahme auf die 7a–7d in Verbindung mit 6 besser verstanden werden. Wie in 6 gezeigt, weist das Modellelement 70 drei Komponentenmodellelemente auf, die bezeichnet werden als Y-Modellelement 72, C₁-Modellelement 74 und C₂-Modellelement 76. Die drei Komponentenelemente leiten Komponentenmodelle ab, von denen ein zusammengesetztes Modell von einem zusammengesetzten Modellelement 78 abgeleitet wird.
Jedes Komponentenmodellelement leitet ein exponentielles Modell des Quantisierungsindexes im Verhältnis zu der Rate für die Komponente, basierend auf den verwendeten Quantisierungsindizes und ihrer entsprechenden Raten, von dem aktuellen Segment der Eingabe ab. Das Y-Modellelement 72 empfängt als Eingabe drei Sätze von Datenpunkten (q₁(Y), r₁(Y)), (q₂(Y), r₂(Y)) und (q₃(Y), r₃(Y)), die durch (q_i(Y), r_i(Y)) in 6 dargestellt werden. Die Datenraten r_i(Y) beziehen sich auf die Gesamtraten vom Codieren aller vier Luminanzkomponenten eines Segments einer Videoeingabe für die drei Quantisierungsindizes. Die drei Sätze von Datenpunkten werden verwendet, um das in 7a gezeigte exponentielle Y-Komponentenmodell gemäß den obigen Gleichungen (7)–(10) abzuleiten.
Das C₁-Modellelement 74 empfängt als Eingabe drei Sätze von Datenpunkten (q₁(C₁), r₁(C₁)), (q₂(C₁), r₂(C₁)) und (q₃(C₁), r₃(C₁)), die durch (q_i(C₁), r_i(C₁)) in 6 dargestellt werden. Die Datenpunkte sind die für die C₁-Komponente verwendeten Quantisierungsindizes und die Datenraten, die aus der Verwendung der Quantisierungsindizes resultieren. Die drei Sätze von Datenpunkten werden verwendet, um das in 7b gezeigte exponentielle C₁-Komponentenmodell wiederum gemäß den obigen Gleichungen (7)–(10) abzuleiten. Dann werden basierend auf dem Modell die Raten an den aktuellen Quantisierungsindizes für die Y-Komponente geschätzt. In 7b wurde q₂(C₁) gleich q₂(Y) gesetzt, so dass r₂(C₁) basierend auf q₂(Y) gleich r₂(C₁) bleibt. Jedoch werden Schätzungen für r₁(C₁) basierend auf q₁(Y) und r₃(C₁) basierend auf q₃(Y) abgeleitet.
Ähnlich empfängt das C₂-Modellelement 76 als Eingabe drei Sätze von Datenpunkten (q₁(C₂), r₁(C₂)), (q₂(C₂), r₂(C₂)) und (q₃(C₂), r₃(C₂)), die durch (q_i(C₂), r_i(C₂)) in 6 dargestellt werden. Die Datenpunkte sind die für die C₂-Komponente verwendeten Quantisierungsindizes und die Datenraten, die aus der Verwendung der Quantisierungsindizes resultieren. Diese drei Sätze von Datenpunkten werden verwendet, um das in 7c gezeigte exponentielle C₂-Komponentenmodell gemäß den obigen Gleichungen (7)–(10) abzuleiten. Ebenso werden basierend auf dem C₂-Komponentenmodell die Raten an den aktuellen Quantisierungsindizes für die Y-Komponente geschätzt. Somit werden r₁(C₂) basierend auf q₁(Y), r₂(C₂) basierend auf q₂(Y) und r₃(C₂) basierend auf q₃(Y) geschätzt. In 7b ist q₂(C₂) = q₂(Y), somit bleibt r₂(C₂) basierend auf q₂(Y) r₂(C₂).
Aus den drei Komponentenmodellen wird ein zusammengesetztes Modell abgeleitet. Das zusammengesetzte Modell basiert auf drei Sätzen von Datenpunkten: (q₁(Y), r₁(total)), (q₂(Y), r₂(total)) und (q₃(Y), r₃(total)). Die Gesamtraten werden gemäß den folgenden Gleichungen bestimmt: r1(total) = r1(Y) + r1(C1) basierend auf q1(Y) + r1(C2) basierend auf q1(Y); (15) r2(total) = r2(Y) + r2(C1) basierend auf q2(Y) + r2(C2) basierend auf q2(Y); (16) r3(total) = r3(Y) + r3(C1) basierend auf q3(Y) + r3(C2) basierend auf q3(Y). (17)
Das zusammengesetzte Modell wird in 7d dargestellt. Wiederum wird ein exponentielles Modell gemäß der Gleichung (7) verwendet, um das Modell abzuleiten. Ferner wird die Lösung der kleinsten Fehlerquadrate für das Modell, wie in den Gleichungen (9)–(10) definiert, verwendet, um die Modellparameter b(total) und m(total) abzuleiten. Wie oben erwähnt, werden Signale von b(total) und m(total) in das Quantisierungsindex-Aktualisierungselement 66 eingegeben.
Die andere Eingabe in das Quantisierungsindex-Aktualisierungselement 66, die aktualisierte Gesamtzielbitrate, wird von dem Gesamtzielbitrate-Aktualisierungselement 68 basierend auf dem Ratenpufferstatus nach Verarbeitung des aktuellen Segments des Eingabesignals abgeleitet.
Unter Bezugnahme zurück auf die 5a–5c ist zu sehen, dass die gewählten Y-, C₁- und C₂-Komponenten den Ratenpuffern 48, 56 und 64 vor der Übertragung durch den Kommunikationskanal präsentiert werden. Wie oben beschrieben sollte angemerkt werden, dass, obwohl die Ratenpuffer 48, 56 und 64 als drei getrennte Ratenpuffer gezeigt werden, es nur einen Ratenpuffer gemeinsam für alle Komponenten geben kann. In dem in 6 dargestellten Ausführungsbeispiel empfängt ein einziger Ratenpuffer 80 alle ausgewählten Y-, C₁- und C₂-Komponenten. Eine Ratenpufferstatus-Anzeigevorrichtung 82 bestimmt dann den Ratenpufferstatus (BF_k) nach der Verarbeitung des aktuellen Segments einer Videoeingabe basierend auf der obigen Gleichung (11). Der Ratenpufferstatus BF_k wird an das Gesamtzielbitrate-Aktualisierungselement 68 geliefert, das die aktualisierte Zielbitrate NT_k basierend auf der obigen Gleichung (12) ableitet. Das Gesamtzielbitrate-Aktualisierungselement 68 liefert dann die aktualisierte Zielbitrate NT_k an das Quantisierungsindex-Aktualisierungselement 66.
Nachdem es Eingaben von b(total), m(total) und der aktualisierten Gesamtzielbitrate erlangt hat, ist das Quantisierungsindex-Aktualisierungselement 66 nun bereit, aktualisierte Quantisierungsindizes zur Verarbeitung des nächsten Segments der Videoeingabe zu wählen. Es werden drei Quantisierungsindizes für jede Y-, C₁- und C₂-Komponente gewählt. Für die Y-Komponente werden die Quantisierungsindizes als q₁'(Y)–q₃'(Y) bezeichnet, für die C₁-Komponente werden die Quantisierungsindizes als q₁'(C₁)–q₃'(C₁) bezeichnet und für die C₂-Komponente werden die Quantisierungsindizes als q₁'(C₂)–q₃'(C₂) bezeichnet.
In einem bevorzugten Ausführungsbeispiel wählt der Aktualisierungsalgorithmus denselben mittleren Quantisierungsindex für alle Y-, C₁- und C₂-Komponenten. Der Quantisierungsindex q₂'(Y) wird gemäß der obigen Gleichung (3) gewählt. Die mittleren Quantisierungsindizes für die C₁- und C₂-Komponenten, q2'(C₁) und q₂'(C₂), werden gleich q₂'(Y) gesetzt. Dann wird das oben beschriebene Zwei-Anker-Verfahren verwendet, um q₁'(Y) und q₃'(Y) für alle Luminanzkomponenten zu setzen. Die anderen C₁- und C₂-Quantisierungsindizes werden so gewählt, dass sie unterschiedlich sind und einen absoluten Spreizungsunterschied jeweils von den q₂'(C₁)- und q₂'(C₂)-Quantisierungsindizes haben. Diese aktualisierten Quantisierungsindizes werden dann an einen Codieren 12 (1) präsentiert zur Verwendung bei einer Quantisierung des nächsten Segments eines Eingabesignals.
Die vorangegangene Beschreibung der bevorzugten Ausführungsbeispiele ist vorgesehen, um Fachleuten zu ermöglichen, die vorliegende Erfindung herzustellen oder zu verwenden. Die verschiedenen Modifizierungen dieser Ausführungsbeispiele sind für Fachleute offensichtlich und die hier definierten generischen Prinzipien können auf andere Ausführungsbeispiele ohne die Verwendung der Erfindungsgabe angewendet werden. Folglich soll die vorliegende Erfindung nicht auf die hier gezeigten Ausführungsbeispiele beschränkt sein, sondern soll dem weitesten Umfang entsprechen, wie von den angehängten Ansprüchen definiert.

Claims

Ein Unter- bzw. Teilsystem zum adaptiven Steuern der Kodierungsbitrate eines Videosignals in einem Bildkompremierungssystem, wobei das Teilsystem Folgendes aufweist: Kodiermittel (12) zum Empfangen eines Segments eines Videosignals und zum Generieren einer Vielzahl von kodierten Strömen (VC1, VC2, VC3) von Datenbits gemäß einem vorbestimmten Satz von Quantisierungseinstellungen; und Ratensteuerungsmittel (14) zum Empfangen der Vielzahl von kodierten Strömen und Auswählen eines kodierten Stromes aus der Vielzahl von kodierten Strömen gemäß einem vorbestimmten Auswahlalgorithmus basierend auf einer Zielbitrate; wobei die Ratensteuerungsmittel (14) weiterhin Folgendes aufweisen: einen Puffer (34) zum Empfangen des ausgewählten kodierten Stroms in Vorbereitung auf die Übertragung, wobei der Puffer (34) einen Pufferstatus als Ergebnis des Empfangens des ausgewählten kodierten Stromes besitzt; und Aktualisierungsmittel (36, 38) zum Generieren eines aktualisierten Satzes der Quantisierungseinstellungen und einer aktualisierten Zielbitrate gemäß dem Pufferstatus für das nächste Segment des Videosignals.
Teilsystem nach Anspruch 1, wobei die Kodiermittel (12) Folgendes aufweisen: eine Vielzahl von Quantisierern (20), wobei jeder der Quantisierer zum Empfangen des Segments der Dateneingabe und zum Quantisieren des Segments der Dateneingabe gemäß einer der Quantisierungseinstellungen zum Generieren eines quantisierten Datenstromes dient; eine Vielzahl von Kodierern mit variabler Länge (22), wobei jeder zum Empfangen eines der quantisierten Ströme und zum Kodieren des empfangenen quantisierten Stromes gemäß eines Kodieralgorithmus mit variabler Länge zum Generieren eines der kodierten Ströme von Datenbits dient.
Teilsystem nach Anspruch 1, wobei die Kodiermittel (12) weiterhin Ratenmessungsmittel (24) aufweisen zum Empfangen der Vielzahl von kodierten Strömen und zum Bestimmen einer Bitrate entsprechend einer jeden der Vielzahl von kodierten Ströme und wobei die Bitraten abhängig sind von den Quantisierungseinstellungen.
Teilsystem nach Anspruch 1, wobei die Ratensteuerungsmittel (14) Aktualisierungsmittel zum Generieren eines aktualisierten Satzes der Quantisierungseinstellungen gemäß dem Status der Ratensteuerungsmittel (14) nach dem Generieren des ausgewählten kodierten Stromes aufweisen.
Teilsystem nach Anspruch 3, wobei die Ratensteuerungsmittel (14) Auswahlmittel (28, 30) aufweisen, und zwar zum Empfangen der Vielzahl von kodierten Strömen (VC1, VC2, VC3) und der entsprechenden Bitraten (r1, r2, r3) und zum Auswählen des kodierten Stromes gemäß dem vorbestimmten Auswahlkriterium, wobei das vorbestimmte Auswahlkriterium auf den Bitraten basiert.
Teilsystem nach Anspruch 2, wobei der Kodieralgorithmus mit variabler Länge eine Huffman-Kodierung aufweist.
Teilsystem nach Anspruch 1, wobei der Kodierungsalgorithmus mit variabler Länge eine Run-Length- bzw. Lauflängen-Kodierung von Nullen gefolgt durch Huffman-Kodierung aufweist.
Teilsystem nach Anspruch 1, wobei jede der Quantisierungseinstellungen eine Gewichtungsmaskenfunktion generiert gemäß einem Quantisierungsindex aufweist.
Teilsystem nach Anspruch 8, das weiterhin ein Modellelement (32) aufweist, zum Empfangen der Quantisierungsindizes und der Bitraten (r1, r2, r3) und zum Herleiten eines Modells des Quantisierungsindex bezüglich der Rate gemäß der Quantisierungsindizes und der Bitraten (r1, r2, r3); wobei die Aktualisierungsmittel weiterhin die Parameter des Modells empfangen und den aktualisierten Satz der Quantisierungseinstellungen gemäß der Modellparameter generieren.
Teilsystem nach Anspruch 10, wobei das Modell ein exponentielles Modell ist.
Teilsystem nach Anspruch 5, wobei das vorbestimmte Auswahlkriterium, das durch die Auswahlmittel (30, 28) verwendet wird, einen absoluten, kodierten Ratenfehler basierend auf der vorbestimmten Zielbitrate minimiert.
Teilsystem nach Anspruch 1, das weiterhin einen Vorprozessor (10) aufweist, zum Empfangen eines Blocks von Pixeldaten und zum Ausführen einer diskreten Cosinus-Transformations- bzw. DCT-Operation (DCT = discrete cosine transform) hinsichtlich des Blocks von Pixeldaten, um einen Block von DCT-Koeffizientwerten zu generieren, der den Kodiermitteln (12) als das Segment des Videosignals präsentiert wird.
Teilsystem nach Anspruch 9, wobei das vorbestimmte Auswahlkriterium, das von den Auswahlmitteln (28, 30) verwendet wird, einen absoluten bzw. Betragskodierratenfehler basierend auf der vorbestimmten Zielbitrate minimiert; und wobei die Aktualisierungsmittel (36, 38) weiterhin eine aktualisierte Zielbitrate gemäß dem Pufferstatus generieren.
Teilsystem nach Anspruch 13, wobei die aktualisierte Zielbitrate weiterhin gemäß einem Zielpufferfüllpegel generiert wird.
Teilsystem nach Anspruch 14, wobei die Aktualisierungsmittel (36, 38) einen aktualisierten Satz der Quantisierungsindizes gemäß dem Modell generieren.
Teilsystem nach Anspruch 15, wobei ein Index des aktualisierten Satzes von Quantisierungsindizes generiert wird durch Auflösen bezüglich des Quantisierungsindex entsprechend der aktualisierten Zielbitrate, und die anderen des aktualisierten Satzes von Quantisierungsindizes generiert werden, basierend auf einem "One-Anchor-" bzw. Ein-Anker-Verfahren.
Teilsystem nach Anspruch 15, wobei ein Index der aktualisierten Sätze von Quantisierungsindizes generiert wird durch Auflösen hinsichtlich des Quantisierungsindex entsprechend der aktualisierten Zielbitrate, und die anderen des aktualisierten Satzes von Quantisierungsindizes generiert werden basierend auf einem "Two-Anchor-" bzw. Zwei-Anker-Verfahren.
Teilsystem nach Anspruch 1, wobei das Videosignal ein Farbvideosignal ist.
Teilsystem nach Anspruch 9, wobei das Segment des Videosignals ein Farbvideosignal mit Luminanz- und Chrominanz-Komponenten ist; wobei jede der Luminanz- und Chrominanz-Komponenten separat durch die Vielzahl von Quantisierern (20) entsprechend der Quantisierungsindizes quantisiert wird, um die quantisierten Ströme von Daten zu generieren; wobei die Kodieren mit variabler Länge (22) die Vielzahl von kodierten Strömen von Datenbits für jede der Luminanz- und Chrominanz-Komponenten generieren; wobei das Ratenmesselement (24) die Bitraten für jeden der kodierten Ströme für jede der Luminanz- und Chrominanz-Komponenten bestimmt; wobei das Modellelement weiterhin ein Komponentenmodell für jede der Luminanz- und Chrominanz-Komponenten basierend auf den Quantisierungsindizes und den Bitraten für jede der Komponenten generiert; und wobei das Modell des Quantisierungsindex bezüglich der Rate eine Zusammensetzung der Komponentenmodelle ist.
Teilsystem nach Anspruch 19, wobei die Auswahlmittel (28, 30) die kodierten Ströme und die Bitraten für die Luminanz- und Chrominanz- Komponenten empfangen und ausgewählte kodierte Ströme für die Luminanz- und Chrominanz-Komponenten basierend auf der Kombination von Luminanz- und Chrominanz-Komponenten generieren, und zwar für solche, deren Raten einen absoluten Kodierratenfehler basierend auf einer vorbestimmten Zielbitrate minimieren.
Teilsystem nach Anspruch 20, wobei die Aktualisierungsmittel (36, 38) die aktualisierten Quantisierungseinstellungen für jede der Luminanz- und Chrominanz-Komponenten generieren.
Ein Verfahren zum adaptiven Steuern der kodierten Bitrate bzw. Kodierungsbitrate einer Videoeingabe für die Bildkomprimierung, wobei das Verfahren die folgenden Schritte aufweist: Kodieren eines Videosegments gemäß einem vorbestimmten Satz von Quantisierungseinstellungen, um eine Vielzahl von kodierten Strömen von Datenbits zu generieren; Auswählen eines kodierten Stromes aus einem der Vielzahl von kodierten Strömen gemäß einem vorbestimmten Auswahlalgorithmus, basierend auf einer Zielbitrate; Empfangen des ausgewählten kodierten Stroms in einem Puffer (34) für die Übertragung, wobei der Puffer einen Pufferstatus hat, als Ergebnis des Empfangs des ausgewählten kodierten Stroms; Generieren eines Steuersignals, das eine aktualisierte Zielbitrate enthält, und zwar basierend auf dem Pufferstatus; und Aktualisieren der Quantisierungseinstellungen gemäß dem Steuersignal für das nächste Segment des Videosignals.
Verfahren nach Anspruch 22, wobei der Schritt des Kodierens die folgenden Schritte aufweist: Quantisieren des Segments des Videosignals um eine Vielzahl von quantisierten Strömen zu generieren, wobei jeder der Vielzahl von quantisierten Strömen gemäß einer der Quantisierungseinstellungen quantisiert ist; und Kodieren mit variabler Länge eines jeden der Vielzahl von quantisierten Strömen und Verwendung eines Kodieralgorithmus mit variabler Länge, um eine entsprechende Vielzahl der kodierten Ströme zu generieren.
Verfahren nach Anspruch 23, das weiterhin folgende Schritte aufweist: Bestimmen einer kodierten Bitrate für einen jeden der Vielzahl von kodierten Strömen, Speichern des ausgewählten kodierten Stromes in dem Puffer (34) in Vorbereitung für die Übertragung; und wobei das vorbestimmte Auswahlkriterium auf den kodierten Bitraten basiert.
Verfahren nach Anspruch 23, wobei der Kodieralgorithmus mit variabler Länge Huffman-Kodierung aufweist.
Verfahren nach Anspruch 23, wobei der Kodieralgorithmus mit variabler Länge eine Lauflängenkodierung von Nullen gefolgt durch Huffman-Kodierung aufweist.
Verfahren nach Anspruch 24, wobei jede der Quantisierungseinstellungen eine Gewichtungsmaskenfunktion ist, die gemäß einem Quantisierungsindex generiert wird.
Verfahren nach Anspruch 26, das weiterhin folgende Schritte aufweist: Herleiten eines Modells eines Quantisierungsindex bezüglich der Rate gemäß den Quantisierungsindizes und den kodierten Bitraten; und Aktualisieren der Quantisierungseinstellungen gemäß der Parameter des Modells.
Verfahren nach Anspruch 28, wobei das Modell ein exponentielles Modell ist.
Verfahren nach Anspruch 23, das weiterhin folgende Schritte aufweist: Empfangen eines Blocks von Pixeldaten und Ausführen einer diskreten Cosinus-Transformationsoperation- bzw. DCT-Operation auf das Segment von Pixeldaten, um einen Block von DCT-Koeffizienten zu generieren, der das Segment des Videosignals ist.
Verfahren nach Anspruch 28, wobei das vorbestimmte Auswahlkriterium zum Auswählen des kodierten Stromes mit variabler Länge einen absoluten Kodierratenfehler basierend auf einer vorbestimmten Zielbitrate minimiert; und weiterhin den Schritt des Aktualisierens der Zielbitrate gemäß dem Pufferstatus aufweist.
Verfahren nach Anspruch 31, das weiterhin den Schritt des Generierens eines aktualisierten Satzes der Quantisierungsindizes aufweist, und zwar durch Auflösen nach dem Quantisierungsindex entsprechend der aktualisierten Zielbitrate gemäß dem Modell.
Verfahren nach Anspruch 32, wobei ein Index aus dem aktualisierten Satz von Quantisierungsindizes generiert wird durch Auflösen nach dem Quantisierungsindex entsprechend der aktualisierten Zielbitrate und die anderen Indizes des aktualisierten Satzes von Quantisierungsindizes generiert werden, basierend auf einem "Ein-Anker"-Verfahren.
Verfahren nach Anspruch 32, wobei ein Index des aktualisierten Satzes von Quantisierungindizes generiert wird durch Auflösen nach dem Quantisierungsindex entsprechend der aktualisierten Zielbitrate, und die anderen Indizes des aktualisierten Satzes von Quantisierungsindizes generiert werden, basierend auf einem "Zwei-Anker"-Verfahren.
Verfahren nach Anspruch 28, wobei die Videoeingabe ein Farbsignal ist mit Luminanz- und Chrominanz-Komponenten; wobei der Schritt des Quantisierens separat die Luminanz- und Chrominanz-Komponenten quantisiert; wobei der Schritt des Kodierens mit variabler Länge die Vielzahl von kodierten Strömen für jede der Luminanz- und Chrominanz-Komponenten generiert; wobei der Schritt des Bestimmens von kodierten Bitraten für jede der Luminanz- und Chrominanz-Komponenten ausgeführt wird; und wobei der Schritt des Herleitens eines Modells ein Komponenten-Modell für jede der Luminanz- und Chrominanz-Komponenten herleitet, wobei das Modell eine Zusammensetzung des Komponentenmodells ist.
Verfahren nach Anspruch 35, wobei der Schritt des Auswählens einen kodierten Strom für eine ausgewählte Komponente für jede der Luminanz- und Chrominanz-Komponenten basierend auf der Kombination von Luminanz- und Chrominanz-Komponenten auswählt, und zwar diejenigen Komponenten, deren Raten einen absoluten Kodierratenfehler basierend auf einer vorbestimmten Zielbitrate minimieren.
Verfahren nach Anspruch 36, wobei der Schritt des Aktualisierens der Quantisierungseinstellungen die aktualisierten Quantisierungseinstellungen für jede der Luminanz- und Chrominanz-Komponenten generiert.