DE69214523T3 - Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder - Google Patents

Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder Download PDF

Info

Publication number
DE69214523T3
DE69214523T3 DE69214523T DE69214523T DE69214523T3 DE 69214523 T3 DE69214523 T3 DE 69214523T3 DE 69214523 T DE69214523 T DE 69214523T DE 69214523 T DE69214523 T DE 69214523T DE 69214523 T3 DE69214523 T3 DE 69214523T3
Authority
DE
Germany
Prior art keywords
channels
signals
channel
subband
delivery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69214523T
Other languages
English (en)
Other versions
DE69214523T2 (de
DE69214523D1 (de
Inventor
Mark Franklin Pacifica DAVIS
Craig Campbell Mill Valley TODD
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27093203&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69214523(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of DE69214523D1 publication Critical patent/DE69214523D1/de
Publication of DE69214523T2 publication Critical patent/DE69214523T2/de
Publication of DE69214523T3 publication Critical patent/DE69214523T3/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Description

  • TECHNISCHES GEBIET
  • Die Erfindung betrifft allgemein die Wiedergabe von Mehrkanal-Signalen. Insbesondere betrifft die Erfindung die Decodierung von Mehrkanal-Audiosignalen, die mehrdimensionale Schallfelder repräsentieren, welche von zwei oder mehreren Lieferkanälen geliefert werden, wobei die Komplexität der Decodierung grob der zur Präsentation des decodierten Signals verwendeten Anzahl von Kanälen proportional ist, die von der Anzahl von Lieferkanälen verschieden sein kann.
  • STAND DER TECHNIK
  • Ein Ziel für die Hi-Fi-Wiedergabe aufgezeichneten oder übertragenen Schalls ist die zu einer anderen Zeit oder an einem anderen Ort unter den gegebenen Beschränkungen des Präsentations- oder Wiedergabesystems so naturgetreu wie möglich erfolgende Präsentation eines "originalen Schallfeldes". Ein Schallfeld ist definiert als eine Sammlung von Schalldrücken, die eine Funktion von Zeit und Raum sind. Somit versucht die Hi-Fi-Wiedergabe die akustischen Drücke, die in dem originalen Schallfeld in einem Bereich um einen Hörer existierten, nachzubilden.
  • Idealerweise sind Unterschiede zwischen dem originalen Schallfeld und dem wiedergegebenen Schallfeld unhörbar oder, falls nicht unhörbar, wenigstens für die meisten Hörer relativ unmerkbar. Zwei allgemeine Maße für die Wiedergabetreue sind "Schallqualität" und "Schallfeldlokalisierung".
  • Die Schallqualität enthält Wiedergabeeigenschaften wie Frequenzbereich (Bandbreite), Genauigkeit relativer Amplitudenpegel über den Frequenzbereich (Klangfarbe), Bereich des Schallamplitudenpegels (Dynamikbereich), Genauigkeit der Amplitude und Phase von Harmonischen (Verzerrungspegel) sowie Amplitudenpegel und Frequenz von unechten Tönen und Artefakten, die in dem ursprünglichen Schall nicht enthalten sind (Rauschen). Obwohl die meisten Aspekte der Schallqualität mittels Instrumenten gemessen werden können, machen bei praktischen Systemen die Eigenschaften des menschlichen Hörsystems (psychoakustische Effekte) bestimmte meßbare Abweichungen von den "originalen" Schallereignissen unhörbar oder relativ unmerkbar.
  • Schallfeldlokalisierung ist ein Maß räumlicher Wiedergabetreue. Die Bewahrung der scheinbaren Richtung (sowohl Azimut als auch Höhe) und der Entfernung einer Schallquelle wird manchmal als Winkel bzw. Tiefenlokalisierung bezeichnet. Im Fall bestimmter orchestraler oder anderer Aufzeichnungen soll diese Lokalisierung dem Hörer die physische Anordnung der Musikanten und ihrer Instrumente vermitteln. Im Bezug auf andere Aufzeichnungen, insbesondere in einem Studio erzeugter Mehrspuraufzeichnungen, können die Winkel-Richtwirkung und die Tiefe ohne Beziehung zu irgendeiner tatsächlichen Anordnung von Schallquellen sein, und die Lokalisierung ist lediglich Teil der gesamten, dem Hörer zu übermittelnden künstlerischen Impression. Beispielsweise kann scheinbar von einem speziellen Punkt im Raum stammende Sprache einem voraufgezeichneten Schallfeld hinzugefügt werden. Auf jeden Fall besteht ein Zweck von Hi-Fi-Mehrkanal-Wiedergabesystemen darin, räumliche Aspekte eines ablaufenden Schallfeldes, ob echt oder synthetisiert, wiederzugeben. Im Bezug auf Schallqualität sind in praktischen Systemen meßbare Änderungen der Lokalisierung unter bestimmten Umständen unhörbar oder relativ unmerkbar, und zwar aufgrund von Eigenschaften des menschlichen Hörens.
  • Es reicht aus zu erkennen, daß ein Schallfelderzeuger aufgezeichnete oder übertragene Signale entwickeln kann, die in Verbindung mit einem Wiedergabesystem einem menschlichen Hörer ein Schallfeld präsentieren, das spezielle Eigenschaften hinsichtlich Schallqualität und Schallfeldlokalisierung besitzt. Das dem Hörer präsentierte Schallfeld kann dem von dem Erzeuger beabsichtigten idealen Schallfeld sehr nahe kommen oder von ihm abweichen, und zwar abhängig von vielen Faktoren, einschließlich der Wiedergabeanlage und der akustischen Widergabeumgebung.
  • Ein zur Übertragung oder Wiedergabe eingefangenes Schallfeld wird gewöhnlich an irgendeinem Punkt durch ein oder mehrere elektrische Signale repräsentiert. Solche Signale stellen üblicher Weise einen oder mehrere Kanäle am Punkt des Schallfeldeinfangens ("Einfangkanäle"), am Punkt der Schallfeldübertragung oder -aufzeichnung ("Übertragungskanäle") und am Punkt der Schallfeldpräsentation (Präsentationskanäle) dar. Obwohl innerhalb einiger Grenzen die Fähigkeit zur Wiedergabe komplexer Schallfelder mit zunehmender Anzahl dieser Schallkanäle zunimmt, setzen praktische Überlegungen der Anzahl solcher Kanäle Grenzen.
  • In den meisten, wenn nicht allen Fällen arbeitet der Schallfelderzeuger in einem relativ gut definierten System, in dem es bekannte Präsentationskanal-Figurationen und -umgebungen gibt. Beispielsweise erwartet man allgemein, daß eine 2-Kanal-Stereoaufzeichnung über entweder zwei Präsentationskanäle ("stereophon") oder einen Präsentationskanal ("monophon") wiedergegeben wird. Die Aufzeichnung wird üblicherweise so optimiert, daß sie den meisten Hörern, die entweder eine stereophone oder eine monophone Wiedergabeanlage besitzen, gut erscheint. Als anderes Beispiel erfolgt eine Mehrkanal-Aufzeichnung in Stereo mit Surround-Sound (Umgebungsschall) für Filme in der Erwartung, daß Filmtheater entweder eine bekannte, im allgemeinen genormte Anordnung zur Präsentation des linken, mittleren, rechten, Baß- und Surround-Kanals besitzen oder, alternativ, eine klassische "Academy" monophone Wiedergabe. Solche Aufzeichnungen werden auch in der Erwartung gemacht, daß sie von einer Heimwiedergabeanlage wiedergegeben werden, die von Einzelpräsentationskanalsystemen, wie etwa einem kleinen Lautsprecher in einem Fernsehgerät, zu relativ hoch entwickelten Mehrpräsentationskanal-Surround-Soundsystemen reicht.
  • Verschiedene Techniken werden manchmal dazu benutzt, die Anzahl von Übertragungskanälen, die erforderlich sind, um Signale, welche mehrdimensionale Schallfelder repräsentieren, zu übertragen, zu reduzieren. Ein Beispiel einer solchen Technik ist ein 4-2-4-Matrixsystem, welches zur Übertragung oder Speicherung vier Kanäle zu zwei Übertragungskanälen kombiniert, von denen für die Wiedergabe vier Präsentationskanäle extrahiert werden. Idealerweise sollen solche Techniken keine hörbaren Änderungen des Schallfeldes bei dessen Präsentation hervorrufen.
  • Solche Techniken können verwendet werden, ohne den Rahmen der vorliegenden Erfindung zu verlassen. Dies zu tun mag jedoch nicht immer wünschenswert sein. Die Verwendung dieser Techniken macht es nötig, das Konzept eines "Lieferkanals" zu entwickeln. Ein Lieferkanal repräsentiert einen diskreten Codiererkanal oder einen Satz von Information, die unabhängig codiert ist. Ein Lieferkanal entspricht einem Übertragungskanal in Systemen, die keine Techniken zur Verringerung der Anzahl von Übertragungskanälen einsetzen. Beispielsweise trägt ein 4-2-4-Matrixsystem vier Lieferkanäle über zwei Übertragungskanäle scheinbar zur Wiedergabe unter Verwendung von vier Präsentationskanälen. Die vorliegende Erfindung ist auf die Auswahl einer Anzahl von Präsentationskanälen gerichtet, die sich von der Anzahl von Lieferkanälen unterscheidet.
  • Ein Beispiel einer einfachen Technik, die einen Präsentationskanal abhängig von zwei Lieferkanälen erzeugt, ist das Summieren von zwei Lieferkanälen zur Bildung eines Präsentationskanals. Wenn ein Signal abgetastet und unter Verwendung der Pulscodemodulation (PCM) digital codiert wird, kann die Summierung von zwei Lieferkanälen im digitalen Bereich erfolgen, indem die PCM-Abtastwerte, die den jeweiligen Kanal repräsentieren, addiert werden und die summierten Abtastwerte unter Verwendung eines Digital/Analog-Umsetzers (DAC) in ein analoges Signal umgesetzt werden. Die Summierung von zwei PCM-codierten Signalen kann auch im analogen Bereich erfolgen, indem die PCM-Abtastwerte für jeden einzelnen Lieferkanal unter Verwendung von zwei DACs in ein analoges Signal umgesetzt und die beiden analogen Signale summiert werden. Das Durchführen der Summenbildung im digitalen Bereich wird gewöhnlich bevorzugt, da ein digitaler Addierer allgemein genauer und kostengünstiger auszuführen ist als die Verwendung eines zweiten DAC hoher Präzision.
  • Diese Technik wird jedoch komplexer, wenn Signalabtastwerte in nicht-linearer Form statt in linearer PCM codiert werden. Nicht-lineare Formen können durch Codierverfahren wie logarithmisches Quantisieren, Normieren von Gleitkommadarstellungen und adaptives Zuweisen von Bits zur Darstellung der einzelnen Abtastwerte erzeugt werden.
  • Nicht-lineare Darstellungen werden häufig bei Codier/Decodiersystemen zur Verringerung der Informationsmenge verwendet, die zur Darstellung des codierten Signals erforderlich ist. Solche Darstellungen können von Übertragungskanälen mit geringerer Informationskapazität wie geringerer Bandbreite oder rauschbehafteten Übertragungswegen vermittelt werden, oder durch Aufzeichnungsmedium mit geringerer Speicherkapazität.
  • Nicht-lineare Darstellungen brauchen nicht die Informationsanforderungen zu verringern. Verschiedene Formen von Informationspacken können allein zur Erleichterung der Erfassung und Korrektur von Übertragungsfehlern verwendet werden. Die weiteren Begriffe "formatiert" und "Formatierung" dienen hier als Verweis auf nicht-lineare Darstellungen, bzw. zum Erhalt solcher Darstellungen. Die Begriffe "deformatiert" und "Deformatierung" verweisen auf rekonstruierte lineare Darstellungen bzw. auf den Erhalt solcher rekonstruierter linearer Darstellungen.
  • Es ist anzumerken, daß, was eine "lineare" Darstellung ist, von den eingesetzten Signalverarbei tungsverfahren abhängt. Beispielsweise ist eine Gleitkommadarstellung für einen digitalen Signalprozessor (DSP) linear, der Rechenoperationen mit Gleitkommaoperanden ausführen kann, während andererseits solch eine Darstellung für einen DSP nicht-linear ist, der nur Ganzzahl-Rechenoperationen ausführen kann. Die Bedeutung von "linear" wird in Verbindung mit der Beschreibung der Ausführungsformen der Erfindung unten weiter erläutert.
  • Ein Decoder sollte Deformatierungstechniken verwenden, die invers zu den Formatierungstechniken sind, welche zur Formatierung der Information benutzt werden, um eine Darstellung wie PCM zu erhalten, die in der oben beschriebene Weise summiert werden kann.
  • Zwei Codierungstechniken, die eine Formatierung zur Verringerung der Informationsanforderungen einsetzen, sind Teilbandcodierung und Transformationscodierung. Teilband- und Transformationscodierer versuchen, die übertragene Informationsmenge in bestimmten Frequenzbändern zu verringern, wo die resultierende Codierungsungenauigkeit oder das Codierungsrauschen von benachbarten Spektralkomponenten psychoakustisch maskiert wird. Psychoakustische Maskierungseffekte können gewöhnlich wirkungsvoller ausgenutzt werden, wenn die Bandbreite der Frequenzbänder entsprechend den Bandbreiten der "kritischen Bänder" des menschlichen Gehörs gewählt werden. Siehe allgemein das Audio Engineering Handbook, K. Blair Benson ed., McGraw-Hill, San Francisco, 1988, Seiten 1.40 bis 1.42 und 4.8 bis 4.10. Durchgehend durch die folgende Erörterung verweist der Begriff "Teilband" auf Teile der Nutzsignalbandbreite, unabhängig davon, ob dies durch einen wahren Teilbandcodierer, einen Transformationscodierer oder eine andere Technik implementiert ist. Der Begriff "Teilbandcodierer" verweist auf wahre Teilbandcodierer, Transformationscodierer und andere Codierungstechniken, die solche "Teilbänder" verarbeiten.
  • Signale in formatierter Form können nicht direkt summiert werden. Daher muß jeder von zwei Lieferkanälen decodiert werden, bevor sie durch Summierung kombiniert werden können. Allgemein sind Decodierungstechniken wie Teilbanddecodierung relativ teuer zu implementieren. Daher ist eine monophone Präsentation eines 2-Kanal-Signals annähernd doppelt so teuer wie eine monophone Präsentation eines 1-Kanal-Signals. Die Kosten sind etwa doppelt so hoch, da ein teurer Decoder für jeden Lieferkanal erforderlich ist.
  • Eine bekannte Technik, die die Kostenbelastung einer monophonen Präsentation eines 2-Kanal-Signals vermeidet, ist die Matrixierung. Es ist wichtig, zwischen einer Matrixierung zur Verringerung der Anzahl von Präsentationskanälen und einer Matrixierung zu unterscheiden, die zur Verringerung der Anzahl von Übertragungskanälen verwendet wird. Obwohl sie mathematisch ähnlich sind, ist jede Technik auf sehr verschiedene Aspekte von Signalübertragung und -wiedergabe gerichtet.
  • Ein einfaches Matrixierungsbeispiel codiert zwei Kanäle, A und B, in SUMME- und DIFFERENZ-Lieferkanäle entsprechend SUMME = A + B, und DIFFERENZ = A – B .
  • Für eine stereophone 2-Kanal-Wiedergabe kann ein Präsentationssystem das ursprüngliche 2-Kanal-Signal durch Verwendung von zwei Decodern zur Decodierung jedes Lieferkanals und De-Matrixierung der decodierten Kanäle erhalten, entsprechend A'= 1/2 · (SUMME + DIFFERENZ), und B'= 1/2 ·(SUMME – DIFFERENZ) .
  • Die Benennung A' und B' wird dazu verwendet, der Tatsache Rechnung zu tragen, daß bei praktischen Systemen die durch die De-Matrixierung wiedergewonnenen Signale im allgemeinen nicht exakt den ursprünglichen matrixierten Signalen entsprechen.
  • Für eine monophone Wiedergabe kann ein Präsentationssystem eine Summierung des ursprünglichen 2-Kanal-Signals unter Verwendung lediglich eines Decoders zum Decodieren des SUMME-Lieferkanals erhalten.
  • Obwohl das Matrixieren das Problem unproportionaler Kosten für eine monophone Präsentation von zwei Lieferkanälen löst, leidet es an etwas, das als Kreuzkanal-Rauschmodulation wahrgenommen werden kann, wenn es in Verbindung mit Codierungstechniken eingesetzt wird, die die Informationsanforderungen des codierten Signals verringern. Beispielsweise kann für analoge Signale "Compandierung" verwendet werden, und für digitale Signale können verschiedene Bitraten-reduktionsverfahren eingesetzt werden. Das Anwenden solcher Verfahren stimuliert Rauschen im Ausgangssignal des Decoders. Die Absicht und Erwartung ist, daß dieses Rauschen von dem Audiosignal, welches es verursacht hat, maskiert wird und daher unhörbar ist. Wenn solche Techniken auf matrixierte Signale angewendet werden, kann das dematrixierte Signal unfähig sein, das Rauschen zu maskieren.
  • Es sei angenommen, daß ein Matrixcodierer Kanäle A und B codiert, von denen lediglich Kanal B ein Audiosignal enthält. Normalerweise wird Rauschen in die SUMME- und DIFFERENZ-Kanäle eingeführt, wenn das SUMME- und das DIFFERENZ-Signal zur Übertragung mittels eines analogen Companders oder einer digitalen Bitraten-reduzierungstechnik codiert werden. Während der Decodierung erhält man den A'-Präsentationskanal aus der Summe des SUMME- und des DIFFERENZ-Lieferkanals. Obwohl der A'-Präsentationskanal keinerlei Audiosignal enthalten wird, wird er die Summe des analogen Modulationsrauschens oder des digitalen Codierungsrauschens enthalten, die unabhängig in jeden der SUMME- und DIFFERENZ-Lieferkanäle eingeführt wurde. Der A'-Präsentationskanal enthält keinerlei Audiosignal zur psychoakustischen Maskierung des Rauschens. Ferner kann es sein, daß das Rauschen im Kanal A' nicht von dem Audiosignal im Kanal B' maskiert wird, da das Ohr gewöhnlich Rauschen von Audiosignalen unterscheiden kann, insbesondere wenn das Rauschen und das Signal unterschiedliche Winkel-Lokalisierung aufweisen.
  • Eine andere bekannte Technik ist in EP-A-0 372 601 und in ten Kate, et al., "Digital Audio Carrying Extra Information," ICASSP 90 Proceedings, April 1990, Band 2, Seiten 1097 bis 1100 ausgeführt. Gemäß dieser Technik wird ein primäres Audiosignal in Teilbandsignale aufgeteilt, und jedes Teilbandsignal wird unter Verwendung einer Schrittgröße qstep so quantisiert, daß das resultierende Quantisierungsrauschen als gerade nicht hörbar angesehen wird. Ein Hilfssignal, vorzugsweise eines, das mit dem primären Audiosignal korreliert ist, wird in Teilbandsignale unterteilt, und jedes Teilbandsignal wird abgeschwächt und in einen Bereich von Werten von –1/2 qstep bis +1/2 qstep quantisiert und zu dem jeweiligen quantisierten primären Audio-Teilbandsignal hinzuaddiert. Die zusammengesetzten Teilbandsignale durchlaufen eine Synthesefilterbank zur Erzeugung eines Breitbandsignals mit einem für vorhandene Empfänger kompatiblen Format.
  • Empfänger mit Spezialdecodern können das quantisierte Hilfsaudiosignal wiedergewinnen. Der Spezialdecoder teilt das Breitbandsignal in Teilbandsignale auf, bestimmt dieselbe Quantisierungsschrittgröße gstep, die in dem Codierer verwendet wird, um die quantisierten primären Audioteilbandsignale wiederzugewinnen, und erhält die Hilfsaudioteilbandsignale aus der Differenz der beiden. Das Hilfsaudiosignal wird durch Umkehrung der Wirkungen der von dem Codierer ausgeführten Abschwächung und Anwenden einer Synthesefilterbank an die resultierenden Teilbandsignale wiedergewonnen.
  • Vorhandene Empfänger können das primäre Audiosignal ohne Spezialdecoder reproduzieren. Das Hilfsaudiosignal wird nicht wahrgenommen, da es in dem Breitbandsignal in einer solchen Weise enthalten ist, daß es von der Spektralenergie des primären Audiosignals maskiert wird.
  • Auf der einen Seite bietet diese Technik sehr niedrige Implementierungskosten von Empfängern, die das Hilfsaudiosignal nicht reproduzieren, da sie keinen Spezialdecoder benötigen. Auf der anderen Seite resultiert diese Technik in sehr hohen Implementierungskosten von Empfängern, die das Hilfssignal reproduzieren, und zwar ungeachtet der Anzahl von Präsentationskanälen, da für jedes Hilfsaudiosignal sowohl eine Analysefilterbank als auch eine Synthesefilterbank benötigt wird. Ferner erfordert diese Technik eine Wahrnehmungsquantisierung und erfordert die Verwendung eines Breitbandsignalformats, das Bitraten- und/oder Kanalbandbreiten-Anforderungen stellt, die nicht optimal sind.
  • Techniken, die dazu verwendet werden, die Anzahl von Präsentationskanälen zu steuern, werden zu einem noch größeren Problem, wenn mehr als zwei Lieferkanäle betroffen sind. Filmtonspuren enthalten zum Beispiel typischerweise vier Kanäle: links, mitte, rechts und surround. Einige gegenwärtige Vorschläge für zukünftigen Film und fortgeschrittene Fernsehanwendungen schlagen fünf Kanäle sowie einen sechsten Subwoofer-Kanal mit begrenzter Bandbreite vor. Wenn Mehrkanal-Signale in formatierter Form zur Wiedergabe auf einer monophonen oder 2-Kanal-Heimanlage ausgegeben werden, stellt sich die Frage, wie man ökonomisch ein Signal erhält, das für eine 1- und 2-Kanal Präsentation geeignet ist, während der oben beschriebene Kreuzkanal-Rauschmodulationseffekt vermieden wird.
  • OFFENBARUNG DER ERFINDUNG
  • Es ist eine Aufgabe der vorliegenden Erfindung, die Decodierung von zwei oder mehreren Lieferkanälen von Signalen vorzusehen, die dazu codiert sind, in einer formatierten Form ein mehrdimensio nales Schallfeld zu repräsentieren, ohne daß Artefakte wie Kreuzkanal-Rauschmodulation wahrgenommen werden, wobei die Komplexität oder Kosten der Decodierung grob proportional der Anzahl von Präsentationskanälen ist. Obwohl ein die vorliegende Erfindung verkörpernder Decoder unter Verwendung von analogen oder digitalen Techniken oder sogar einer Hybridanordnung dieser Techniken implementiert werden kann, wird die Erfindung einfacher unter Verwendung digitaler Techniken implementiert, und die hier beschriebenen bevorzugten Ausführungsformen stellen digitale Implementationen dar.
  • Gemäß den Lehren der vorliegenden Erfindung empfängt bei einer Ausführungsform ein Transformationsdecoder ein codiertes Signal in einer formatierten Form, umfassend zwei oder mehrere Lieferkanäle. Eine deformatierte Darstellung wird für jeden Lieferkanal erzeugt. Jeder Kanal deformatierter Information wird auf eine oder mehrere inverse Transformationen zur Ausgangssignalsynthese verteilt, eine inverse Transformation für jeden Präsentationskanal.
  • Wie oben erörtert, gilt die vorliegende Erfindung für Teilbandcodierer, die in irgendeiner von verschiedenen Techniken implementiert sind. Eine bevorzugte Ausführung verwendet eine Transformation, genauer gesagt eine Zeitbereichs-zu-Frequenzbereichs-Transformation gemäß der Time Domain Aliasing Cancellation (TDAC)-Technik. Siehe Princen und Bradley, "Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation, "IEEE Trans. on Acoust., Speech, Signal Proc., Band ASSP-34, 1986, Seiten 1153 bis 1161. Ein Beispiel eines Transformations-Codier/Decodiersystems, das eine TDAC-Transformation verwendet, wird in der Veröffentlichung der Internationalen Patentanmeldung mit der Nummer WO 90/09022, veröffentlicht am 9. August 1990 gegeben.
  • Die verschiedenen Merkmale der Erfindung und ihre bevorzugten Ausführungsformen werden in der folgenden Beschreibung von Ausführungsformen und den begleitenden Zeichnungen näher ausgeführt.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Funktionsblockdiagramm, das den Grundaufbau einer die Erfindung enthaltenden Ausführungsform zur Verteilung von vier Lieferkanälen auf zwei Präsentationskanäle darstellt,
  • 2 ist ein Funktionsblockdiagramm, das den Grundaufbau eines Einzelkanal-Teilbanddecoders darstellt,
  • 3 ist ein Funktionsblockdiagramm, das den Grundaufbau eines Mehrkanal-Teilbanddecoders darstellt, der vier decodierte Lieferkanäle auf zwei Präsentationskanäle verteilt.
  • 4 ist ein Funktionsblockdiagramm, das den Grundaufbau einer die Erfindung enthaltenden Ausführungsform darstellt, die vier Lieferkanäle auf einen Präsentationskanal verteilt.
  • BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
  • 2 zeigt den Grundaufbau eines typischen Einzelkanal-Teilbanddecoders 200. Codierte Teilbandsignale, die von einem Lieferkanal 202 empfangen werden, werden von einem Deformatierer 204 in lineare Form deformatiert, und ein Synthesizer 206 erzeugt längs einem Präsentationskanal 208 eine Darstellung voller Bandbreite des empfangenen Signals. Es ist darauf hinzuweisen, daß eine praktische Ausführung eines Decoders zusätzliche Elemente enthalten kann, wie etwa einen Puffer für den Lieferkanal 202 sowie einen Digital/Analog-Umsetzer und ein Tiefpaßfilter für den Präsentationskanal 208, die nicht gezeigt sind.
  • Wie oben kurz erwähnt, sollte der Deformatierer 204 eine lineare Darstellung gewinnen, indem ein Verfahren invers zu demjenigen benutzt wird, das ein zugehöriger Codierer verwendet, der die nichtlineare Darstellung erzeugt hat. Bei einer praktischen Ausführungsform werden solche nicht-linearen Darstellungen im allgemeinen dazu verwendet, die Informationsanforderungen, die an Übertragungskanäle und Speichermedien gestellt werden, zu verringern. Die Deformatierung beinhaltet im allgemeinen einfache Operationen, die relativ schnell ausgeführt werden können und relativ billig zu implementieren sind.
  • Der Synthesizer 206 stellt für wahre digitale Teilbanddecoder eine Synthesefilterbank dar, während er für digitale Transformationsdecoder eine inverse Transformation darstellt. Für beide Decodertypen ist die Signalsynthese rechenintensiv und erfordert viele komplexe Operationen. Somit benötigt der Synthesizer 206 typischerweise sehr viel mehr Zeit zur Durchführung und beinhaltet höhere Kosten zur Ausführung, als sie für den Deformatierer 204 erforderlich sind.
  • 3 zeigt den Grundaufbau eines typischen Decoders, der vier Lieferkanäle zur Darstellung durch zwei Präsentationskanäle empfängt und decodiert. Das von jedem der Lieferkanäle 302a bis 302d empfangene codierte Signal wird durch einen jeweiligen von Decodern 303a bis 303d geschickt, von denen jeder einen jeweiligen von Deformatierern 304a bis 304d und einen jeweiligen von Synthesizern 306a bis 306d umfaßt. Das synthetisierte Signal wird von jedem Decoder längs einem jeweiligen von Wegen 308a bis 308d zu einem Verteiler 310 weitergegeben, der die vier synthetisierten Kanäle zu zwei Präsentationskanälen 312a und 312b kombiniert. Der Verteiler 310 umfaßt im allgemeinen einfache Operationen, die relativ schnell unter Verwendung von Ausführungen ausgeführt werden können, die relativ billig zu realisieren sind.
  • Den größten Teil der zur Implementierung des in 3 gezeigten Decoders erforderlichen Kosten benötigen die Synthesizer. Die Anzahl von Synthesizern ist gleich der Anzahl von Lieferkanälen. Damit sind die Kosten zur Implementierung grob der Anzahl von Lieferkanälen proportional.
  • Eine Signalsynthese ist linear, wenn unter Vernachlässigung arithmetischer Rundungsfehler vor der Synthese kombinierte Signale dasselbe Ausgangssignal ergeben wie das, das durch Kombination der Signale nach der Synthese erzeugt wird. Die Synthese ist für viele Ausführungen von Decodern linear. Daher ist es oft möglich, bei solch einem Mehrkanal-Decoder einen Verteiler zwischen die Deformatierer und die Synthesizer zu setzen. Solch ein Aufbau wird nachfolgend näher erörtert und ist in 1 dargestellt. Auf diese Weise sind die Implementierungskosten grob der Anzahl von Präsentationskanälen proportional. Dies ist bei Anwendungen wie solchen, die für fortgeschrittene Fernsehsysteme vorgeschlagen wurden, sehr wünschenswert, die fünf Lieferkanäle empfangen können aber nur einen oder zwei Präsentationskanäle bieten.
  • In diesem Zusammenhang ist es möglich, die Bedeutung des oben erörterten Begriffs "linear" besser zu verstehen. Kurz gesagt, wird jede Darstellung als linear betrachtet, wenn sie zwei Kriterien erfüllt: (1) es kann sich um eine direkte Eingabe für den Synthesizer handeln, und (2) sie erlaubt die direkte Bildung von linearen Kombinationen wie Addition oder Subtraktion, die die oben beschriebene Signalsynthese-Linearitätseigenschaft erfüllen.
  • 1 zeigt eine Ausführungsform eines Decoders gemäß der vorliegenden Erfindung, der aus vier Lieferkanälen zwei Präsentationskanäle bildet. Der Decoder empfängt codierte Information von vier Lieferkanälen 102a102d, die er unter Verwendung von Deformatierern 104a bis 104d, einer für jeden Lieferkanal, deformatiert. Ein Verteiler 108 kombiniert die von Wegen 106a bis 106d empfangenen deformatierten Signale zu zwei Signalen, die er auf Wegen 110a und 110b zu Synthesizern 112a bzw. 112b weitergibt. Jeder der Synthesizer erzeugt ein Signal, das er auf einem jeweiligen von Präsentationskanälen 114a und 114b weitergibt.
  • Ein Fachmann wird ohne weiteres verstehen, daß die vorliegende Erfindung auf eine weite Vielfalt von wahren Teilband- und Transformationsdecoder-Ausführungen angewendet werden kann. Einzelheiten von Ausführungen für Deformatierer und Synthesizer gehen über den Rahmen dieser Erörterung hinaus. Man mag jedoch Ausführungsdetails einer von etlichen internationalen Patentanmeldungen entnehmen: Veröffentlichung Nr. WO 90/09022, veröffentlicht am 9. August 1990; Veröffentlichung Nr. WO 90/09064, veröffentlicht am 9. August 1990; und Veröffentlichung Nr. WO 91/16769, veröffentlicht am 31. Oktober 1991.
  • Eine Ausführungsform eines Transformationsdecoders gemäß der vorliegenden Erfindung umfaßt Deformatierer und Synthesizer im wesentlichen ähnlich denen, die in der Veröffentlichung WO 90/09022 beschrieben werden. Gemäß dieser Ausführungsform wird, unter Bezugnahme auf 1, ein serieller Bitstrom umfassend Frequenzbereichs-Transformationskoeffizienten, die in Teilbänder gruppiert sind, von jedem der Lieferkanäle 102a bis 102d empfangen. Jeder Deformatierer 104a-104d puffert den Bitstrom zu Informationsblöcken, stellt die Anzahl von Bits fest, die jedem Frequenzbereichs-Transformationskoeffizienten durch den Codierer des Bitstroms adaptiv zugewiesenen wurden, und rekonstruiert eine lineare Darstellung für jeden Frequenzbereichs-Transformationskoeffizienten. Der Verteiler 108 empfängt die linearisierten Frequenzbereichs-Transformationskoeffizienten von Wegen 106a106d, kombiniert sie nach Bedarf und verteilt die Frequenzbereichsinformation unter den Wegen 110a und 110b. Jeder der Synthesizer 112a und 112b erzeugt Zeitbereichs-Abtastwerte nach Maßgabe der von den Wegen 110a und 110b empfangenen Frequenzbereichsinformation durch Ausüben einer inversen Schnellen Fourier Transformation, die die oben erwähnte inverse TDAC-Transformation implementiert. Obwohl keine nachfolgenden Elemente in
  • 1 gezeigt sind, werden die Zeitbereichs-Abtastwerte längs Präsentationskanälen 114a und 114b weitergereicht, gepuffert und zu einer Zeitbereichsdarstellung des ursprünglichen codierten Signals kombiniert und nachfolgend mittels eines DAC von der digitalen Form zur analogen Form umgesetzt.
  • Es sei angenommen, daß die vier Lieferkanäle 112a bis 112d in 1 den linken (L), den mittleren (C), den rechten (R) und den Surround-(S)-Kanal eines 4-Kanal-Audiosystems repräsentieren, in welchem Fall ein typische Ausführungsform des Verteilers 108 diese Kanäle zur Bildung einer stereophonen 2-Kanal Darstellung wie folgt kombiniert: L'=L+.7071·C+.5·S (1) R'=R+.7071·C+.5·S (2)wobei L' = linker Präsentationskanal und
    R' = rechter Präsentationskanal.
  • Für einen Transformations-Decoder repräsentieren diese Kombinationen die Summenbildung der Transformationskoeffizienten im Frequenzbereich. Es ist klar, daß normalerweise lediglich Koeffizienten, die denselben Bereich spektraler Frequenzen repräsentieren, kombiniert werden. Beispielsweise sei angenommen, daß jeder Lieferkanal eine Frequenzbereichsdarstellung eines durch eine 256-Punkt-Transformation transformierten Signals mit 20 kHz Bandbreite trägt. Frequenzbereichs-Transformationskoeffizient X(0) für jeden Lieferkanal repräsentiert die spektrale Energie des codierten Signals, das von dem jeweiligen Lieferkanal getragen wird, mit 0 Hz als Mitte, und Koeffizient X(1) für jeden Lieferkanal repräsentiert die Spektralenergie des codierten Signals für den jeweiligen Lieferkanal, mit 78,1 Hz als Mitte (20 kHz/256). Somit wird der Koeffizient X(1) für den L'-Präsentationskanal von der gewichteten Summe der X(1)-Koeffizienten für jeden Lieferkanal entsprechend Gleichung 1 gebildet. Die Gleichungen 1 und 2 können umgeschrieben werden in der Form X(i)L'= X(i)L + .7071·X(i)C + .5·X(i)s (3) X(i)R'= X(i)R + .7071·X(i)C + .5·X(i)s (4)wobei X(i)Z = Transformationskoeffizient i für Kanal Z.
  • Für einen wahren Teilbanddecoder, repräsentieren diese Kombinationen die Summierung entsprechender Zeitbereichs-Abtastwerte in jedem Teilband. Somit können die Gleichungen 1 und 2 umgeschrieben werden in die Form xj(nt)L'= xj(nt)L + .7071·xj(nt)C + .5·xj(nt)s (5) xj(nt)R,= xj(nt)R + .7071 · xj(nt)C + .5 · xj(nt)S (6)wobei xj(nt)Z = Signalabtastwert zum Zeitpunkt nt im Teilband j des Kanals Z.
  • 4 zeigt eine Anwendung der vorliegenden Erfindung zur Bildung eines Präsentationskanals 414 von vier Lieferkanälen 402a bis 402d. Eine typische Kombinationsgleichung für den Verteiler 408 bei dieser Anwendung ist M'=.7071·L+C+.7071·R+S, (7) wobei M' = monophoner Präsentationskanal.
  • Die präzisen Formen und Kombinationen, die von dem Verteiler geschaffen werden, variieren mit der Anwendung.
  • Obwohl vorzustellen ist, daß die vorliegende Erfindung normalerweise dazu benutzt wird, eine geringere Anzahl von Präsentationskanälen zu erhalten als Lieferkanäle vorhanden sind, ist die Erfindung nicht dahingehend beschränkt. Die Anzahl von Präsentationskanälen kann gleich oder größer sein als die Anzahl von Lieferkanälen, wobei der Verteiler dazu genutzt wird, Präsentationskanäle nach Maßgabe der Erfordernisse einer gewünschten Anwendung zu schaffen.

Claims (3)

  1. Decoder zum Dekodieren von Mehrkanal-Audiosignalen, die ein mehrdimensionales Schallfeld repräsentieren, das von einer Mehrzahl von Lieferkanälen geliefert wird, wobei jeder Lieferkanal formatierte Information in der Form einer nicht-linearen Darstellung von Frequenzbereichs-Transformationskoeffizienten trägt, umfassend: Empfangsmittel (116; 416) zum Empfang der Mehrzahl von Lieferkanälen (102a102d; 402a402d), Deformatierungsmittel (104a104d; 404a404d) zum Deformatieren, ansprechend auf die Empfangsmittel, der nicht-linearen Darstellung der Transformations-Koeffizienten jedes Lieferkanals in eine jeweilige lineare Darstellung der Transformations-Koeffizienten, und Synthesemittel (112a112b; 412) zum Anlegen einer Frequenzbereichs-zu-Zeitbereichs-Transformation zur Erzeugung von Ausgangssignalen abhängig von den linearen Darstellungen von Transformations-Koeffizienten, dadurch gekennzeichnet, daß zwischen den Deformatierungsmitteln und den Synthesemitteln angeordnete Verteilermittel (108; 408) auf die Deformatierungsmittel ansprechen und einen oder mehrere Zwischensignale erzeugen, wobei wenigstens ein Zwischensignal durch die Summierung der Transformations-Koeffizienten, die die gleichen Spektralfrequenzen von zwei oder mehreren der linearen Darstellungen repräsentieren, erzeugt wird, und die Synthesemittel ein jeweiliges Ausgangssignal als Antwort auf jedes der Zwischensignale erzeugen.
  2. Decoder zum Dekodieren von Mehrkanal-Audiosignalen, die ein mehrdimensionales Schallfeld repräsentieren, das von einer Mehrzahl von Lieferkanälen geliefert wird, wobei jeder Lieferkanal formatierte Information in der Form einer nicht-linearen Darstellung von Teilbandsignalen trägt, umfassend: Empfangsmittel (116; 416) zum Empfang der Mehrzahl von Lieferkanälen (102a102d; 402a402d), Deformatierungsmittel (104a104d; 404a404d) zum Deformatieren, ansprechend auf die Empfangsmittel, der nicht-linearen Darstellung von Teilbandsignalen jedes Lieferkanals in eine jeweilige lineare Darstellung der Teilbandsignale, und Synthesemittel (112a112b; 412) zum Anlegen einer Teilband-Synthesefilterbank zur Erzeugung von Ausgangssignalen abhängig von den linearen Darstellungen von Teilbandsignalen, dadurch gekennzeichnet, daß zwischen den Deformatierungsmitteln und den Synthesemitteln angeordnete Verteilermittel (108; 408) auf die Deformatierungsmittel ansprechen und eines oder mehrere Zwischensignale erzeugen, wobei wenigstens ein Zwischensignal von der Summierung entsprechender Zeitbereichs-Abtastwerte in jedem entsprechenden Teilband von zwei oder mehreren der linearen Darstellungen erzeugt werden, und die Synthesemittel ein jeweiliges Ausgangssignal als Antwort auf jedes der Zwischensignale erzeugen.
  3. Decoder nach Anspruch 1 oder 2, bei dem die lineare Darstellung höhere Informationskapazitätsanforderungen aufweist als die Lieferkanäle formatierter Information.
DE69214523T 1991-01-08 1992-01-08 Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder Expired - Lifetime DE69214523T3 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63889691A 1991-01-08 1991-01-08
US638896 1991-01-08
US07/718,356 US5274740A (en) 1991-01-08 1991-06-21 Decoder for variable number of channel presentation of multidimensional sound fields
US718356 1991-06-21
PCT/US1992/000134 WO1992012608A1 (en) 1991-01-08 1992-01-08 Decoder for variable-number of channel presentation of multidimensional sound fields

Publications (3)

Publication Number Publication Date
DE69214523D1 DE69214523D1 (de) 1996-11-21
DE69214523T2 DE69214523T2 (de) 1997-03-27
DE69214523T3 true DE69214523T3 (de) 2005-03-03

Family

ID=27093203

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69214523T Expired - Lifetime DE69214523T3 (de) 1991-01-08 1992-01-08 Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder

Country Status (12)

Country Link
US (2) US5274740A (de)
EP (1) EP0519055B2 (de)
JP (1) JP3197012B2 (de)
KR (1) KR100228687B1 (de)
AT (1) ATE144364T1 (de)
AU (1) AU649786B2 (de)
CA (1) CA2077668C (de)
DE (1) DE69214523T3 (de)
DK (1) DK0519055T4 (de)
ES (1) ES2093250T5 (de)
SG (1) SG49884A1 (de)
WO (1) WO1992012608A1 (de)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE40280E1 (en) 1988-12-30 2008-04-29 Lucent Technologies Inc. Rate loop processor for perceptual encoder/decoder
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
EP0559348A3 (de) 1992-03-02 1993-11-03 AT&T Corp. Rateurregelschleifenprozessor für einen wahrnehmungsgebundenen Koder/Dekoder
WO1995022816A1 (en) * 1992-06-29 1995-08-24 Corporate Computer Systems, Inc. Method and apparatus for adaptive power adjustment of mixed modulation radio transmission
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
EP0678226B1 (de) * 1993-10-27 2003-05-14 Koninklijke Philips Electronics N.V. Senden und empfangen einer ersten und einer zweiten signalkomponente
US5652824A (en) * 1993-10-29 1997-07-29 Tokyo Shibaura Electric Co Multilingual recording medium and reproducing apparatus with automatic selection of substitutes and languages based on frequency of selections
US5835669A (en) 1995-06-28 1998-11-10 Kabushiki Kaisha Toshiba Multilingual recording medium which comprises frequency of use data/history data and a plurality of menus which are stored in a still picture format
JPH07264144A (ja) * 1994-03-16 1995-10-13 Toshiba Corp 信号圧縮符号化装置および圧縮信号復号装置
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
US5594911A (en) * 1994-07-13 1997-01-14 Bell Communications Research, Inc. System and method for preprocessing and delivering multimedia presentations
US5577258A (en) * 1994-07-13 1996-11-19 Bell Communications Research, Inc. Apparatus and method for preprocessing multimedia presentations to generate a delivery schedule
US5818943A (en) * 1994-10-25 1998-10-06 U.S. Philips Corporation Transmission and reception of a first and a second main signal component
JP3072709B2 (ja) 1994-11-21 2000-08-07 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 要求伝達方法
ES2143673T3 (es) * 1994-12-20 2000-05-16 Dolby Lab Licensing Corp Metodo y aparato para aplicar una prediccion de formas de onda a subbandas de un sistema codificador perceptual.
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
US5852800A (en) * 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
ATE309644T1 (de) * 1996-02-08 2005-11-15 Koninkl Philips Electronics Nv Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
KR100370412B1 (ko) * 1996-04-17 2003-04-07 삼성전자 주식회사 복잡도 조절이 가능한 오디오 복호화방법 및 이를이용한오디오복호화기
US6252965B1 (en) * 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US7085387B1 (en) * 1996-11-20 2006-08-01 Metcalf Randall B Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources
US6236730B1 (en) * 1997-05-19 2001-05-22 Qsound Labs, Inc. Full sound enhancement using multi-input sound signals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
KR100486208B1 (ko) * 1997-09-09 2005-06-16 삼성전자주식회사 돌비에이.시.-쓰리디코더의시간영역알리아싱제거장치및방법
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6765930B1 (en) 1998-12-11 2004-07-20 Sony Corporation Decoding apparatus and method, and providing medium
US6239348B1 (en) * 1999-09-10 2001-05-29 Randall B. Metcalf Sound system and method for creating a sound event based on a modeled sound field
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP4744874B2 (ja) 2002-05-03 2011-08-10 ハーマン インターナショナル インダストリーズ インコーポレイテッド サウンドの検出および特定システム
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
WO2004032351A1 (en) * 2002-09-30 2004-04-15 Electro Products Inc System and method for integral transference of acoustical events
JP2004335931A (ja) * 2003-05-12 2004-11-25 Alps Electric Co Ltd Cpp型巨大磁気抵抗効果素子
US7542815B1 (en) * 2003-09-04 2009-06-02 Akita Blue, Inc. Extraction of left/center/right information from two-channel stereo sources
GB2410164A (en) * 2004-01-16 2005-07-20 Anthony John Andrews Sound feature positioner
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
KR100923478B1 (ko) * 2004-03-12 2009-10-27 노키아 코포레이션 부호화된 다중채널 오디오 신호에 기반하여 모노 오디오신호를 합성하는 방법 및 장치
ES2295837T3 (es) * 2004-03-12 2008-04-16 Nokia Corporation Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada.
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
US8009837B2 (en) * 2004-04-30 2011-08-30 Auro Technologies Nv Multi-channel compatible stereo recording
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
US7636448B2 (en) * 2004-10-28 2009-12-22 Verax Technologies, Inc. System and method for generating sound events
EP1851656A4 (de) * 2005-02-22 2009-09-23 Verax Technologies Inc System und verfahren zum formatieren von multimodus-soundinhalten und metadaten
EP1876586B1 (de) * 2005-04-28 2010-01-06 Panasonic Corporation Audiocodierungseinrichtung und audiocodierungsverfahren
EP1876585B1 (de) * 2005-04-28 2010-06-16 Panasonic Corporation Audiocodierungseinrichtung und audiocodierungsverfahren
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US9233301B2 (en) * 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
US8935733B2 (en) * 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US8966545B2 (en) * 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
US8005236B2 (en) * 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
TWI449442B (zh) 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
US20100223552A1 (en) * 2009-03-02 2010-09-02 Metcalf Randall B Playback Device For Generating Sound Events
EP2409298B1 (de) 2009-03-17 2013-05-08 Dolby International AB Erweiterter stereocoder basierend auf einer kombination von adaptivwählbarer links/rechts oder mittseiten-stereocodierung und parametrischer stereocodierung
TWI484481B (zh) 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
KR101809272B1 (ko) * 2011-08-03 2017-12-14 삼성전자주식회사 다 채널 오디오 신호의 다운 믹스 방법 및 장치

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2073556B (en) * 1980-02-23 1984-02-22 Nat Res Dev Sound reproduction systems
US4700362A (en) * 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation A-D encoder and D-A decoder system
FR2577084B1 (fr) * 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US5046098A (en) * 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US4941177A (en) * 1985-03-07 1990-07-10 Dolby Laboratories Licensing Corporation Variable matrix decoder
US4774496A (en) * 1986-02-28 1988-09-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital encoder and decoder synchronization in the presence of data dropouts
US4726019A (en) * 1986-02-28 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Digital encoder and decoder synchronization in the presence of late arriving packets
US4882755A (en) * 1986-08-21 1989-11-21 Oki Electric Industry Co., Ltd. Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5040212A (en) * 1988-06-30 1991-08-13 Motorola, Inc. Methods and apparatus for programming devices to recognize voice commands
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
EP0400222A1 (de) * 1989-06-02 1990-12-05 ETAT FRANCAIS représenté par le Ministère des Postes, des Télécommunications et de l'Espace Digitales Übertragungssystem unter Verwendung der Teilbandkodierung eines digitalen Signals
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5036538A (en) * 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields

Also Published As

Publication number Publication date
AU1194292A (en) 1992-08-17
ES2093250T5 (es) 2005-04-01
DK0519055T3 (da) 1997-03-24
ES2093250T3 (es) 1996-12-16
WO1992012608A1 (en) 1992-07-23
AU649786B2 (en) 1994-06-02
US5274740A (en) 1993-12-28
CA2077668C (en) 2001-02-27
SG49884A1 (en) 1998-06-15
ATE144364T1 (de) 1996-11-15
EP0519055A1 (de) 1992-12-23
KR100228687B1 (ko) 1999-11-01
EP0519055B1 (de) 1996-10-16
EP0519055B2 (de) 2004-11-03
JP3197012B2 (ja) 2001-08-13
KR920704540A (ko) 1992-12-19
CA2077668A1 (en) 1992-07-09
JPH05505504A (ja) 1993-08-12
DK0519055T4 (da) 2005-01-10
US5400433A (en) 1995-03-21
DE69214523T2 (de) 1997-03-27
DE69214523D1 (de) 1996-11-21

Similar Documents

Publication Publication Date Title
DE69214523T3 (de) Dekodierer für variable anzahl von kanaldarstellungen mehrdimensionaler schallfelder
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE69933659T2 (de) Verfahren und system zur räumlichen kodierung mit niedriger bitrate
US7876905B2 (en) Multichannel spectral mapping audio apparatus and method
JPH09102742A (ja) 符号化方法および装置、復号化方法および装置、並びに記録媒体

Legal Events

Date Code Title Description
8363 Opposition against the patent
8366 Restricted maintained after opposition proceedings