-
Hintergrund
der Erfindung
-
Diese
Erfindung bezieht sich auf einen neuen I/O-Bus, der beim Aufbauen
eines Mehrlaufwerksbibliothek-Computersystems verwendet werden könnte. Mit
dem hierin offenbarten neu erfundenen I/O-Bus könnte eine Reparatur eines ausgefallenen
Laufwerks auftreten, während
eines oder mehrere funktionierende Laufwerke in dem Bibliotheksystem
betriebsbereit bleiben. Auf diese Weise könnte ein Host fortwährenden
und ununterbrochenen Zugriff auf Informationen haben, die in der
Bibliothek gespeichert sind.
-
Obwohl
der hierin offenbarte I/O-Bus insbesondere bei Mehrlaufwerksbibliothek-Computersystemen des
entfernbaren Medientyps von Vorteil ist, könnte derselbe auch auf andere
Mehrkomponenten-Computersysteme angepasst werden.
-
Der
hierin offenbarte I/O-Bus könnte
in Verbindung mit der Computerrahmenstruktur mit Modulargehäusen (Computer
Frame Structure with Modular Housings) und einem System und einem
Verfahren einer Betriebsbereit-Laufwerk-Reparatur (Online Drive
Repair), die hierin offenbart sind, verwendet werden.
-
In
einem Mehrlaufwerksbibliothek-Computersystem ist oft die erste Komponente,
die aufgrund übermäßiger Benutzung
ausfällt,
ein Speicherlaufwerk. Üblicherweise
durchläuft
die Bibliothek, wenn ein Speicherlaufwerk ausfällt, einen Zeitraum einer Ausfallzeit,
während
das Laufwerk repariert und/oder ersetzt wird. Während dieser Ausfallzeit kann
ein Host (ob er eine UNIX-Arbeitsstation, ein PC-Netzwerkserver
oder etwas anderes ist) nicht auf die Informationen, die innerhalb
der Bibliothek enthalten sind, zugreifen.
-
Da
ein Verlust eines Informationszugriffs inakzeptabel ist, wurden
Bemühungen
unternommen, um eine Bibliotheksausfall zeit zu minimieren. Diese
Bemühungen
umfassen ein redundantes Array billiger Platten (RAID) und Heißreparatur-
(oder Hot-Repair-) Technologien.
-
Die
RAID-Technologie beinhaltet ein Verfahren zum Rekonstruieren von
Daten, die in dem Fall eines Laufwerkausfalls verloren gehen. Daten
sind in einem redundanten Array von Laufwerken des nicht-entfernbaren
Medientyps gespeichert, derart, dass, wenn ein ausgefallenes Laufwerk
ersetzt wird, eine Fehlerkorrekturoperation auf die Datenblöcke der
verbleibenden Speicherlaufwerke in dem redundanten Array angewendet werden
kann, so dass die verlorengegangenen Daten rekonstruiert werden
können.
Obwohl das RAID-Verfahren eine Minimierung einer Bibliotheksausfallzeit
unterstützt,
ist das Verfahren nicht auf Bibliotheken des entfernbaren Medientyps
anwendbar. In einer Bibliothek des entfernbaren Medientyps führt der
Ausfall eines Laufwerks nicht zu einem Datenverlust. Er führt nur
zu dem Verlust eines Zugriffs auf Daten.
-
In
einem heiß-reparierbaren
System werden Speicherlaufwerke auf Schienen in Heißreparatur-Buchsen
geführt.
Ein ausgefallenes Laufwerk könnte
ohne Benachrichtigung an das Bibliothekssystem oder einen Host aus
seiner Buchse entfernt werden. Wenn das ausgefallene Laufwerk aus
seiner Buchse gezogen wird, wird ein System langer und kurzer Anschlussstifte
verwendet, um eine Leistung zu dem Laufwerk inkremental zu trennen,
das Bibliothekssystem und den Host zu benachrichtigen, dass das
Laufwerk nicht weiter verfügbar ist,
und um die nötigen
Veränderungen
an Systemparametern vorzunehmen, um das Bibliothekssystem betriebsbereit
zu halten. Es besteht jedoch eine Barriere für eine Implementierung einer
Heißreparatur-Technologie
in einer Bibliothek des entfernbaren Medientyps. Die Barriere existiert
aufgrund der Anforderung einer Bibliothek des entfernbaren Medientyps,
dass die Medieneinführungsflächen ihrer
Speicherlaufwerke einem automatischen Medieneinführer zugewandt sein müssen. Um
ein derartiges System betriebsbereit zu halten, ist es nötig, Speicherlaufwerke
zu entfernen, indem dieselben aus dem automatischen Einführer herausgezogen
werden. Hierzu müssen
die elektrischen Verbindungsflächen
der Speicherlaufwerke (die in Standardlaufwerken gegenüber von
ihren Medieneinführungsflächen sind)
frei von einer Blockierung sein (Buchsen, Schaltungsplatinen, Anschlussstiften
usw.). Um eine Heiß-Reparatur
eines Speicherlaufwerks entfernbarer Medien zu beeinflussen, müsste ein
Speicherlaufwerk aufgebaut werden, bei dem seine Medieneinführungsfläche und elektrische
Verbindungsfläche
an benachbarten Seiten und nicht an gegenüberliegenden Seiten sind.
-
Deshalb
besteht eine Hauptaufgabe dieser Erfindung darin, die Ausfallzeit
eines Mehrlaufwerksbibliothek-Computersystems auf einen Ausfall
eines oder mehrerer der Speicherlaufwerke der Bibliothek hin wesentlich
zu reduzieren. In dem Fall einer Bibliothek des entfernbaren Medientyps
geht man davon aus, dass die Ausfallzeit einer Bibliothek aufgehoben
werden kann.
-
Eine
weitere Aufgabe dieser Erfindung besteht darin, einem Host fortwährenden
Zugriff auf eines oder mehrere funktionierende Speicherlaufwerke
eines Mehrlaufwerksbibliothek-Computersystems
zu ermöglichen,
während
eines oder mehrere ausgefallene Laufwerke der Bibliothek repariert
werden.
-
Zusammenfassung
der Erfindung
-
Bei
dem Erzielen der vorstehenden Aufgaben haben die Erfinder einen
neuen I/O-Bus entwickelt, der allgemein unter einem SCSI-Typ-Protokoll
arbeitet, wobei der Bus einen primären I/O-Bus und eine Mehrzahl sekundärer I/O-Busse,
die pigtailmäßig mit
dem primären
Bus verbunden sind, aufweist. Die pigtailmäßig verbundenen I/O-Busse sind
länger
als die 100 mm-Stichleitungen, die unter einem SCSI-Protokoll geduldet
werden. Ferner ist die Gesamtbuslänge länger als die maximale Länge von
sechs Fuß,
die durch das SCSI-Protokoll vorgegeben wird.
-
Der
I/O-Bus wird in Verbindung mit einem betriebsbereiten reparierbaren
Mehrlaufwerksbibliothek-Computersystem verwendet, das eine Mehrzahl
von Speicherlaufwerken aufweist. Die Laufwerke sind über die
Mehrzahl sekundärer
I/O-Busse, die pigtailmäßig mit
dem primären
I/O-Bus verbunden sind, mit dem I/O-Bus verbunden. Der primäre I/O-Bus
ist mit einer Bibliotheksteuerung verbunden. Die Bibliotheksteuerung kommuniziert
mit einem Host-System über
den I/O-Bus. Die Steuerung kommuniziert mit den Laufwerken über einen
internen Universalbus, der zwischen der Steuerung und jedem der
Speicherlaufwerke verläuft.
-
Der
neue I/O-Bus ermöglicht
es, dass funktionierende Laufwerke in einem Mehrlaufwerksbibliothek-Computersystem
während
der Reparatur eines oder mehrerer ausgefallener Laufwerke betriebsbereit und
für einen
Host zugänglich
bleiben.
-
Eine
Bibliotheksausfallzeit wird dadurch wesentlich reduziert oder in
dem Fall einer Bibliothek des entfernbaren Medientyps wird die Bibliothekausfallzeit
aufgehoben.
-
Diese
und weitere wichtige Vorteile und Aufgaben der vorliegenden Erfindung
werden in der beigefügten
Beschreibung, Zeichnungen und Ansprüchen weiter erklärt oder
aus denselben ersichtlich.
-
Kurze Beschreibung
der Zeichnungen
-
Ein
darstellendes und gegenwärtig
bevorzugtes Ausführungsbeispiel
der Erfindung ist in den Zeichnungen dargestellt, in denen:
-
1 eine
perspektivische Ansicht ist, die ein Mehrlaufwerksbibliothek-Computersystem
zeigt;
-
2 eine
schematische Ansicht ist, die die sechs Laufwerke aus 1,
die mit anderen Bibliotheksystemkomponenten über einen I/O-Bus verbunden
sind, zeigt;
-
3 eine
schematische Ansicht ist, die eine Variation des Systems aus 1,
die zwölf
Laufwerke umfasst, zeigt;
-
4 eine
verbesserte Version von 1 ist, wobei der I/O-Bus aus 2 zu
der Figur hinzugefügt wurde,
eines der Modularlaufwerksgehäuse
entfernt wurde, um die Details der Laufwerk/Bus-Verbindungen zu zeigen,
und die Rahmenstruktur der Bibliothek entfernt wurde, um den automatischen
Medieneinführer
des Systems freizugeben;
-
5 eine
perspektivische Rückansicht
eines der Modularlaufwerksgehäuse
aus 1 ist, wobei ein Laufwerk mit voller Höhe darin
befestigt ist;
-
6 eine
perspektivische Rückansicht
des Modularlaufwerksgehäuses
aus 5 ist, wobei zwei Laufwerke mit halber Höhe nun darin
befestigt sind;
-
7 eine
perspektivische Vorderansicht des Modularlaufwerksgehäuses und
der Laufwerke aus 6 ist;
-
8 eine
perspektivische Rückansicht
der auseinandergebauten Teile aus 6 ist, wobei
I/O-Busse hinzugefügt
wurden;
-
9 ein
Flussdiagramm der Schritte ist, die bei dem Verfahren einer Betriebsbereit-Laufwerk-Reparatur,
das hierin offenbart ist, beinhaltet sind;
-
10 eine
Tabelle der Laufwerkszustandsdefinitionen ist, die bei dem hierin
offenbarten Verfahren einer Betriebsbereit-Laufwerk-Reparatur verwendet
werden;
-
11 die
Spezifizierungen des SCSI-Befehls „Puffer-Schreiben" gibt, der durch einen Host-Computer
beim Erzielen des hierin offenbarten Verfahrens einer Betriebsbereit-Laufwerk-Reparatur
verwendet wird; und
-
12 die
Spezifizierungen des SCSI-Befehls „Puffer-Lesen" gibt, der durch einen Host-Computer beim
Erzielen des hierin offenbarten Verfahrens einer Betriebsbereit-Laufwerk-Reparatur
verwendet wird.
-
Beschreibung
des bevorzugten Ausführungsbeispiels
-
Ein
Mehrlaufwerksbibliothek-Computersystem 44 ist in den 1, 2 und 4 dargestellt,
das allgemein einen I/O-Bus 122 aufweisen kann, der unter
einem SCSI-Protokoll arbeitet, wobei der Bus 122 einen
primären
I/O-Bus 94 und eine Mehrzahl sekundärer I/O-Busse 96, 98, 100, 102, 104, 106,
die pigtailmäßig mit
dem primären
Bus 94 verbunden sind, eine Mehrzahl von Speicherlaufwerken 50, 52, 54, 56, 58, 60,
die mit der Mehrzahl sekundärer
I/O-Busse (96, 98, ...) verbunden sind, und eine
Bibliotheksteuerung 36, die mit dem primären I/O-Bus 94 verbunden
ist, wobei die Steuerung 36 eine Firmware, um mit einem
Host-Computer 48 über
den I/O-Bus 122 zu kommunizieren, und eine Firmware aufweist,
um mit den Speicherlaufwerken (50, 52, ...) über einen
Universalbus 62 zu kommunizieren, aufweist.
-
Nach
dieser allgemeinen Beschreibung des Mehrlaufwerksbibliothek-Computersystems
wird das System nun detaillierter beschrieben.
-
Bei
einem ersten bevorzugten Ausführungsbeispiel
weist das Bibliotheksystem 44 sechs Computerspeicherlaufwerke
(50, 52, ...) auf. Die Speicherlaufwerke sind
in sechs Modulargehäusen 20, 22, 24, 26, 28, 30 gehäust, die
jeweils ein Laufwerk (50, 52, ...) mit voller
Höhe halten
können.
-
Die
Laufwerke (50, 52, ...) sind mit anderen Bibliotheksystemkomponenten über einen
internen I/O-Bus 122 verbunden. Dieser Bus 122 arbeitet
unter einem Kleincomputersystemschnittstellen-Protokoll (SCSI-Protokoll).
Siehe 2. Der interne I/O-Bus 122 weist ferner
einen primären
I/O-Bus 94 und eine Mehrzahl sekundärer I/O-Busse (96, 98,
...), die pigtailmäßig mit
dem primären
I/O-Bus 94 verbunden sind, auf. Alle Speicherlaufwerke
(50, 52, ...) sind mit dem I/O-Bus 122 über die
sekundären
(pigtailmäßig verbundenen)
Busse (96, 98, ...) verbunden.
-
In 2 ist
der primäre
I/O-Bus 94 als zwischen Verbindungselementen 78, 80, 82, 84, 86, 88 auf
einer oberen 32 und einer unteren 34 Zwischenelement-PC-Platine
laufend gezeigt. Einige Abschnitte des primären I/O-Bus 94 könnten Leiterbahnen 112, 114, 118, 120 aufweisen,
die in die Zwischenelementplatinen 32, 34 geätzt sind.
Andere Abschnitte 108, 110, 116 des primären I/O-Bus 94 könnten eine
Standard-SCSI-Verkabelung aufweisen.
-
Ein
Universal-Bus 62 ist zwischen die Speicherlaufwerke (50, 52,
...) und die Bibliotheksteuerung 36 geschaltet. Während die
Hauptfunktion des SCSI-Protokoll-I/O-Bus 122 eine Datenübertragung
ist, ist die Hauptfunktion des Universalbus eine Kommunikation zwischen
den Speicherlaufwerken (50, 52, ...) und der Bibliotheksteuerung 36.
-
4 zeigt
die Rückfläche eines
Speicherlaufwerks 60. Die gezeigten Speicherlaufwerke (50, 52,
...) sind optische Laufwerke des entfernbaren Medientyps. Siehe 5.
Jedes Laufwerk (50, 52, ...) weist eine Medieneinführungsfläche 300 auf,
die an einen automatischen Medieneinführer 40 angrenzt.
Die Medieneinführungsfläche 300 eines
Laufwerks 60 ist in 5 gezeigt.
Eine typische Platzierung eines automatischen Medieneinführers 40 ist
am besten in 4 zu sehen. Automatische Medieneinführer für optische
Laufwerke des entfernbaren Medientyps sind in dem U.S.-Patent 5,010,536
und dem U.S.-Patent 5,730,031 offenbart. Gegenüber von den Medieneinführungsflächen 300 weisen
die Laufwerke (50, 52, ...) elektrische Verbindungsflächen 302 auf.
Jede elektrische Verbindungsfläche 302 weist
ein Verbindungselement (z. B. Verbindungselement 304 an
dem Laufwerk 60, wie in 4 gezeigt)
zum Verbinden eines sekundären
I/O-Bus (96, 98, ...) und eines Verbindungselements,
an dem ein Leistungskabel angebracht sein könnte (nicht gezeigt), auf.
-
Der
primäre
I/O-Bus 94 ist an einem Verbindungselement 76 an
einer Bibliotheksteuerung 36 (oder einer Autowechslersteuerung)
angebracht. Wie bereits erwähnt
wurde, ist ein Universalbus 62 ebenso an der Steuerung
angebracht. Die Steuerung 36 weist eine Firmware auf, die
es derselben erlaubt, mit den Speicherlaufwerken (50, 52,
...) über
den Universalbus 62 zu kommunizieren. Die Steuerung 36 weist
außerdem
eine Firmware auf, die es derselben erlaubt, mit einem Host 48 (ob
dieser eine UNIX-Arbeitsstation, ein PC-Netzwerkserver oder etwas anderes ist) über den
SCSI-Protokoll-I/O-Bus 122 zu
kommunizieren.
-
Die
Steuerung 36 spricht auf Host-Befehle an und könnte derartige
Operationen durchführen,
wie z. B. ein Verfolgen des Orts entfernbarer Medienkassetten, ein
Bewegen entfernbarer Medienkassetten und ein Weitergeben ihrer Erfolge
und/oder Ausfälle
an den Host 48. Die Steuerung 36 könnte auch
Bibliotheksbefehle verarbeiten und ausführen. Obwohl die Steuerung 36 auch
für ein
Verändern
von Laufwerkszuständen
verantwortlich sein könnte,
bleibt dies bei dem bevorzugten Ausführungsbeispiel dem Host 48 überlassen.
Obwohl die Steuerung 36 einen Mikroprozessor beinhaltet,
ist die Steuerung eine Komponente, die unter Umständen nur spricht,
wenn sie angesprochen wird – sie
kann keine Aktion einleiten.
-
Die
Steuerung 36 könnte
außerdem
eine Firmware aufweisen, die es derselben erlaubt, eine Leistung zu
einem oder mehreren Speicherlaufwerken (50, 52,
...) zu aktivieren oder zu deaktivieren. Bei einem derartigen Aktivieren
oder Deaktivieren einer Leistung wird ein System zum Unterdrücken von
Leistungstransienten verwendet. Dieses Leistungstransienten-Unterdrückungssystem ähnelt demjenigen,
das in dem U.S.-Patent 4,959,829 offenbart ist. Alternativ könnten Schalter
(nicht gezeigt) verwendet werden, um eine Leistung zu den Laufwerken
(50, 52, ...) zu aktivieren oder zu deaktivieren.
-
Eine
LED 64, 66, 68, 70, 72, 74 ist
neben jedem Laufwerk (50, 52, ...) befestigt.
Die LEDs (64, 66, ...) sind an den Zwischenelementplatinen 32, 34 befestigt.
Die LEDs (64, 66, ...) könnten durch entweder das Bibliotheksystem 44 oder
den Host 48 gesteuert werden, um als eine visuelle Anzeige
des Status eines Laufwerks (50, 52, ...) für einen
Wartungstechniker zu dienen. Eine beleuchtete LED (64, 66,
...) könnte
z. B. „Leistung
ein" bedeuten, eine
unbeleuchtete LED (64, 66, ...) könnte „Leistung
aus" bedeuten und
eine blinkende LED (64, 66, ...) könnte ein
mit Leistung versorgtes Laufwerk in einem „Nicht-Betriebsbereit Ausgefallen"-Zustand bedeuten
(dieser Zustand wird bald detaillierter beschrieben).
-
Eine
SCSI-Repeater-Platine 46 ist außerdem mit dem primären I/O-Bus 94 über ein
Verbindungselement 90 verbunden. Siehe 2.
Die Repeater-Platine 46 ist innerhalb einer Repeater-Platinenumhüllung 38 enthalten.
Die Repeater-Platine 46 ist verantwortlich für ein elektrisches
Trennen des I/O-Bus 122 von der Außenwelt. Sie schützt das
auf dem Bus 122 verwendete Protokoll vor einer Rekonfiguration
durch einen Computer außerhalb
des Bibliotheksystems 44, wie z. B. den Host 48.
Die Repeater-Platine 46 liefert eine Eingabe 128 für einen
externen SCSI-Bus 92, der das Bibliotheksystem 44 mit
einem Host 48 verbindet. Der Host 48 könnte eine
UNIX-Arbeitsstation,
ein PC-Netzwerkserver oder eine andere Host-Vorrichtung sein, wie
bereits erwähnt
wurde.
-
Die
Repeater-Platine 46 ist insbesondere aufgrund der Konfiguration
des I/O-Bus 122 in dem Bibliotheksystem 44, das
oben dargestellt wurde, wichtig. Ein typisches SCSI-System weist mehrere
Komponenten auf, die in Kaskade miteinander verbunden sind. So bewirkt
ein Entfernen einer Komponente aus dem System eine Unterbrechung
in dem System, die eine Kommunikation mit vielen Komponenten abschalten
kann. Da ein Zweck dieser Erfindung darin bestand, ein betriebsbereit-reparierbares
System zu erzielen, wurde es notwendig, ein Kabel aufzubauen, das
eine Entfernung einer einzelnen Komponente ohne ein Deaktivieren
des gesamten Bus erlaubt. Um das erwünschte Ergebnis zu erzielen,
sind Speicherlaufwerke (50, 52, ...) pigtailmäßig mit
einem primären
I/O-Bus 94 über
sekundäre
I/O-Busse (96, 98, ...) verbunden. Ein beliebiger
sekundärer I/O-Bus
(96, 98, ...) könnte aus dem System entfernt
werden, ohne den primären
I/O-Bus 94 zu brechen und eine Kommunikation zwischen anderen
Systemkomponenten über
den primären
I/O-Bus 94 zu stören.
Das SCSI-Protokoll gibt jedoch vor, dass ein Bus 122 nicht
mehr als sechs Fuß Kabel
aufweisen darf und eine Stichleitung (wie z. B. Pigtails bzw. Anschlussdrähte (96, 98,
...) außerhalb
eines primären
Bus 94 nicht länger als
100 mm sein darf. Bei dem oben beschriebenen bevorzugten Ausführungsbeispiel
weist der primäre
Bus 94 etwa 62 Zoll Kabel auf und jeder Pigtail (96, 98,
...) weist etwa 12 Zoll Kabel auf. Die Gesamtkabellänge beträgt 11 Fuß 2 Zoll.
Um ein SCSI-Protokoll auf diesem neu erfundenen Bus-Kabel erfolgreich
zu verwenden, muss der I/O-Bus 122 von der Außenwelt
getrennt sein und kann keiner Rekonfiguration unterzogen werden. Die
Repeater-Platine 46 dient dieser wichtigen Funktion.
-
Die
Speicherlaufwerke (50, 52, ...) sind über Modularlaufwerksgehäuse (20, 22,
...) an der Bibliotheksystemrahmenstruktur 42 befestigt.
Bei einem alternativen Ausführungsbeispiel
(nicht gezeigt) könnten
die Laufwerke (50, 52, ...) einzeln direkt an
der Bibliotheksystemrahmenstruktur 42 befestigt sein. Diese
Anordnung wird aufgrund der größeren Schwierigkeit
eines Zugreifens auf Laufwerke (50, 52, ...),
während
das Bibliotheksystem 44 betriebsbereit gehalten wird, nicht
bevorzugt.
-
5 zeigt
ein Modularlaufwerksgehäuse 30,
das aus dem Bibliotheksystem 44 entfernt ist. Jedes Modularlaufwerksgehäuse (20, 22,
...) weist sein eigenes Kühlgebläse 310, 312, 314, 316, 318 & 320 und
einen Griff 330, 332, 334, 336, 338 & 340 zum
Entfernen desselben aus dem Bibliotheksystem 44 auf. Siehe auch 4.
-
Eine
Entfernung eines Modularlaufwerkgehäuses (20, 22,
...) wird durch ein anfängliches
Trennen einer möglichen
Verkabelung, die sich von dem Modulargehäuse (20, 22,
...) erstreckt (wie z. B. I/O-Bus-Kabel (96, 98,
...) und mögli
cher Leistungskabel (nicht gezeigt)), erzielt. Da die elektrischen
Verbindungsflächen 302 der
Laufwerke (50, 52, ...) nicht ohne weiteres zugänglich sind,
während
die Laufwerke (50, 52, ...) innerhalb eines Modulargehäuses (20, 22,
...) befestigt sind, wird eine Verkabelung an den Zwischenelementplatinen 32 & 34 getrennt.
Als eine Folge werden sekundäre
I/O-Busse (96, 98, ...) und Abschnitte von Leistungskabeln mit
einem Modulargehäuse
(20, 22, ...) entfernt. Sobald die Verkabelung
getrennt ist, könnte
ein Modulargehäuse 30 aus
dem Bibliotheksystem 44 entfernt werden. Eine Verkabelung
ist in 5 nicht gezeigt, um so eine Ansicht eines Kühlgebläses 320 und
eines Griffs 340 nicht zu stören. Ein Modulargehäuse (20, 22,
...) wird durch ein Ziehen des Modulargehäuses (20, 22,
...) weg von dem automatischen Medieneinführer 40 entfernt.
Griffe (330, 332, ...) an den Modulargehäusen (20, 22,
...) erleichtern ihre Entfernung. Beispielhaft werden ein Modulargehäuse 30 und
das darin befestigte Laufwerk 60 in 5 als eine
Einheit aus dem Bibliotheksystem 44 entfernt.
-
Bei
einem zweiten bevorzugten Ausführungsbeispiel
weist das Bibliotheksystem 44 zwölf Computerspeicherlaufwerke 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161 auf.
Die zwölf
Speicherlaufwerke (150, 151, ...) sind in den
gleichen sechs Modulargehäusen
(20, 22, ...), die oben angegeben wurden, gehäust. Jedes
Modulargehäuse
(20, 22, ...) ist so entworfen, dass es ohne Modifizierung
entweder ein Laufwerk (50, 52, ...) mit voller
Höhe oder
zwei Laufwerke (150, 151, ...) mit halber Höhe hält.
-
Die
Laufwerke (150, 151, ...) sind mit anderen Systemkomponenten über zwei
interne I/O-Busse 222, 223 verbunden. Jeder Bus 222, 223 arbeitet
allgemein unter einem SCSI-Protokoll.
Siehe 3. Zwei interne I/O-Busse 222, 223 sind
aufgrund der SCSI-Einschränkung
von acht Komponentenadressen auf einem bestimmten Bus bei dem Zwölf-Laufwerks-Ausführungsbeispiel
erforderlich. Der erste SCSI-I/O-Bus 123 weist einen primären Bus 194,
der mehrere Kabelabschnitte 208, 210, 212, 214 umfasst,
die zwischen zahlreichen Verbindungselementen 176, 178, 180, 182, 191 laufen,
und sekundäre
Busse 196, 198, 200 auf. Der zweite SCSI-I/O-Bus 122 weist
einen primären
Bus 195, der wieder mehrere Kabelabschnitte 209, 213, 215 umfasst, die
zwischen zahlreichen Verbindungselementen 184, 186, 188, 190 laufen,
und sekundäre
Busse 202, 204, 206 auf. Sechs der zwölf Laufwerke 150, 152, 154, 156, 158, 160 sind
direkt mit sekundären
Bussen 196, 198, 200, 202, 204, 206 verbunden.
Die verbleibenden sechs Laufwerke 151, 153, 155, 157, 159, 161 sind
mit den SCSI-I/O-Bussen 222, 223 über die
ersten sechs Laufwerke 150, 152, 154, 156, 158, 160 mittels
mehrerer in Kaskade geschalteter I/O-Busse 197, 199, 201, 203, 205, 207 verbunden.
-
Wie
bei dem ersten Ausführungsbeispiel
läuft ein
Universalbus 162 zwischen den Speicherlaufwerken (150, 151,
...) und der Bibliotheksteuerung 36. Eine obere 132 und
eine untere 134 PC-Zwischenelementplatine liefern wieder
Befestigungen für
Busverbindungselemente 178, 180, 182, 184, 186, 188 und
Leistungsstatus-LEDs 164–175.
-
Aufgrund
des Vorliegens zweier SCSI-I/O-Busse 222, 223 werden
zwei SCSI-Repeater-Platinen benötigt 144, 146,
nämlich
eine für
jeden SCSI-Busabschnitt. Der Host 48 ist mit jeder der
Repeater-Platinen 144, 146 über ein SCSI-kompatibles Kabel
verbunden.
-
6 zeigt
eine Rückansicht
des Modulargehäuses 30 aus 5,
bei dem zwei Laufwerke 160, 161 mit halber Höhe anstelle
des einen Laufwerks 60 mit voller Höhe eingesetzt wurden. Die Medieneinführungsflächen 340 der
beiden Laufwerke 160, 161 mit halber Höhe sind
als sich von der Rückseite
des Gehäuses 30 erstreckend
zu sehen. 7 zeigt eine perspektivische
Vorderansicht der Komponenten aus 6. 8 zeigt
die beiden Laufwerke 160, 161 mit halber Höhe und das
Modulargehäuse 30 aus 6 in
einer auseinandergebauten Weise. Der sekundäre I/O-Bus 206 und
der in Kaskade geschaltete I/O-Bus 207, die die gezeigten
Speicherlaufwerke 160, 161 mit dem primären I/O-Bus 195 verbinden,
sind in 8 ebenso gezeigt. Wie zuvor
angemerkt wurde, werden diese I/O-Busse 206, 207 mit
ihren Speicherlaufwerken 160, 161 und dem Modulargehäuse 30 als
eine Einheit entfernt. Bei diesem Ausführungsbeispiel sind die sekundären I/O-Busse
(196, 198, ...) etwa 14 Zoll lang. Schließlich zeigt 8 die
drei Teilabschnitte 31, 33 & 35, die ein Modulargehäuse 30 bilden.
-
Unser
Verfahren zum Reparieren eines oder mehrerer Laufwerke in den Mehrlaufwerksbibliothek-Computersystemen,
wie oben beschrieben wurde, ist wie folgt. Zu Beschreibungszwecken
wird angenommen, dass das ausgefallene Laufwerk ein Laufwerk 160 mit
halber Höhe
ist, das als ein Paar mit einem anderen Laufwerk 161 mit
halber Höhe
in einem Einzelmodulargehäuse 30 gehäust ist,
das innerhalb eines Systems enthalten ist, das demjenigen ähnelt, das
bei dem oben beschriebenen zweiten bevorzugten Ausführungsbeispiel
beschrieben wurde. Es ist jedoch wichtig, darauf zu achten, dass
dieses Verfahren auch auf die Reparatur eines Laufwerks mit voller
Höhe oder
eines Laufwerks in einem Bibliotheksystem anwendbar ist, bei dem
mehr als zwei Laufwerke innerhalb eines einzelnen Modulargehäuses 30 befestigt
sind. Das Verfahren ist auch auf die Reparatur von zwei oder mehr
Laufwerken gleichzeitig anwendbar.
-
Zuerst
muss der Ausfall eines Laufwerks erfasst oder angewiesen werden.
Es wird Bezug auf das Flussdiagramm aus 9 genommen.
Dies könnte
entweder durch die Bibliotheksteuerung 36 und/oder den Host 48 durchgeführt werden.
Bei dem bevorzugten Ausführungsbeispiel
liefert eine Software des Hosts die Einrichtung zum Erfassen, wenn
ein Laufwerk 160 ausgefallen ist. Der Host 48 könnte auf
mehreren Wegen erfassen, dass ein Laufwerk 160 ausgefallen
ist. Wenn der Host 48 einen Befehl an die Bibliothek ausgibt,
Medien in ein Laufwerk 160 auszustoßen oder zu laden, und einen
Status-Code von der Bibliotheksteuerung 36 empfängt, der
anzeigt, dass die Bewegungsoperation nicht erfolgreich war, könnte der
Host 48 annehmen, dass das Laufwerk 160 fehlerhaft
war und repariert werden muss. Der Host 48 könnte auch
einen Laufwerksausfall aus einem Systempegelfehler erfassen, der
anzeigt, dass das Laufwerk 160 nicht korrekt funktioniert.
-
Sobald
der Ausfall eines Laufwerks erfasst ist, versucht der Host 48,
Medien, falls vorhanden, aus dem ausgefallenen Laufwerk zu entfernen.
Nach einer Entfernung von Medien informiert der Host 48 die
Bibliotheksteuerung 36 über
den Laufwerksausfall und platziert das Laufwerk 160 in
einem „Nicht-Betriebsbereit_Ausgefallen"-Zustand. (Anmerkung:
eine Beschreibung aller verschiedenen Laufwerkszustände ist
in 10 zu finden). Die Bibliotheksteuerung 36 speichert
die Laufwerkszustandsinformationen und erlaubt keinen weiteren Zugriff
auf das ausgefallene Laufwerk 160, bis dessen Zustand zu „Betriebsbereit_Funktionierend" verändert wird.
Laufwerkszustände
bleiben während
eines Leistungsan/abschaltens erhalten.
-
Das
ausgefallene Laufwerk 160 könnte gewartet werden, während das
Bibliotheksystem 44 betriebsbereit bleibt. Es ist deshalb
möglich,
dass der Host 48 mit einem Zugreifen auf eines oder mehrere
funktionierende Laufwerke 150, 151, 152, 153, 154, 155, 156, 157, 158, 159 in
einem „Betriebsbereit_Funktionierend"-Zustand fortfahren
und Informationen von Medien, die in diese Laufwerke eingeführt sind,
wiedergewinnen kann, während
das ausgefallene Laufwerk 160 repariert wird.
-
Während das
Bibliotheksystem 44 betriebsfähig bleibt, greift eine qualifizierte
Wartungsperson auf den inneren Betrieb der Bibliothek (in 1 gezeigt)
zu. Die Wartungsperson weiß durch
eine blinkende LED 174 nahe dem Laufwerk 160,
welches Laufwerk in einem „Nicht-Betriebsbereit_Ausgefallen"-Zustand ist. Wenn
wie angenommen ein ausgefallenes Laufwerk in einem Modulargehäuse 30 befestigt
ist, das zwei Laufwerke 160, 161 mit halber Höhe beinhaltet,
müssen
beide Laufwerke 160, 161 außer Betrieb genommen werden.
Nur das ausgefallene Laufwerk 160 jedoch wird tatsächlich ersetzt.
-
Bei
dem bevorzugten Ausführungsbeispiel
platziert der Host 48 das funktionierende Laufwerk 161,
das gemeinsam mit dem ausgefallenen Laufwerk 160 gehäust ist,
in einen „Nicht-Betriebsbereit_Funktionierend_Wartend"-Zustand. Der Host 48 kann
dann Medien aus dem gemeinsam gehäusten funktionierenden Laufwerk 161 entfernen,
bevor dasselbe in einem „Nicht-Betriebsbereit_Funktionierend"-Zustand platziert
wird.
-
Wenn
beide Laufwerke 160, 161 in einem Laufwerkspaar
nicht betriebsbereit sind, entfernt die Bibliotheksteuerung 36 eine
Leistung zu dem Laufwerkspaar. LEDs 174, 175 für das Laufwerkspaar 160, 161 zeigen an,
dass Leistung zu den Laufwerken 160, 161 entfernt
wurde. An diesem Punkt könnte
das sekundäre I/O-Bus-Kabel 206 sicher
von dem primären
I/O-Bus 195 getrennt werden. Leistungskabel zu den Laufwerken (nicht
gezeigt) könnten
auch an der PC-Zwischenelementplatine 134, die den zu entfernenden
Laufwerken 160, 161 entspricht, getrennt werden.
Auf diese Weise tritt keine Unterbrechung zu dem Rest des Systems 44 oder
dem Host 48 auf.
-
Das
Modulargehäuse 30,
das das ausgefallene Laufwerk 160 beinhaltet, könnte dann
entfernt werden. Das Modulargehäuse 30 wird
durch ein Wegziehen desselben von dem automatischen Medieneinführer 40 entfernt.
Durch ein Entfernen der Laufwerke 160, 161 auf
diese nicht übliche
Weise wird der automatische Medieneinführer 40 nicht unterbrochen,
wenn er weiterhin Medien zu den funktionierenden Laufwerken 150, 151, 152, 153, 154, 155, 156, 157, 158, 159 der
Bibliothek zuführt.
-
Nachdem
das ausgefallene Laufwerk 160 ausgetauscht ist, wird das
entfernte Modulargehäuse 130 wieder
an seinem Ort befestigt und eine Verkabelung wird wieder mit den
entfernten Laufwerken 160, 161 verbunden, wobei
der Wartungstechniker den Laufwerkspaarstatus über einen Schalter (nicht gezeigt)
an der entsprechenden PC-Zwischenelementplatine 134, die
die Bibliotheksteuerung 36 benachrichtigt, auf „Betriebsbereit_Wartend" setzt. Die Bibliotheksteuerung 36 legt
dann eine Leistung an das Laufwerkspaar 160, 161 an
und informiert außerdem
den Host 48 über
die Laufwerkszustandsveränderungen.
Der Host 48 verändert
dann die Zustände
der „Betriebsbereit_Wartend"-Laufwerke zu „Betriebsbereit_Funktionierend". Alle Laufwerke
(150, 151, ...) der Bibliothek sind nun für den Host 48 zugänglich.
-
Der
Host 48 könnte
auch nur auf ein Laufwerk (150, 151, ...) zugreifen,
wenn dasselbe in einem „Betriebsbereit_Funktionierend"- oder „Nicht-Betriebsbereit_Funktionierend_Wartend"-Zustand ist. Zu
allen anderen Zeiten verweigert die Bibliotheksteuerung 36 Zugriff
auf ein Laufwerk (150, 151, ...).
-
Der
Host 48 verändert
Laufwerkszustände
für die
Laufwerke (150, 151, ...) über einen SCSI-Befehl „Puffer-Schreiben". Jedes Mal, wenn
der Host 48 den Zustand eines Laufwerks verändern möchte, gibt
er einfach den geeigneten Befehl „Puffer-Schreiben" aus. Siehe 11 für Spezifizierungen
des SCSI-Befehls „Puffer-Schreiben".
-
Die
Bibliotheksteuerung
36 kommuniziert mit dem Host
48 über die
SCSI-Bedingung „Einheit-Abruf". Jedes Mal, wenn
die Bibliotheksteuerung
36 den Host
48 über eine
Veränderung
an einem oder mehreren Zuständen
eines oder mehrerer Laufwerke informieren möchte, gibt sie eine Bedingung „Einheit-Abruf" bei dem nächsten SCSI-Befehl,
der durch den Host
48 gesendet wird, aus. Nach einem Empfangen
der Bedingung „Einheit-Abruf" sendet der Host
48 einen
SCSI-Befehl „Puffer-Lesen", um die eine oder
die mehreren Zustandsveränderungen
des oder der Laufwerke zu bestimmen. Siehe
12 für Spezifizierungen
des SCSI-Befehls „Puffer-Lesen". Spezifizierungen
für die
Bedingung „Einheit-Abruf" sind wie folgt: „Anforderungserfassungs"-Daten für die SCSI-Bedingung „Einheit-Abruf":
Erfassungsschlüssel = 6 | (Einheit-Abruf) |
ASC
= 0x2A | (Parameter
verändert) |
ASCQ
= 0x80 | (für HP-Bibliotheken
Verkäufer-eindeutig) |
-
Die
Bibliotheksteuerung 36 spricht mit einer Bedingung „Einheit-Abruf" auf einen beliebigen
Befehl von dem Host 48 (mit Ausnahme von Anfrage) an, wenn
eine wartende Zustandsveränderung
für eines
oder mehrere der Speicherlaufwerke (150, 151,
...) der Bibliothek vorliegt. Der Host 48 muss dann einen „Puffer-Lesen"-Befehl zur Bestimmung
der Zu standsveränderung
senden. Die Bedingung „Einheit-Abruf" wird nur einmal pro
Zustandsveränderung
berichtet. Der Host 48 könnte die Bibliotheksteuerung 36 mit
dem Befehl „Puffer-Lesen" abfragen, falls
erwünscht.
-
Die
Bibliotheksteuerung
36 spricht mit einer Bedingung „unzulässige Anforderung" auf einen Bewegen-
oder Austausch-Befehl
von dem Host
48 an, der ein Laufwerk beinhaltet, das nicht
in einem „Betriebsbereit_Funktionierend"- oder „Nicht-Betriebsbereit_Funktionierend_Wartend"-Zustand ist. Die
Spezifizierungen für
die SCSI-Bedingung „unzulässige Anforderung" sind unten gegeben: „Anforderungserfassungs"-Daten für die SCSI-Bedingung „unzulässige Anforderung":
Erfassungsschlüssel = 5 | (unzulässige Anforderung) |
ASC
= 0x22 | (unzulässige Funktion) |
ASCQ
= 0x80 | (für HP-Bibliotheken
Verkäufer-eindeutig) |