Golem pur

Golem.de ohne Werbung nutzen
Mehrseitige Artikel auf einer Seite lesen
RSS-Volltext-Feed für Artikel
Ab 3,00 € pro Monat

Habana Gaudi: AWS setzt auf Intel-Beschleuniger für KI-Training

Amazons Cloud-Computing-Sparte AWS verwendet die Steckkarten der von Intel für 2 Milliarden US-Dollar zugekauften Habana Labs.

Artikel veröffentlicht am 2. Dezember 2020, 9:49 Uhr, Marc Sauter

Habana Gaudi als Mezzanine-Modul (Bild: Intel)

Amazon Web Services (AWS) hat neue EC2-Instanzen ankündigt, diese werden Intels Habana Gaudi nutzen und sollen im ersten Halbjahr 2021 verfügbar sein. Gedacht sind diese für das Trainieren von tiefen neuronalen Netzen, als Beispiele für das Deep Learning nennt AWS etwa Sprachverarbeitung, Objekterkennung sowie -klassifizierung und Empfehlungen für Produkte in Online-Shops.

Intel hatte die Habana Labs im Dezember 2019 für 2 Milliarden US-Dollar übernommen. Habana ist ein isrealisches Startup, das neben dem Gaudi für Training auch den Goya für Inferencing entwickelt hat. Intel will so sein Angebot für künstliche Intelligenz (KI) verbessern, der KI-Siliziummarkt soll bis zum Jahr 2024 ein Volumen von mehr als 25 Milliarden US-Dollar erreichen.

Die EC2-Instanzen bestehen aus bis zu acht Gaudi-Beschleunigern, welche als Mezzanine-Module montiert sind. Laut AWS soll die Leistung pro US-Dollar bei maschinellem Lernen um bis zu 40 Prozent höher ausfallen als bei bisherigen Instanzen mit GPUs statt mit den Habana-Chips. Als Vergleich wurde hierbei die teure p4d.24xlarge-Konfiguration mit acht Nvidia A100 herangezogen.

Intels Habana Gaudi kommen in die Amazon-Cloud. (Bild: AWS)

Der Gaudi ist ein ASIC, den Intel in einem 7-nm-Verfahren beim weltgrößten Auftragsfertiger TSMC produzieren lässt. Der Gaudi nutzt sogenannte Tensor Processing Cores (TPCs), genauer VLIW-Vektoreinheiten, und ist mit 32 GByte HBM2-Stapelspeicher ausgestattet, um möglichst viele Daten lokal vorhalten zu können. Die Mezzanine-Module sind per PCIe Gen4 x16 angebunden, ein Host-Prozessor wie ein Intel Xeon ist erforderlich.

Habanas Traning-ASIC kann mit typischen Formaten wie FP32, INT8, INT8 und BF16 umgehen. Folgerichtig unterstützt das Software Development Kit auch Frameworks wie Tensorflow oder Pytorch und Habana will eine Migrationsanleitung zur Verfügung stellen (PDF).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de

ohne Werbung
mit ausgeschaltetem Javascript
mit RSS-Volltext-Feed

Themenseiten:

Kommentarübersicht

Artikel

IPv4 wird knapp

Provider nutzt IPv4-Adressen als Kreditabsicherung

IPv4-Adressen bleiben trotz IPv6 weiterhin wichtig. Durch die begrenzte Anzahl sind sie sogar wertvoll und eignen sich als Absicherung.
Softwarekonzern

Vertragsverlängerung und mehr Macht für den SAP-Chef

Christian Klein kommt mit seinem Führungstil gut beim Aufsichtsrat an. Ein Titel-Upgrade erfolgt zusammen mit einer vorzeitigen Verlängerung seines Vertrags bei SAP.
Elon Musk

Zusätzliche Reichweite beim Model Y nur gegen Aufpreis

Autofirmen setzen verstärkt auf zusätzliche Kaufoptionen für Funktionen. Beim Tesla Model Y betrifft das auch die Reichweite.

Schnäppchen, Rabatte und Top-Angebote

Die besten Deals des Tages

Daily Deals • Mailights: Neuer MM-Flyer mit Rabatten bis zu 60% • Logitech Gaming-Zubehör -51% • Ambilight zum Nachrüsten ab 109,99€ • MSI 32" 4K UHD 144Hz 719€ • Alternate: Sony Dualsense PS5-Controller 55,55€, Adata 32 GB DDR5-6400 119,90€ • Samsung 990 Evo 2TB 138,60€ [Werbung]

Themen
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
#