Habana Gaudi: AWS setzt auf Intel-Beschleuniger für KI-Training

Amazons Cloud-Computing-Sparte AWS verwendet die Steckkarten der von Intel für 2 Milliarden US-Dollar zugekauften Habana Labs.

Artikel veröffentlicht am ,
Habana Gaudi als Mezzanine-Modul
Habana Gaudi als Mezzanine-Modul (Bild: Intel)

Amazon Web Services (AWS) hat neue EC2-Instanzen ankündigt, diese werden Intels Habana Gaudi nutzen und sollen im ersten Halbjahr 2021 verfügbar sein. Gedacht sind diese für das Trainieren von tiefen neuronalen Netzen, als Beispiele für das Deep Learning nennt AWS etwa Sprachverarbeitung, Objekterkennung sowie -klassifizierung und Empfehlungen für Produkte in Online-Shops.

Intel hatte die Habana Labs im Dezember 2019 für 2 Milliarden US-Dollar übernommen. Habana ist ein isrealisches Startup, das neben dem Gaudi für Training auch den Goya für Inferencing entwickelt hat. Intel will so sein Angebot für künstliche Intelligenz (KI) verbessern, der KI-Siliziummarkt soll bis zum Jahr 2024 ein Volumen von mehr als 25 Milliarden US-Dollar erreichen.

Die EC2-Instanzen bestehen aus bis zu acht Gaudi-Beschleunigern, welche als Mezzanine-Module montiert sind. Laut AWS soll die Leistung pro US-Dollar bei maschinellem Lernen um bis zu 40 Prozent höher ausfallen als bei bisherigen Instanzen mit GPUs statt mit den Habana-Chips. Als Vergleich wurde hierbei die teure p4d.24xlarge-Konfiguration mit acht Nvidia A100 herangezogen.

  • Intels Habana Gaudi kommen in die Amazon-Cloud. (Bild: AWS)
  • Training mit den ASICs soll günstiger sein als mit Nvidias A100. (Bild: AWS)
Intels Habana Gaudi kommen in die Amazon-Cloud. (Bild: AWS)

Der Gaudi ist ein ASIC, den Intel in einem 7-nm-Verfahren beim weltgrößten Auftragsfertiger TSMC produzieren lässt. Der Gaudi nutzt sogenannte Tensor Processing Cores (TPCs), genauer VLIW-Vektoreinheiten, und ist mit 32 GByte HBM2-Stapelspeicher ausgestattet, um möglichst viele Daten lokal vorhalten zu können. Die Mezzanine-Module sind per PCIe Gen4 x16 angebunden, ein Host-Prozessor wie ein Intel Xeon ist erforderlich.

Habanas Traning-ASIC kann mit typischen Formaten wie FP32, INT8, INT8 und BF16 umgehen. Folgerichtig unterstützt das Software Development Kit auch Frameworks wie Tensorflow oder Pytorch und Habana will eine Migrationsanleitung zur Verfügung stellen (PDF).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
S73-7
25 Jahre vermisster Satellit wieder entdeckt

Einen verloren gegangenen Satelliten wiederzufinden ist schwer. Der Space Force ist es gelungen.

S73-7: 25 Jahre vermisster Satellit wieder entdeckt
Artikel
  1. IPv4 wird knapp: Provider nutzt IPv4-Adressen als Kreditabsicherung
    IPv4 wird knapp
    Provider nutzt IPv4-Adressen als Kreditabsicherung

    IPv4-Adressen bleiben trotz IPv6 weiterhin wichtig. Durch die begrenzte Anzahl sind sie sogar wertvoll und eignen sich als Absicherung.

  2. Softwarekonzern: Vertragsverlängerung und mehr Macht für den SAP-Chef
    Softwarekonzern
    Vertragsverlängerung und mehr Macht für den SAP-Chef

    Christian Klein kommt mit seinem Führungstil gut beim Aufsichtsrat an. Ein Titel-Upgrade erfolgt zusammen mit einer vorzeitigen Verlängerung seines Vertrags bei SAP.

  3. Elon Musk: Zusätzliche Reichweite beim Model Y nur gegen Aufpreis
    Elon Musk
    Zusätzliche Reichweite beim Model Y nur gegen Aufpreis

    Autofirmen setzen verstärkt auf zusätzliche Kaufoptionen für Funktionen. Beim Tesla Model Y betrifft das auch die Reichweite.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Mailights: Neuer MM-Flyer mit Rabatten bis zu 60% • Logitech Gaming-Zubehör -51% • Ambilight zum Nachrüsten ab 109,99€ • MSI 32" 4K UHD 144Hz 719€ • Alternate: Sony Dualsense PS5-Controller 55,55€, Adata 32 GB DDR5-6400 119,90€ • Samsung 990 Evo 2TB 138,60€ [Werbung]
    •  /