Technologische Neuigkeiten, Bewertungen und Tipps!

Grafikchip im Wafer-Maßstab mit 400.000 Kernen und 15 kW Verbrauch

Ein Startup namens Gehirnsystem Dies hat einen Prototyp eines Phasen-Grafikchips gezeigt, der über den berühmten GPU-Hersteller hinausgeht und zweistellige Leistungsverbesserungen bietet, wie sein neuerer Grafikchip Wafer Flake Machine Brain (WSE Brain), kombiniert nicht weniger als 5600% mehr Transistoren über den besten Grafikchip auf dem Markt, Nvidia V100für anbieten zu können 21) 1 Milliarde Transistoren über 2.100 Millionen welches Nvidia Chips kombiniert.

Um dies zu realisieren, Das Startup hat die wichtigsten technischen Herausforderungen, die andere noch nicht entschlüsseln können, erfolgreich gelöst und damit Der erste Prozessor, der die Wafer-Skala misst Überall auf der Welt

WSE Cerebras ist der weltweit erste Wafer-Scale-Prozessor. Es ist logisch zu fragen, warum niemand anderes etwas so Offensichtliches tut, und der Grund dafür ist, dass die wichtigsten technischen Herausforderungen der Querkommunikation nie von anderen bewältigt wurden.

Die lithografische Ausrüstung ist derzeit entworfen viele kleine Prozessoren entlang des Wafers zu gravieren;; Sie können keinen vollständigen Prozessor durch den Wafer herstellen. Dies bedeutet, dass die Geschichte in der einen oder anderen Form vorliegen wird und dass jeder Block in der Lage sein muss, auf verschiedene Weise über diese Linien zu kommunizieren, und dies ist, was Cerebras beschlossen hat, den Thron zu beanspruchen. der weltweit erste Prozessor mit einer Milliarde Transistoren.

Cerebra WSE nimmt eine Fläche von 46.225 mm² ein und bietet Platz für 1,2 Milliarden Transistoren. Alle Kerne sind optimiert. für Workloads im Zusammenhang mit künstlicher Intelligenz und die Pommes frites verbrauchen 15 KW Leistung. Da all diese Energie auch gekühlt werden muss, muss dieses Kühlsystem ebenso revolutionär sein wie das Energiesystem.

Um abzukühlenkönnen Unternehmen nutzen Färbekühlsystem mit dem Freon Kältemittel in sich schnell bewegenden Schaltkreisen oder revolutionäreren Methoden. Das Energiesystem muss auch sehr stark sein. Laut Cerebras Dieser Chip ist rund 1000-mal schneller als herkömmliche Systeme Nur weil die Kommunikation über den Schreibpfad erfolgen kann, anstatt über den Kreis zu springen (Interconnect, DIMM usw.).

Grafikchip im Wafer-Maßstab mit 400.000 Kernen und 15 kW Verbrauch 1

WSE enthält 400.000 gestreuter linearer Algebra-Kern (SLA). Jeder Kern ist flexibel, kann für Berechnungen programmiert und optimiert werden, die die meisten neuronalen Netze unterstützen. Programmierkenntnisse sorgen dafür Der Kern kann alle Algorithmen im Bereich des maschinellen Lernens ausführen ständig wechselnd

400.000 Kerne in WSE sind über Swarm-Kommunikationsverbindungen in 2D-Mesh mit einer Bandbreite von 100 Pb / s verbunden. Swarm ist ein riesiges Kommunikationsnetzwerk, das innovative Bandbreite und geringe Latenz zu einem Bruchteil des Stromverbrauchs herkömmlicher Techniken zur Gruppierung von Grafikprozessoren bietet. Dies ist vollständig konfigurierbar; Die Software konfiguriert alle WSE-Kerne so, dass sie die genaue Kommunikation unterstützen, die zum Trainieren benutzerdefinierter Modelle erforderlich ist. Für jedes neuronale Netzwerk bietet Swarm einen einzigartigen und optimierten Kommunikationskanal.

WSE hat Speicher 18 GB im Chip eingebettetEs ist alles in einem einzigen Taktzyklus zugänglich und bietet eine Speicherbandbreite von 9 PB / s. Dies ist die Kapazität 3.000-mal mehr Bandbreite und 10.000-mal mehr Bandbreite als die der führenden Wettbewerber. Mehr zentraler und lokaler Speicher ermöglicht schnelle und flexible Berechnungen mit weniger Latenz und weniger Leistung.

Dies ermöglicht eine starke Beschleunigung in KI-Anwendungen. und reduziert die Trainingszeit von Monaten auf einige Stunden. Dies ist wirklich revolutionär, keine Frage, vorausgesetzt, sie können ihre Versprechen einhalten und dies sofort an die Kunden weitergeben. WSE Gehirn Produziert auf 300mm TSMC Wafern Verwenden Sie Ihren Prozess 16nmWas bedeutet, dass es Technologie ist und Nur ein Herstellungsprozess hinter Giganten wie Nvidia. Bei 84 miteinander verbundenen Blöcken mit über 400.000 Kernen ist der Herstellungsprozess natürlich kein Problem.

Gehirn WSE "Breite =" 740 "Höhe =" 333

Die Leistung und das Binning (Frequenz) des WSE-Gehirns werden sehr interessant sein. Wenn Sie den gesamten Wafer als einen einzigen Chip verwenden, erhalten Sie einerseits 100% Ergebnisse, wenn das Design Fehler absorbieren kann, oder 0%, wenn Sie dies nicht können. Offensichtlich, weil der Prototyp gemacht wurde, Das Design ist in der Lage, Fehler zu absorbieren.. In der Tat erklärte der CEO, dass das Design wartet 1% bis 1,5% der Defekte in der FunktionsoberflächeDies ist jedoch kein Problem, da die Mikroarchitektur einfach ist Konfigurieren Sie die verfügbaren Kerne neu. Auch Übermäßige Kerne sind im gesamten Chip platziert, um Leistungsverluste zu minimieren. Derzeit gibt es keine Informationen zum Binning, aber es versteht sich von selbst, dass dies das binnbarste Design der Welt ist.

Das haben sie uns auch gesagt Das Unternehmen muss seine eigene Wissenschaft der Herstellung und Verkapselung entwickeln Derzeit gibt es keine Tools für Prozessoren im Wafer-Maßstab. Nicht nur das, Die Software muss neu geschrieben werden, um mehr als 1 Milliarde Transistoren in einem Prozessor zu verarbeiten.

via: Wccftech

Table of Contents