Deci veröffentlicht neue MLPerf-Benchmarks für das NLP-Modell und erzielt mit AMD EPYC Milan-X-CPUs einen enormen 6,46-fachen Gewinn

September 9, 2022

47

[ad_1]

Deep-Learning-Unternehmen Dez enthüllt die Ergebnisse seines NLP-Inferenzmodells (Natural Language Processing), das in der Benchmark-Suite MLPerf Inference v2.1 enthalten ist und mit AMDs EPYC-Prozessoren eine bis zu 6,46-fache Leistungssteigerung erzielt.

Das NLP-Modell von Deci erreicht bahnbrechende Leistungsniveaus bei MLPerf, bis zu 6,46-mal mehr als bei AMD EPYC-Prozessoren

Das von Decis AutoNAC-Technologie (Automated Neural Architecture Construction) entwickelte NLP-Modell mit dem Namen DeciBERT-Large lief auf Dell-PowerEdge-R7525-2-Hardware mit dem AMD EPYC 7773X-Prozessor. Das resultierende Modell übertraf die Durchsatzleistung des BERT-Large-Modells um fast das Sechseinhalbfache und erreichte eine Verbesserung der Genauigkeit um 1 %. Die Verbesserung umfasst Cloud-Kostensenkungen, sodass für einen Teil der Zeit mehr Prozesse auf einer Maschine ausgeführt werden können. Es ermöglicht Gruppen auch, eine kostengünstigere Maschine zu verwenden und gleichzeitig eine genaue Durchsatzleistung beizubehalten.

Das neue Modell wurde unter dem Offline-Szenario in der offenen Division von MLPerf in der Kategorie BERT 99.9 vorgestellt. Das Ziel bestand darin, den Durchsatz zu maximieren und gleichzeitig die Genauigkeit innerhalb einer Fehlerspanne von 0,1 % von der Basislinie oder 90,874 F1 (SQUAD) beizubehalten. Das DeciBERT-Large-Modell hat diese Ziele übertroffen und einen Durchsatz von 116 Anfragen pro Sekunde (QPS) und einen F1-Genauigkeitswert von 91,08 erreicht. Wie Sie der folgenden Tabelle entnehmen können, bietet der AMD EPYC 7773X Milan-X-Chip bis zu 6,46-mal mehr Leistung als das BERT-Large-Modell.

Material

F1-Präzision an

SQUAD (INT8)

Modellgröße (in Millionen Parametern)

Durchsatz (RPS)

ONNX-Ausführung

FP32

Durchsatz (RPS)

ONNX-Ausführung

INT8

Decis Boost

Bert Groß

Dell-PowerEdge-R7525-2xAMD-EPYC-7773X

90.067

340

12

18

–

DeciBERT groß

Dell-PowerEdge-R7525-2xAMD-EPYC-7773X

91.08

115

76

116

6,64x

Deci nutzte seine proprietäre Automated Neural Architecture Construction (AutoNAC)-Technologie-Engine, um eine neue Modellarchitektur zu entwickeln, die für den AMD EPYC-Prozessor geeignet ist. AutoNAC, eine algorithmische Optimierungs-Engine, die die besten Deep-Learning-Modellarchitekturen für jede Zuweisung, jeden Datensatz und jede Inferenzhardware schmiedet, ermöglicht in der Regel eine bis zu fünfmal bessere Inferenzleistung mit ähnlicher oder besserer Genauigkeit, die dem Stand der Technik nahe kommt. – neuronale Kunstmodelle.

Während das Hauptoptimierungsziel bei der Generierung des DeciBERT-Modells die Maximierung des Durchsatzes war, konnte AutoNAC auch die Größe des Modells erheblich reduzieren – eine bedeutende Errungenschaft mit mehreren Vorteilen, einschließlich der Möglichkeit, mehrere Modelle auf demselben Server auszuführen und besser zu nutzen des Cache-Speichers. Diese Ergebnisse bestätigen einmal mehr die herausragende Leistungsfähigkeit unserer AutoNAC-Technologie, die auf nahezu alle Bereiche der Deep-Learning- und Inferenz-Hardware anwendbar ist.

– Lehrer. Ran El-Yaniv, Chefwissenschaftler und Mitbegründer von Deci

MLPerf bringt führende Experten im Bereich Deep Learning zusammen, um faire und nützliche Benchmarks für die Berechnung der Ausführung von Training und Inferenz von ML-Hardware, -Software und -Diensten zu erstellen.

Deci veröffentlicht neue NLP-Modell-MLPerf-Benchmarks und erzielt mit AMD EPYC Milan-X 2-CPUs einen enormen 6,46-fachen Gewinn — Ein Vergleich der Durchsatzleistung von BERT-Large DeciBERT-Large-Modellen. Bildquelle: Deci.

Die NLP-Inferenzbeschleunigung von Deci führt direkt zu Cloud-Kostensenkungen, sodass mehr Prozesse in kürzerer Zeit auf demselben Computer ausgeführt werden können. Es ermöglicht Teams, kostengünstige Maschinen zu verwenden und gleichzeitig die gleiche Durchsatzleistung beizubehalten. Ein höherer Durchsatz für bestimmte NLP-Anwendungen, wie z. B. die Beantwortung von Fragen, bedeutet eine bessere Benutzererfahrung, da Abfragen schnell verarbeitet werden und Informationen in Echtzeit wiedergegeben werden können.

Nachrichtenquelle: Dez

[ad_2]

Source

Vorheriger Artikel

Solo Stove versucht, das Lagerfeuer in Ihren kleinen Garten zu bringen

Nächster Artikel

Globalstar sinkt auf Apple Deal. ‚Kaufen Sie das Gerücht; Verkaufen Sie die Nachrichten.‘

Kampf gegen Antisemitismus: Zentralrat der Juden zieht Bilanz

Die rapide Zunahme von Adipositas-Operationen in Deutschland – Eine Analyse ihrer Auswirkungen

Klara Hensel sagt vor Gericht aus – Ein Wendepunkt im Fall Block?

Hitzewelle in Deutschland erreicht Rekordniveau

Waldbrände in Brandenburg – Feuerwehr stemmt sich gegen Feuerkatastrophe

Trumps Politik: Ein gefährliches Spiel mit hohen Einsätzen

Der 77. Jahrestag des Endes des Zweiten Weltkriegs – Japans Umgang mit historischer Verantwortung

Massentourismus auf Mallorca: Fluch oder Segen?

Welche Chance Herzogin Meghan bei einer Versöhnung wittert

Trumps Exekutivanordnung zu Collegesport – Was bedeutet das für die Zukunft des Hochschulsports?

Das Support-Ende von Windows 10 – Was Nutzer jetzt wissen und tun sollten

7 Tipps und Tricks, um die Leistung Ihres Androids im Jahr 2025 zu optimieren

Oracle Linux 10: Was ist neu und warum ist es wichtig?

Die besten Tools und Trends zur Erstellung kostenloser YouTube-Intros im Jahr 2025

Kopf- und Fußzeilen in Word verwenden – Eine ausführliche Anleitung

Lattafa Eclair Eau de Parfum: Das Must-Have für Herren

Larise Liste – Luxusparfüms für jedermann

Larise Liste 2025: Finde deinen perfekten Duftzwilling

Parfümzwillinge: Finde Deinen Lieblingsduft zum Schnäppchenpreis

Duftzwillinge Parfum dupes DM

Deci veröffentlicht neue MLPerf-Benchmarks für das NLP-Modell und erzielt mit AMD EPYC Milan-X-CPUs einen enormen 6,46-fachen Gewinn

Das NLP-Modell von Deci erreicht bahnbrechende Leistungsniveaus bei MLPerf, bis zu 6,46-mal mehr als bei AMD EPYC-Prozessoren

Intel Arc GPUs und das Ende der DirectX 9 Unterstützung – Ein mutiger Schritt in die Zukunft?

5 Dinge, die Sie vor dem Kauf von BLUETTI B230 oder B300 wissen sollten

Intel Xeon Platinum 8380 und Linux 6.0: Ein Meilenstein in der Servertechnologie

Am beliebtesten

Das nächste große Update bei Genshin Impact erscheint – Was Spieler wirklich wissen sollten

Trumps Politik: Ein gefährliches Spiel mit hohen Einsätzen

Zwischen Kriegen und Konflikten – Ein Blick auf das Interview mit Außenminister Johann Wadephul

Pedro Pascal und die Fantastischen 4: Ein humorvoller Einblick in deutsche Wörter und Superkräfte