In diesem CPU-Vergleich stellen wir den Apple M3 Max (16-CPU 40-GPU) und den Apple M1 Ultra (64-GPU) gegenüber und prüfen anhand von Benchmarks, welcher Prozessor schneller ist.
Wir vergleichen den Apple M3 Max (16-CPU 40-GPU) 16-Kern Prozessor der im Q4/2023 erschienen ist mit dem Apple M1 Ultra (64-GPU), welcher 20 CPU-Kerne besitzt und im Q1/2022 vorgestellt wurde.
Der Apple M3 Max (16-CPU 40-GPU) ist ein 16-Kern Prozessor mit einer Taktfrequenz von 0,70 GHz (4,06 GHz). Der Prozessor kann zeitgleich 16 Threads berechnen. Der Apple M1 Ultra (64-GPU) taktet mit 0,60 GHz (3,20 GHz), besitzt 20 CPU-Kerne und kann parallel 20 Threads berechnen.
Prozessoren mit Unterstützung von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) können viele Berechnungen insbesondere der Audio-, Bild- und Videoverarbeitung sehr viel schneller verarbeiten als klassische Prozessoren. Algorithmen für ML verbessern ihre Leistung je mehr Daten sie per Software gesammelt haben. ML-Aufgaben können bis zu 10.000 Mal so schnell verarbeitet werden wie mit einem klassischen Prozessor.
Eine in den Prozessor integrierte Grafik (iGPU) ermöglicht nicht nur die Bildausgabe ohne auf eine dedizierte Grafiklösung angewiesen zu sein, sondern kann auch die Videowiedergabe effizient beschleunigen.
Ein in Hardware beschleunigter Foto- oder Videocodec kann die Arbeitsgeschwindigkeit eines Prozessors stark beschleunigen und die Akkulaufzeit von Notebooks oder Smartphones bei der Wiedergabe von Videos verlängern.
Bis zu 128 GB Arbeitsspeicher in maximal 4 Speicherkanälen werden vom Apple M3 Max (16-CPU 40-GPU) unterstützt, während der Apple M1 Ultra (64-GPU) maximal 128 GB Arbeitsspeicher mit einer maximalen Speicherbandbreite von 819,2 GB/s ermöglicht.
Der Apple M3 Max (16-CPU 40-GPU) besitzt eine TDP von 57 W. Die TDP des Apple M1 Ultra (64-GPU) liegt bei 60 W. Systemintegratoren orientieren sich bei der Dimensionierung der Kühllösung an der TDP des Prozessors.
Der Apple M3 Max (16-CPU 40-GPU) besitzt 36,00 MB Cache und wird in 3 nm hergestellt. Der Cache des Apple M1 Ultra (64-GPU) liegt bei 52,00 MB. Der Prozessor wird in 5 nm gefertigt.
Hier kannst Du den Apple M3 Max (16-CPU 40-GPU) bewerten, um anderen Besuchern bei ihrer Kaufentscheidung zu helfen. Die durchschnittliche Bewertung liegt bei 5,0 Sternen (539 Bewertungen). Jetzt bewerten:
Hier kannst Du den Apple M1 Ultra (64-GPU) bewerten, um anderen Besuchern bei ihrer Kaufentscheidung zu helfen. Die durchschnittliche Bewertung liegt bei 3,7 Sternen (3 Bewertungen). Jetzt bewerten:
Der Cinebench 2024 Benchmark basiert auf der Redshift-Rendering Engine die auch im 3D-Programm Cinema 4D des Herstellers Maxon zum Einsatz kommt. Die Benchmark-Durchläufe sind je 10 Minuten lang um zu Testen ob der Prozessor durch seine Wärmeentwicklung limitiert wird.
Der Mehrkern-Test des Cinebench 2024-Benchmarks nutzt alle CPU-Kerne zum Rendern mit der Redshift-Rendering-Engine, die auch in Maxons Cinema 4D zum Einsatz kommt. Der Benchmark-Lauf dauert 10 Minuten, um zu testen, ob der Prozessor durch seine Wärmeentwicklung eingeschränkt wird.
Cinebench R23 ist die Weiterentwicklung von Cinebench R20 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Single-Core Test nutzt nur einen CPU-Kern, die Anzahl der Kerne sowie Hyperthreading beeinflussen das Ergebnis nicht.
Cinebench R23 ist die Weiterentwicklung von Cinebench R20 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Multi-Core Test bezieht alle CPU-Kerne mit ein und zieht einen großen Nutzen aus Hyperthreading.
Der Geekbench 5 Benchmark misst die Leistung des Prozessors und bezieht dabei auch den Arbeitsspeicher mit ein. Ein schnellerer Arbeitsspeicher kann das Ergebnis stark verbessern. Der Single-Core Test nutzt nur einen CPU-Kern, die Anzahl der Kerne sowie Hyperthreading beeinflussen das Ergebnis nicht.
Der Geekbench 5 Benchmark misst die Leistung des Prozessors und bezieht dabei auch den Arbeitsspeicher mit ein. Ein schnellerer Arbeitsspeicher kann das Ergebnis stark verbessern. Der Multi-Core Test bezieht alle CPU-Kerne mit ein und zieht einen großen Nutzen aus Hyperthreading.
Geekbench 6 ist ein Benchmark für moderne Computer, Notebooks und Smartphones. Neu ist eine optimierte Auslastung neuerer CPU-Architekturen die z.B. auf das big.LITTLE Konzept aufbauen und unterschiedlich große CPU-Kerne miteinander kombinieren. Der Einkern-Benchmark bewertet nur die Leistung des schnellsten CPU-Kerns, die Anzahl der CPU-Kerne eines Prozessors spielt hier keine Rolle.
Geekbench 6 ist ein Benchmark für moderne Computer, Notebooks und Smartphones. Neu ist eine optimierte Auslastung neuerer CPU-Architekturen die z.B. auf das big.LITTLE Konzept aufbauen und unterschiedlich große CPU-Kerne miteinander kombinieren. Der Mehrkern-Benchmark bewertet die Leistung aller CPU-Kerne des Prozessors. Virtuelle Threadverbesserungen wie die AMD SMT oder Intels Hyper-Threading haben einen positiven Einfluss auf das Benchmark-Ergebnis.
Die theoretische Rechenleistung der internen Grafikeinheit des Prozessors bei einfacher Genauigkeit (32 bit) in GFLOPS. GFLOPS gibt an, wie viele Milliarden Gleitkommaoperationen die iGPU pro Sekunde durchführen kann.
Prozessoren mit Unterstützung von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) können viele Berechnungen insbesondere der Audio-, Bild- und Videoverarbeitung sehr viel schneller verarbeiten als klassische Prozessoren. Die Leistung wird in der Anzahl (Billionen) an Rechenoperationen pro Sekunde angegeben (TOPS).
Cinebench R20 ist die Weiterentwicklung von Cinebench R15 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Single-Core Test nutzt nur einen CPU-Kern, die Anzahl der Kerne sowie Hyperthreading beeinflussen das Ergebnis nicht.
Cinebench R20 ist die Weiterentwicklung von Cinebench R15 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Multi-Core Test bezieht alle CPU-Kerne mit ein und zieht einen großen Nutzen aus Hyperthreading.
Im Blender Benchmark 3.1 werden die Szenen "monster", "junkshop" sowie "classroom" gerendert und die von dem System benötigte Zeit gemessen. In unserem Benchmark testen wir die CPU und nicht die Grafikkarte. Blender 3.1 wurde im März 2022 als eigenständige Version vorgestellt.
Nicht alle der hier aufgelisteten Prozessoren wurden von uns getestet. Einige der Ergebnisse wurden basierend auf einer Formel errechnet und können von Passmark CPU mark Ergebnissen abweichen und sind unabhängig von PassMark Software Pty Ltd. Der PassMark CPU Mark generiert Primzahlen um die Geschwindigkeit eines Prozessors zu messen. Hierbei werden alle CPU-Kerne sowie Hyperthreading genutzt.
Cinebench R15 ist die Weiterentwicklung von Cinebench 11.5 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Single-Core Test nutzt nur einen CPU-Kern, die Anzahl der Kerne sowie Hyperthreading beeinflussen das Ergebnis nicht.
Cinebench R15 ist die Weiterentwicklung von Cinebench 11.5 und basiert ebenso auf der Cinema 4D Suite, einem weltweit eingesetzten Programm, das benutzt wird um 3D-Inhalte und Formen zu generieren. Der Multi-Core Test bezieht alle CPU-Kerne mit ein und zieht einen großen Nutzen aus Hyperthreading.
Effizienz des Prozessors unter voller Auslastung im Cinebench R23 (Mehrkern) Benchmark. Die erreichte Punktzahl wird durch die durchschnittlich benötigte Energie (CPU Package Power in Watt) geteilt. Je höher der Wert, desto effizienter ist die CPU unter Volllast.
Apple M3 Max (16-CPU 40-GPU) - Beschreibung des Prozessors
Den Apple M3 Max gibt es in zwei verschiedenen Ausführungen: einmal mit 16 CPU-Kernen und 40 GPU-Kernen und einmal mit 14 CPU-Kernen und 30 GPU-Kernen. Beide Modelle gibt es aktuell im Apple MacBook Pro 14 und Apple MacBook Pro 16.
Der Apple M3 Max (16-CPU 40-GPU) besitzt 12 große P-Kerne die mit 0,7 GHz sehr niedrig takten. Bei Bedarf können die P-Kerne mit bis zu 4,06 GHz takten. Die vier kleineren E-Kerne sind nochmal etwas effizienter und takten mit 0,74 GHz. Auch die E-Kerne können bei Bedarf ihre Taktfrequenz auf bis zu 2,75 GHz erhöhen.
Hatte Apple in den M-Prozessoren bisher mindestens immer die gleiche Anzahl von E-Kernen im Verhältnis zu den P-Kernen verbaut, kommt im Apple M3 Max (16-CPU 40-GPU) erstmals eine Konfiguration zum Einsatz, die über deutlich mehr P-Kerne verfügt.
Auch an Bord ist die neue AI-Recheneinheit, die auf 16 Neurale-Kerne kommt und eine Rechenleistung von bis zu 35 TOPS aufweist. Die AI-Recheneinheit kommt bei der Bild- und Videoverarbeitung genauso zum Einsatz wie in Kombination mit der GPU bei grafiklastigen Anwendungen.
Die integrierte Grafik hat Apple mit der dritten Generation der Apple M Prozessoren deutlich überarbeitet. Diese unterstützt nun den freien AV1-Videocodec (dekodieren) sowie die Berechnung von Lichtstrahlen über die Hardware (Raytracing). Außerdem hat Apple die Speicherlogik des SoCs geändert. Über den Dynamic Cache kann der gemeinsame Speicher, den sich CPU und GPU teilen deutlich effizienter genutzt werden.
Maximal sind bis zu 128 GB Speicher beim Apple M3 Max möglich. Dieser ist über 4 Speicherkanäle angebunden und kommt so auf eine sehr hohe Speicherbandbreite von 409,6 GB pro Sekunde. Der Prozessor selbst unterstützt PCIe 4.0 und kann über eine nicht bekannte Anzahl von PCIe-Leistungen so externe Geräte schnell anbinden. Der SoC wird in 3 nm bei TSMC in Taiwan gefertigt.
Apple M1 Ultra (64-GPU) - Beschreibung des Prozessors
Im Apple M1 Ultra setzt Apple auf insgesamt 20 CPU-Kerne. Die Taktfrequenz liegt mit 3,2 GHz (Performance-Kerne) bzw. 2,06 GHz (Effizienz-Kerne) auf dem selben Niveau wie schon beim normalen Apple M1 bzw. den größeren Ausbaustufen Apple M1 Pro und Apple M1 Max.
Der Apple M1 Ultra mit 64-GPU Kernen ist aktuell der größte und schnellste Apple Prozessor. Er vereint über ein Interface mit einer Bandbreite von 2,5 TB/s zwei einzelne Apple M1 Max Prozessorchips. Eine ähnliche Technik verwendet auch AMD in seinen aktuellen AMD Ryzen Prozessoren.
Über die Schnittstelle der beiden Prozessoren im Apple M1 Ultra werden neben den CPU-Kernen auch die beiden Grafikeinheiten synchronisiert. Die Schnittstelle selbst besteht dabei laut Apple aus 1000 separaten Leitungen, die eine so große Bandbreite überhaupt erst möglich machen.
Die Speicherbandbreite des LPDDR5-6400 Speichers liegt bei knapp 820 GB/s, was ca. 10x so schnell ist wie bei aktuellen Desktop-Prozessoren von AMD und Intel. Da Apple auf keine externe Grafikeinheit in seinen neuen Produkten setzt, muss der Speicher so schnell sein um die GPU-Einheiten des Apple M1 Ultra nichts auszubremsen. Prozessor und Grafikeinheit teilen sich den bis zu 128 GB großen Speicher dynamisch auf.
Der Apple M1 Ultra mit 64 GPU-Kernen erreicht eine FP32 Rechenleistung (einfache Genauigkeit) von 21,2 TFLOP/s. Die stärkste Apple iGPU ist damit ca. 5x so schnell wie die schnellste iGPU der Konkurrenz um AMD Ryzen 9 6980HX. Der Apple M1 Ultra braucht in Sachen Grafikleistung auch keinen Vergleich mit externen Grafikkarten von AMD oder NVIDIA zu fürchten. Die FP32 Leistung liegt in etwa auf dem Niveau einer AMD Radeon RX 6800XT bzw. einer NVIDIA RTX 3070.
Auch der Energieverbrauch des Apple M1 Ultra kann sich Dank neuster 5 nm Fertigung und dem energieeffizienten ARM-Chipdesign sehen lassen und liegt etwas oberhalb der neusten AMD Ryzen 6000 Mobilprozessoren.