Glossar

Was ist eine Neural Engine / NPU?

Eine Neural Engine (oder NPU, Neural Processing Unit) ist ein dedizierter Chipbereich, der für KI-/ML-Aufgaben optimiert ist. Sie beschleunigt On-Device-Funktionen wie Fotoverbesserung, Sprachassistenten und KI-Textgenerierung.

Eine NPU (Neural Processing Unit) oder Neural Engine ist spezialisiertes Silizium, optimiert für Machine-Learning-Inferenz (das Ausführen trainierter Modelle). Anders als CPUs (sequenzielle Logik) oder GPUs (Grafik-Parallelität) nutzen NPUs eine systolische Array-Architektur: Tausende kleiner Verarbeitungselemente in einem Raster, die je eine Multiply-Accumulate-Operation parallel ausführen. Diese Architektur ist für die in KI üblichen Matrixmultiplikationen 50–100× effizienter als eine GPU. Die Leistung wird in TOPS (Tera = Billionen Operationen pro Sekunde) gemessen: höhere TOPS ermöglichen größere/schnellere Modelle. Apple A17 Pro: 35 TOPS; Snapdragon 8 Gen 3: 45+ TOPS; Intel Core Ultra 7: 40+ TOPS; Apple M4: 38 TOPS.

**Wie NPU-Beschleunigung On-Device-KI technisch begünstigt:** Ein Sprachmodell mit 7 Mrd. Parametern (LLaMA-7B) benötigt ~14 GB Speicher und 7 Billionen Operationen. Auf der CPU: 30 s Latenz. Auf der GPU: 5 s. Auf einer 40-TOPS-NPU: ~0,175 s. Energieeffizienz: NPU ~5 W, GPU ~50 W, CPU 100 W+. Das ermöglicht On-Device-Funktionen: Echtzeit-Kameraübersetzung, Foto-Motivfreistellung, Sprachtranskription. Ohne NPU erfordern diese die Cloud (langsam, Datenschutzrisiko, Akkuverbrauch durch Streaming).

**Warum das für Käufer wichtig ist:** Ab 2024 ist die NPU-TOPS-Zahl ein zentrales Kaufkriterium, besonders für Windows-11-Copilot+-PCs (40+ TOPS Basis). Smartphones hatten seit Jahren NPUs (On-Device-Fotoverarbeitung), aber die Windows-Verbreitung schuf das Bewusstsein. Hohe TOPS (40+) ermöglichen LLM-Inferenz auf dem Laptop; niedrige TOPS (10) leichte Aufgaben (Bildklassifizierung, Sprache). Zukunftsinvestition: Apps lagern zunehmend an die NPU aus; höhere TOPS = zukunftssicheres Gerät.

**Worauf Sie achten sollten / häufige Fallstricke:** - 10–20 TOPS: Einsteiger-NPU, nur leichte Modelle - 35–45 TOPS: Flaggschiff, bewältigt 7B–13B-Modelle angemessen - 45+ TOPS: Premium, nahe GPU-Parität für größere Modelle - Speicherbandbreite beachten: die NPU braucht schnellen RAM-Zugriff (speicher-, nicht rechengebunden) - TOPS-Angabe manchmal aufgebläht; realer Durchsatz bei großen Modellen niedriger

Praxis 2026: iPhone 16 Pro (40+ TOPS Neural Engine), Snapdragon 8 Gen 3 Leading (45+ TOPS Hexagon), Intel Core Ultra 9 (50 TOPS angegeben), Apple M4 Pro (38 TOPS Neural Engine), ältere Smartphones (20–25 TOPS, für Fotoverarbeitung noch okay).

Was ist eine Neural Engine / NPU?

Verwandte Begriffe

Was ist eine Neural Engine / NPU?

Verwandte Begriffe