Glossaire

Qu'est-ce qu'un Neural Engine / NPU ?

Un Neural Engine (ou NPU, Neural Processing Unit) est une section de puce dédiée optimisée pour les tâches d'IA/ML. Il accélère les fonctions sur l'appareil comme l'amélioration photo, les assistants vocaux et la génération de texte par IA.

Un NPU (Neural Processing Unit) ou Neural Engine est un silicium spécialisé optimisé pour l'inférence de machine learning (exécuter des modèles entraînés). Contrairement aux CPU (logique séquentielle) ou GPU (parallélisme graphique), les NPU utilisent une architecture en réseau systolique : des milliers de petits éléments de traitement disposés en grille, chacun effectuant une opération de multiplication-accumulation en parallèle. Cette architecture est 50–100× plus efficace que le GPU pour les multiplications matricielles propres à l'IA (convolutions, couches d'attention). Performance en TOPS (Tera = mille milliards d'opérations par seconde) : plus de TOPS = modèles plus grands/rapides. Apple A17 Pro : 35 TOPS ; Snapdragon 8 Gen 3 : 45+ TOPS ; Intel Core Ultra 7 : 40+ TOPS ; Apple M4 : 38 TOPS.

**Comment l'accélération NPU profite techniquement à l'IA sur l'appareil :** Exécuter un modèle de langage de 7 milliards de paramètres (LLaMA-7B) demande ~14 Go de mémoire et 7 mille milliards d'opérations. Sur CPU, 30 s de latence. Sur GPU, 5 s. Sur un NPU à 40 TOPS, ~0,175 s. Efficacité : NPU ~5 W, GPU ~50 W, CPU 100 W+. Cela permet des fonctions locales : traduction caméra en temps réel (Google Translate en mode local), masquage de sujet photo (Apple), transcription vocale (Whisper local). Sans NPU, elles nécessitent le cloud (lent, risque de vie privée, consommation par streaming).

**Pourquoi c'est important à l'achat :** Depuis 2024, les TOPS du NPU sont un critère d'achat clé, surtout pour les PC Windows 11 Copilot+ (base de 40+ TOPS). Les smartphones avaient déjà un NPU depuis des années (traitement photo local), mais l'adoption Windows a fait connaître le terme. Un TOPS élevé (40+) permet l'inférence de LLM sur portable ; un TOPS faible (10) permet des tâches légères (classification d'images, parole). Investissement d'avenir : les applis délégueront de plus en plus au NPU ; plus de TOPS = appareil pérennisé.

**Ce qu'il faut regarder / pièges courants :** - 10–20 TOPS : NPU d'entrée de gamme, modèles légers seulement - 35–45 TOPS : phare, gère raisonnablement les modèles 7B–13B - 45+ TOPS : premium, quasi-parité GPU pour les modèles plus grands - Pense à la bande passante mémoire : le NPU exige un accès RAM rapide (limité par la mémoire, pas le calcul) - Spec TOPS parfois gonflée ; débit réel plus bas sur les gros modèles

Concret 2026 : iPhone 16 Pro (Neural Engine 40+ TOPS), Snapdragon 8 Gen 3 Leading (Hexagon 45+ TOPS), Intel Core Ultra 9 (50 TOPS annoncés), Apple M4 Pro (Neural Engine 38 TOPS), smartphones plus anciens (20–25 TOPS, encore corrects pour le traitement photo).

Termes associés

Qu'est-ce qu'un chipset (SoC) ?RAM vs stockage : quelle différence ?Qu'est-ce qu'un GPU (processeur graphique) ?