Glosario

¿Qué es un Neural Engine / NPU?

Un Neural Engine (o NPU, Neural Processing Unit) es una sección de chip dedicada optimizada para tareas de IA/ML. Acelera funciones en el dispositivo como la mejora de fotos, los asistentes de voz y la generación de texto por IA.

Un NPU (Neural Processing Unit) o Neural Engine es silicio especializado optimizado para la inferencia de machine learning (ejecutar modelos entrenados). A diferencia de las CPU (lógica secuencial) o las GPU (paralelismo gráfico), los NPU usan una arquitectura de matriz sistólica: miles de pequeños elementos de proceso dispuestos en rejilla, cada uno realizando una operación de multiplicación-acumulación en paralelo. Esta arquitectura es 50–100× más eficiente que la GPU para las multiplicaciones matriciales propias de la IA (convoluciones, capas de atención). El rendimiento se mide en TOPS (Tera = billones de operaciones por segundo): más TOPS = modelos más grandes/rápidos. Apple A17 Pro: 35 TOPS; Snapdragon 8 Gen 3: 45+ TOPS; Intel Core Ultra 7: 40+ TOPS; Apple M4: 38 TOPS.

**Cómo beneficia técnicamente la aceleración NPU a la IA en el dispositivo:** Ejecutar un modelo de lenguaje de 7000 millones de parámetros (LLaMA-7B) requiere ~14 GB de memoria y 7 billones de operaciones. En CPU, 30 s de latencia. En GPU, 5 s. En un NPU de 40 TOPS, ~0,175 s. Eficiencia: NPU ~5 W, GPU ~50 W, CPU 100 W+. Esto permite funciones locales: traducción de cámara en tiempo real (Google Translate en modo local), enmascarado de sujeto en fotos (Apple), transcripción de voz (Whisper local). Sin NPU, requieren la nube (lento, riesgo de privacidad, consumo por streaming).

**Por qué importa al comprar:** Desde 2024, los TOPS del NPU son un criterio de compra clave, sobre todo para los PC Windows 11 Copilot+ (base de 40+ TOPS). Los móviles ya tenían NPU desde hace años (procesado de fotos local), pero la adopción en Windows dio a conocer el término. Un TOPS alto (40+) permite inferencia de LLM en portátil; uno bajo (10) permite tareas ligeras (clasificación de imágenes, voz). Inversión de futuro: las apps descargarán cada vez más al NPU; más TOPS = dispositivo a prueba de futuro.

**Qué mirar / errores comunes:** - 10–20 TOPS: NPU de entrada, solo modelos ligeros - 35–45 TOPS: insignia, gestiona razonablemente modelos de 7B–13B - 45+ TOPS: premium, casi paridad con GPU en modelos mayores - Considera el ancho de banda de memoria: el NPU necesita acceso rápido a RAM (limitado por memoria, no por cómputo) - Spec TOPS a veces inflada; el rendimiento real es menor en modelos grandes

Real 2026: iPhone 16 Pro (Neural Engine 40+ TOPS), Snapdragon 8 Gen 3 Leading (Hexagon 45+ TOPS), Intel Core Ultra 9 (50 TOPS anunciados), Apple M4 Pro (Neural Engine 38 TOPS), móviles más antiguos (20–25 TOPS, aún correctos para el procesado de fotos).

Términos Relacionados

¿Qué es un chipset (SoC)?RAM vs almacenamiento: ¿cuál es la diferencia?¿Qué es una GPU (procesador gráfico)?