Publicado el mayo 17, 2024

Contrariamente a la creencia popular, la NPU no «mejora» mágicamente tus fotos nocturnas; las reconstruye matemáticamente a partir de la información incompleta que captura el sensor.

  • Una NPU real ejecuta modelos computacionales complejos para segmentar y procesar cada elemento de una foto (cielo, piel, texto) de forma independiente.
  • La «IA» de un móvil barato es a menudo un simple filtro que satura colores, sin capacidad de reconstrucción ni análisis de la escena.

Recomendación: Al elegir un móvil, ignora el marketing de «Cámara con IA» y busca el nombre del procesador (Tensor, Neural Engine, Snapdragon 8) para garantizar que tienes un chip neuronal de verdad.

Seguramente te ha pasado. Intentas hacer una foto de noche con tu móvil y el resultado es decepcionante: una imagen oscura, con ruido y colores que no se parecen en nada a la realidad. Entonces ves anuncios de nuevos teléfonos con «cámara con Inteligencia Artificial» que prometen fotos nocturnas espectaculares y piensas que es algún tipo de magia. Como desarrollador de algoritmos de imagen, estoy aquí para decirte que no hay magia, sino matemáticas y hardware especializado. El corazón de esa revolución es la Unidad de Procesamiento Neuronal, o NPU (Neural Processing Unit).

A diferencia de la CPU (el cerebro principal) o la GPU (especializada en gráficos), la NPU es un chip diseñado con un único propósito: ejecutar los cálculos de los modelos de inteligencia artificial a una velocidad y eficiencia energética brutales. Hablamos de tareas de inferencia en local, es decir, realizadas directamente en tu dispositivo, sin necesidad de conectarse a internet. Esto no solo se aplica a la fotografía. Afecta a cómo tu móvil traduce idiomas, gestiona la batería o incluso te entiende cuando hablas.

El error común es pensar en la IA como una entidad abstracta que «aprende». En realidad, son modelos matemáticos pre-entrenados que la NPU ejecuta en milisegundos. Mi trabajo consiste en diseñar esos modelos. Por ejemplo, para reducir el ruido en una foto nocturna, el modelo no «ve» el ruido; lo que hace es identificar patrones de píxeles que, estadísticamente, corresponden a ruido electrónico y los sustituye por los valores más probables basándose en millones de imágenes de referencia. Este artículo desmitificará cómo funciona realmente este componente, qué tareas ejecuta sin que te des cuenta y cómo diferenciar la tecnología real del simple marketing.

A lo largo de este análisis, desglosaremos las capacidades reales de un chip neuronal, desde la traducción instantánea hasta la optimización de la batería, y aprenderemos a identificar las falsas promesas de la «IA» en los móviles más económicos. Prepárate para entender el motor oculto de tu smartphone.

¿Por qué traducir textos sin internet es posible gracias al chip neuronal de tu teléfono?

La capacidad de traducir un cartel en otro idioma simplemente apuntando con la cámara, y sin conexión a internet, parece ciencia ficción. Sin embargo, es uno de los ejemplos más claros del poder de la inferencia en local ejecutada por una NPU. Para entenderlo, hay que abandonar la idea de que el móvil «entiende» el lenguaje. Lo que hace es procesar modelos lingüísticos, que no son más que enormes matrices de números que representan las relaciones estadísticas entre palabras.

Cuando la NPU procesa una traducción, realiza millones de operaciones matemáticas (principalmente multiplicaciones de matrices) para encontrar la secuencia de palabras más probable en el idioma de destino. Hacer esto en una CPU tradicional sería lento y consumiría una cantidad ingente de batería. La NPU, en cambio, está diseñada específicamente para este tipo de cálculo. De hecho, un chip como el Kirin 970 fue pionero al demostrar ser 25 veces más rápido y 50 veces más eficiente que una CPU para estas tareas.

Esta capacidad es especialmente relevante en España, donde la convivencia de varias lenguas es una realidad. Gracias a los modelos offline que se ejecutan en la NPU, Google Traductor ha mejorado enormemente su soporte para las lenguas cooficiales. Por ejemplo, el catalán ya cuenta con un soporte muy avanzado, mientras que el gallego y el euskera también pueden usarse sin conexión para traducir texto capturado por la cámara, un avance impensable hace solo unos años sin un procesador neuronal dedicado.

¿Cómo aprende tu móvil tus hábitos para ahorrar batería y por qué tarda una semana en hacerlo?

Otra de las funciones silenciosas pero cruciales de la NPU es la optimización adaptativa de la batería. Cuando estrenas un móvil, es habitual que la autonomía parezca mediocre durante los primeros días. Esto se debe a que el sistema operativo está utilizando la NPU para una fase de aprendizaje de patrones de uso. El dispositivo no «sabe» si trabajas de noche, si usas más Instagram por la mañana o si juegas a videojuegos después de comer.

Durante aproximadamente una semana, la NPU registra y analiza tus hábitos: a qué hora cargas el móvil, qué aplicaciones abres con más frecuencia y en qué momentos, y cuándo el teléfono permanece inactivo. Con estos datos, construye un modelo predictivo de tu comportamiento. Pasado ese periodo de calibración, el sistema puede anticiparse. Por ejemplo, puede cerrar aplicaciones en segundo plano que sabe que no usarás en las próximas horas, o reducir la potencia del procesador durante la noche porque ha aprendido que no lo utilizas mientras duermes. Este tipo de optimización es tan efectiva que, según investigadores, puede suponer hasta un 30% más de duración de batería.

Vista cenital de un móvil mostrando patrones de uso diario con gráficos de consumo energético

Este sistema se adapta perfectamente a las particularidades del estilo de vida en España. La NPU aprende los horarios partidos, con pausas largas para comer y una mayor actividad social nocturna, ajustando el rendimiento del dispositivo para ofrecer máxima potencia en los momentos de uso intensivo y conservar energía durante las pausas, algo que un ajuste de fábrica genérico no podría hacer con la misma eficacia.

Apple Neural Engine o Google Tensor: ¿quién tiene el asistente de voz más rápido y natural?

En la gama alta, la batalla por la supremacía en IA se libra entre dos titanes: el Apple Neural Engine (integrado en sus chips A-series) y el Google Tensor (con su propia TPU, o Tensor Processing Unit). Aunque ambos son NPUs en esencia, su filosofía y enfoque son diferentes, lo que se refleja directamente en la naturalidad y velocidad de sus respectivos asistentes de voz, Siri y Google Assistant.

Apple lleva años perfeccionando su Neural Engine, centrándose en una integración vertical total con iOS. Esto le otorga un rendimiento y una eficiencia energética líderes en el mercado para tareas de procesamiento en local, como el reconocimiento facial (Face ID) o el procesamiento de lenguaje natural de Siri. Google, por su parte, ha diseñado el chip Tensor específicamente para potenciar sus servicios y sus modelos de IA más avanzados, como la familia Gemini. Su fortaleza reside en la simbiosis con la nube, aunque cada vez más tareas se ejecutan en el propio dispositivo.

Para un aficionado a la fotografía, la diferencia es sutil pero importante. Apple optimiza sus algoritmos para que funcionen a la perfección con su hardware, mientras que Google diseña su hardware para que ejecute sus algoritmos de fotografía computacional de forma óptima. Esto nos lleva a una reflexión clave que un experto compartió en un documento de análisis comparativo:

Los modelos de la NPU son más rígidos que los de la nube y necesitan ser ‘educados’ por el usuario para ser verdaderamente útiles en el día a día.

– Análisis técnico de procesadores neuronales, PcComponentes

A continuación, una tabla simplificada muestra las diferencias conceptuales entre ambos enfoques, aunque hay que tener en cuenta que las cifras de TOPS (billones de operaciones por segundo) no siempre cuentan toda la historia, ya que la optimización del software es igual de importante.

Comparativa conceptual de NPUs: Apple vs. Google
Característica Apple Neural Engine Google Tensor TPU
TOPS (rendimiento) 35 TOPS (aprox.) No especificado oficialmente
Eficiencia energética Líder del mercado por optimización iOS Optimizado para modelos Gemini Nano
Integración software Total con iOS 18 Diseñado para servicios Google
Procesamiento offline Excelente Muy bueno

La mentira de la «Cámara con IA» en móviles de 100 euros que solo satura los colores

Aquí es donde, como desarrollador, siento la necesidad de ser tajante. La etiqueta «Cámara con IA» en un móvil de gama de entrada es, en el 99% de los casos, puro marketing. Una NPU real, como las que hemos visto, es un componente de hardware caro. Lo que estos móviles económicos suelen tener es un software básico que aplica reglas predefinidas, no un modelo de inteligencia artificial que analiza la escena.

Este software funciona con una lógica simple: si el software «detecta» algo verde y azul, asume que es un paisaje y satura esos colores para que la foto parezca más vistosa. Si detecta tonos piel, aplica un suavizado exagerado. Esto no es procesamiento de imagen inteligente; es un filtro glorificado. El resultado son imágenes artificiales, con colores irreales y pérdida de detalle. Una paella, por ejemplo, pierde toda la textura y los matices de sus ingredientes para convertirse en una mancha amarilla y roja.

Fotografía macro detallada de ingredientes de paella mostrando texturas y colores naturales

En contraste, una NPU de verdad realiza una segmentación semántica: identifica el cielo, los edificios, las personas, el texto de un cartel y aplica un procesamiento diferente y específico a cada elemento, todo en una fracción de segundo. La capacidad de procesamiento es abismal: una NPU potente puede procesar hasta 33 imágenes por segundo, analizando y reconstruyendo cada una de ellas. Un móvil barato simplemente no tiene esa capacidad de cálculo. Por eso, aprender a identificar una NPU real es fundamental para no caer en el engaño.

Plan de acción: Cómo identificar una NPU real al comprar un móvil

  1. Buscar términos específicos: En la ficha técnica, busca palabras clave como ‘NPU’, ‘Neural Engine’, ‘Tensor’ o ‘Hexagon’ (el DSP de Qualcomm con funciones de IA).
  2. Verificar el procesador: Asegúrate de que el móvil lleva un procesador de gama media-alta o alta, como los Snapdragon 8 Gen, Apple A-series, Google Tensor o Kirin 9000 en adelante.
  3. Comprobar en tiendas especializadas: Revisa las especificaciones detalladas en webs como PcComponentes o MediaMarkt, que suelen ser más precisas que las del fabricante.
  4. Desconfiar de etiquetas genéricas: Si solo ves «Cámara con IA» o «AI Scene Recognition» sin más detalles sobre el chip, es una señal de alerta.
  5. Consultar benchmarks de IA: Para usuarios avanzados, herramientas como AI Benchmark de AnTuTu pueden dar una idea del rendimiento real del chip en tareas de IA.

¿Qué nuevas funciones de realidad aumentada permitirá tu chip neuronal en los próximos 2 años?

Si la fotografía y la eficiencia ya son el presente de las NPU, la realidad aumentada (RA) es su futuro más inmediato y emocionante. Las aplicaciones de RA actuales, como los filtros de Instagram o Pokémon GO, son relativamente simples. Sin embargo, la próxima generación de experiencias inmersivas requerirá una capacidad de cálculo en tiempo real que solo una NPU potente puede ofrecer.

El chip neuronal es fundamental para la RA porque debe realizar varias tareas complejas simultáneamente y con latencia cero: identificar superficies en el mundo real (suelos, paredes, mesas), rastrear el movimiento del usuario con precisión (SLAM – Simultaneous Localization and Mapping), y reconocer objetos para interactuar con ellos. Como explica un análisis de Xataka, las redes neuronales de una NPU son clave para la visión artificial y el reconocimiento de objetos, pilares de la RA.

Imagina visitar la Alhambra de Granada y, a través de la cámara de tu móvil, ver una reconstrucción de cómo eran los salones en el siglo XIV, con personajes de la época moviéndose por ellos. O durante las Fallas de Valencia, apuntar a un «ninot» y obtener información sobre su significado y el artista que lo creó. Estas experiencias, que fusionan el mundo real y el digital de forma fluida, dependen de la capacidad de la NPU para interpretar el entorno al instante. Microsoft ya ha establecido un estándar de facto, sugiriendo que se necesitan 40 TOPS como mínimo para funciones de IA y RA avanzadas como las de Copilot+, una cifra que solo los chips más modernos pueden alcanzar.

¿Por qué los procesadores de 3 nanómetros calientan menos tu móvil en verano?

El calor es el gran enemigo de la electrónica. En un país como España, usar el móvil bajo el sol en agosto puede convertirlo en una pequeña estufa, ralentizando su rendimiento y degradando la batería. Aquí es donde la arquitectura del procesador, y en concreto el tamaño de sus transistores medido en nanómetros (nm), juega un papel crucial. Un procesador de 3nm, como los que ya equipan los móviles de gama más alta, es intrínsecamente más eficiente que uno de 5nm o 7nm.

La razón es física pura: a menor tamaño de los transistores, menor es la distancia que tienen que recorrer los electrones y, por tanto, menor es la energía necesaria para que funcionen y el calor que se disipa en el proceso. Cuando esta eficiencia se combina con núcleos especializados como una NPU, el resultado es espectacular. Ejecutar un algoritmo de IA en una GPU genérica es como usar un camión para llevar un paquete pequeño: funciona, pero es terriblemente ineficiente. Una NPU es como una bicicleta diseñada solo para ese paquete: consume muchísima menos energía.

Esta eficiencia es crítica en condiciones extremas. Bajo el sol de agosto en Córdoba, un chip de 7nm puede alcanzar temperaturas que provocan el «thermal throttling» (reducción de rendimiento para evitar daños), mientras que un chip de 3nm con una NPU optimizada puede mantenerse en una temperatura operativa mucho más baja. Las pruebas de laboratorio lo confirman, mostrando que para tareas de IA, una NPU puede tener un 70% menos de consumo que una GPU, pasando de 37W a tan solo 10W. Esta diferencia es lo que permite que tu móvil siga funcionando de forma fluida incluso en los días más calurosos del verano.

¿Por qué el asistente no entiende a ciertas personas y cómo entrenar la voz para mejorar?

«Ok Google, pon la calefacción». Silencio. Lo intentas de nuevo, vocalizando más. Nada. Esta frustración es común y su origen está en cómo los modelos de reconocimiento de voz son entrenados. La mayoría de los modelos globales se entrenan con un enorme corpus de voces, pero este tiende a estar dominado por acentos «estándar», como el inglés americano o el castellano del centro de España. Los acentos regionales, los giros locales o las diferentes entonaciones pueden suponer un desafío para el asistente.

La NPU juega un papel doble en este problema. Por un lado, permite que el reconocimiento de voz principal se ejecute en local, lo que da una respuesta más rápida. Por otro, es la clave para la personalización del modelo a tu propia voz. Cuando configuras el asistente por primera vez y repites varias frases, estás proporcionando los primeros datos para que la NPU ajuste el modelo general a tus características vocales específicas. Esfuerzos como los del traductor Elia, basado en IA y redes neuronales, demuestran la importancia de diseñar modelos teniendo en cuenta desde el origen la diversidad lingüística de España, incluyendo euskera, catalán y gallego.

Para mejorar la precisión del asistente, no basta con hablarle más claro. Hay que «educar» al modelo de la NPU con datos relevantes y variados. Aquí tienes algunos consejos prácticos para entrenarlo con tu acento específico:

  • Usa nombres de lugares locales: En lugar de «llévame a una farmacia», prueba con «llévame a la Farmacia Central en la Calle Larios de Málaga».
  • Incluye jerga y equipos locales: «Pon los resultados del Betis» o «recuérdame comprar pipas».
  • Practica con diminutivos y expresiones típicas: Frases como «nos vemos en un ratillo» o «eso está guay» ayudan al modelo a aprender tus patrones.
  • Sé constante: Realiza este tipo de peticiones variadas durante al menos una semana. La repetición y la diversidad de los datos son clave para que la NPU refine su modelo.

A recordar

  • Una NPU no es un cerebro genérico, sino un procesador matemático especializado en los cálculos de la IA, lo que le otorga una velocidad y eficiencia imbatibles.
  • Las funciones más avanzadas como la reconstrucción de fotos nocturnas o la traducción offline dependen de la inferencia en local, posible gracias a la NPU.
  • La etiqueta «Cámara con IA» en móviles baratos suele ser marketing; la verdadera IA reside en procesadores específicos como Apple Neural Engine, Google Tensor o los Snapdragon de gama alta.

¿Cómo instalar la Google Camera (GCam) para mejorar drásticamente las fotos de tu Xiaomi barato?

Incluso con todo lo que hemos hablado sobre hardware, a veces el software puede marcar una diferencia abismal. Este es el caso de la Google Camera, o GCam. Se trata de la aplicación de cámara oficial de los móviles Google Pixel, cuyo software de procesamiento de imagen es considerado uno de los mejores del mundo. La buena noticia es que una comunidad de desarrolladores la ha adaptado para que funcione en cientos de otros móviles Android, especialmente en marcas como Xiaomi.

Instalar GCam en un Xiaomi de gama media o de entrada es como realizar un «trasplante de cerebro» a su sistema de fotografía. Estás reemplazando los algoritmos de procesamiento de imagen del fabricante, a menudo mediocres, por los modelos de fotografía computacional de Google. Esto incluye su famoso modo HDR+, el modo noche (Night Sight) y el modo retrato, que a menudo superan con creces a los que vienen de serie.

Para que esto sea posible, tu móvil debe cumplir un requisito técnico: tener activada la API «Camera2». Esta es una interfaz de programación que da a las apps de terceros un control mucho más profundo sobre el hardware de la cámara (enfoque, exposición, ISO, captura en RAW, etc.). La mayoría de los móviles modernos la tienen activada. El proceso de instalación implica encontrar la versión correcta del archivo APK de GCam para tu modelo de móvil específico, algo que se puede hacer en foros especializados como los de XDA Developers o webs dedicadas a GCam. Aunque requiere un pequeño esfuerzo de investigación, el resultado suele ser una mejora tan drástica en la calidad de imagen que parece que has cambiado de teléfono.

La próxima vez que busques un móvil, no te dejes llevar solo por los megapíxeles. Fíjate en el procesador y su NPU: ahí es donde reside la verdadera inteligencia que transformará tu experiencia.

Preguntas frecuentes sobre La NPU y la inteligencia artificial en tu móvil

¿Qué es exactamente una NPU y en qué se diferencia de una CPU o una GPU?

Una NPU (Unidad de Procesamiento Neuronal) es un procesador especializado diseñado exclusivamente para acelerar los cálculos de inteligencia artificial. Mientras que la CPU es el cerebro generalista del móvil y la GPU está optimizada para gráficos, la NPU es experta en las operaciones matemáticas masivas y paralelas (como la multiplicación de matrices) que requieren los modelos de IA, haciéndolo de forma mucho más rápida y con un consumo de energía muy inferior.

¿Todos los móviles con «IA» tienen una NPU real?

No, en absoluto. Muchos móviles económicos utilizan el término «IA» como una herramienta de marketing para describir funciones de software muy básicas, como el reconocimiento simple de escenas que solo ajusta el color y el contraste. Una NPU real es un componente de hardware presente en procesadores de gama media y alta, como el Apple Neural Engine, el Google Tensor o los Snapdragon de la serie 8. La presencia de este hardware es lo que permite funciones avanzadas de procesamiento en local.

¿La NPU solo sirve para mejorar las fotos?

No, la fotografía es solo una de sus aplicaciones más visibles. La NPU es fundamental para cualquier tarea que requiera inferencia de IA en el dispositivo. Esto incluye la traducción de idiomas sin conexión, el reconocimiento de voz de los asistentes virtuales, la optimización adaptativa de la batería según tus hábitos de uso, y será la pieza clave para las futuras aplicaciones de realidad aumentada.

Escrito por Elena Castillo, Analista de Tecnología Móvil y Fotógrafa Técnica con 9 años de experiencia. Especialista en fotografía computacional, pantallas OLED y ecosistemas Apple/Android.