Apple A10X Fusion: características, arquitectura y rendimiento

Video relacionado
4.7/5 - (103 votos)

Contexto: del apple a10 fusion al apple a10x fusion

Para entender bien el A10X Fusion conviene conocer primero el Apple A10 Fusion “a secas”, estrenado con los iPhone 7 y 7 Plus. Este fue el primer SoC de Apple con una configuración de cuatro núcleos de CPU, combinando dos núcleos de alto rendimiento con otros dos de alta eficiencia energética.

El A10 Fusion está fabricado por TSMC en un proceso FinFET de 16 nm, con una superficie aproximada de 125 mm² y alrededor de 3.300 millones de transistores, incluyendo la GPU y las distintas memorias caché integradas. Se identifica internamente con el código APL1W24.

En cuanto a la CPU, el chip integra dos núcleos de alto rendimiento de 64 bits basados en arquitectura ARMv8-A diseñados por Apple, con nombre en clave Hurricane, funcionando a unos 2,34 GHz. A ellos se suman dos núcleos de bajo consumo, también de 64 bits y también de diseño propio de Apple, denominados Zephyr, pensados para tareas ligeras como revisar el correo, la mensajería o procesos en segundo plano.

Este esquema recuerda a la filosofía big.LITTLE de ARM, donde se combinan núcleos potentes con núcleos eficientes para equilibrar rendimiento y autonomía. Sin embargo, la implementación de Apple en el A10 Fusion se aparta de la mayoría de chips Android de la época, como el Snapdragon 820 o el Exynos 8890, porque en el A10 solo puede estar activo un tipo de núcleo a la vez.

El resultado es que, desde el punto de vista de muchos benchmarks, el A10 Fusion se identifica como un chip de dos núcleos, ya que únicamente los núcleos Hurricane o los Zephyr funcionan simultáneamente, pero nunca los cuatro juntos. Un controlador de rendimiento se encarga de decidir en tiempo real qué pareja de núcleos entra en juego en función de la carga de trabajo, priorizando bien el rendimiento, bien la autonomía.

Cachés y arquitectura interna del a10 fusion

Un aspecto clave de la arquitectura del A10 Fusion es su jerarquía de memorias caché L1, L2 y L3, que contribuye de forma decisiva al rendimiento global del sistema. Las cachés permiten que la CPU trabaje con datos e instrucciones de acceso muy rápido, evitando cuellos de botella con la memoria principal.

En primer lugar, cada núcleo dispone de una caché L1 de 64 KB para datos y 64 KB para instrucciones. Este tamaño relativamente generoso para un dispositivo móvil ayuda a que las operaciones inmediatas de la CPU se resuelvan con muy baja latencia, lo que redunda en una mayor fluidez en tareas del día a día.

Por encima, los núcleos de alto rendimiento comparten una caché L2 de 3 MB. Una caché L2 de mayor capacidad, como la del A10, se traduce en un incremento notable del rendimiento tanto de la CPU como del sistema en general, ya que reduce el número de accesos que tienen que “bajar” hasta la memoria principal.

El SoC se completa con una caché L3 de 4 MB que cubre todo el chip. Esta caché actúa como colchón global entre la CPU, la GPU y otros bloques internos, y un tamaño más alto en L3 se asocia con una mejor capacidad para manejar cargas pesadas y multitarea, manteniendo al mínimo la necesidad de acceder a la RAM y mejorando así tanto la velocidad como la eficiencia.

La combinación de cachés L1 generosas, una L2 amplia y una L3 compartida permite que el A10 Fusion ofrezca un rendimiento muy superior a generaciones anteriores, con Apple afirmando una mejora de hasta el 40 % frente al A9 en los núcleos de alto rendimiento, mientras que los núcleos eficientes consumen apenas el 20 % de la energía de aquellos en tareas sencillas.

Gpu del a10: base para el salto al a10x fusion

En el apartado gráfico, el A10 Fusion introdujo una GPU de 6 núcleos, diseñada para mejorar tanto la potencia como la eficiencia. Apple indicaba que esta GPU era aproximadamente un 50 % más rápida que la integrada en el A9, consumiendo a la vez alrededor de un 66 % de la energía que necesitaba la anterior.

Diversos análisis técnicos han sugerido que la compañía mantuvo la base del núcleo gráfico PowerVR GT7600 (empleado ya en el A9), pero con modificaciones internas importantes. En particular, se habrían reemplazado partes clave del diseño original de PowerVR por bloques y optimizaciones propias de Apple, dando lugar a una GPU personalizada y mejor adaptada al resto de la arquitectura del chip.

Esta GPU de seis núcleos sirvió de plataforma de lanzamiento para el desarrollo del Apple A10X Fusion, que llevó la idea bastante más lejos en términos de número de núcleos gráficos, ofreciendo un salto destacable en rendimiento para tareas intensivas como juegos de alto nivel, edición de vídeo o aplicaciones de realidad aumentada.

Apple a10x fusion: evolución “vitaminada”

El Apple A10X Fusion es una variante avanzada del A10 Fusion, diseñada específicamente para dispositivos con mayores necesidades de potencia sostenida, como los iPad Pro y el Apple TV 4K. Apple lo presentó durante la WWDC de 2017 como el motor que impulsaría los iPad Pro de 10,5 pulgadas y de 12,9 pulgadas de segunda generación.

En el momento de su presentación, Apple afirmó que la CPU del A10X Fusion era hasta un 30 % más rápida que la del A9X, mientras que la GPU podía llegar a superar en torno a un 40 % el rendimiento gráfico de dicho chip. Estas cifras reflejan un avance considerable en muy poco tiempo, sobre todo teniendo en cuenta que el A9X ya era un procesador bastante potente.

Una de las claves del A10X Fusion es que incorpora una CPU de 6 núcleos, frente a los cuatro del A10 Fusion estándar. Aunque Apple no desglosa oficialmente el reparto entre núcleos de alto rendimiento y núcleos de bajo consumo, se sabe que sigue manteniendo una arquitectura de 64 bits y un diseño muy centrado en maximizar la relación rendimiento/consumo.

En el terreno gráfico, el salto también es notable: el A10X Fusion integra una GPU de 12 núcleos, doblando el número de núcleos gráficos con respecto al A10 básico. Esto permite manejar con mayor soltura pantallas de alta resolución, animaciones a 120 Hz (en el caso de los iPad Pro con ProMotion) y flujos de trabajo de creación de contenido mucho más intensos.

Al igual que su predecesor, el A10X Fusion mantiene una arquitectura de 64 bits y proceso avanzado de fabricación, lo que ayuda a mantener bajo control el calor generado y el consumo eléctrico incluso en escenarios de potencia prolongada, algo crucial en tablets que deben ofrecer una buena autonomía sin recurrir a sistemas de refrigeración activos.

Hilos, núcleos y heterogeneous multi-processing (hmp)

Cuando se analiza un chip como el A10X Fusion es habitual fijarse en el número de núcleos de CPU y de GPU, pero también es interesante entender el papel de los hilos de ejecución (threads) y de tecnologías como el Heterogeneous Multi-Processing (HMP).

Un mayor número de hilos permite mejorar el rendimiento en multitarea y en aplicaciones que están preparadas para paralelizar sus cargas de trabajo. Aunque Apple no detalla el soporte de hilos simultáneos para cada núcleo, la evolución hacia arquitecturas con más núcleos físicos responde precisamente a la necesidad de gestionar múltiples procesos y tareas en paralelo.

La tecnología Heterogeneous Multi-Processing (HMP) puede considerarse una versión avanzada de la filosofía big.LITTLE, en la que el procesador es capaz de utilizar de forma simultánea todos sus núcleos (tanto los potentes como los eficientes) o bien limitarse a uno solo para ahorrar energía en tareas ligeras.

En un enfoque HMP completo, el sistema operativo y el controlador de rendimiento deciden dinámicamente qué núcleos se activan y en qué combinación, lo que permite escalar desde un consumo mínimo hasta una potencia máxima cuando se necesita todo el músculo del chip. Esto ofrece un equilibrio muy interesante entre desempeño pico y vida de la batería.

En el caso concreto del A10 Fusion, Apple optó por una solución más conservadora donde, como se comentaba antes, solo se activa a la vez un tipo de núcleo (alto rendimiento o baja potencia). Con la llegada de chips más avanzados y complejos, la industria ha ido adaptando cada vez más esquemas de procesamiento heterogéneo que se aproximan al ideal de HMP, aunque Apple combina estas ideas con su propio sistema de gestión energética y de rendimiento.

Importancia de la caché l1, l2 y l3 en el rendimiento

Uno de los puntos que a menudo se pasa por alto al hablar de chips móviles es la relevancia de las memorias caché. Tanto en el A10 Fusion como en el A10X Fusion, el tamaño y la organización de L1, L2 y L3 tienen un impacto directo en la fluidez del sistema.

La caché L1 es la más rápida y la que está físicamente más cercana a los núcleos de CPU. Un mayor tamaño de caché L1 para datos e instrucciones permite que la CPU disponga con más facilidad de la información inmediata que necesita, lo que se traduce en respuestas más rápidas al abrir aplicaciones, cambiar entre ellas y ejecutar pequeñas operaciones continuas.

La caché L2, algo más lenta pero también más grande, actúa como segundo nivel de respaldo para los datos que se usan con frecuencia. Cuando se aumenta la cantidad de memoria en L2, se reduce el número de veces que la CPU tiene que acudir a la memoria principal (DRAM), mucho más lenta. Por ello, un caché L2 más grande suele suponer un aumento apreciable en el rendimiento global y un mejor comportamiento del sistema en multitarea.

La caché L3 es compartida por distintos elementos del SoC (CPU, GPU y otros bloques) y su propósito es servir como gran almacén intermedio, mejorando el intercambio de datos dentro del propio chip. Incrementar el tamaño de la L3 ayuda a que operaciones pesadas, como juegos 3D o edición de vídeo, se beneficien de un flujo de datos más constante y predecible.

En conjunto, una jerarquía de cachés bien dimensionada permite que, incluso con frecuencias moderadas, el chip mantenga un rendimiento muy alto y estable. Esta es una de las razones por las que, pese a tener a veces menos GHz sobre el papel, los SoC de Apple suelen ofrecer una experiencia muy fluida en el uso real.

Frecuencia, multiplicador de reloj y eficiencia

Otro concepto relevante en este tipo de procesadores es el del multiplicador de reloj, que determina la frecuencia efectiva a la que trabajan los núcleos de la CPU a partir de un reloj base. Ajustando dicho multiplicador, el sistema puede aumentar o reducir la velocidad de los núcleos en función de la carga.

Cuando se incrementa el multiplicador, la frecuencia de la CPU aumenta, lo que permite procesar más instrucciones por segundo y da más rendimiento. A la inversa, reduciendo el multiplicador, la frecuencia baja, disminuyendo el consumo energético y el calor generado, algo fundamental en dispositivos móviles donde la refrigeración es pasiva.

En chips como el A10 y el A10X Fusion, Apple combina este juego de frecuencias dinámicas con la activación selectiva de núcleos de alto rendimiento o de baja potencia para lograr una gestión energética muy fina. Esta capacidad de escalar el rendimiento con precisión es uno de los motivos por los que estos SoC pueden ofrecer tanta potencia cuando se exige, sin arruinar la batería en tareas ligeras como navegar o leer.

Dispositivos que utilizan el apple a10 fusion y el a10x fusion

El ecosistema de dispositivos que han montado estos chips es bastante amplio.