En resumen

  • Z.AI de China lanzó un importante modelo de imágenes open-source que fue entrenado completamente en chips de Huawei.
  • Utiliza un diseño híbrido autoregresivo-difusión que mejora la precisión del texto y el control espacial.
  • El lanzamiento señala el impulso de China hacia la autosuficiencia en IA sin GPUs estadounidenses.

La empresa china de inteligencia artificial Z.AI lanzó el miércoles un modelo de generación de imágenes open-source entrenado completamente en procesadores de Huawei, marcando la primera vez que un modelo importante de IA completa su ciclo de entrenamiento sin depender de hardware estadounidense.

Esta movida resalta un potencial desafío a largo plazo para el dominio de Nvidia en chips de IA, ya que demuestra que una de las principales compañías chinas de IA puede entrenar modelos grandes sin depender de GPUs fabricadas en Estados Unidos.

El modelo ya está disponible para descargar y produce resultados buenos —aunque no impresionantes según los estándares actuales— en términos de estética y coherencia textual, y demuestra excelente conciencia espacial según nuestras primeras pruebas rápidas.

Z.AI de China lanza el primer modelo importante de generación de imágenes con IA entrenado sin chips estadounidenses image 0 Imagen generada con el nuevo modelo de Z.AI.

La empresa con sede en Pekín, que recaudó 558 millones de dólares en su IPO en Hong Kong la semana pasada, entrenó el modelo, llamado GLM-Image, en servidores Ascend Atlas 800T A2 de Huawei usando el framework MindSpore.

"Esperamos que esto pueda proporcionar una referencia valiosa para que la comunidad explore el potencial del poder de cómputo doméstico", dijo Z.AI en un comunicado compartido con el

South China Morning Post
.

Presentamos GLM-Image: Un nuevo hito en la generación de imágenes open-source.

GLM-Image utiliza una arquitectura híbrida autoregresiva más difusión, combinando una fuerte comprensión semántica global con alta fidelidad en el detalle visual. Igualando a los modelos de difusión más populares en calidad general…

— Z.ai (@Zai_org) 14 de enero de 2026

GLM-Image combina técnicas autoregresivas y de difusión en una arquitectura híbrida con un total de 16 mil millones de parámetros. El componente autoregresivo, basado en el modelo de lenguaje GLM-4 de Z.AI, se encarga de la comprensión de instrucciones y la composición de imágenes, mientras que un decodificador de difusión refina los detalles finos. Este enfoque refleja técnicas utilizadas por el último modelo de generación de imágenes de OpenAI, gpt-image-1.5, que ha demostrado una mejor interpretación de texto y adherencia a las indicaciones en comparación con modelos de difusión puros como Stable Diffusion.

Los modelos de difusión generan imágenes comenzando con ruido visual aleatorio y refinándolo lentamente hasta formar una imagen, mientras que los modelos autoregresivos construyen imágenes paso a paso, prediciendo cada parte en base a lo anterior. La difusión es excelente para lograr realismo general, pero puede tener dificultades con detalles precisos como texto o disposición, mientras que los modelos autoregresivos destacan en estructura y seguimiento de instrucciones. Actualmente, la difusión es la técnica dominante entre los generadores de imágenes de IA open-source.

Los nuevos sistemas híbridos combinan ambos enfoques, usando la generación autoregresiva para planificar la imagen y la difusión para pulir el resultado final.

Z.AI de China lanza el primer modelo importante de generación de imágenes con IA entrenado sin chips estadounidenses image 1 Imagen: Z.AI

El lanzamiento tiene peso para Z.AI, que fue incluida en la lista negra de Washington en 2025 por supuestos vínculos con el ejército chino. Esa designación cortó el acceso de la empresa a los procesadores H100 y A100 de Nvidia. Ahora, Z.AI ha demostrado que las compañías sancionadas aún pueden producir sistemas de IA competitivos usando hardware nacional, un desarrollo que Pekín lleva tiempo buscando demostrar.

Justo después del anuncio de Z.AI,

Reuters
informó que las autoridades aduaneras chinas habían instruido a los agentes para bloquear el ingreso de chips Nvidia H200 al país. Funcionarios gubernamentales convocaron a empresas tecnológicas a reuniones donde se les indicó no comprar los chips a menos que fuera estrictamente necesario. Según las fuentes, la formulación fue lo suficientemente severa como para constituir "básicamente una prohibición por ahora".

Pekín parece estar dando la señal de que los laboratorios de IA chinos pueden construir modelos capaces sin silicio estadounidense, reduciendo la urgencia para que las empresas chinas acumulen hardware de Nvidia. El H200, que ofrece aproximadamente seis veces el rendimiento del chip H20 que Pekín ya había bloqueado en agosto pasado, había generado pedidos de más de dos millones de unidades por parte de empresas chinas a 27.000 dólares cada una.

Analistas del Center for Security and Emerging Technologies de Georgetown han señalado que la estrategia de chips de China se basa en compensar el menor rendimiento por chip con grandes clusters de procesadores Huawei. El enfoque funciona, pero requiere más hardware, más energía y mayor esfuerzo de ingeniería.

"Una de las principales limitaciones de esta estrategia es la capacidad de China para producir suficientes chips a nivel doméstico para compensar y mantener el ritmo respecto a la brecha de capacidad", dijo la analista senior de investigación Hanna Dohmen a

CNBC
en noviembre.

Según la propia hoja de ruta de Huawei, su chip de próxima generación en 2026 será en realidad inferior a su buque insignia actual en términos de potencia bruta. Pero tales evaluaciones pueden subestimar lo que los laboratorios chinos pueden lograr mediante la eficiencia algorítmica, como demostró DeepSeek al entrenar modelos competitivos con menos chips gracias a la optimización a nivel de ensamblador para GPUs.

Z.AI de China lanza el primer modelo importante de generación de imágenes con IA entrenado sin chips estadounidenses image 2 Fuente: Council on Foreign Relations

Según el reporte técnico de la compañía, GLM-Image de Z.AI logró puntajes líderes en la industria en los benchmarks entre modelos open-source en renderizado de texto y generación de caracteres chinos. Aquellos que no cuenten con el hardware adecuado también pueden probarlo online con acceso vía API a un precio de $0,014 por imagen generada, o a través de un espacio gratuito en Hugging Face mantenido por Z.AI.

Z.AI se convirtió en la primera de las "tigres de IA" de China, un grupo de startups que construyen grandes modelos de lenguaje para competir con OpenAI y Anthropic, en salir a bolsa. Su acción ha subido alrededor del 80% desde que cotiza, siguiendo el entusiasmo de los inversores por empresas chinas de IA como DeepSeek o Alibaba en medio de las ambiciones de China respecto a chips nacionales.

Mientras tanto, Huawei se está preparando para aumentar drásticamente la producción de sus procesadores Ascend este año. La presencia de la empresa en conferencias de IA en toda China ha sido cada vez más notoria, mientras intenta consolidarse como la columna vertebral de una infraestructura nacional de IA que ya no depende de Santa Clara.