W skrócie

  • Chińska firma Z.AI wypuściła zaawansowany otwartoźródłowy model generowania obrazów, który został w całości wytrenowany na chipach Huawei.
  • Stosuje hybrydową architekturę autoregresyjną-dyfuzyjną, co zwiększa dokładność tekstu oraz kontrolę przestrzenną.
  • Premiera ta sygnalizuje chińskie dążenie do niezależności w dziedzinie AI bez amerykańskich GPU.

Chińska firma zajmująca się sztuczną inteligencją Z.AI ogłosiła w środę wydanie otwartoźródłowego modelu generowania obrazów, który został w całości wytrenowany na procesorach Huawei. Jest to pierwszy przypadek, kiedy duży model AI ukończył cały cykl treningowy bez użycia amerykańskiego sprzętu.

Ten ruch podkreśla potencjalne długoterminowe wyzwanie dla dominacji Nvidia na rynku chipów AI, gdyż pokazuje, że jedna z czołowych chińskich firm AI potrafi trenować duże modele bez polegania na GPU wyprodukowanych w USA.

Model jest już dostępny do pobrania i generuje dobre — choć nie imponujące według dzisiejszych standardów — wyniki pod względem estetyki oraz spójności tekstu, a nasze pierwsze szybkie testy wykazały doskonałą świadomość przestrzenną.

Chińska Z.AI wprowadza pierwszy znaczący model generowania obrazów AI wytrenowany bez amerykańskich chipów image 0 Obraz wygenerowany przez nowy model Z.AI.

Firma z Pekinu, która w zeszłym tygodniu zebrała 558 milionów dolarów podczas IPO w Hongkongu, wytrenowała model o nazwie GLM-Image na serwerach Huawei Ascend Atlas 800T A2, korzystając z frameworka MindSpore.

"Mamy nadzieję, że może to stanowić cenne odniesienie dla społeczności przy eksploracji potencjału krajowej mocy obliczeniowej," napisała firma Z.AI w oświadczeniu przesłanym do

South China Morning Post
.

Przedstawiamy GLM-Image: nowy kamień milowy w otwartoźródłowej generacji obrazów.

GLM-Image wykorzystuje hybrydową architekturę autoregresyjną z dyfuzją, łącząc silne globalne zrozumienie semantyczne z wysoką wiernością szczegółów wizualnych. Dorównuje głównym modelom dyfuzyjnym pod względem ogólnej jakości…

— Z.ai (@Zai_org) 14 stycznia 2026

GLM-Image łączy techniki autoregresyjne i dyfuzyjne w hybrydowej architekturze z 16 miliardami parametrów. Składnik autoregresyjny, oparty na modelu językowym GLM-4 od Z.AI, odpowiada za rozumienie instrukcji i kompozycję obrazu, podczas gdy dekoder dyfuzyjny dopracowuje szczegóły. To podejście odzwierciedla techniki używane przez najnowszy model generowania obrazów OpenAI gpt-image-1.5, który wykazał lepsze renderowanie tekstów i trzymanie się promptów w porównaniu do czysto dyfuzyjnych modeli jak Stable Diffusion.

Modele dyfuzyjne tworzą obrazy, zaczynając od losowego szumu wizualnego i stopniowo przekształcając go w obraz, podczas gdy modele autoregresyjne budują obraz krok po kroku, przewidując każdą część na podstawie poprzednich. Dyfuzja świetnie sprawdza się przy ogólnym realizmie, ale może mieć trudności z precyzyjnymi detalami, takimi jak tekst czy układ, podczas gdy modele autoregresyjne doskonale radzą sobie ze strukturą i wykonywaniem instrukcji. Obecnie dyfuzja jest najpopularniejszą techniką wśród otwartoźródłowych generatorów obrazów AI.

Nowe systemy hybrydowe łączą oba podejścia, używając generacji autoregresyjnej do zaplanowania obrazu, a dyfuzji do dopracowania ostatecznego rezultatu.

Chińska Z.AI wprowadza pierwszy znaczący model generowania obrazów AI wytrenowany bez amerykańskich chipów image 1 Źródło: Z.AI

Premiera ma znaczenie dla Z.AI, którą Waszyngton wpisał na czarną listę w 2025 roku z powodu rzekomych powiązań z chińskim wojskiem. To oznaczenie odcięło firmę od procesorów Nvidia H100 i A100. Teraz Z.AI udowodniło, że firmy objęte sankcjami nadal mogą tworzyć konkurencyjne systemy AI, korzystając z krajowego sprzętu — co Pekin od dawna chciał pokazać.

Tuż po ogłoszeniu Z.AI,

Reuters
poinformował, że chińskie służby celne nakazały agentom blokowanie dostaw chipów Nvidia H200 do kraju. Przedstawiciele rządu wezwali firmy technologiczne na spotkania, podczas których powiedziano im, by nie kupowały tych chipów, chyba że jest to konieczne. Według źródeł sformułowanie było na tyle ostre, że stanowiło "praktycznie zakaz na ten moment".

Wygląda na to, że Pekin sygnalizuje, iż chińskie laboratoria AI mogą budować zaawansowane modele bez amerykańskich układów, zmniejszając presję na chińskie firmy do gromadzenia sprzętu Nvidia. H200, który oferuje około sześciokrotnie większą wydajność niż chip H20 już zablokowany przez Pekin w sierpniu ubiegłego roku, wygenerował zamówienia od chińskich firm na ponad dwa miliony sztuk po 27 000 dolarów za każdy.

Analitycy z Center for Security and Emerging Technologies z Georgetown zauważyli, że chińska strategia chipowa polega na rekompensowaniu niższej wydajności pojedynczego układu za pomocą ogromnych klastrów procesorów Huawei. To podejście działa, ale wymaga więcej sprzętu, więcej energii i większego wysiłku inżynieryjnego.

"Jednym z kluczowych ograniczeń tej strategii jest zdolność Chin do produkcji wystarczającej liczby własnych chipów, aby nadrobić i utrzymać różnicę w możliwościach," powiedziała starsza analityczka Hanna Dohmen dla

CNBC
w listopadzie.

Według własnej mapy drogowej Huawei, ich chip następnej generacji w 2026 roku będzie faktycznie gorszy od obecnego flagowego pod względem czystej mocy. Jednak takie oceny mogą nie doceniać tego, co chińskie laboratoria są w stanie osiągnąć dzięki efektywności algorytmicznej, co pokazał DeepSeek, trenując konkurencyjne modele na mniejszej liczbie chipów dzięki optymalizacji GPU na poziomie asemblera.

Chińska Z.AI wprowadza pierwszy znaczący model generowania obrazów AI wytrenowany bez amerykańskich chipów image 2 Źródło: Council on Foreign Relations

GLM-Image od Z.AI osiągnął najlepsze w branży wyniki benchmarkowe wśród otwartoźródłowych modeli w zakresie renderowania tekstu i generowania chińskich znaków, zgodnie z raportem technicznym firmy. Osoby nieposiadające odpowiedniego sprzętu mogą także testować model online z dostępem do API w cenie 0,014 USD za wygenerowany obraz lub poprzez darmową przestrzeń na Hugging Face utrzymywaną przez Z.AI.

Z.AI stało się pierwszym spośród chińskich "tygrysów AI" — grupy startupów budujących duże modele językowe rywalizujące z OpenAI i Anthropic — które weszło na giełdę. Od debiutu akcje wzrosły o około 80%, co odzwierciedla entuzjazm inwestorów wobec chińskich firm AI takich jak DeepSeek czy Alibaba, w związku z ambicjami Chin dotyczącymi krajowych chipów.

Huawei natomiast przygotowuje się do gwałtownego zwiększenia produkcji swoich procesorów Ascend w tym roku. Obecność firmy na konferencjach AI w całych Chinach staje się coraz bardziej widoczna, ponieważ Huawei stara się pozycjonować jako kręgosłup krajowej infrastruktury AI, która nie jest już zależna od Santa Clara.