Tóm tắt
- Z.AI của Trung Quốc đã phát hành một mô hình hình ảnh mã nguồn mở lớn, được huấn luyện hoàn toàn trên chip Huawei.
- Mô hình sử dụng thiết kế kết hợp giữa autoregressive và diffusion, nâng cao độ chính xác của văn bản và khả năng kiểm soát không gian.
- Việc phát hành này cho thấy nỗ lực của Trung Quốc hướng tới tự chủ AI mà không cần GPU của Mỹ.
Công ty trí tuệ nhân tạo Trung Quốc, Z.AI, vào thứ Tư đã phát hành một mô hình tạo hình ảnh mã nguồn mở được huấn luyện hoàn toàn trên bộ xử lý của Huawei, đánh dấu lần đầu tiên một mô hình AI lớn hoàn thành toàn bộ quá trình huấn luyện mà không cần dựa vào phần cứng của Mỹ.
Động thái này làm nổi bật thách thức tiềm tàng trong dài hạn đối với sự thống trị của Nvidia trong lĩnh vực chip AI, bởi nó chứng tỏ một trong những công ty AI hàng đầu của Trung Quốc có thể huấn luyện các mô hình lớn mà không cần phụ thuộc vào GPU do Mỹ sản xuất.
Mô hình này đã có sẵn để tải về và tạo ra các kết quả tốt — mặc dù không ấn tượng theo tiêu chuẩn hiện nay — về mặt thẩm mỹ và văn bản nhất quán, đồng thời thể hiện nhận thức không gian xuất sắc dựa trên những thử nghiệm nhanh đầu tiên của chúng tôi.

Hình ảnh được tạo bởi mô hình mới của Z.AI.
Công ty có trụ sở tại Bắc Kinh, vừa huy động được 558 triệu USD trong đợt IPO tại Hồng Kông vào tuần trước, đã huấn luyện mô hình có tên GLM-Image trên các máy chủ Ascend Atlas 800T A2 của Huawei bằng framework MindSpore.
"Chúng tôi hy vọng điều này có thể cung cấp tham khảo giá trị cho cộng đồng trong việc khám phá tiềm năng của sức mạnh tính toán nội địa," Z.AI cho biết trong một tuyên bố chia sẻ với
Bưu Điện Hoa Nam Buổi Sáng
.
Giới thiệu GLM-Image: Một cột mốc mới trong tạo hình ảnh mã nguồn mở.
GLM-Image sử dụng kiến trúc kết hợp giữa tự hồi quy (auto-regressive) và diffusion, kết hợp sự hiểu biết ngữ nghĩa toàn cục mạnh mẽ với chi tiết hình ảnh trung thực cao. Nó sánh ngang với các mô hình diffusion phổ biến về chất lượng tổng thể…
— Z.ai (@Zai_org) Ngày 14 tháng 1, 2026
GLM-Image kết hợp các kỹ thuật autoregressive và diffusion trong một kiến trúc lai với tổng cộng 16 tỷ tham số. Thành phần autoregressive, dựa trên mô hình ngôn ngữ GLM-4 của Z.AI, đảm nhận việc hiểu chỉ dẫn và bố cục hình ảnh, trong khi decoder diffusion tinh chỉnh các chi tiết nhỏ. Cách tiếp cận này phản ánh các kỹ thuật được sử dụng bởi mô hình tạo hình ảnh mới nhất của OpenAI là gpt-image-1.5, vốn đã thể hiện khả năng hiển thị văn bản và tuân thủ prompt vượt trội so với các mô hình diffusion thuần túy như Stable Diffusion.
Các mô hình diffusion tạo hình ảnh bằng cách bắt đầu với nhiễu thị giác ngẫu nhiên và dần dần tinh chỉnh nó thành một bức tranh, trong khi các mô hình autoregressive xây dựng hình ảnh từng bước, dự đoán từng phần dựa trên những gì đã có. Diffusion rất tốt trong việc tạo tính chân thực tổng thể nhưng có thể gặp khó khăn với các chi tiết chính xác như văn bản hoặc bố cục, trong khi các mô hình autoregressive vượt trội về cấu trúc và tuân thủ chỉ dẫn. Hiện tại, diffusion là kỹ thuật thống trị trong số các trình tạo hình ảnh AI mã nguồn mở.
Các hệ thống lai mới kết hợp cả hai phương pháp, sử dụng tạo autoregressive để lên kế hoạch hình ảnh và diffusion để hoàn thiện kết quả cuối cùng.

Hình ảnh: Z.AI
Việc phát hành này có ý nghĩa lớn đối với Z.AI, công ty bị Washington đưa vào danh sách đen năm 2025 do cáo buộc có liên quan đến quân đội Trung Quốc. Quyết định đó đã cắt đứt Z.AI khỏi bộ vi xử lý H100 và A100 của Nvidia. Giờ đây, Z.AI đã chứng minh rằng các công ty bị đưa vào danh sách đen vẫn có thể phát triển các hệ thống AI cạnh tranh bằng phần cứng trong nước, điều mà Bắc Kinh từ lâu muốn chứng minh.
Ngay sau thông báo của Z.AI,
Reuters
đưa tin rằng các cơ quan hải quan Trung Quốc đã chỉ thị cho nhân viên chặn các chip Nvidia H200 không được vào nước này. Các quan chức chính phủ đã triệu tập các công ty công nghệ tới các cuộc họp, nơi họ được thông báo không nên mua chip này trừ khi thực sự cần thiết. Theo các nguồn tin, cách diễn đạt đủ nghiêm trọng để coi như "gần như là lệnh cấm tạm thời."
Bắc Kinh dường như đang phát đi tín hiệu rằng các phòng thí nghiệm AI Trung Quốc có thể xây dựng các mô hình mạnh mẽ mà không cần silicon của Mỹ, giảm bớt nhu cầu cấp bách của các công ty Trung Quốc trong việc tích trữ phần cứng Nvidia. H200, vốn có hiệu năng gấp khoảng sáu lần chip H20 mà Bắc Kinh đã chặn từ tháng 8 năm ngoái, đã nhận được các đơn đặt hàng từ các công ty Trung Quốc với hơn hai triệu đơn vị, mỗi đơn vị có giá 27.000 USD.
Các nhà phân tích tại Trung tâm An ninh và Công nghệ Mới nổi Georgetown đã lưu ý rằng chiến lược chip của Trung Quốc dựa vào việc bù đắp hiệu năng thấp hơn trên mỗi chip bằng các cụm bộ xử lý Huawei khổng lồ. Phương pháp này hoạt động, nhưng đòi hỏi nhiều phần cứng, nhiều điện năng và công sức kỹ thuật hơn.
"Một trong những ràng buộc chính của chiến lược này là khả năng của Trung Quốc trong việc sản xuất đủ chip trong nước để bù đắp và bắt kịp khoảng cách về năng lực," nhà phân tích nghiên cứu cấp cao Hanna Dohmen nói với
CNBC
vào tháng 11.
Theo lộ trình của chính Huawei, dòng chip thế hệ tiếp theo vào năm 2026 thực tế sẽ kém hơn flagship hiện tại về sức mạnh thô. Tuy nhiên, những đánh giá như vậy có thể đánh giá thấp những gì các phòng thí nghiệm Trung Quốc có thể đạt được thông qua hiệu quả thuật toán, như DeepSeek đã chứng minh bằng việc huấn luyện các mô hình cạnh tranh với ít chip hơn thông qua tối ưu hóa GPU ở cấp độ lắp ráp.

Nguồn: Hội đồng Quan hệ Đối ngoại
Theo báo cáo kỹ thuật của công ty, GLM-Image của Z.AI đã đạt điểm chuẩn dẫn đầu ngành trong số các mô hình mã nguồn mở về khả năng hiển thị văn bản và tạo ký tự tiếng Trung. Những ai không có phần cứng phù hợp cũng có thể thử nghiệm trực tuyến với quyền truy cập API giá 0,014 USD cho mỗi hình ảnh tạo ra, hoặc qua Hugging Face Space miễn phí do Z.AI duy trì.
Z.AI đã trở thành công ty đầu tiên trong nhóm "hổ AI" của Trung Quốc, gồm các startup xây dựng mô hình ngôn ngữ lớn để cạnh tranh với OpenAI và Anthropic, lên sàn chứng khoán. Giá cổ phiếu của công ty đã tăng khoảng 80% kể từ khi niêm yết, nhờ sự hào hứng của các nhà đầu tư đối với các công ty AI Trung Quốc như DeepSeek hoặc Alibaba trong bối cảnh tham vọng chip nội địa của Trung Quốc.
Trong khi đó, Huawei đang chuẩn bị tăng mạnh sản lượng bộ xử lý Ascend trong năm nay. Sự hiện diện của công ty tại các hội nghị AI trên toàn Trung Quốc ngày càng nổi bật khi họ cố gắng xác lập vị thế là trụ cột của hạ tầng AI quốc gia không còn phụ thuộc vào Santa Clara.