LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở

Bitget

Tin tức

晚点Latepost2026/01/08 02:32

Hiển thị bản gốc

Theo:晚点Latepost

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 0

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 1

Điều thực sự quyết định cục diện giai đoạn tiếp theo vẫn là hai yếu tố cơ bản hơn — kiến trúc mô hình và mô hình học tập. Đồng thời, phía ứng dụng có thể sẽ xuất hiện một hướng đi rõ ràng: năm bùng nổ AI thay thế các ngành nghề/nhiệm vụ khác nhau.

Bài viết丨Shen Yuan

Biên tập丨Song Wei

Theo nguồn tin độc quyền của LatePost, vào ngày 8 tháng 1, ngày lên sàn của Zhipu, Giáo sư Đường Kiệt — Khoa Khoa học Máy tính Đại học Thanh Hoa, người sáng lập kiêm nhà khoa học trưởng của Zhipu — đã gửi một bức thư nội bộ thông báo sẽ sớm ra mắt mô hình thế hệ mới GLM-5.

Đường Kiệt nói, hôm nay là "ngày đầy cảm xúc trong cuộc đời Zhipu". Ông không trực tiếp trả lời các tranh cãi về mô hình kinh doanh của công ty mô hình lớn hay đưa ra mục tiêu thương mại hóa năm 2026 của Zhipu, nhưng nhấn mạnh rằng, chỉ có lý thuyết, công nghệ hoặc sản phẩm thực sự "có người sử dụng" và giúp ích được nhiều người mới là thành tựu quan trọng trên con đường theo đuổi AGI của Zhipu.

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 2

DeepSeek đã tạo ra cú sốc lớn cho các doanh nghiệp mô hình lớn tại Trung Quốc, nhiều người cho rằng, thành công hiện tượng của DeepSeek trước tiên đã ảnh hưởng đến vị trí sinh thái của Zhipu, vì hai bên đều có thuộc tính đội ngũ nghiên cứu học thuật gần như giống nhau, và Zhipu cũng đóng góp rất nhiều cho hệ sinh thái mã nguồn mở mô hình lớn.

Bức thư nội bộ cho biết, Zhipu đã hoàn thành đúng tiến độ chiến lược đề ra từ đầu năm 2025, cụ thể là tháng 4 ra mắt một mô hình "giữ vững trận địa", giữa năm ra mắt một mô hình "lên bàn chơi" (trở thành one of the best), cuối năm ra mắt một mô hình Top 1.

Chiến lược trở lại nghiên cứu mô hình nền tảng toàn diện này là phản ứng của Zhipu trước tác động của DeepSeek. Ngày 23 tháng 12, mô hình nền tảng GLM-4.7 của Zhipu đã được ra mắt và mã nguồn mở, Chỉ số AI Artificial Analysis (AA) cho thấy GLM-4.7 xếp hạng nhất trong nước, đồng hạng sáu toàn cầu cùng Claude 4.5 Sonnet.

Ngoài việc ra mắt GLM-5, bức thư nội bộ còn cho biết ba hướng kỹ thuật trọng tâm của Zhipu vào năm 2026, bao gồm thiết kế kiến trúc mô hình hoàn toàn mới, mô hình RL (học tăng cường) phổ quát hơn và khám phá về khả năng học tập liên tục và tự tiến hóa của mô hình. Tất cả đều xoay quanh việc nâng cao năng lực mô hình nền tảng.

Khi năng lực mô hình nền tảng được nâng cao, Agent và các mô hình lớn lĩnh vực cuối cùng cũng sẽ kết hợp với mô hình nền tảng, thậm chí, AI cũng không nhất thiết phải tạo ra ứng dụng mới. "Ứng dụng của mô hình lớn cũng phải trở về nguyên lý đầu tiên." Đường Kiệt từng nói trên Weibo năm ngoái, 2026 sẽ là năm bùng nổ AI thay thế các ngành nghề khác nhau.

Năm 2025, Zhipu còn trải qua điều chỉnh tổ chức quy mô lớn, thu hẹp quy mô các đội ngũ To C, sản phẩm nghiên cứu và tạo video, các thành quả như AutoGLM lần lượt được mã nguồn mở.

Kể từ khi ChatGPT ra mắt, AI phát triển nhanh chóng trong hơn ba năm qua, "ngành này thực ra không có đồng thuận gì, mọi người chỉ đơn giản là đi về phía trước." Đường Kiệt nói trong một buổi giao lưu nội bộ.

Sau đây là toàn văn thư ngỏ của Đường Kiệt, Zhipu ủy quyền LatePost độc quyền đăng tải.

Làm AGI với tinh thần “cà phê”

Khi tới thăm ngắn hạn tại Đại học Khoa học và Công nghệ Hồng Kông, tôi tình cờ gặp Giáo sư Dương Cường tại quán cà phê tầng một của phòng thí nghiệm. Tôi nói mấy ngày nay uống cà phê nhiều quá, cảm thấy hơi nghiện, chắc phải cai bớt đi.

Thầy Dương nói: “Sao phải cai? Nghiện cũng chưa chắc là xấu, nếu chúng ta làm nghiên cứu mà cũng nghiện như uống cà phê, thì sao phải lo nghiên cứu không thành công?”

Đúng vậy, “nghiện” chính là điều làm nên sự thú vị của cuộc sống, dù là nghiên cứu hay việc gì khác, chỉ cần chuyên tâm, nỗ lực thì nhất định có thể làm tốt.

“Để máy móc suy nghĩ như con người” là tầm nhìn và lý tưởng xuyên suốt của Zhipu, cũng là mục tiêu duy nhất mà người Zhipu kiên trì phấn đấu.

Cuối năm 2018, dưới cảm hứng của lý thuyết hai hệ thống nhận thức của não người, chúng tôi đã thiết kế một hệ thống “nhận thức” của máy có cả suy nghĩ nhanh và suy nghĩ chậm. Năm 2019, chúng tôi chính thức thành lập Zhipu, bắt đầu thử nghiệm khám phá AGI, thực hiện tầm nhìn vĩ đại “để máy móc suy nghĩ như con người”.

Thách thức lớn nhất ở đây có lẽ là cho tới hôm nay, không ai, kể cả chúng tôi, có thể đưa ra một định nghĩa chính xác về AGI hoặc lộ trình kỹ thuật để thực hiện AGI, có lẽ đó cũng chính là sức hấp dẫn của việc khám phá AGI.

Chúng ta đang sống trong một thời khắc phi thường chưa từng có trong lịch sử, một thời điểm mà công nghệ một lần nữa thay đổi thế giới một cách đột phá. Mô hình lớn không chỉ là nền tảng then chốt của trí tuệ nhân tạo tổng quát mà còn hứa hẹn trở thành động cơ cốt lõi thúc đẩy cuộc cách mạng năng suất lao động.

Nhìn lại chặng đường đã qua, một lý do quan trọng để chúng tôi đi được tới hôm nay là luôn kiên trì làm công nghệ AI thực sự hữu ích cho người dùng. Chỉ có lý thuyết, công nghệ hoặc sản phẩm thực sự có người dùng mới trở thành thành tựu quan trọng trên con đường AGI. Tất nhiên, không phải đổi mới nào cũng thành công, chúng tôi cũng từng có nhiều dự án rủi ro thất bại, nhưng chính những thất bại đó đã dạy chúng tôi rút ra sức mạnh, giúp Zhipu mạnh mẽ hơn và có hiểu biết sâu sắc hơn về AGI. Quan trọng hơn, điều này khiến chúng tôi chú trọng thực dụng nhưng không chỉ nhìn vào lợi ích ngắn hạn: giúp người dùng, giúp đất nước, giúp tiến bộ khoa học công nghệ toàn cầu trở thành mục tiêu lâu dài của Zhipu.

Năm 2020, chúng tôi ra mắt kiến trúc thuật toán mô hình lớn GLM của riêng mình, bắt đầu thử nghiệm huấn luyện mô hình nền tảng với 10 tỷ tham số, mô hình rất thành công, được nhiều doanh nghiệp, trong đó có Meituan, thử nghiệm, đây là một thử nghiệm táo bạo, vì thời đó vẫn là thời kỳ của các mô hình nhỏ BERT thống trị. Nhưng thành công khi đó vẫn còn xa so với AGI trong mơ của chúng tôi. Một phần vì lượng kiến thức của mô hình chưa đủ lớn, phần khác là mô hình vẫn chưa biết suy luận như con người.

Giai đoạn 2021-2022, phát triển mô hình lớn khá trắc trở, đa số người không chấp nhận kế hoạch “để máy móc suy nghĩ như con người” kiểu như lên Mặt Trăng, cũng không nghĩ đây là cơ hội biến đổi công nghệ lớn, hoặc sợ thất bại. Chúng tôi vẫn quyết định mạo hiểm, dùng nhiều dữ liệu hơn để huấn luyện một mô hình lớn 130 tỷ tham số.

Quyết định này rất khó khăn vì không được ảnh hưởng đến tiến độ phát triển tổng thể của công ty. Chúng tôi thành lập hai nhóm đổi mới nhỏ chuyên trách, một nhóm phụ trách huấn luyện mô hình, sau này là bộ ba GLM của công ty; nhóm còn lại độc lập xây dựng nền tảng MaaS, thời điểm đó có thể hai nhóm không biết đến sự tồn tại của nhau. Giữa năm 2022, GLM-130B được huấn luyện xong, nhiều thiết kế tinh tế nhận được sự quan tâm toàn cầu; đồng thời nền tảng MaaS đi vào hoạt động, tức bigmodel.cn hiện tại, có những người dùng API thực sự đầu tiên. Sau đó, chúng tôi chính thức thành lập Viện AI trong công ty, chuyên nghiên cứu mô hình lớn thế hệ tiếp theo; thành lập bộ phận nền tảng MaaS, cung cấp dịch vụ API mô hình lớn ra bên ngoài. Đôi khi, chúng ta cần tìm được những người có ước mơ đủ táo bạo (thậm chí phải đầu tư nhiều sức lực để tìm người như vậy), một mục tiêu lớn táo bạo có thể quyết định một nửa thành công.

Năm 2023, tôi nói chuyện với một doanh nhân khởi nghiệp hàng đầu trong nước (thực ra anh ấy nhỏ tuổi hơn tôi khá nhiều) về AI có thể thay đổi tương lai như thế nào, chúng tôi nhất trí rằng AI sẽ thay đổi tìm kiếm, thay đổi trình duyệt, mang lại cho mỗi người một trợ lý AI hoàn toàn mới; thậm chí khi có trợ lý AI này rồi, chúng ta không cần cửa hàng ứng dụng nữa, ngược lại chúng ta có thể cần tạo một “cửa hàng API” cho AI, logic nền tảng của cửa hàng API này có thể là lật đổ hệ điều hành hiện tại; tiếp đó, có lẽ sự lật đổ lớn hơn chính là bản thân máy tính, bởi khi đó có thể chúng ta không cần một máy tính cho người dùng nữa, mà là một máy tính phù hợp cho AI.

Ý nghĩa của sự thay đổi này là vô hạn, vì nó sẽ tái cấu trúc hoàn toàn logic nền tảng của máy tính, thách thức nền tảng mà ngành máy tính đã sử dụng suốt 80 năm qua — hệ thống Von Neumann. Nói tới đây, chúng tôi đều cảm thấy rằng chúng tôi đầu tư cho AI vẫn còn quá ít, vẫn chưa thực sự “all-in”.

Thực tế cũng rất khắc nghiệt, “all-in” không chỉ cần niềm tin kiên định mà còn cần nguồn vốn và đội ngũ cực mạnh, càng cần dự đoán chính xác. Giai đoạn 2023-2024 là năm bùng nổ mô hình lớn toàn cầu, các ông lớn lần lượt “all-in” mô hình lớn, trong nước cũng bùng nổ khởi nghiệp, trăm mô hình tranh tài, các trợ lý AI mọc lên như nấm.

Khi đó, chúng tôi cũng có những sai lầm, cả về kỹ thuật lẫn kinh doanh. Xem xét lại, có thể nguyên nhân là trên con đường theo đuổi AGI, bản thân chúng tôi cũng từng lạc hướng, bị lợi ích ngắn hạn, sự sôi động trước mắt làm mờ mắt. AGI là một cuộc cách mạng công nghệ, công nghệ là bình đẳng, công khai, minh bạch, phải để mọi người đều có thể sử dụng và hưởng lợi.

Sự xuất hiện của DeepSeek đã cảnh tỉnh chúng tôi, Văn Phong khi khởi nghiệp năm 2023 từng nói chuyện với tôi, lúc đó tôi chưa nhận ra anh ấy kiên định với AGI đến vậy, cảm ơn anh ấy đã cho tôi nhiều suy nghĩ khác biệt. Lựa chọn theo đuổi kỹ thuật AGI một cách kiên định, không ngừng khám phá giới hạn trên của AGI, đồng thời dự đoán chính xác tương lai là điều Zhipu cần không ngừng cải tiến và nâng cao. Hai năm qua cho chúng tôi trải nghiệm rất nhiều, quan trọng là “học tăng cường” nhận thức về AGI, quản trị công ty và cạnh tranh thương mại.

Năm vừa qua, thực ra chúng tôi đã làm một lần "tăng cường" khá hệ thống. Chúng tôi đã đề ra khẩu hiệu “Kiên định” và “Thành tựu”, yêu cầu mọi người giữ vững kiên định, không kiêu ngạo, không nóng vội, không tự ti, hoàn thành tốt việc của mỗi người, thành tựu chính mình.

Đầu năm, mọi thứ đều khó khăn, hiệu quả mô hình không đạt kỳ vọng, cả nước cạnh tranh giá cả, muốn vượt lên phải tìm được điểm đột phá chính xác.

Chúng tôi kiên trì giữ vững trận địa, cuối cùng tìm ra Coding làm điểm đột phá.

Nếu nói việc ra mắt GLM-4.1 tháng 4 chỉ là một phép thử tượng trưng, thì việc ra mắt GLM-4.5 cuối tháng 7 gần như là một trận quyết chiến, toàn bộ đội ngũ kỹ thuật, nền tảng, kinh doanh đều hồi hộp, ngày đêm tăng ca, cuối cùng chúng tôi giành được chiến thắng hiếm có, sau đó GLM-4.6 và GLM-4.7 giúp năng lực mô hình của chúng tôi sánh ngang các mô hình hàng đầu quốc tế. GLM-4.7 của chúng tôi đạt SOTA trong các đánh giá như AA, Arena, cả về mã nguồn mở và mô hình trong nước, trải nghiệm thực tế về Coding và Agent phía người dùng cũng rất tốt, 150.000 lập trình viên ở 184 quốc gia trên thế giới sử dụng GLM Coding Plan, sau khi GLM-4.7 ra mắt, doanh thu ARR nền tảng MaaS vượt 500 triệu (trong đó doanh thu nước ngoài hơn 200 triệu), từ 20 triệu lên 500 triệu (gấp 25 lần) chỉ mất 10 tháng.

Tổng thể, phía mô hình chúng tôi đã hoàn thành đúng tiến độ chiến lược tổng thể đề ra từ đầu năm: tháng 4 ra mắt một mô hình "giữ vững trận địa", giữa năm ra mắt một mô hình "lên bàn chơi" (trở thành one of the best), cuối năm ra mắt mô hình Top 1. Điều này đặt nền móng quan trọng cho chúng tôi tiếp tục chinh phục đỉnh cao công nghệ AGI.

AI chủ quyền của chúng tôi cũng đã có bước tiến mới: nền tảng MaaS cấp quốc gia của Malaysia được xây dựng dựa trên mô hình mã nguồn mở Z.ai, GLM trở thành mô hình quốc dân của Malaysia. AI chủ quyền vươn ra nước ngoài là điều tôi được truyền cảm hứng sau khi tham dự buổi tọa đàm với Tổng Bí thư, nhưng thật lòng tôi cũng không biết nên làm như thế nào, đội ngũ quốc tế của chúng tôi dám nghĩ, dám làm, dám chịu trách nhiệm, hoàn thành cột mốc từ không đến có của mô hình lớn Trung Quốc ra nước ngoài. Về kinh doanh, chúng tôi dám cạnh tranh, tiếp tục hoàn thành mục tiêu tăng trưởng doanh thu gấp đôi mỗi năm.

Trong muôn vàn khó khăn và cơ hội, hôm nay, chúng tôi đã trở thành công ty mô hình lớn đầu tiên lên sàn toàn cầu theo một cách gần như không tưởng, điều này cho thấy thị trường công nhận giá trị công nghệ và thương mại của chúng tôi. “Make impossible possible” — bạn còn nhớ chúng tôi từng nói câu này không?

Năm qua, có lẽ sự thay đổi lớn nhất không phải là Zhipu, mà là một nhóm các bạn trẻ tuyến đầu, họ đã biến nhiều điều tưởng chừng không thể thành hiện thực.

Năm 2026, mục tiêu của công ty là trở thành doanh nghiệp mô hình lớn dẫn đầu quốc tế. Năm qua, mọi người bàn nhiều về mô hình lớn, phần lớn nói về ứng dụng, về hệ sinh thái.

Dựa trên nhận định này, năm 2026 chúng tôi sẽ tập trung vào:

GLM-5. GLM-5 sẽ sớm ra mắt, thông qua việc mở rộng quy mô và nhiều cải tiến công nghệ mới, tin rằng GLM-5 sẽ mang lại nhiều trải nghiệm mới mẻ, giúp AI hỗ trợ mọi người hoàn thành nhiều nhiệm vụ thực tế hơn.
Thiết kế kiến trúc mô hình hoàn toàn mới. Kiến trúc Transformer đã được sử dụng rộng rãi gần 10 năm đang bộc lộ nhiều hạn chế, như chi phí tính toán cho ngữ cảnh siêu dài, cơ chế ghi nhớ, cơ chế cập nhật... Tất cả đều cần khám phá kiến trúc mô hình hoàn toàn mới, tìm ra mô hình mở rộng mới, nâng cao hiệu suất tính toán thông qua thiết kế phối hợp chip-thuật toán.
RL có khả năng khái quát mạnh mẽ hơn. Hiện tại, mô hình RLVR chủ đạo đã thành công trong toán học và lập trình, nhưng hạn chế là phụ thuộc vào môi trường có thể xác minh do con người xây dựng ngày càng rõ. Năm nay cần khám phá mô hình RL phổ quát hơn, để AI không chỉ hoàn thành các nhiệm vụ cụ thể theo chỉ dẫn của con người mà còn hiểu và thực hiện các nhiệm vụ kéo dài hàng giờ, thậm chí hàng ngày.
Khám phá thách thức nhất là mở đường cho học tập liên tục và tự tiến hóa. Hiện tại, tất cả các mô hình AI chủ đạo đều có trí thông minh tĩnh sau khi triển khai. Chúng đạt được kiến thức thông qua một quá trình huấn luyện tốn kém duy nhất, sau đó dần lỗi thời trong ứng dụng. Điều này hoàn toàn khác với cách não bộ con người không ngừng học hỏi, tiến hóa từ tương tác với thế giới. Chúng tôi cần bố trí trước cho mô hình học tập thế hệ tiếp theo — học trực tuyến (Online Learning) hoặc học tập liên tục (Continual Learning).

Chúng tôi không phải là một công ty truyền thống, cũng không định trở thành một công ty như vậy. Chúng tôi muốn trở thành một công ty AI nguyên bản mà mọi thứ đều có thể xảy ra: xây dựng mô hình thế hệ tiếp theo không ngừng nâng cao giới hạn trí tuệ, phát triển sản phẩm lấy AI làm trung tâm phục vụ khách hàng. Chúng tôi muốn AI trở thành trợ lý đắc lực nhất cho mỗi người, giúp chúng ta hoàn thành nhiệm vụ. Chúng tôi cho rằng cần tận dụng AI để quản trị công ty nâng cao hiệu quả, công bằng hơn.

Theo thời gian, một công ty thường quen làm những việc giống nhau, cải tiến dần dần, điều này sẽ hạn chế sức sáng tạo của chúng ta. Nhưng trong thời đại AI, mọi thứ đều mang tính cách mạng, chúng ta cần có chút “không thoải mái” để duy trì sức sáng tạo, mới có thể đưa ra ý tưởng đột phá thúc đẩy lĩnh vực tăng trưởng lớn tiếp theo.

Vì vậy, chúng tôi đã thành lập một bộ phận mới trong Zhipu là X-Lab, bộ phận này sẽ tập trung thu hút nhiều bạn trẻ hơn với phương thức mở, làm các nghiên cứu tiên phong, gồm kiến trúc mô hình mới, mô hình nhận thức mới, ươm mầm dự án mới, không giới hạn phần mềm hay phần cứng. Đồng thời, chúng tôi cũng sẽ mở rộng đầu tư ra ngoài, không chỉ liên kết chiến lược với các doanh nghiệp đã đầu tư, mà còn mở rộng lãnh địa mới, giúp toàn ngành kết nối, hệ sinh thái cùng phát triển. Ở X-Lab, sứ mệnh của mỗi người là đổi mới mang tính đột phá hoàn toàn, cuối cùng quay về tuyến chính của AGI.

Hôm nay là ngày đầy cảm xúc trong cuộc đời Zhipu, là một cột mốc quan trọng trong lịch sử Zhipu, cũng là sự khởi đầu cho một kỷ nguyên mới của Zhipu. Tôi rất thích thương hiệu Z.ai, Z là chữ cái cuối cùng của bảng chữ cái, tượng trưng cho đích đến cuối cùng, chúng tôi hy vọng trong hành trình khám phá AGI sẽ đi tới đích cuối cùng của trí tuệ, đó là mục tiêu mà chúng tôi nỗ lực hướng tới. Chúng tôi rất phấn khích:

- Có một sự nghiệp đầy tham vọng, thay đổi thế giới

- Hướng tới lợi ích lâu dài, nhìn về tương lai

- Tập trung hơn nữa, khám phá bản chất của AGI

- Dùng AI giúp các doanh nhân và doanh nghiệp phát triển mạnh mẽ

- Nắm bắt cơ hội phát triển doanh nghiệp bằng dự đoán chính xác hơn

- Cuối cùng, hy vọng chúng tôi có thể mang lại một AI khác biệt cho xã hội loài người, thực sự thúc đẩy sự tiến bộ của phúc lợi nhân loại.

Đây là một khoảnh khắc vui sướng vô song, niềm vui này không phải là dopamine nhất thời, mà là endorphin tích lũy trên con đường khám phá AGI, giúp chúng tôi tập trung hơn, vững vàng tiến bước!

Đường Kiệt

2026.1.8

Ảnh tiêu đề: "Dune 2"

- FIN -

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 3

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 4

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 5

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 6

LatePost độc quyền | Zhiyu lên sàn, Tang Jie gửi thư nội bộ yêu cầu toàn diện quay lại nghiên cứu mô hình cơ sở image 7

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Khóa ngay!