Sự quan tâm của thế giới đối với AI đang ngày một gia tăng với những chú ý tập trung nhiều nhất vào các quốc gia sở hữu nhiều mô hình AI hàng đầu thế giới như Mỹ và Trung Quốc. Là một trong những khu vực kinh tế quan trọng của thế giới, Đông Nam Á đang dần trở thành điểm nóng mới về AI với các bước tiến lớn có thể khiến các nhà hoạch định chính sách, nhà đầu tư và chuyên gia công nghệ toàn cầu quan tâm.
![]() |
Việt Nam đã có mô hình AI nội địa, là một trong số ít mô hình AI phát triển từ đầu tại khu vực Đông Nam Á hiện nay. Ảnh: Zalo. |
Tại Việt Nam, Đảng và Chính phủ cũng đang quyết tâm trong việc định hình và thúc đẩy kỷ nguyên phát triển công nghệ của đất nước, thể hiện thông qua Nghị quyết 57-NQ/TW về Đột phá phát triển Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Định hướng này đã tạo động lực mạnh mẽ cho các doanh nghiệp công nghệ trong nước đầu tư và khai thác tiềm năng của công nghệ tiên tiến toàn cầu.
Hiện tại, Việt Nam đã trở thành một trong số ít quốc gia tại khu vực Đông Nam Á sở hữu mô hình ngôn ngữ lớn (LLM) nội địa. Cụ thể, từ năm 2023, Zalo đã huấn luyện thành công và cho ra mắt mô hình LLM tập trung vào tiếng Việt, được nghiên cứu và phát triển hoàn toàn bởi đội ngũ kỹ sư người Việt.
Chọn huấn luyện từ đầu và kết quả bất ngờ
Các mô hình AI hiện nay có 2 kỹ thuật huấn luyện bao gồm kỹ thuật tinh chỉnh (fine-tuned model) - tối ưu các LLM đã được huấn luyện trước đó để tạo ra LLM mới phục vụ mục đích chuyên biệt và kỹ thuật huấn luyện từ đầu (from-scratch model) - triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định.
Trong đó, việc tinh chỉnh được nhiều doanh nghiệp lựa chọn bởi những ưu điểm như dễ triển khai, tiết kiệm tài nguyên và có thể cho hiệu quả tốt hơn. Đặc biệt, trong bối cảnh mà thiết bị huấn luyện và dữ liệu gần như là thách thức khó vượt qua ở Việt Nam thì kỹ thuật tinh chỉnh được xem là một giải pháp ưu việt.
Tuy vậy, Zalo lại lựa chọn kỹ thuật huấn luyện từ đầu. Với kỹ thuật huấn luyện này, toàn bộ quá trình huấn luyện và mô hình đều do người Việt làm chủ và kiểm soát hoàn toàn, giúp Việt Nam có tên ở khu vực Đông Nam Á là một trong số ít quốc gia có LLM nội địa.
Tại thời điểm ra mắt vào năm 2023, mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt đầu tiên của Zalo đã đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn đánh giá năng lực LLM tiếng Việt VMLU. Đáng chú ý, thời gian huấn luyện chỉ mất 6 tháng, rút ngắn rất nhiều so với dự kiến ban đầu là 18 tháng. Quá trình huấn luyện nhanh chóng này gây bất ngờ cho chính cả đội ngũ phát triển ở Zalo.
Mô hình LLM của Zalo đứng thứ 3 trong thử thách Kahoot, xếp sau 1 người chơi thật và GPT 4 trong lần đầu ra mắt năm 2023. Ảnh: Zalo. |
Năm 2024, mô hình với 13 tỷ tham số của Zalo chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft), chỉ xếp sau Llama-3-70B (Meta) trên bảng xếp hạng năng lực tiếng Việt LLM của VMLU.
![]() |
Bảng xếp hạng Top 10 các mô hình xây dựng từ đầu của nền tảng đánh giá VMLU năm 2024. Ảnh: Zalo. |
Kết quả cho thấy trình độ huấn luyện mô hình ngôn ngữ lớn không thua kém so với thế giới để phát triển một mô hình AI của riêng Việt Nam, nhất là trong bối cảnh phát triển ban đầu gặp nhiều khó khăn.
Nỗ lực phát triển mô hình AI của người Việt
Có 3 vấn đề cốt lõi khi huấn luyện LLM là thiết bị huấn luyện, dữ liệu và trình độ kỹ thuật thì Việt Nam đã gặp trở ngại ở cả ba. Trước đây, trong khi các công ty lớn trên thế giới đã sở hữu hàng nghìn GPU hiệu năng cao mới nhất từ Nvidia thì tại Việt Nam, các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết. Cùng lúc đó, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Nguồn lực con người và kinh nghiệm huấn luyện LLM của Việt Nam cũng còn nhiều hạn chế khi so sánh với các quốc gia phát triển.
Đội ngũ Zalo khi ấy đã phải nghiên cứu và thực nghiệm trên các GPU dân dụng nhỏ để tranh thủ trang bị kiến thức và năng lực huấn luyện LLM, sẵn sàng ngay khi có hạ tầng tính toán lớn. Các chip huấn luyện về AI khan hiếm nên dù đã đặt mua 8 máy chủ DGX H100 của Nvidia thì Zalo cũng không thể sở hữu cùng lúc các thiết bị mà phải chờ từng đợt bàn giao từ nhà sản xuất. Do vậy, việc tối ưu cho hạ tầng tính toán chưa hoàn thiện để tranh thủ thời gian huấn luyện cũng là một bài toán mà đội ngũ Zalo phải giải quyết.
Đồng thời, dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt.
![]() |
TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI. Ảnh: Zalo. |
“Dù xuất phát điểm gặp nhiều khó khăn so với các công ty lớn trên thế giới, nhưng Zalo vẫn quyết định nhập cuộc chơi từ sớm với mục tiêu phát triển thành công mô hình AI của riêng Việt Nam. Chúng tôi đã tham vấn kinh nghiệm từ các nhà nghiên cứu, kỹ sư tại nhiều viện nghiên cứu hàng đầu trên thế giới để có chiến lược phát triển phù hợp. Những dấu mốc thành công tới hiện tại là động lực để các kỹ sư Zalo tiếp tục tối ưu mô hình lớn hơn về lượng và tốt hơn về chất. Đồng thời khai thác tính ứng dụng để tạo ra nhiều sản phẩm AI đẳng cấp thế giới cho người dùng Việt”, TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI, cho biết.
![]() |
Máy chủ DGX H100 Zalo đặt mua của Nvidia. Ảnh: Zalo. |
Nhờ sự ứng biến linh hoạt trong giai đầu phát triển khó khăn, Zalo từng bước đạt được những dấu mốc thành công, tiến tới làm chủ công nghệ AI toàn cầu như hiện nay.
Hiện mô hình AI của Zalo không chỉ thành công trên khía cạnh nghiên cứu huấn luyện, mà còn đang được đưa vào ứng dụng, thúc đẩy việc tiếp cận và khai thác giá trị từ công nghệ mới tiên tiến cho người Việt.
Đầu năm 2025, Zalo ra mắt Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên nền tảng nhắn tin Zalo. Trợ lý hỗ trợ hỏi đáp các chủ đề khác nhau trong cuộc sống, sáng tạo nội dung và giải trí. Theo thống kê của Zalo, trợ lý Kiki Info đã có đến 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong chưa đầy 2 tháng.
![]() |
Mô hình LLM của Zalo được ứng dụng để phát triển Trợ lý Kiki Info. Ảnh: Zalo. |
Một ứng dụng khác của mô hình LLM của Zalo là thiệp AI cũng chạm mốc 15 triệu thiệp được khởi tạo và gửi đi chỉ trong 2 tháng. Đây là ứng dụng được đông đảo người dùng Zalo quan tâm để gửi những lời chúc tới người thân, bạn bè trong các dịp lễ quan trọng.
Hiện các ứng dụng từ mô hình ngôn ngữ lớn vẫn đang tiếp tục được Zalo mở rộng phát triển, hứa hẹn mang lại nhiều giá trị hữu ích cho người dùng trong nước.
Nguồn: https://znews.vn/viet-nam-da-co-mo-hinh-ai-do-nguoi-viet-lam-chu-post1560653.html
Bình luận (0)