Sáng nay (14/3), Tập đoàn Meta cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC) khởi động Chương trình Thách thức Đổi mới sáng tạo 2025, đánh dấu năm thứ ba triển khai chương trình với mục tiêu thúc đẩy phát triển trí tuệ nhân tạo (AI) tại Việt Nam.
Tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao
Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển Al; đồng thời, góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.
Chương trình Thách thức Đổi mới sáng tạo 2025 tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao.
Ông Võ Xuân Hoài, Phó Giám đốc NIC cho biết, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
"Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI trên thế giới", ông Hoài nói.
Ông Sarim Aziz, Giám đốc Chính sách Công tại Meta chia sẻ, năm 2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam. Meta vinh dự được hợp tác cùng Trung tâm Đổi mới sáng tạo Quốc gia và Tổ chức AI for Vietnam Foundation với Dự án ViGen.
"Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam tiếp cận những mô hình AI mã nguồn mở như: Llama cùng các nguồn lực phù hợp với bối cảnh địa phương, chúng tôi mong muốn giúp họ phát huy tối đa tiềm năng và thúc đẩy các sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam", Giám đốc Sarim Aziz thông tin.
Giáo sư Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta, người được mệnh danh là một trong những cha đẻ của AI, đánh giá, dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.
Trong khi đó, ông Chris Lewin, Giám đốc Năng lực AI & Dữ liệu khu vực châu Á - Thái Bình Dương, Deloitte cho biết khi châu Á - Thái Bình Dương trải qua quá trình chuyển đổi số mạnh mẽ, Al mã nguồn mở đang trở thành một động lực quan trọng trong việc định hình tương lai của lĩnh vực công. "Chúng tôi vui mừng được hợp tác cùng Meta nhằm trang bị cho các cơ quan trong lĩnh vực này những đề xuất mang tính thực tiễn cao trong việc áp dụng AI thế hệ mới (Gen AI), dựa trên những nguyên tắc minh bạch và đáng tin cậy về AI", ông Chris Lewin cho hay.
Khai phá tiềm năng cùng LIama
Bên cạnh Dự án ViGen, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đối mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với Al mã nguồn mở: Khai phá tiềm năng đột phá cùng LIama".
Dự án ViGen được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển Al.
Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ Al mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.
Theo ông Trần Việt Hùng, nhà sáng lập & CEO, Tổ chức Al for Vietnam, dự án ViGen sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện hiện trạng tiếng Việt đang bị coi là một ngôn ngữ còn hiện diện hết sức khiêm tốn trong Al. Dự án ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động toàn cầu có tính đến ngữ cảnh của tiếng Việt.
Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Tập đoàn Meta, NIC và tổ chức "Al for Vietnam"; trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. Al for Vietnam là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Sứ mệnh của VIC 2025 - dự án ViGen là làm cho các mô hình Al hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam.
ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình Al. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển Al ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái Al mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.
Nhằm hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình Al và Dữ liệu vì lợi ích cộng đồng của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của Al.
Nguồn: https://www.baogiaothong.vn/meta-ho-tro-xay-dung-bo-du-lieu-tieng-viet-ma-nguon-mo-chat-luong-cao-192250314115403619.htm
Bình luận (0)