Trang chủKhoa học - Công nghệCông nghệ sốMeta hỗ trợ xây dựng bộ dữ liệu tiếng Việt mã nguồn...

Meta hỗ trợ xây dựng bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao

Sáng nay (14/3), Tập đoàn Meta cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC) khởi động Chương trình Thách thức Đổi mới sáng tạo 2025, đánh dấu năm thứ ba triển khai chương trình với mục tiêu thúc đẩy phát triển trí tuệ nhân tạo (AI) tại Việt Nam.

Tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao

Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển Al; đồng thời, góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.

Meta hỗ trợ xây dựng bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao- Ảnh 1.

Chương trình Thách thức Đổi mới sáng tạo 2025 tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao.

Ông Võ Xuân Hoài, Phó Giám đốc NIC cho biết, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

“Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI trên thế giới”, ông Hoài nói.

Ông Sarim Aziz, Giám đốc Chính sách Công tại Meta chia sẻ, năm 2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam. Meta vinh dự được hợp tác cùng Trung tâm Đổi mới sáng tạo Quốc gia và Tổ chức AI for Vietnam Foundation với Dự án ViGen.

“Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam tiếp cận những mô hình AI mã nguồn mở như: Llama cùng các nguồn lực phù hợp với bối cảnh địa phương, chúng tôi mong muốn giúp họ phát huy tối đa tiềm năng và thúc đẩy các sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam”, Giám đốc Sarim Aziz thông tin.

Giáo sư Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta, người được mệnh danh là một trong những cha đẻ của AI, đánh giá, dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.

Trong khi đó, ông Chris Lewin, Giám đốc Năng lực AI & Dữ liệu khu vực châu Á – Thái Bình Dương, Deloitte cho biết khi châu Á – Thái Bình Dương trải qua quá trình chuyển đổi số mạnh mẽ, Al mã nguồn mở đang trở thành một động lực quan trọng trong việc định hình tương lai của lĩnh vực công. “Chúng tôi vui mừng được hợp tác cùng Meta nhằm trang bị cho các cơ quan trong lĩnh vực này những đề xuất mang tính thực tiễn cao trong việc áp dụng AI thế hệ mới (Gen AI), dựa trên những nguyên tắc minh bạch và đáng tin cậy về AI”, ông Chris Lewin cho hay.

Khai phá tiềm năng cùng LIama

Bên cạnh Dự án ViGen, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên “Đối mới sáng tạo trong khu vực công ở châu Á – Thái Bình Dương với Al mã nguồn mở: Khai phá tiềm năng đột phá cùng LIama”. 

Meta hỗ trợ xây dựng bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao- Ảnh 2.

Dự án ViGen được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển Al.

Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ Al mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.

Theo ông Trần Việt Hùng, nhà sáng lập & CEO, Tổ chức Al for Vietnam, dự án ViGen sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện hiện trạng tiếng Việt đang bị coi là một ngôn ngữ còn hiện diện hết sức khiêm tốn trong Al. Dự án ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động toàn cầu có tính đến ngữ cảnh của tiếng Việt.

Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Tập đoàn Meta, NIC và tổ chức “Al for Vietnam”; trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. Al for Vietnam là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Sứ mệnh của VIC 2025 – dự án ViGen là làm cho các mô hình Al hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam.

ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình Al. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển Al ở Việt Nam phù hợp với giá trị văn hóa và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái Al mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.

Nhằm hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình Al và Dữ liệu vì lợi ích cộng đồng của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của Al.



Nguồn: https://www.baogiaothong.vn/meta-ho-tro-xay-dung-bo-du-lieu-tieng-viet-ma-nguon-mo-chat-luong-cao-192250314115403619.htm

Cùng chủ đề

AI đang tiến gần hơn tới trí tuệ con người

Tại hội nghị công nghệ GTC vừa diễn ra, Nvidia – gã khổng lồ trong lĩnh vực sản xuất chip – đã gây ấn tượng mạnh khi công bố nền tảng chip AI mới mang tên Blackwell Ultra....

2.000 học sinh TP Thủ Đức “Vui học

(NLĐO) - 2.000 học sinh của TP Thủ Đức đã có dịp tìm hiểu, trải nghiệm, tham gia các thử thách về khoa học, công nghệ, kỹ thuật, trí tuệ nhân tạo (AI)... ...

Chó robot ‘vờn’ chó nghiệp vụ gây sốt ở Đà Nẵng

TPO - Chú chó robot biết chạy nhảy, đứng ngồi, thậm chí chọc ghẹo như chó thật đang gây sốt tại Đà Nẵng. Đặc biệt, sau đoạn clip chó robot vờn chú chó nghiệp vụ, rất đông bạn trẻ, các gia đình dẫn con đến xem tận mắt chú chó AI này. 29/03/2025 | 10:46 ...

Elon Musk đã bán mạng xã hội X

(CLO) Tối 28/3, Elon Musk thông báo đã bán mạng xã hội X cho công ty trí tuệ nhân tạo xAI của chính mình với giá 45 tỷ USD. ...

Nổi bật

Mới nhất

Cùng tác giả

Đường sắt tăng nhiều tàu khách dịp nghỉ lễ 30/4

Đường sắt chạy thêm nhiều tàu khách phục vụ người dân đi lại dịp nghỉ lễ 30/4 - 1/5 trên các tuyến. ...

Điểm danh 9 dự án đường sắt quốc gia đầu tư trước 2030

Cục Đường sắt VN cho biết, từ nay đến năm 2030 dự kiến khởi công 9 dự án đường sắt quốc gia trên toàn mạng lưới. ...

Lại xảy ra động đất ở Kon Tum

Ngày 30/3, Trung tâm báo tin động đất và cảnh báo sóng thần - Viện Vật lý địa cầu cho biết đang theo dõi một trận động đất xảy ra tại vùng núi Kon Tum có độ lớn 3,3 độ Richter. ...

Không để sai chồng sai khi xử lý các dự án kéo dài, tồn đọng

Liên quan đến các dự án đang kéo dài, tồn đọng, Thủ tướng lưu ý, trong quá trình giải quyết, trách nhiệm của các cá nhân, tập thể được làm rõ tới đâu thì xử lý tới đó; không để sai chồng sai, không tạo tiền lệ cho các sai phạm tiếp theo. ...

Đề xuất gần 1.200 tỷ đồng đầu tư hoàn thiện hầm xuyên núi trên cao tốc Cam Lâm

Theo phương án đề xuất, dự án đầu tư hoàn thiện hầm Núi Vung trên tuyến cao tốc Bắc - Nam đoạn Cam Lâm - Vĩnh Hảo cần khoảng gần 1.200 tỷ đồng. ...

Bài đọc nhiều

Lần đầu tiên phóng thiết bị bay không người lái vào tâm bão

Các nhà nghiên cứu thuộc Cục Quản lý khí quyển và hải dương quốc gia Mỹ (NOAA) vừa thực hiện một nhiệm vụ đột phá, mang tính dấu mốc khi phóng các thiết bị bay không người lái bay sâu vào tâm bão để thu thập dữ liệu khí tượng về cách thức cơn bão hình thành và mạnh lên.

Thực hư hành trình tìm lại nguồn gốc của những đứa trẻ bị ‘đánh cắp’ ở Chile

Công nghệ hiện đại giúp hàng nghìn người Chile, được nhận nuôi bất hợp pháp từ thời Pinochet, tìm kiếm và liên lạc với gia đình ruột thịt của họ sau nhiều thập kỷ xa cách.

TP Hồ Chí Minh: Cấp thiết thành lập trung tâm dữ liệu dự phòng

Chiều 26/6, Trung tâm Chuyển đổi số TP Hồ Chí Minh đã phối hợp với Chi hội An toàn thông tin phía Nam tổ chức hội thảo “Mô hình và phương án lựa chọn Trung tâm dữ liệu dự phòng Thành phố”. ...

Cùng chuyên mục

Doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng

DNVN - Phát biểu chỉ đạo Hội nghị Thủ tướng Chính phủ làm việc với doanh nghiệp Nhà nước tiên phong trong chuyển đổi số và thúc đẩy tăng trưởng, ngày 15/4, Thủ tướng Phạm Minh Chính yêu cầu doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng. ...

33,3% dân số ở Hàn Quốc sử dụng AI tạo sinh

Theo khảo sát của Chính phủ Hàn Quốc, 33,3% dân số đã sử dụng AI tạo sinh như ChatGPT trong năm 2024.

Phát triển dữ liệu để đưa Việt Nam trở thành quốc gia số

Chuyển đổi số, với dữ liệu là trung tâm đang làm thay đổi căn bản cách chúng ta sống, làm việc và phát triển. Việt Nam cần làm gì để tiếp cận cơ hội này?.

Mới nhất

Tăng trưởng kinh doanh mạnh mẽ, doanh thu tăng 22%, đột phá về AI

(Thành phố Hồ Chí Minh – Ngày 03 tháng 4 năm 2025) – Công ty Cổ phần VNG (VNG) vừa công bố kết quả tài chính đã được kiểm toán cho năm tài chính 2024. Trong bối cảnh toàn cầu nhiều biến động, công ty vẫn ghi nhận mức tăng trưởng doanh thu thuần ấn tượng 22%, đạt...

Tin tức doanh nghiệp-Bắt nhịp kỷ nguyên công nghệ, nhiều đơn vị công an triển khai hoạt động trên không gian số

Hàng loạt đơn vị công an trên cả nước đang tiên phong ứng dụng Zalo Official Account (OA) và Zalo Mini App để kết nối với người dân, nâng cao hiệu quả quản lý nhà nước và thúc đẩy chuyển đổi số.Đây là bước đi thiết thực, thể hiện tinh thần Nghị quyết 57-NQ/TW ngày 22/12/2024 của Bộ...

Báo cáo-Báo cáo kết quả hoạt động năm 2024

VNG Snapshot FY.2024 trình bày tóm lược các chỉ số tài chính và những thông tin xoay quanh hiệu quả hoạt động, chiến lược kinh doanh của VNG, các mảng sản phẩm cho năm tài chính 2024.Trong năm 2024, bên cạnh việc đẩy mạnh các mũi nhọn chiến lược như AI, VNG tiếp tục đảm bảo trách nhiệm...

Tin tức doanh nghiệp-VNG được vinh danh tại Lễ tôn vinh & Phong đẳng cấp Thể thao điện tử 2025

Ngày 06/04/2025, VNG đã nhận bằng khen của Ủy ban Olympic nhờ những nỗ lực nổi bật trong việc phát triển Thể thao điện tử (eSports) và thúc đẩy phong trào Olympic tại Việt Nam năm 2024. Tại Lễ Tôn vinh & Phong đẳng cấp Thể thao Điện tử 2025 do Hiệp hội Thể thao điện tử Giải trí...

Tin tức doanh nghiệp-VNG lần thứ 3 tham gia Vietnam Game Awards 2025 với 53 đề cử

Tại vòng sơ loại Vietnam Game Awards 2025, VNGGames và Zalopay đang dẫn đầu với  53 đề cử cùng hơn 320.000 lượt bình chọn từ cộng đồng chỉ trong 3 tuần, khẳng định sức hút mạnh mẽ của hệ sinh thái giải trí và thanh toán số VNG.Cụ thể, Zalopay dẫn đầu hạng mục Kênh thanh toán yêu...

Mới nhất