Trang chủKhoa học - Công nghệCông nghệ sốZalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng...

Zalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí


VMLU (Vietnamese Multitask Language Understanding) do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt.

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau.

zalo ai.jpg
Bộ tiêu chuẩn đánh giá năng lực tiếng Việt được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu, vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh?

Sự phát triển bùng nổ của ChatGPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm ChatGPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tự như ChatGPT ra đời.

Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu với quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Trên thị trường hiện nay, hầu hết các nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình.

Tạo động lực cho AI Việt Nam gia nhập làn sóng Generative AI thế giới

Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU. Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt.

Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới.

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì?

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: Dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt.

Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp – cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp.

Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản.

Đóng góp cho cộng đồng AI Việt Nam

Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.

Trước đó, Zalo AI đã thực hiện, triển khai và tổ chức hàng loạt các cuộc thi, chương trình cho cộng đồng AI Việt Nam như: Zalo AI Challenge, Zalo AI Hackathon, Zalo AI Summit… Những hoạt động này không chỉ tạo sân chơi cho cộng đồng AI Việt mà còn khuyến khích việc ứng dụng AI vào cuộc sống, giải quyết các bài toán cấp thiết của xã hội, phục vụ cho nhu cầu của hàng triệu người Việt Nam.

Tiến sĩ Châu Thành Đức, Trưởng bộ phận nghiên cứu Zalo AI – Giảng viên Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP Hồ Chí Minh khẳng định: “Zalo AI luôn hướng tới sự đóng góp cho cộng đồng AI Việt Nam, tạo động lực để AI Việt Nam phát triển. Từ đó, kỳ vọng ngày càng có nhiều sản phẩm AI của người Việt, cho người Việt”.



Nguồn

Cùng chủ đề

Kiki Auto chính thức đạt 1 triệu lượt cài đặt trên ô tô

Ra mắt vào tháng 12/2020, sau 4 năm phát triển, trợ lý ảo “make-in-Vietnam” - Kiki Auto đã chính thức cán mốc 1 triệu lượt cài đặt và sử dụng trên ô tô. Ra mắt vào tháng 12/2020, Trợ lý ảo AI tiếng Việt của Zalo AI ghi nhận trung bình gần 1.100 lượt cài đặt và sử dụng mỗi ngày trong năm 2024, cá biệt có thời điểm lên tới gần 2000 lượt. Theo đánh giá từ cộng đồng...

Adtima và Zalo AI thắng lớn tại Vietnam MMA SMARTIES 2024 nhờ chiến lược “AI-first”

Tại lễ trao giải MMA SMARTIES Vietnam 2024 ngày 25/10/2024, nền tảng tiếp thị di động - Adtima cùng Zalo AI đã xuất sắc giành ba giải thưởng ở hạng mục “AI Marketing” và “Industry Awards.” nhờ những nỗ lực ứng dụng AI trong Marketing sáng tạo và hiệu quả. Chiến dịch “Mang Tết về nhà, Sống trọn khoảnh khắc” của Pepsi hợp tác cùng Adtima trong dịp Tết 2024 đã xuất sắc giành giải Vàng ở hạng mục “AI-Powered...

Zalo ra mắt tính năng giúp gửi hàng triệu thông điệp ý nghĩa dịp 20/10

Thành phố Hồ Chí Minh, ngày 18 tháng 10 năm 2024 - Nhằm hỗ trợ người dùng gửi đi vô vàn thông điệp ý nghĩa trong ngày Phụ nữ Việt Nam 20/10, Zalo mới đây đã cho ra mắt những tính năng thú vị giúp người dùng có thể thỏa sức sáng tạo với nhiều cách chúc mừng 20/10 đặc biệt. Người dùng Zalo có thể khám phá tính năng “Cùng Zalo chúc mừng 20/10” ngay trong phần “Nhật ký"...

Con người-Kỹ sư “GenZ” của Zalo AI giới thiệu nghiên cứu tại hội nghị khoa học hàng đầu thế giới

Công trình nghiên cứu giúp tăng độ chính xác của các mô hình nhận dạng tiếng nói trong thời gian thực (Streaming Automatic Speech Recognition) của Lê Duy Khánh - kỹ sư “GenZ” của Zalo AI - sẽ lần đầu được công bố tại Hội nghị khoa học quốc tế, diễn ra tại Hy Lạp vào tháng 9/2024 tới đây. Với đề tài "Improving Streaming Speech Recognition With Time-Shifted Contextual Attention And Dynamic Right Context Masking (Cải thiện nhận dạng...

Cách tạo ảnh phong cách Euro với Zalo AI ấn tượng nhất

Bạn đã biết cách tạo ra một ảnh độc đáo để chia sẻ với bạn bè thể hiện niềm đam mê bóng đá của mình chưa? Cùng tạo ảnh phong cách Euro với Zalo AI qua bài viết!

Nổi bật

Mới nhất

Cùng tác giả

Danh sách học sinh các tỉnh lọt đội tuyển dự thi Olympic quốc tế năm 2025

Bộ GD-ĐT vừa công bố kết quả kỳ thi chọn đội tuyển quốc gia dự thi Olympic quốc tế và khu vực năm 2025. Theo đó, có 37 học sinh lọt vào danh sách này. Từ ngày 25 - 27/3, Bộ GD-ĐT tổ chức kỳ thi chọn đội tuyển quốc gia dự thi Olympic quốc tế và khu vực năm 2025. Kỳ thi năm nay có sự tham gia của 187 thí sinh đến từ các tỉnh, thành phố trên...

Nghệ sĩ Việt viếng nhạc sĩ Lư Nhất Vũ – tác giả ‘Cô gái Sài Gòn đi tải đạn’

Lễ tang nhạc sĩ Lư Nhất Vũ được tổ chức tại Nhà tang lễ Quốc gia phía Nam (TP.HCM). Các nghệ sĩ Việt ở nhiều thế hệ đến tiễn biệt ông. Lễ tang nhạc sĩ Lư Nhất Vũ được tổ chức tại Nhà tang lễ Quốc gia phía Nam (TP.HCM). Các nghệ sĩ Việt ở nhiều thế hệ đến tiễn biệt ông. Chiều 30/3, lễ tang nhạc sĩ Lư Nhất Vũ diễn ra trang trọng, ấm áp tại Nhà tang lễ...

Đại diện duy nhất của Việt Nam lọt top 100 món rau ngon nhất thế giới

Rau muống xào tỏi mới đây đã được vinh danh là một trong 100 món rau ngon nhất thế giới, theo chuyên trang ẩm thực nổi tiếng Taste Atlas. Theo đó, món ăn dân dã của Việt Nam được đánh giá 4,3/5 sao và đứng thứ 24 trong danh sách. Taste Atlas mô tả rau muống xào tỏi là món ăn truyền thống của Việt Nam, đặc biệt phù hợp với những người ăn chay. Tuy chỉ sử dụng những nguyên...

Xem lịch tổ chức họp Đại hội đồng cổ đông các ngân hàng

Mùa Đại hội cổ đông thường niên của các ngân hàng thương mại đã bắt đầu, tập trung chủ yếu trong tháng 4/2025. Đến nay, các ngân hàng TMCP đã chốt ngày tổ chức đại hội. Các ngân hàng VIB, Nam A Bank và NCB đã tổ chức thành công Đại hội đồng cổ đông thường niên năm 2025 lần lượt vào các ngày 27, 28 và 29/3.  Theo đó, đại hội đồng cổ đông (ĐHĐCĐ) VIB đã thông qua kế...

Vietlott lại tìm được vé số trúng độc đắc gần 57 tỷ đồng

Một tấm vé số trúng giải độc đắc Jackpot của loại hình xổ số Mega 6/45 trị giá gần 57 tỷ đồng vừa được Vietlott tìm ra. Theo thông tin từ Công ty Xổ số Điện toán Việt Nam (Vietlott), trong kỳ quay số mở thưởng lần thứ 1.334 của sản phẩm Mega 6/45 diễn ra tối nay (30/3), hội đồng quay thưởng của Vietlott đã tìm ra 1 vé số trúng giải Jackpot với trị giá   56.741.982.500 đồng...

Bài đọc nhiều

Tác chiến điện tử Nga khiến Mỹ và đồng minh ‘giật mình’

Cuộc chiến Nga - Ukraine khiến Mỹ và phương Tây giật mình đánh giá lại tác chiến điện tử (EW), lĩnh vực nhiều năm họ đã “lãng quên” khi chỉ phải đối đầu với tay súng địa phương Iraq hay khủng bố Taliban. Hãng thông tấn Ria Novosti gần đây đưa tin máy bay tấn công tầm xa hai động cơ Sukhoi Su-34 của Nga, có biệt danh “Fullback” vừa được nâng cấp khả năng bảo vệ mới chống...

Lộ diện “siêu vũ khí tương lai” của Nga

Bom lượn Drel sẽ trở thành siêu vũ khí tương lai, Đại tá quân đội đã nghỉ hưu Viktor Litovkin cho truyền thông Nga biết.

Panasonic kiện Xiaomi và Oppo tại Trung Quốc và châu Âu

Vụ kiện mới nhất giữa Panasonic và Xiaomi, Oppo liên quan đến công nghệ truyền thông không dây, theo Panasonic. Công ty cho biết đây là lần đầu họ thấy cần phải hành động vì các bằng sáng chế tiêu chuẩn thiết yếu của mình. Hãng điện tử Nhật Bản nói thêm, họ đã đạt thỏa thuận cấp phép với các nhà sản xuất smartphone khác nhưng không thể đi đến đồng thuận với Xiaomi, Oppo “sau nhiều năm...

Gần 1 triệu thuê bao di động sẽ bị thu hồi sau ngày 15/5

Đến ngày 15/5, những thuê bao di động có thông tin không trùng khớp với cơ sở dữ liệu quốc gia về dân cư và chưa được chuẩn hóa thông tin sẽ bị thu hồi.

Cùng chuyên mục

Doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng

DNVN - Phát biểu chỉ đạo Hội nghị Thủ tướng Chính phủ làm việc với doanh nghiệp Nhà nước tiên phong trong chuyển đổi số và thúc đẩy tăng trưởng, ngày 15/4, Thủ tướng Phạm Minh Chính yêu cầu doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng. ...

33,3% dân số ở Hàn Quốc sử dụng AI tạo sinh

Theo khảo sát của Chính phủ Hàn Quốc, 33,3% dân số đã sử dụng AI tạo sinh như ChatGPT trong năm 2024.

Phát triển dữ liệu để đưa Việt Nam trở thành quốc gia số

Chuyển đổi số, với dữ liệu là trung tâm đang làm thay đổi căn bản cách chúng ta sống, làm việc và phát triển. Việt Nam cần làm gì để tiếp cận cơ hội này?.

Mới nhất

Bất ngờ với cấu trúc đắp dựng thành Dền

Phục hồi giá trị từ một di tích bị lãng quên Phát hiện tại thành Dền nối tiếp chuỗi bằng chứng khảo cổ về kỹ thuật đắp thành thời Đinh - Tiền Lê, vốn đã được khẳng định qua các đợt khai quật tại thành Đông (1969), thành phía Đông Bắc (2024) và một phần thành phía Nam....

Phát hiện khu vực cư trú ở di sản thế giới Mỹ Sơn

VHO - Tại khu đền tháp Mỹ Sơn (huyện Duy Xuyên, Quảng Nam) đang triển khai song song hai dự án khai quật khảo cổ, bảo tồn nhóm tháp L và nhóm E, F, với mục tiêu quan trọng là bảo tồn các yếu tố gốc của di sản, tiếp tục nhận diện giá trị còn tiềm ẩn...

Giữ lại thanh âm xứ sở

VHO - Giữa nhịp sống sôi động và dòng chảy hiện đại hóa mạnh mẽ, việc bảo tồn và phát huy các giá trị di sản văn hóa nghệ thuật dân gian luôn là một bài toán không dễ có lời giải. Tại Đà Nẵng, thành phố trẻ năng động đang vươn mình trên bản đồ du lịch...

TC Group thông báo kết quả bán hàng Hyundai tháng 5/2025 – Tập đoàn Thành Công

Hà Nội ngày 13/06/2025, Tập đoàn Thành Công (TC GROUP) thông báo kết quả bán hàng tháng 5/2025. Theo đó, tổng doanh số xe Hyundai tháng 5 đạt 4.063 xe, đưa tổng luỹ kế 5 tháng bán hàng của năm 2025 đạt 20.007 xe. Hyundai Accent là mẫu xe có số lượng bán hàng tốt nhất...

CHOLIMEX FOOD ĐẾN VỚI NGÀY HỘI TUYỂN DỤNG TÍCH HỢP – JOB FAIR UFM 2025

Ngày hội Tuyển dụng Tích hợp – Job Fair UFM 2025 đã diễn ra vào ngày 14/6/2025 tại Trường đại học Tài chính – Marketing với nhiều cảm xúc và cơ hội quý giá được trao đi.Đã có gần 60 doanh nghiệp tích cực tham gia tuyển dụng, chia sẻ cơ hội việc làm và tạo điều kiện...

Mới nhất