Trang chủKhoa học - Công nghệCông nghệ sốTrí tuệ nhân tạo bước vào thế giới ngôn ngữ tiếng Việt

Trí tuệ nhân tạo bước vào thế giới ngôn ngữ tiếng Việt


Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông minh ngôn ngữ tốt hơn.

Kết hợp AI “dạy” tiếng Việt  

Lãnh đạo của một doanh nghiệp có vốn đầu tư trực tiếp nước ngoài (FDI) tại Việt Nam mong muốn học tiếng Việt nhanh, đọc được 90% nội dung của các văn bản thông thường. Vấn đề là, ông ấy quá bận rộn và chỉ có khoảng thời gian 1 tiếng (từ 12-13h mỗi ngày) để học. Vì vậy, cần áp dụng công nghệ vào phần mềm học ngôn ngữ sao để giúp ông ngoại ngữ nhanh? 

Trên đây là bài toán của vị trí lãnh đạo công ty FDI đặt ra với PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP.HCM. 

Là người có nhiều đề tài nghiên cứu khoa học và công trình công bố quốc tế về ứng dụng trí tuệ nhân tạo (AI) trong dịch máy, ngôn ngữ học phản bác và dạy tiếng Việt cho người nước ngoài, PGS Điền cho rằng, ứng dụng AI rất cần thiết để giải quyết các vấn đề trong ngôn ngữ học.  

Cụ thể, bước đầu tiên của việc học bất kỳ ngôn ngữ nào là dạy ngôn ngữ âm thanh. Rào cản ở đây là tiếng Việt có thanh điệu, có điệu, khi dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như người Anh, người Pháp… sẽ rất khó. Đơn cử, thay vì hỏi: “Bạn đi ngủ chưa?” thì người học sẽ nói “Bạn đi ngu chưa?”, bởi họ không phân biệt được thanh điệu. Cần dạy họ đặt trò chơi ở đâu khi phát âm, khẩu hình ngậm ra sao, phát âm ra đúng hay sai khác nhau như thế nào.  

Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình đánh răng, phát âm thanh sẵn để người học bắt chước. Sau đó, người học tập phát lại âm thanh, thu vào phần mềm, sử dụng công nghệ đối chiếu giữa phát âm của người học và phát âm chuẩn từ phần mềm, cải thiện khả năng phát âm nhanh. Tất cả các công đoạn trên đều bắt buộc phải ứng dụng AI.  

Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố Giáo sư Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ, tính toán cho thấy, cần dạy khoảng 10% lượng từ cho máy, tương đương với 3.400 từ thông tin ứng dụng, là máy có thể đọc được khoảng 90% văn bản tiếng Việt thông thường. Để có được bảng thống kê dữ liệu này, PGS Điền buộc phải sử dụng AI, gắn nhãn lên hệ thống từ vựng trong kho ngữ liệu tiếng Việt . 

Có thể nói, AI đã thay đổi cách dạy – học của ngành giáo dục. Thực tế, rất nhiều ứng dụng trí tuệ nhân tạo đã ra đời nhằm hỗ trợ quá trình dạy – học trở nên nhanh chóng, hiệu quả hơn.  

Câu chuyện kết hợp giữa khoa học máy tính và ngôn ngữ học khá thú vị trên cho thấy, quá trình đào tạo, ứng dụng AI vào thực tế là rất cần thiết, song không dễ dàng. Các dữ liệu cần được phân tách theo nhiều lớp định danh, ở mỗi lớp sẽ phải xử lý từng biến số với các định danh cụ thể khác nhau nữa. 

Khi máy móc học ngôn ngữ…  

Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông minh ngôn ngữ tốt hơn. Máy móc được huấn luyện và tiến bộ mỗi ngày.  

Tương tự câu chuyện của PGS Điền, dưới đây lại là dẫn chứng sinh động khác về cách mà một trợ lý thông minh hiểu ngôn ngữ con người.

Đó là quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt Kiki trên ô tô, để nhận dạng tốt giọng nói với nhiều ngữ điệu vùng miền khác nhau. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của trí tuệ nhân tạo (AI), chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính. Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới. Phổ biến nhất có thể kể đến như: Siri của Apple, Google Assistant, Amazon Alexa, hay Kiki ở Việt Nam.

Anh Nguyễn Hoàng Khánh Duy, người viết những dòng code đầu tiên cho Kiki chia sẻ, để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói, phản hồi thông tin đúng cho người dùng, thì dữ liệu ngôn ngữ đóng vai trò chủ chốt. 

Dẫn chứng, chức năng rất quan trọng với người dùng trợ lý tiếng Việt Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.

Việc nhận diện giọng nói trên xe ô tô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác. 

Ví dụ, đặc thù sử dụng Kiki trên xe ô tô thì tiếng ồn do động cơ, gió hay tiếng phát ra từ các thiết bị giao thông trên đường cũng rất lớn, điều này ảnh hưởng trực tiếp tới chất lượng nhận diện giọng nói của Kiki trên xe. Do đó, yêu cầu đội ngũ Kiki phải cố gắng giải quyết điều kiện ồn ào bằng cách tăng cường dữ liệu bằng cách nói trong điều kiện ồn ào sao cho phù hợp với cuộc sống thực tế nhất.  

Ngoài ra, bằng các kỹ thuật mới trên thế giới như self-supervised (học tự giám sát), Kiki đang cố gắng “học” từ cả những dữ liệu không được gán nhãn, để cải thiện mô hình tốt hơn nữa. Tính ổn định của trợ lý giọng nói tiếng Việt này đang cải thiện với việc không ngừng đào tạo, nâng cấp sản phẩm.

Rõ ràng, tiến bộ của công nghệ đang diễn ra hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần cho câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang “bước” vào giữa đời sống, đặc biệt, trong giáo dục, ngôn ngữ, những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. AI tái định nghĩa cách chúng ta học tập, làm việc, sinh hoạt… như những ví dụ cụ thể nêu trên.



Nguồn

Cùng chủ đề

Người đưa tiếng Việt vào top các ngoại ngữ được chọn học nhiều nhất

Sau 16 năm giảng dạy tiếng Việt tại ĐH Quốc lập Đài Loan, chị Nguyễn Thị Liên Hương đã giúp đưa tiếng Việt trở thành một trong các ngoại ngữ được nhiều sinh viên đăng ký học tại đây. ...

Những tủ sách Tiếng Việt trên thế giới

(NLĐO)- Các Tủ sách Tiếng Việt được coi là "nguồn tài nguyên" quý giá trong khuyến khích dạy và học tiếng Việt ở nước ngoài. ...

Nổi bật

Mới nhất

Cùng tác giả

Gợi ý của ban giám khảo về nội dung viết thư UPU lần thứ 54

Dưới đây là một số gợi ý của Ban giám khảo cuộc thi viết thư UPU lần thứ 54 năm 2025, các em học sinh có thể tham khảo để hoàn thiện bài dự thi của mình. Hàng năm, Liên minh Bưu chính Thế giới (gọi tắt là UPU) tổ chức Cuộc thi Viết thư quốc tế dành cho trẻ em, nhằm góp phần phát triển khả năng viết văn và sự phong phú trong tư duy sáng tạo của...

Sau sự cố bung khe co giãn trên cao tốc, Bộ GTVT ra công điện khẩn

Sau sự cố bung khe co giãn cao tốc qua Thanh Hóa, Bộ GTVT đã ra công điện yêu cầu các chủ đầu tư tăng cường kiểm tra định kỳ, kiểm tra đột xuất, kịp thời phát hiện khiếm khuyết để yêu cầu nhà thầu khắc phục. Theo đó, để đảm bảo chất lượng công trình và an toàn giao thông các tuyến đường bộ cao tốc, Bộ GTVT yêu cầu Cục Đường bộ Việt Nam, Cục Đường cao tốc...

Miền Bắc sắp phải đối phó đợt sương mù, mưa phùn ẩm ướt

Khoảng từ 12-16/2, khu vực Nam Sơn La, Hòa Bình và phía Đông Bắc Bộ xảy ra tình trạng sáng sớm và đêm có mưa nhỏ, mưa phùn và sương mù rải rác; trời rét, vùng núi có nơi rét đậm, rét hại. Chiều nay (9/2), Trung tâm Dự báo khí tượng thủy văn quốc gia cho biết, do tác động của đợt không khí lạnh mạnh tràn về từ 7/2, thời tiết Bắc Bộ tiếp tục rét đậm, rét...

Hãng taxi truyền thống đầu tiên chuyển đổi sang xe điện

Lado Taxi vừa công bố thay thế 100% đội xe xăng sang xe điện VF e34 và VF5 tại chi nhánh Lâm Đồng từ ngày 8/2 và sẽ chuyển đổi hoàn toàn ở các tỉnh thành khác trong năm 2025. Hành trình chuyển đổi xanh của Lado Taxi bắt đầu từ tháng 5/2022 với 20 chiếc VF e34 mua từ VinFast chuyên phục vụ hành khách di chuyển từ sân bay Liên Khương đến các địa phương. Mẫu xe điện chủ...

Khách tố quán bánh mì ở Hà Nội bán ‘thịt mốc đen’, chủ quán phản bác ra sao?

Tối 8/2, trên mạng xã hội lan truyền một bài viết tố quán bánh mì N.H (Quán Thánh, Ba Đình, Hà Nội) bán thịt mốc đen cho thực khách. Bài viết được chia sẻ nhiều với hàng ngàn lượt tương tác bình luận. Khách tố trong bánh mì có "thịt mốc" Thực khách T.T. - người đăng bài, cho biết: Khoảng 20h ngày 8/2, anh T. vào quán bánh mì N.H., mua một chiếc bánh mì thập cẩm. Khi mang về...

Bài đọc nhiều

Phát huy vai trò của chuyển đổi số trong kỷ nguyên vươn mình của dân tộc

Thế giới, bao gồm cả Việt Nam đang đứng trước nhiều thách thức và cơ hội trong kỷ nguyên số. Đâu là giải pháp để Việt Nam phát huy vai trò tích cực của chuyển đổi số trong kỷ nguyên mới?

Những bộ, ngành nào dẫn đầu bảng xếp hạng về chuyển đổi số?

DNVN - Ở nhóm 17 bộ, ngành có dịch vụ công, Bộ Kế hoạch và Đầu tư đứng ở vị trí số 1, Bộ Tài chính đứng ở vị trí số 2 ở tất cả các chỉ số chính, đây cũng là thứ tự xếp hạng giữ nguyên như năm 2022. Ngân hàng Nhà...

Cùng chuyên mục

Quá khứ “bất hảo” của nhân viên được Elon Musk trọng dụng

Edward Coristine từng khoe khoang về việc giữ quyền truy cập máy chủ của công ty cũ. Nay, với tư cách nhân viên dưới trướng Elon Musk, cậu được tiếp cận thông tin nhạy cảm của chính phủ Mỹ.

Đà Nẵng lần thứ tư liên tiếp đứng đầu cả nước về chuyển đổi số

Bộ Thông tin và Truyền thông vừa công bố "Báo cáo chỉ số đánh giá chuyển đổi số của các bộ, cơ quan ngang bộ, cơ quan thuộc Chính phủ và tỉnh, thành phố trực thuộc Trung ương - DTI cấp bộ, cấp tỉnh năm 2023".

Mới nhất

Một người dân Quảng Trị câu được con cá chình dài tới 1,2m, nặng 14kg

2 ngày nay, cư dân mạng tỉnh Quảng Trị chú ý đến một con cá chình “khủng” được một chủ cửa hàng mua từ người đi câu. ...

Động thổ dự án đường song hành Vành đai 5 qua Hà Nam trị giá 1.500 tỷ

Tuyến đường được xem là trục hành lang Đông Tây mới, kết nối các khu vực kinh tế, đô thị quan trọng của tỉnh Hà Nam. ...

Trump chỉ đạo mật vụ cung cấp ‘mọi thông tin’ về những kẻ ám sát ông

(CLO) Theo truyền thông Mỹ, Tổng thống Donald Trump cho biết ông đã chỉ đạo Cơ quan Mật vụ Mỹ cung cấp cho ông "mọi thông tin" về hai kẻ cố...

Khai hội đền thờ Vua Lê Lợi tại Lai Châu

(CLO) Lễ hội Đền thờ vua Lê Lợi nhằm tri ân công ơn đức độ của vua Lê Thái Tổ - người đã thân chinh cầm quân dẹp loạn vùng Tây...

Hàng Việt trước nguy cơ gia tăng phòng vệ thương mại từ Mỹ

Hàng Việt xuất khẩu sang Mỹ trong năm 2025 cần cẩn trọng hơn trước chính sách thương mại mới của nước này, cùng với đó là rủi ro gia tăng từ các vụ việc phòng vệ thương mại.

Mới nhất