Trang chủKhoa học - Công nghệCông nghệ sốTrí tuệ nhân tạo bước vào thế giới ngôn ngữ tiếng Việt

Trí tuệ nhân tạo bước vào thế giới ngôn ngữ tiếng Việt


Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông minh ngôn ngữ tốt hơn.

Kết hợp AI “dạy” tiếng Việt  

Lãnh đạo của một doanh nghiệp có vốn đầu tư trực tiếp nước ngoài (FDI) tại Việt Nam mong muốn học tiếng Việt nhanh, đọc được 90% nội dung của các văn bản thông thường. Vấn đề là, ông ấy quá bận rộn và chỉ có khoảng thời gian 1 tiếng (từ 12-13h mỗi ngày) để học. Vì vậy, cần áp dụng công nghệ vào phần mềm học ngôn ngữ sao để giúp ông ngoại ngữ nhanh? 

Trên đây là bài toán của vị trí lãnh đạo công ty FDI đặt ra với PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP.HCM. 

Là người có nhiều đề tài nghiên cứu khoa học và công trình công bố quốc tế về ứng dụng trí tuệ nhân tạo (AI) trong dịch máy, ngôn ngữ học phản bác và dạy tiếng Việt cho người nước ngoài, PGS Điền cho rằng, ứng dụng AI rất cần thiết để giải quyết các vấn đề trong ngôn ngữ học.  

Cụ thể, bước đầu tiên của việc học bất kỳ ngôn ngữ nào là dạy ngôn ngữ âm thanh. Rào cản ở đây là tiếng Việt có thanh điệu, có điệu, khi dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như người Anh, người Pháp… sẽ rất khó. Đơn cử, thay vì hỏi: “Bạn đi ngủ chưa?” thì người học sẽ nói “Bạn đi ngu chưa?”, bởi họ không phân biệt được thanh điệu. Cần dạy họ đặt trò chơi ở đâu khi phát âm, khẩu hình ngậm ra sao, phát âm ra đúng hay sai khác nhau như thế nào.  

Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình đánh răng, phát âm thanh sẵn để người học bắt chước. Sau đó, người học tập phát lại âm thanh, thu vào phần mềm, sử dụng công nghệ đối chiếu giữa phát âm của người học và phát âm chuẩn từ phần mềm, cải thiện khả năng phát âm nhanh. Tất cả các công đoạn trên đều bắt buộc phải ứng dụng AI.  

Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố Giáo sư Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ, tính toán cho thấy, cần dạy khoảng 10% lượng từ cho máy, tương đương với 3.400 từ thông tin ứng dụng, là máy có thể đọc được khoảng 90% văn bản tiếng Việt thông thường. Để có được bảng thống kê dữ liệu này, PGS Điền buộc phải sử dụng AI, gắn nhãn lên hệ thống từ vựng trong kho ngữ liệu tiếng Việt . 

Có thể nói, AI đã thay đổi cách dạy – học của ngành giáo dục. Thực tế, rất nhiều ứng dụng trí tuệ nhân tạo đã ra đời nhằm hỗ trợ quá trình dạy – học trở nên nhanh chóng, hiệu quả hơn.  

Câu chuyện kết hợp giữa khoa học máy tính và ngôn ngữ học khá thú vị trên cho thấy, quá trình đào tạo, ứng dụng AI vào thực tế là rất cần thiết, song không dễ dàng. Các dữ liệu cần được phân tách theo nhiều lớp định danh, ở mỗi lớp sẽ phải xử lý từng biến số với các định danh cụ thể khác nhau nữa. 

Khi máy móc học ngôn ngữ…  

Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông minh ngôn ngữ tốt hơn. Máy móc được huấn luyện và tiến bộ mỗi ngày.  

Tương tự câu chuyện của PGS Điền, dưới đây lại là dẫn chứng sinh động khác về cách mà một trợ lý thông minh hiểu ngôn ngữ con người.

Đó là quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt Kiki trên ô tô, để nhận dạng tốt giọng nói với nhiều ngữ điệu vùng miền khác nhau. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của trí tuệ nhân tạo (AI), chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính. Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới. Phổ biến nhất có thể kể đến như: Siri của Apple, Google Assistant, Amazon Alexa, hay Kiki ở Việt Nam.

Anh Nguyễn Hoàng Khánh Duy, người viết những dòng code đầu tiên cho Kiki chia sẻ, để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói, phản hồi thông tin đúng cho người dùng, thì dữ liệu ngôn ngữ đóng vai trò chủ chốt. 

Dẫn chứng, chức năng rất quan trọng với người dùng trợ lý tiếng Việt Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.

Việc nhận diện giọng nói trên xe ô tô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác. 

Ví dụ, đặc thù sử dụng Kiki trên xe ô tô thì tiếng ồn do động cơ, gió hay tiếng phát ra từ các thiết bị giao thông trên đường cũng rất lớn, điều này ảnh hưởng trực tiếp tới chất lượng nhận diện giọng nói của Kiki trên xe. Do đó, yêu cầu đội ngũ Kiki phải cố gắng giải quyết điều kiện ồn ào bằng cách tăng cường dữ liệu bằng cách nói trong điều kiện ồn ào sao cho phù hợp với cuộc sống thực tế nhất.  

Ngoài ra, bằng các kỹ thuật mới trên thế giới như self-supervised (học tự giám sát), Kiki đang cố gắng “học” từ cả những dữ liệu không được gán nhãn, để cải thiện mô hình tốt hơn nữa. Tính ổn định của trợ lý giọng nói tiếng Việt này đang cải thiện với việc không ngừng đào tạo, nâng cấp sản phẩm.

Rõ ràng, tiến bộ của công nghệ đang diễn ra hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần cho câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang “bước” vào giữa đời sống, đặc biệt, trong giáo dục, ngôn ngữ, những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. AI tái định nghĩa cách chúng ta học tập, làm việc, sinh hoạt… như những ví dụ cụ thể nêu trên.



Nguồn

Cùng chủ đề

Khởi động tìm kiếm “Sứ giả tiếng Việt” ở nước ngoài năm 2025

(Dân trí) - Ngày 29/3, tại Hà Nội, Ủy ban Nhà nước về người Việt Nam ở nước ngoài, Bộ Ngoại giao đã tổ chức Lễ Phát động Ngày Tôn vinh tiếng Việt và Cuộc thi Tìm kiếm Sứ giả tiếng Việt ở nước ngoài năm 2025. Chương trình do Thứ trưởng Bộ Ngoại giao Lê Thị Thu Hằng chủ trì, với sự tham dự của đại diện các bộ, ban, ngành trong nước, các chuyên gia ngôn ngữ và...

Lễ Phát động Ngày Tôn vinh tiếng Việt năm 2025

Chiều 29/3, tại Hà Nội, Ủy ban Nhà nước về người Việt Nam ở nước ngoài (Bộ Ngoại giao) đã tổ chức Lễ phát động Ngày Tôn vinh tiếng Việt và Cuộc thi Tìm kiếm sứ giả tiếng Việt ở nước ngoài năm 2025. ...

5 trường ĐH Việt Nam có ngành đào tạo Khoa học máy tính lọt top thế giới

(Dân trí) - 5 trường đại học Việt Nam có ngành Khoa học máy tính nằm trong bảng xếp hạng QS 2025 là ĐH Duy Tân, ĐH Quốc gia TPHCM, ĐH Bạch khoa Hà Nội, ĐH Quốc gia Hà Nội và ĐH Tôn Đức Thắng. Tổ chức QS mới đây đã công bố Bảng xếp hạng các trường đại học theo ngành (QS World University Rankings by Subject 2025), trong đó 5 đại diện của Việt Nam góp mặt trong...

Giữ gìn ngôn ngữ tiếng Việt trong thời kỳ hội nhập

MC Thanh Mai cho rằng, trong xu thế hội nhập và toàn cầu hóa, ngôn ngữ tiếng Việt có nhiều cơ hội trở nên giàu có, nhưng mặt khác cũng phải đối đầu trước nguy cơ hòa tan...

Nổi bật

Mới nhất

Cùng tác giả

Danh sách học sinh các tỉnh lọt đội tuyển dự thi Olympic quốc tế năm 2025

Bộ GD-ĐT vừa công bố kết quả kỳ thi chọn đội tuyển quốc gia dự thi Olympic quốc tế và khu vực năm 2025. Theo đó, có 37 học sinh lọt vào danh sách này. Từ ngày 25 - 27/3, Bộ GD-ĐT tổ chức kỳ thi chọn đội tuyển quốc gia dự thi Olympic quốc tế và khu vực năm 2025. Kỳ thi năm nay có sự tham gia của 187 thí sinh đến từ các tỉnh, thành phố trên...

Nghệ sĩ Việt viếng nhạc sĩ Lư Nhất Vũ – tác giả ‘Cô gái Sài Gòn đi tải đạn’

Lễ tang nhạc sĩ Lư Nhất Vũ được tổ chức tại Nhà tang lễ Quốc gia phía Nam (TP.HCM). Các nghệ sĩ Việt ở nhiều thế hệ đến tiễn biệt ông. Lễ tang nhạc sĩ Lư Nhất Vũ được tổ chức tại Nhà tang lễ Quốc gia phía Nam (TP.HCM). Các nghệ sĩ Việt ở nhiều thế hệ đến tiễn biệt ông. Chiều 30/3, lễ tang nhạc sĩ Lư Nhất Vũ diễn ra trang trọng, ấm áp tại Nhà tang lễ...

Đại diện duy nhất của Việt Nam lọt top 100 món rau ngon nhất thế giới

Rau muống xào tỏi mới đây đã được vinh danh là một trong 100 món rau ngon nhất thế giới, theo chuyên trang ẩm thực nổi tiếng Taste Atlas. Theo đó, món ăn dân dã của Việt Nam được đánh giá 4,3/5 sao và đứng thứ 24 trong danh sách. Taste Atlas mô tả rau muống xào tỏi là món ăn truyền thống của Việt Nam, đặc biệt phù hợp với những người ăn chay. Tuy chỉ sử dụng những nguyên...

Xem lịch tổ chức họp Đại hội đồng cổ đông các ngân hàng

Mùa Đại hội cổ đông thường niên của các ngân hàng thương mại đã bắt đầu, tập trung chủ yếu trong tháng 4/2025. Đến nay, các ngân hàng TMCP đã chốt ngày tổ chức đại hội. Các ngân hàng VIB, Nam A Bank và NCB đã tổ chức thành công Đại hội đồng cổ đông thường niên năm 2025 lần lượt vào các ngày 27, 28 và 29/3.  Theo đó, đại hội đồng cổ đông (ĐHĐCĐ) VIB đã thông qua kế...

Vietlott lại tìm được vé số trúng độc đắc gần 57 tỷ đồng

Một tấm vé số trúng giải độc đắc Jackpot của loại hình xổ số Mega 6/45 trị giá gần 57 tỷ đồng vừa được Vietlott tìm ra. Theo thông tin từ Công ty Xổ số Điện toán Việt Nam (Vietlott), trong kỳ quay số mở thưởng lần thứ 1.334 của sản phẩm Mega 6/45 diễn ra tối nay (30/3), hội đồng quay thưởng của Vietlott đã tìm ra 1 vé số trúng giải Jackpot với trị giá   56.741.982.500 đồng...

Bài đọc nhiều

Panasonic kiện Xiaomi và Oppo tại Trung Quốc và châu Âu

Vụ kiện mới nhất giữa Panasonic và Xiaomi, Oppo liên quan đến công nghệ truyền thông không dây, theo Panasonic. Công ty cho biết đây là lần đầu họ thấy cần phải hành động vì các bằng sáng chế tiêu chuẩn thiết yếu của mình. Hãng điện tử Nhật Bản nói thêm, họ đã đạt thỏa thuận cấp phép với các nhà sản xuất smartphone khác nhưng không thể đi đến đồng thuận với Xiaomi, Oppo “sau nhiều năm...

Lộ diện “siêu vũ khí tương lai” của Nga

Bom lượn Drel sẽ trở thành siêu vũ khí tương lai, Đại tá quân đội đã nghỉ hưu Viktor Litovkin cho truyền thông Nga biết.

Gần 1 triệu thuê bao di động sẽ bị thu hồi sau ngày 15/5

Đến ngày 15/5, những thuê bao di động có thông tin không trùng khớp với cơ sở dữ liệu quốc gia về dân cư và chưa được chuẩn hóa thông tin sẽ bị thu hồi.

Cùng chuyên mục

Doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng

DNVN - Phát biểu chỉ đạo Hội nghị Thủ tướng Chính phủ làm việc với doanh nghiệp Nhà nước tiên phong trong chuyển đổi số và thúc đẩy tăng trưởng, ngày 15/4, Thủ tướng Phạm Minh Chính yêu cầu doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng. ...

33,3% dân số ở Hàn Quốc sử dụng AI tạo sinh

Theo khảo sát của Chính phủ Hàn Quốc, 33,3% dân số đã sử dụng AI tạo sinh như ChatGPT trong năm 2024.

Phát triển dữ liệu để đưa Việt Nam trở thành quốc gia số

Chuyển đổi số, với dữ liệu là trung tâm đang làm thay đổi căn bản cách chúng ta sống, làm việc và phát triển. Việt Nam cần làm gì để tiếp cận cơ hội này?.

Mới nhất

Bất ngờ với cấu trúc đắp dựng thành Dền

Phục hồi giá trị từ một di tích bị lãng quên Phát hiện tại thành Dền nối tiếp chuỗi bằng chứng khảo cổ về kỹ thuật đắp thành thời Đinh - Tiền Lê, vốn đã được khẳng định qua các đợt khai quật tại thành Đông (1969), thành phía Đông Bắc (2024) và một phần thành phía Nam....

Phát hiện khu vực cư trú ở di sản thế giới Mỹ Sơn

VHO - Tại khu đền tháp Mỹ Sơn (huyện Duy Xuyên, Quảng Nam) đang triển khai song song hai dự án khai quật khảo cổ, bảo tồn nhóm tháp L và nhóm E, F, với mục tiêu quan trọng là bảo tồn các yếu tố gốc của di sản, tiếp tục nhận diện giá trị còn tiềm ẩn...

Giữ lại thanh âm xứ sở

VHO - Giữa nhịp sống sôi động và dòng chảy hiện đại hóa mạnh mẽ, việc bảo tồn và phát huy các giá trị di sản văn hóa nghệ thuật dân gian luôn là một bài toán không dễ có lời giải. Tại Đà Nẵng, thành phố trẻ năng động đang vươn mình trên bản đồ du lịch...

TC Group thông báo kết quả bán hàng Hyundai tháng 5/2025 – Tập đoàn Thành Công

Hà Nội ngày 13/06/2025, Tập đoàn Thành Công (TC GROUP) thông báo kết quả bán hàng tháng 5/2025. Theo đó, tổng doanh số xe Hyundai tháng 5 đạt 4.063 xe, đưa tổng luỹ kế 5 tháng bán hàng của năm 2025 đạt 20.007 xe. Hyundai Accent là mẫu xe có số lượng bán hàng tốt nhất...

CHOLIMEX FOOD ĐẾN VỚI NGÀY HỘI TUYỂN DỤNG TÍCH HỢP – JOB FAIR UFM 2025

Ngày hội Tuyển dụng Tích hợp – Job Fair UFM 2025 đã diễn ra vào ngày 14/6/2025 tại Trường đại học Tài chính – Marketing với nhiều cảm xúc và cơ hội quý giá được trao đi.Đã có gần 60 doanh nghiệp tích cực tham gia tuyển dụng, chia sẻ cơ hội việc làm và tạo điều kiện...

Mới nhất