Trang chủKhoa học - Công nghệCông nghệ sốViễn cảnh con người mất kiểm soát khi chatbot AI kết nối...

Viễn cảnh con người mất kiểm soát khi chatbot AI kết nối Internet


Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới. 

Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ “thăm dò định tính thử đối đầu” mô hình mới, với mục tiêu “bẻ khoá” nó.

Đội xử lý “độc hại”

White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.

“Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn,” White cho biết. “Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm”.

FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.

Những phát hiện đáng báo động của “đội Đỏ” cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.

Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và “bóng gió” hay không.

OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.

Phát hiện của “đội Đỏ” được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và “đào tạo lại” GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.

Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).

“Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ”, José Hernández-Orallo, thành viên của “đội Đỏ” GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. “Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới.”

Rủi ro lớn lên từng ngày

OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.

Nếu được kết nối Internet để “tự học”, các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?

Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.

Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến ​​công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.

Chuyên gia này cũng phát hiện ra tình trạng ảo giác – khi chatbot phản hồi bằng thông tin bịa đặt – còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.

Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. “Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi”, Gollu nói. “Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến.” 

Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.

Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của “đội Đỏ” cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người “không thể kiểm soát được”.

“Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet”, Dan khẳng định.

Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.

Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.

Theo FT



Nguồn

Cùng chủ đề

Cầu Tăng Long tăng tốc

(NLĐO) - Dự án cầu Tăng Long đang được đẩy nhanh tiến độ, dự kiến thông xe một nhánh vào cuối tháng 2, giúp cải thiện giao thông và tạo thuận lợi cho người dân. ...

Hội nghị Thường trực Chính phủ với doanh nghiệp hàng đầu đất nước

Thường trực Chính phủ sẽ lần lượt có các hội nghị với doanh nghiệp nhà nước, doanh nghiệp tư nhân, ngân hàng, doanh nghiệp có vốn đầu tư nước ngoài để lắng nghe ý kiến của doanh nghiệp. ...

Xu hướng tăng trở lại

Giá lúa gạo hôm nay ngày 10/2/2025 tại khu vực Đồng bằng sông Cửu Long không biến động nhiều, thị trường lượng ít, gạo nguyên liệu nhích nhẹ, lúa xu hướng tăng. Giá lúa gạo hôm nay ngày 10/2/2025 tại khu vực Đồng bằng sông Cửu Long ít biến động. Gạo nguyên liệu các loại nhích nhẹ, mặt hàng lúa có xu hướng tăng so với cuối tuần. ...

Trao quyết định nghỉ hưu trước tuổi đối với Chủ tịch UBND tỉnh Đồng Tháp

Bí thư Tỉnh ủy Đồng Tháp ghi nhận và đánh giá cao quá trình cống hiến của ông Phạm Thiện Nghĩa, góp phần phát triển Đảng bộ tỉnh Đồng Tháp và quá trình vươn lên của tỉnh. Zalo Facebook Twitter Lưu bài viết Bản in Copy link Sáng 10/2, Ban Thường vụ Tỉnh ủy Đồng Tháp tổ chức Hội nghị về công tác cán bộ, trao quyết định về việc nghỉ hưu trước tuổi đối với Chủ tịch Ủy ban Nhân dân tỉnh. Tại hội nghị,...

Trai làng Lại Yên ngâm mình trong nước lạnh để bắt vịt cầu may

Lễ hội bắt vịt của làng Lại Yên (huyện Hoài Đức, Hà Nội) được tổ chức với quan niệm thể thao lành mạnh và cầu cho thủy lợi tốt lành, mùa màng tươi tốt, con cháu trong gia đình mạnh khỏe, giỏi giang. Hàng năm cứ vào ngày 12 tháng Giêng, lễ hội Xuân của xã Lại Yên, huyện Hoài Đức, Hà Nội lại được tổ chức trong không khí tưng bừng và náo nhiệt với nhiều trò chơi thú...

Nổi bật

Mới nhất

Cùng tác giả

Quảng Nam phát triển 2.397 trạm thu phát sóng di động

Thông tin được Ban Chỉ đạo Cải cách hành chính, chuyển đổi số và Đề án 06 tỉnh Quảng Nam cho biết tại báo cáo sơ kết triển khai thực hiện Đề án 06 trên địa bàn tỉnh Quảng Nam năm 2024. Theo đó, đến nay toàn tỉnh phát triển được 2.397 trạm BTS (trạm thu phát sóng di động); đường truyền cáp quang đã kéo đến 100% cấp xã, 90,2% cấp thôn (1.119/1.240 thôn), 121 thôn chưa có hạ...

3 lãnh đạo Sở TT&TT, GTVT, Tài chính Đà Nẵng xin nghỉ hưu trước tuổi

Với mong muốn tạo điều kiện thuận lợi cho việc sắp xếp, tinh gọn tổ chức bộ máy, Giám đốc Sở TT&TT, Tài chính và Phó Giám đốc Sở GTVT Đà Nẵng đã có đơn xin nghỉ hưu trước tuổi. Ngày 10/2, chia sẻ với PV VietNamNet, ông Nguyễn Trung Nghĩa, Phó Giám đốc Sở Giao thông vận tải (GTVT) TP Đà Nẵng cho biết, ông đã có đơn xin nghỉ hưu trước tuổi. Theo ông Nghĩa, quyết định trên của...

Thủ tướng mời gọi doanh nghiệp đăng ký làm những việc lớn của đất nước

Thủ tướng Phạm Minh Chính đề nghị trong các việc lớn của đất nước, các doanh nghiệp xem có thể làm được gì thì đăng ký làm và đề xuất cơ chế chính sách để thực hiện, miễn là không tư lợi, phòng chống tham nhũng, tiêu cực. Thường trực Chính phủ sáng nay (10/2) có cuộc gặp gỡ doanh nghiệp về nhiệm vụ, giải pháp để doanh nghiệp tư nhân tăng tốc, bứt phá, góp phần phát triển đất...

Việt Nam đứng thứ 2 thế giới về số người học trực tuyến miễn phí

Việt Nam trở thành quốc gia đứng thứ 2 trên thế giới (ngoại trừ Mỹ) trong năm 2024 sử dụng nền tảng trực tuyến miễn phí cho việc học tập. Theo Khan Academy (trụ sở tại Silicon Valley, Mỹ), trong năm 2024, có hơn 204 triệu phút học tập ghi nhận trên nền tảng của tổ chức này tại Việt Nam, với hơn 2 triệu tài khoản học tập được tạo lập. Với những con số này, Việt Nam vươn...

Tìm ông cụ mất tích khi vừa từ quê vào TPHCM đưa cháu nội đi học

Cụ ông vừa từ quê vào TPHCM, dùng xe đạp đưa cháu nội đi học nhưng rồi mất tích nhiều ngày nay. Hiện gia đình của ông Trần Vệ (66 tuổi, quê Quảng Bình) vừa trình báo việc mất tích của ông đến Công an huyện Bình Chánh nhờ hỗ trợ tìm kiếm. Anh Trần Đăng Dân (46 tuổi, quê quảng Bình, ngụ huyện Bình Chánh, là con trai ông Vệ) cho biết, ông Vệ từ quê vào TPHCM ngày 6/2...

Bài đọc nhiều

Những bộ, ngành nào dẫn đầu bảng xếp hạng về chuyển đổi số?

DNVN - Ở nhóm 17 bộ, ngành có dịch vụ công, Bộ Kế hoạch và Đầu tư đứng ở vị trí số 1, Bộ Tài chính đứng ở vị trí số 2 ở tất cả các chỉ số chính, đây cũng là thứ tự xếp hạng giữ nguyên như năm 2022. Ngân hàng Nhà...

Cùng chuyên mục

Google phát hành Gemini 2.0, cạnh tranh với AI Trung Quốc

Google phát hành Gemini 2.0, chatbot trí tuệ nhân tạo thế hệ mới với nhiều phiên bản và cập nhật tạo sự cạnh tranh mạnh mẽ với các đối thủ AI trên thị trường.

Apple chính thức chặn người dùng iPhone hạ cấp về iOS 18.2.1

Apple vừa chính thức khóa sign iOS 18.2.1, qua đó chặn người dùng iPhone chạy iOS 18.3 hạ cấp về phiên bản iOS cũ này.

Tỷ phú Elon Musk không mặn mà mua lại TikTok

Bất chấp những thông tin đồn thổi về khả năng mua lại TikTok của ByteDance, tỷ phú giàu nhất thế giới Elon Musk vừa nói rằng ông không hứng thú với ứng dụng đến từ Trung Quốc. ...

Mới nhất

Bất động sản Bắc Giang cất cánh nhờ quy hoạch vùng Đông Bắc Thủ đô

Bắc Giang đang là một mảnh ghép quan trọng của bức tranh kinh tế Đông Bắc vùng Thủ đô, đóng vai trò kết nối Hà Nội, Hải Phòng với biên giới Lạng Sơn, đầu mối đồng bằng sông Hồng của vùng với các tỉnh Đông Bắc. Đặc biệt, TP. Bắc Giang được quy hoạch trở thành đô thị loại...

3 lãnh đạo Sở TT&TT, GTVT, Tài chính Đà Nẵng xin nghỉ hưu trước tuổi

Với mong muốn tạo điều kiện thuận lợi cho việc sắp xếp, tinh gọn tổ chức bộ máy, Giám đốc Sở TT&TT, Tài chính và Phó Giám đốc Sở GTVT Đà Nẵng đã có đơn xin nghỉ hưu trước tuổi. Ngày 10/2, chia sẻ với PV VietNamNet, ông Nguyễn Trung Nghĩa, Phó Giám đốc Sở Giao thông vận tải (GTVT)...

Lương CEO Yeah1 tăng lên 2,55 tỷ đồng/năm sau thành công của “Anh trai, Chị đẹp”

Nhờ sự thành công của "Anh trai vượt ngàn chông gai" và "Chị đẹp đạp gió", mức lương của Tổng giám đốc và Phó tổng giám đốc Yeah1 đã tăng 300 - 338 triệu đồng trong năm vừa qua. Lương CEO Yeah1 tăng lên 2,55 tỷ đồng/năm sau thành công của “Anh trai, Chị đẹp”Nhờ sự thành công của "Anh...

Cải cách thuế và kỳ vọng từ cộng đồng doanh nghiệp

Cộng đồng doanh nghiệp trong và ngoài nước kỳ vọng, những thay đổi về chính sách thuế của Việt Nam sẽ tạo môi trường kinh doanh thuận lợi, thúc đẩy tăng trưởng kinh tế, đảm bảo thực hành thuế công bằng và điều chỉnh hệ thống thuế của Việt Nam theo các tiêu chuẩn toàn cầu. Cộng đồng doanh nghiệp...

Tôi tưởng sẽ mất con nhưng nhờ ghép tim, giờ con còn được chơi Tết…

Ánh nắng xuân dịu nhẹ, Huỳnh Tiến Phát (24 tuổi, thôn Phú Khương, xã Hành Tín Tây, huyện Nghĩa Hành, Quảng Ngãi) ngồi bên hiên nhà chăm chút chú chim đang đợt thay lông. ...

Mới nhất