Trang chủKhoa học - Công nghệCông nghệ sốViễn cảnh con người mất kiểm soát khi chatbot AI kết nối...

Viễn cảnh con người mất kiểm soát khi chatbot AI kết nối Internet


Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới. 

Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ “thăm dò định tính thử đối đầu” mô hình mới, với mục tiêu “bẻ khoá” nó.

Đội xử lý “độc hại”

White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.

“Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn,” White cho biết. “Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm”.

FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.

Những phát hiện đáng báo động của “đội Đỏ” cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.

Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và “bóng gió” hay không.

OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.

Phát hiện của “đội Đỏ” được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và “đào tạo lại” GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.

Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).

“Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ”, José Hernández-Orallo, thành viên của “đội Đỏ” GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. “Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới.”

Rủi ro lớn lên từng ngày

OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.

Nếu được kết nối Internet để “tự học”, các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?

Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.

Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến ​​công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.

Chuyên gia này cũng phát hiện ra tình trạng ảo giác – khi chatbot phản hồi bằng thông tin bịa đặt – còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.

Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. “Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi”, Gollu nói. “Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến.” 

Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.

Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của “đội Đỏ” cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người “không thể kiểm soát được”.

“Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet”, Dan khẳng định.

Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.

Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.

Theo FT



Nguồn

Cùng chủ đề

Thỏa thuận ngừng bắn Israel

Lực lượng Hamas ngày 10.2 thông báo sẽ hoãn kế hoạch thả con tin vào cuối tuần này cho đến khi có thông báo thêm do Israel vi phạm thỏa thuận ngừng bắn. ...

Gia đình một tỉ phú Việt bị ‘thổi bay’ vài ngàn tỉ sau tuyên bố từ ông Trump

Sau thông điệp từ ông Trump về thuế quan với ngành thép, thị giá cổ phiếu 'quốc dân' HPG giảm mạnh. Tài sản trên thị trường chứng khoán của gia đình tỉ phú Trần Đình Long bị 'thổi bay' gần 2.500 tỉ đồng. Hôm...

Hòa Phát sẽ tăng trưởng ít nhất 15% mỗi năm từ nay đến năm 2030, hưởng ứng mục tiêu tăng trưởng hai con số...

Tối 09/02/2025, trong chương trình công tác tại Quảng Ngãi, Thủ tướng Phạm Minh Chính đã tới thăm, làm việc tại Khu liên hợp gang thép Hòa Phát Dung Quất. Thay mặt Chính phủ, nhân dịp đầu năm mới Thủ tướng gửi lời chúc sức khỏe, lời hỏi thăm của Tổng Bí thư Tô Lâm tới CBCNV Tập đoàn Hòa Phát. Tổng Bí thư chúc Tập đoàn sẽ thành công, chúc Hòa Phát sẽ phát triển theo tốc...

Dự thảo Luật Khoa học, Công nghệ và Đổi mới sáng tạo vẫn tồn tại nhiều hạn chế

Nhiều ý kiến cho rằng dự thảo Luật Khoa học, Công nghệ và Đổi mới sáng tạo cần có những điều chỉnh mang tính đột phá hơn, tập trung, đơn giản hóa thủ tục thương mại hóa. ...

Vì sao Chủ tịch UBND huyện Long Thành bị bắt?

(NLĐO) - Trước khi bắt tạm giam, lực lượng chức năng đã khám xét và thu giữ một số tài liệu tại nhà riêng của Chủ tịch UBND huyện Long Thành, tỉnh Đồng Nai ...

Nổi bật

Mới nhất

Cùng tác giả

Dự báo thời tiết 11/2/2025: Miền Bắc mưa phùn, sương mù

Dự báo thời tiết 11/2/2025: Thời tiết Miền Nam và miền Bắc đối lập trong ngày 11/2. Trong khi miền Bắc chìm trong mưa phùn và sương mù, trời rét, thì miền Nam lại đón nắng vàng rực rỡ. Theo chuyên gia của Trung tâm Dự báo khí tượng thủy văn quốc gia, thời tiết, từ ngày 11 - 20/2, miền Bắc sẽ có nhiều biến động, với mưa phùn và sương mù kéo dài do ảnh hưởng của áp...

Chính phủ đề xuất chỉ định thầu để làm nhanh nhà máy điện hạt nhân Ninh Thuận

Chính phủ đề nghị cho phép áp dụng hình thức chỉ định thầu gói thầu chìa khóa trao tay xây dựng nhà máy chính (dự án điện hạt nhân Ninh Thuận) với nhà thầu được nêu tên trong Hiệp định liên Chính phủ. Chiều tối 10/2, Ủy Thường vụ Quốc hội cho ý kiến về chủ trương, cơ chế đặc thù xây dựng các nhà máy điện hạt nhân tại Ninh Thuận để chuẩn bị trình Quốc hội xem xét...

Trao quyết định 12 nhân sự mới trong Ban Thường vụ Đảng ủy Quốc hội

Chiều 10/2, Đảng ủy Quốc hội đã tổ chức hội nghị công bố quyết định của Ban Thường vụ Đảng ủy Quốc hội về phân công, điều động, bổ nhiệm lãnh đạo các cơ quan tham mưu, giúp việc Đảng ủy Quốc hội. Phó Chủ tịch Quốc hội Nguyễn Khắc Định đã trao quyết định về phân công, điều động, bổ nhiệm lãnh đạo các cơ quan tham mưu, giúp việc Đảng ủy Quốc hội đối với 3 nhân sự. Theo...

Cháy bãi tập kết cuộn cao su băng tải ở Hà Nội, khói lửa cuồn cuộn

Một vụ cháy đã xảy ra tại bãi tập kết cuộn cao su băng tải trên đường Phan Trọng Tuệ (xã Vĩnh Quỳnh, huyện Thanh Trì, Hà Nội), khói lửa cuồn cuộn bốc cao. Theo thông tin ban đầu, khoảng 17h15 ngày 10/2, một vụ cháy đã xảy ra tại bãi tập kết cuộn cao su băng tải trên đường Phan Trọng Tuệ (xã Vĩnh Quỳnh, huyện Thanh Trì, Hà Nội). Người dân chứng kiến sự việc cho biết, thời điểm...

Thanh Hóa có tân Viện trưởng Viện kiểm sát nhân dân tỉnh

Ông Trần Thế Kính, Viện trưởng VKSND tỉnh Hà Nam được điều động, bổ nhiệm giữ chức vụ Viện trưởng VKSND tỉnh Thanh Hóa. Ngày 10/2, tại tỉnh Thanh Hóa, Viện Kiểm sát Nhân dân (VKSND) Tối cao đã tổ chức lễ công bố và trao quyết định điều động, bổ nhiệm Viện trưởng VKSND tỉnh Thanh Hóa. Tại buổi lễ, đại diện lãnh đạo Vụ Tổ chức cán bộ VKSND tối cao đã công bố quyết định của Viện trưởng...

Bài đọc nhiều

Cách nhân bản nhanh trong Canva giúp bạn tiết kiệm thời gian

Nhân bản trong Canva giúp bạn sao chép nhanh các thiết kế mà không cần làm lại, nhằm tiết kiệm thời gian và tối ưu quy trình làm việc. Bài viết dưới đây sẽ hướng dẫn bạn cách nhân bản nhanh trong Canva trong vài thao tác đơn giản.

Cùng chuyên mục

Tình báo Hàn Quốc cáo buộc DeepSeek thu thập dữ liệu cá nhân “quá mức”

Cơ quan tình báo Hàn Quốc cáo buộc ứng dụng AI DeepSeek của Trung Quốc thu thập dữ liệu cá nhân "quá mức" và sử dụng dữ liệu đầu vào để đào tạo, đồng thời đặt câu hỏi về phản ứng của ứng dụng đối với các câu hỏi liên quan đến vấn đề dân tộc. ...

Hội nghị thượng đỉnh AI hướng đến đổi mới và trí tuệ nhân tạo an toàn

Các nhà lãnh đạo thế giới và giám đốc điều hành công nghệ bắt đầu họp tại Paris (Pháp) hôm nay (10/2) để thảo luận về sự đổi mới và cách áp dụng trí tuệ nhân tạo (AI) an toàn. ...

Mới nhất

thống nhất các nội dung về đổi mới quản lý, tinh gọn bộ máy

Kinhtedothi-Chiều 10/2, đồng chí Phạm Đình Nghị, Phó Bí thư Tỉnh ủy, Chủ tịch UBND tỉnh chủ trì cuộc họp để xem xét, thông qua các nội dung trình tại Kỳ họp HĐND tỉnh khóa XIX, nhiệm kỳ 2021-2026. Cuộc họp tập trung vào việc giải quyết các công việc phát sinh đột xuất và triển khai Đề án sắp...

Nam Định có thêm cụm công nghiệp hơn 666 tỷ đồng

CCN Nam Thanh được quy hoạch diện tích 50ha, vị trí giao thông thuận lợi: phía Bắc giáp thôn Quyết Tiến, xã Nam Thanh; phía Nam giáp xã Trực Tuấn, phía Đông giáp xã Trung Đông (huyện Trực Ninh); phía Tây giáp tuyến đường bộ Nam Định - Lạc Quần. CCN này sẽ tập trung các ngành nghề hoạt...

Dự báo thời tiết 11/2/2025: Miền Bắc mưa phùn, sương mù

Dự báo thời tiết 11/2/2025: Thời tiết Miền Nam và miền Bắc đối lập trong ngày 11/2. Trong khi miền Bắc chìm trong mưa phùn và sương mù, trời rét, thì miền Nam lại đón nắng vàng rực rỡ. Theo chuyên gia của Trung tâm Dự báo khí tượng thủy văn quốc gia, thời tiết, từ ngày 11 - 20/2,...

Cổ phiếu thép lao dốc, VN-Index giảm gần 12 điểm

NDO - Phiên giao dịch ngày 10/2, áp lực bán gia tăng trên diện rộng khiến thị trường chìm trong sắc đỏ sau bốn phiên tăng liên tiếp, trong đó nhóm cổ phiếu thép lao dốc. Điểm nhấn phiên này là nhóm cổ phiếu khoáng sản lội ngược dòng tiếp tục bứt phá với nhiều mã tăng...

Việt Nam nắm giữ 2 loại nông sản “nóng” nhất toàn cầu

Theo Bloomberg, Việt Nam đang sở hữu 2 loại nông sản 'nóng' nhất toàn cầu là cao su và cà phê, trong bối cảnh thế giới đang bị ảnh hưởng bởi biến đổi khí hậu. Trong 6 tháng vừa qua, hàng loạt nhà đầu tư đã ‘đặt cược’ vào thị trường nông sản vùng nhiệt đới...

Mới nhất