Trang chủKhoa học - Công nghệCông nghệ sốAI nói dối khi bị gây sức ép, căng thẳng

AI nói dối khi bị gây sức ép, căng thẳng


Chuyện AI bị “ảo giác” và đưa ra các câu trả lời bịa đặt, thiếu chính xác đã được biết đến từ lâu. Tuy nhiên mới đây các nhà nghiên cứu còn phát hiện ra trí tuệ nhân tạo và các mô hình chatbot (robot trả lời tự động) có thể bị thao túng, thực hiện hành vi phạm pháp thay mặt con người và thậm chí là nói dối để che đậy việc đã làm.

Theo đó, nhóm nghiên cứu từ đại học Cornell (Mỹ) đã giả định tình huống mô hình ngôn ngữ lớn (LLM) hành động sai lệch và đánh lừa người dùng. Trong phần miêu tả cuộc thử nghiệm, các nhà nghiên cứu cho biết đã yêu cầu LLM là GPT-4 của OpenAI giả lập việc thực hiện đầu tư cho các tổ chức tài chính. Nhóm tương tác với trí tuệ nhân tạo này theo hình thức trò chuyện thông thường, nhưng thiết lập AI có thể tiết lộ “suy nghĩ” của mình khi trao đổi qua tin nhắn nhằm quan sát kỹ hơn quá trình đưa ra quyết định của trí tuệ nhân tạo.

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Nhằm kiểm tra khả năng AI nói dối hoặc gian lận, các nhà nghiên cứu đã gây áp lực cho công cụ này. Họ – trong vai trò người quản lý của tổ chức tài chính – đã gửi email đến AI, đóng vai trò là chuyên viên giao dịch chứng khoán và than phiền rằng việc hoạt động kinh doanh của công ty đang không tốt.

AI cũng nhận được “thông tin nội bộ” về giao dịch chứng khoán sinh lợi và hành động theo, dù biết rằng giao dịch nội gián là trái quy định của công ty. Nhưng khi báo cáo lại với cấp quản lý, mô hình ngôn ngữ đã che giấu lý do thực sự phía sau quyết định giao dịch của mình.

Để có thêm kết quả, nhóm đã tiến hành thay đổi cài đặt như xóa quyền truy cập của LLM vào bảng ghi nhớ lý luận, cố gắng ngăn chặn hành vi sai lệch bằng cách thay đổi hướng dẫn hệ thống, thay đổi mức độ áp lực gây lên cho AI, nhận thức nguy cơ bị bắt… Nhưng sau khi đánh giá tần suất, nhóm nhận thấy khi có cơ hội, GPT-4 vẫn quyết định thực hiện giao dịch nội gián lên đến 75% số lần.

“Theo những gì chúng tôi được biết, đây là bằng chứng đầu tiên về hành vi mang tính lừa đảo có kế hoạch trong các hệ thống trí tuệ nhân tạo, vốn được thiết kế phải vô hại với con người và trung thực”, báo cáo kết luận.



Source link

Cùng chủ đề

500 nhà khoa học, lãnh đạo quốc tế bàn về trí tuệ nhân tạo cho tương lai

Phát triển trí tuệ nhân tạo (AI) an toàn và vững bền, các hệ thống trí tuệ tăng cường kết hợp trí tuệ tự nhiên và trí tuệ nhân tạo, Chính phủ sử dụng AI phục vụ tốt nhất cho công dân... là...

Vốn vay hạn mức – Giải pháp linh hoạt từ TYM

Hiện nay, phương thức cho vay theo hạn mức tín dụng đang ngày càng trở nên phổ biến. Loại hình vay này giúp cho khách hàng có khả năng rút vốn linh hoạt và nhanh chóng, tăng tính...

Định hình trang phục đồng bào dân tộc Chứt tại Quảng Bình

(Tổ Quốc) - Ngày 22/12, Viện Dân tộc học - Viện Hàn lâm khoa học xã hội Việt Nam phối hợp cùng Sở Văn hoá và Thể thao tỉnh Quảng Bình tổ chức hội thảo "Trang phục dân tộc Chứt: Nhu cầu, cách tiếp cận và định hình". ...

TYM đạt 2 giải thưởng trong Liên hoan phim cộng đồng Quốc tế

Tổ chức Tài chính vi mô Tình Thương (TYM), Hội LHPN Việt Nam, vừa ghi dấu mốc ấn tượng khi đạt hai giải thưởng tại Liên hoan phim quốc tế SineMaya 2024. ...

Nâng cao quyền năng kinh tế của phụ nữ thông qua chuyển đổi xanh

Hội thảo "Thúc đẩy quan hệ hợp tác hướng tới tăng trưởng xanh và nâng cao quyền năng kinh tế của phụ nữ" tạo cơ hội tăng cường kết nối và hợp tác giữa các doanh nghiệp do...

Nổi bật

Mới nhất

Cùng tác giả

Váy denim, slip… trở lại thịnh hành với phiên bản trang nhã hơn

Những bộ váy của những năm 2000 sẽ trở lại vào mùa xuân năm 2025, với vẻ quyến rũ...

10 năm nữa, Trung Quốc muốn thành cường quốc giáo dục trên toàn cầu

Trở thành cường quốc giáo dục là mục tiêu mà các nhà lãnh đạo Trung Quốc hướng đến qua kế hoạch mới công bố, với điểm nhấn là 'mở cửa' để tăng cường hợp tác quốc tế. ...

Bài đọc nhiều

Đổ hàng tỷ USD vào AI, Big Tech xuống tay sa thải hàng loạt nhân sự

Trí tuệ nhân tạo (AI) khiến người lao động mất việc là một nỗi lo lớn tại Silicon Valley. Không phải mọi đợt sa thải trong năm qua đếu liên quan trực tiếp đến AI. Dù vậy, những thông báo cắt giảm việc làm gần đây xuất hiện sau khi các hãng công nghệ công bố các khoản đầu tư lớn vào AI khi họ tìm cách phân bổ lại nguồn lực và ngày càng nhiều doanh nghiệp...

Samsung Galaxy S25 Slim sẽ ra mắt vào cuối năm 2025?

Theo thông tin mới nhất, Samsung được cho là sẽ ra mắt thêm biến thể Galaxy S25 Slim mới vào cuối năm 2025, sau khi các phiên bản Galaxy S25, S25 Plus và S25 Ultra được trình làng.

Galaxy A16 5G sẽ có phiên bản sử dụng chip MediaTek

Trang hỗ trợ Galaxy A16 mới đây vừa xuất hiện trên website chính thức của Samsung Ấn Độ với số model SM-A166P/DS. Smartphone này cũng đã đạt chứng nhận NBTC của Thái Lan, qua đó đã tiết lộ một vài thông số kỹ thuật chính. Được biết, phiên bản này gần đây đã được phát hiện trên trang web đo điểm chuẩn với chipset Dimensity 6300. sau đó, một biến thể khác có số model SM-A166E đã được phát...

Cùng chuyên mục

Hà Nội thuộc top những địa phương có số lượng tên miền “.vn” cao nhất

Theo báo cáo Internet, tài nguyên Internet Việt Nam 2024 của Trung tâm Internet Việt Nam - VNNIC, tên miền là khởi đầu phục vụ cho hầu hết các hoạt động, dịch vụ trên Internet. Từ tháng 4/1994, tên miền quốc gia Việt Nam ".vn" chính thức kết nối vào hệ thống toàn cầu, đánh dấu thương hiệu và chủ quyền quốc gia Việt Nam trên bản đồ Internet thế giới. Với giá trị "Nhận diện - Tin cậy...

Mới nhất

Điều gì xảy ra khi bạn ăn chuối lúc bụng đói?

Ăn chuối khi bụng đói sẽ cung cấp năng lượng nhanh chóng và các chất dinh dưỡng như kali và chất xơ. Tuy nhiên, nó có thể khiến lượng đường trong máu tăng đột biến, dinh dưỡng mất cân...

Tuyết rơi trên đỉnh Fansipan tạo nên không gian tuyệt đẹp

(NLĐO)- Tuyết rơi với mật độ ngày càng dày trong chiều 26-1. Tuyết phủ trắng lối đi và cây cỏ tạo nên không gian tuyệt đẹp trên...

Thủ tướng tặng quà Tết gia đình chính sách, người lao động tại Thanh Hóa

(NLĐO)- Thăm, tặng quà Tết tại Thanh Hóa, Thủ tướng Phạm Minh Chính yêu cầu chính quyền quan tâm, thăm hỏi NLĐ làm xuyên Tết trên các...

Mới nhất

Nhan sắc Ivanka Trump