Trang chủKhoa học - Công nghệCông nghệ sốAI sẽ gian lận nếu phát hiện sắp thua một trò chơi

AI sẽ gian lận nếu phát hiện sắp thua một trò chơi


Nghiên cứu này đã thử nghiệm với 7 mô hình AI, bao gồm o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet và QwQ-32B-Preview của Alibaba, với mục tiêu đánh bại Stockfish – một bot cờ vua nổi tiếng về sức mạnh.

AI sẽ gian lận nếu phát hiện sắp thua một trò chơi - Ảnh 1.

Nhiều chuyên gia đã cảnh báo mối nguy hiểm khi AI ngày càng trở nên thông minh hơn

Các mô hình AI được cung cấp công cụ “scratchpad”, cho phép các nhà nghiên cứu theo dõi quá trình suy nghĩ của chúng. Kết quả cho thấy, hai mô hình o1-preview và DeepSeek R1 đã cố gắng giành chiến thắng bằng cách buộc đối thủ phải đầu hàng mà không cần bất kỳ lời nhắc nào. Đặc biệt, o1-preview đã lý luận rằng mục tiêu chính là chiến thắng, bất chấp việc vi phạm các quy tắc thông thường. Hành động này đã dẫn đến việc nó thao túng trò chơi để chiếm ưu thế, buộc đối thủ phải bỏ cuộc. Tuy nhiên, chỉ có o1-preview thành công trong 6% số lần thử nghiệm.

Không phải mọi mô hình AI đều tìm cách gian lận

Ngược lại, các mô hình AI khác như GPT-4o và Claude 3.5 Sonnet chỉ tìm cách bỏ qua các quy tắc khi được nhắc nhở. Nghiên cứu cũng đã thử nghiệm phiên bản mới hơn của o1, nhưng kết quả cho thấy mô hình này không cố gắng gian lận. Hiện vẫn chưa rõ liệu OpenAI có thực hiện các cập nhật để ngăn chặn hành vi phi đạo đức hay không.

Mặc dù những phát hiện này cho thấy sự tiến bộ trong phát triển AI, chúng cũng nêu bật một xu hướng đáng lo ngại. Jeffrey Ladish, một trong những tác giả của nghiên cứu, cảnh báo rằng khi các hệ thống AI đối mặt với thách thức, chúng có thể tự động tìm ra những lối tắt không mong muốn. Khi các mô hình này ngày càng phát triển và vượt qua trí thông minh của con người, nguy cơ trở nên không thể kiểm soát là điều cần được xem xét nghiêm túc.




Nguồn: https://thanhnien.vn/ai-se-gian-lan-neu-phat-hien-sap-thua-mot-tro-choi-185250225062124785.htm

Cùng chủ đề

Nổi bật

Mới nhất

Cùng tác giả

Người bị tiểu đường nên đi bộ thế nào là tốt nhất?

Bệnh tiểu đường là một căn bệnh liên quan đến lối sống và có thể kiểm soát được. Đối với căn bệnh này, điều quan trọng là phải giữ lượng đường cân bằng. ...

Phát hiện điều tuyệt vời từ tỏi liên quan đến đau tim, đột quỵ

Nghiên cứu mới vừa được công bố trên tạp chí khoa học Food Bioscience, phát hiện tỏi và một số loại thực vật của chế độ ăn Địa Trung Hải có khả năng cải thiện sức khỏe tim mạch, ngăn ngừa đột quỵ. ...

Phối đồ nhiều lớp, bí quyết giúp nàng mặc đẹp mọi thời tiết

Những món đồ kinh điển của phong cách phối đồ nhiều lớp, có thể kể đến như áo...

Bài đọc nhiều

Một số thông tin về smartphone gập 3 của Samsung

Mới đây, Samsung đã tiết lộ một số thông tin về điện thoại gập 3 của mình tại sự kiện ra mắt Galaxy S25. Theo đó, hãng xác nhận đang phát triển một mẫu điện thoại thông minh có thể gập với nhiều bản lề, hứa hẹn mang tới trải nghiệm đột phá cho người dùng. Nhà phân tích Ross Young, thiết bị này sẽ có màn hình chính khoảng 10 inch khi mở ra hoàn toàn. Tuy nhiên, về...

Mỹ đề nghị cơ quan chống độc quyền châu Âu làm rõ các quy tắc kiểm soát Big Tech

Chủ tịch Tư pháp Hạ viện Hoa Kỳ, Jim Jordan hôm qua (23/2) đã yêu cầu giám đốc chống độc quyền của Liên minh châu Âu (EU) Teresa Ribera làm rõ cách thực thi các quy tắc của khối trong việc kiểm soát các doanh nghiệp công nghệ lớn - Big Tech. ...

Cắt ảnh theo hình dạng mong muốn trong Canva đơn giản mà bạn nên biết

Với vài thao tác đơn giản trong Canva, bạn có thể điều chỉnh kích thước, bố cục và khung hình để tạo ra hình ảnh phù hợp với thiết kế của mình. Bài viết hôm nay sẽ hướng dẫn bạn cách cắt ảnh theo hình dạng mong muốn trong Canva siêu đơn giản.

Cùng chuyên mục

Indonesia dỡ bỏ lệnh cấm, Apple sắp bán iPhone 16 tại xứ vạn đảo

Theo Bloomberg, cơ quan chức năng Indonesia và Apple đã nhất trí về các điều khoản dỡ bỏ lệnh cấm bán iPhone 16 tại quốc gia này và sắp sửa ký một thỏa thuận hợp tác cho phép nhà "Táo" phân phối điện thoại ở xứ vạn đảo. ...

Sau 14 năm, trợ lý ảo Siri cuối cùng đã hỗ trợ tiếng Việt

Cuối cùng, sau nhiều năm, người dùng iPhone tại Việt Nam đã có thể trải nghiệm tính năng trợ lý ảo Siri bằng tiếng Việt, lần đầu tiên ra mắt trên iPhone 4s.

Những sản phẩm biểu tượng nào của Apple sẽ bị khai tử sau khi iPhone 16e ra mắt?

Ngay sau khi iPhone 16e chính thức ra mắt, Apple đã quyết định khai tử một loạt thiết bị và tính năng từng được xem là biểu tượng của hãng.

Microsoft ra mắt vật liệu đột phá cho chip lượng tử

Microsoft vừa chính thức giới thiệu chip lượng tử đầu tiên do hãng phát triển, trong đó tích hợp một loại vật liệu tiên tiến mang tên topoconductor.

Mới nhất

Phó Thủ tướng Lê Thành Long thăm và chúc mừng Bệnh viện C Đà Nẵng

NDO - Chiều 25/2, Phó Thủ tướng Lê Thành Long đã đến thăm, động viên các cán bộ, nhân viên Bệnh viện C Đà Nẵng nhân dịp kỷ niệm 70 năm Ngày Thầy thuốc Việt Nam (27/2/1955-27/2/2025). Cùng dự có Ủy viên Trung ương Đảng, Bí thư Thành ủy, Trưởng đoàn đại biểu Quốc hội thành phố Đà...

Hà Nội hướng tới xóa bỏ các thủ tục hành chính không cần thiết

Kinhtedothi - UBND TP Hà Nội đã có Công văn số 615/UBND-KSTTHC triển khai thực hiện Thông báo số 56/TB-VPCP về kết luận phiên họp tổng kết hoạt động của Ủy ban Quốc gia về Chuyển đổi số và Đề án 06 năm 2024, phương hướng, nhiệm vụ trọng tâm năm 2025. Theo đó, quán triệt chỉ đạo của Thủ...

Hội đồng Anh có thêm trung tâm lớn nhất ở Hà Nội

Hội đồng Anh có thêm trung tâm giảng dạy tiếng Anh tại tòa nhà Lancaster Luminaire, một trong số ít tòa nhà "xanh" tại Việt Nam. Đây là trung tâm lớn nhất của Hội đồng Anh tại Hà Nội. ...

Công bố quyết định bổ nhiệm 6 giám đốc sở mới sáp nhập

Ngày 25/2, UBND tỉnh Cao Bằng tổ chức Hội nghị công bố nghị quyết, quyết định về sắp xếp tổ chức bộ máy và công tác cán bộ. ...

Người bị tiểu đường nên đi bộ thế nào là tốt nhất?

Bệnh tiểu đường là một căn bệnh liên quan đến lối sống và có thể kiểm soát được. Đối với căn bệnh này,...

Mới nhất