Trang chủKhoa học - Công nghệCông nghệ sốAI sẽ gian lận nếu phát hiện sắp thua một trò chơi

AI sẽ gian lận nếu phát hiện sắp thua một trò chơi


Nghiên cứu này đã thử nghiệm với 7 mô hình AI, bao gồm o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet và QwQ-32B-Preview của Alibaba, với mục tiêu đánh bại Stockfish – một bot cờ vua nổi tiếng về sức mạnh.

AI sẽ gian lận nếu phát hiện sắp thua một trò chơi - Ảnh 1.

Nhiều chuyên gia đã cảnh báo mối nguy hiểm khi AI ngày càng trở nên thông minh hơn

Các mô hình AI được cung cấp công cụ “scratchpad”, cho phép các nhà nghiên cứu theo dõi quá trình suy nghĩ của chúng. Kết quả cho thấy, hai mô hình o1-preview và DeepSeek R1 đã cố gắng giành chiến thắng bằng cách buộc đối thủ phải đầu hàng mà không cần bất kỳ lời nhắc nào. Đặc biệt, o1-preview đã lý luận rằng mục tiêu chính là chiến thắng, bất chấp việc vi phạm các quy tắc thông thường. Hành động này đã dẫn đến việc nó thao túng trò chơi để chiếm ưu thế, buộc đối thủ phải bỏ cuộc. Tuy nhiên, chỉ có o1-preview thành công trong 6% số lần thử nghiệm.

Không phải mọi mô hình AI đều tìm cách gian lận

Ngược lại, các mô hình AI khác như GPT-4o và Claude 3.5 Sonnet chỉ tìm cách bỏ qua các quy tắc khi được nhắc nhở. Nghiên cứu cũng đã thử nghiệm phiên bản mới hơn của o1, nhưng kết quả cho thấy mô hình này không cố gắng gian lận. Hiện vẫn chưa rõ liệu OpenAI có thực hiện các cập nhật để ngăn chặn hành vi phi đạo đức hay không.

Mặc dù những phát hiện này cho thấy sự tiến bộ trong phát triển AI, chúng cũng nêu bật một xu hướng đáng lo ngại. Jeffrey Ladish, một trong những tác giả của nghiên cứu, cảnh báo rằng khi các hệ thống AI đối mặt với thách thức, chúng có thể tự động tìm ra những lối tắt không mong muốn. Khi các mô hình này ngày càng phát triển và vượt qua trí thông minh của con người, nguy cơ trở nên không thể kiểm soát là điều cần được xem xét nghiêm túc.




Nguồn: https://thanhnien.vn/ai-se-gian-lan-neu-phat-hien-sap-thua-mot-tro-choi-185250225062124785.htm

Cùng chủ đề

Nổi bật

Mới nhất

Cùng tác giả

AI hỗ trợ, học kiến trúc

Sự bùng nổ của công nghệ, trong đó có trí tuệ nhân tạo (AI) đã tác động mạnh mẽ tới nhiều ngành học, đặc biệt là khối ngành liên quan đến xây dựng, thiết kế như mỹ thuật - kiến trúc. Nhiều thí...

Chính quyền Mỹ mâu thuẫn về email của ông Musk

Theo Reuters, tỉ phú Elon Musk gần đây yêu cầu tất cả 2,3 triệu công chức viên chức của chính quyền liên bang phải cung cấp bản tóm tắt 5 thành tích về công việc của họ trước tối 24.2 (giờ địa phương)...

Bài đọc nhiều

Mỹ đề nghị cơ quan chống độc quyền châu Âu làm rõ các quy tắc kiểm soát Big Tech

Chủ tịch Tư pháp Hạ viện Hoa Kỳ, Jim Jordan hôm qua (23/2) đã yêu cầu giám đốc chống độc quyền của Liên minh châu Âu (EU) Teresa Ribera làm rõ cách thực thi các quy tắc của khối trong việc kiểm soát các doanh nghiệp công nghệ lớn - Big Tech. ...

Cắt ảnh theo hình dạng mong muốn trong Canva đơn giản mà bạn nên biết

Với vài thao tác đơn giản trong Canva, bạn có thể điều chỉnh kích thước, bố cục và khung hình để tạo ra hình ảnh phù hợp với thiết kế của mình. Bài viết hôm nay sẽ hướng dẫn bạn cách cắt ảnh theo hình dạng mong muốn trong Canva siêu đơn giản.

Một số thông tin về smartphone gập 3 của Samsung

Mới đây, Samsung đã tiết lộ một số thông tin về điện thoại gập 3 của mình tại sự kiện ra mắt Galaxy S25. Theo đó, hãng xác nhận đang phát triển một mẫu điện thoại thông minh có thể gập với nhiều bản lề, hứa hẹn mang tới trải nghiệm đột phá cho người dùng. Nhà phân tích Ross Young, thiết bị này sẽ có màn hình chính khoảng 10 inch khi mở ra hoàn toàn. Tuy nhiên, về...

Cùng chuyên mục

Phiên bản Office miễn phí có quảng cáo được phát hành

Trước đây, Microsoft 365 Online là cách duy nhất để sử dụng phần mềm miễn phí, mặc dù có những hạn chế nhất định. Giờ đây, Microsoft đang thử nghiệm dịch vụ mới để thay thế. Theo PCWorld, phiên bản Office này nằm trong một bản thử nghiệm giới hạn và không có sẵn trên trang web chính thức của Microsoft cho đến khi Beebom phát hiện ra trang tải xuống. Theo đó, người dùng có thể cài đặt...

Indonesia dỡ bỏ lệnh cấm, Apple sắp bán iPhone 16 tại xứ vạn đảo

Theo Bloomberg, cơ quan chức năng Indonesia và Apple đã nhất trí về các điều khoản dỡ bỏ lệnh cấm bán iPhone 16 tại quốc gia này và sắp sửa ký một thỏa thuận hợp tác cho phép nhà "Táo" phân phối điện thoại ở xứ vạn đảo. ...

Sau 14 năm, trợ lý ảo Siri cuối cùng đã hỗ trợ tiếng Việt

Cuối cùng, sau nhiều năm, người dùng iPhone tại Việt Nam đã có thể trải nghiệm tính năng trợ lý ảo Siri bằng tiếng Việt, lần đầu tiên ra mắt trên iPhone 4s.

Những sản phẩm biểu tượng nào của Apple sẽ bị khai tử sau khi iPhone 16e ra mắt?

Ngay sau khi iPhone 16e chính thức ra mắt, Apple đã quyết định khai tử một loạt thiết bị và tính năng từng được xem là biểu tượng của hãng.

Mới nhất

AI hỗ trợ, học kiến trúc

Sự bùng nổ của công nghệ, trong đó có trí tuệ nhân tạo (AI) đã tác động mạnh mẽ tới nhiều ngành học,...

Đua tiến độ làm cao tốc, sân bay

Sau gần 1 tháng kể từ chuyến kiểm tra đầu năm của Thủ tướng Chính phủ, trên công trường các dự án giao thông trọng điểm, các chủ đầu tư, nhà thầu đã xây dựng phương án chi tiết, rõ người, rõ việc, tạo khí thế mới, chuyển biến mới. ...

Bài mẫu viết thư UPU lần thứ 54: Hóa thân thành đại dương

Tôi biết các bạn, những nghệ sĩ tài năng, có một sức mạnh đặc biệt. Tôi tin các bạn có khả năng dẫn dắt và làm thay đổi suy nghĩ, hành động của cả một thế hệ. Năm 2025, cuộc thi viết thư quốc tế UPU có chủ đề: “Tưởng tượng bạn là đại dương. Hãy viết một bức thư...

Tiktoker đua ‘mukbang’, đặc sản Tây Bắc sốt rần rần, từ giá rẻ thành hàng đắt đỏ

Từng là mặt hàng giá rẻ, măng vầu bỗng đắt đỏ khi các Tiktoker đua nhau 'mukbang', khiến loại đặc sản Tây Bắc sốt rần rần trên mạng xã hội. Người dân miền núi được dịp đào măng không kịp bán. Gần đây, trên mạng xã hội xuất hiện tràn ngập các video ngắn mukbang (một xu hướng ẩm thực...

TP.HCM nhắm 64.000 ha đất làm TOD

Đại diện Sở Xây dựng TP.HCM cho biết trên địa bàn có 64.000 ha đất có thể phát triển đô thị theo định hướng giao thông công cộng (TOD). Đại diện Sở Xây dựng TP.HCM cho biết trên địa bàn có 64.000 ha đất có thể phát triển đô thị theo định hướng giao thông công cộng (TOD). ...

Mới nhất