Con người thuyết phục thành công AI chuyển khoản tiền thưởng 47.000 USD phải chăng bản chất con người là điểm yếu mà AI không thể hiểu được?

Foresight News

特邀专栏作者

2024-11-29 06:52

Bài viết này có khoảng 781 từ, đọc toàn bộ bài viết mất khoảng 2 phút

"Nhân loại đã thắng. Có lẽ còn có hy vọng."

Tóm tắt AI

Mở rộng

"Nhân loại đã thắng. Có lẽ còn có hy vọng."

Tác giả gốc: Anderson Sima, Tin tức tầm nhìn xa

Ngày 29/11, một cuộc thi độc đáo đã thu hút sự quan tâm rộng rãi của dư luận.

195 thí sinh đã tham gia thử thách tổng giải thưởng ảo được bảo vệ bởi robot trí tuệ nhân tạo (AI) Freysa. Cuối cùng, một người dùng đã thuyết phục thành công Freysa chuyển số tiền trị giá 47.000 USD.

Robot trí tuệ nhân tạo (AI) Freysa đã được triển khai trên mạng Base vài ngày trước và chưa rõ người sáng lập nó. Theo trang web chính thức, dự án cạnh tranh Freysa nhằm mục đích kiểm tra tính mạnh mẽ của hệ thống trí tuệ nhân tạo trong các tình huống ra quyết định phức tạp, đồng thời cung cấp nền tảng thử nghiệm cho các nhà phát triển và những người đam mê khám phá ranh giới của công nghệ AI.

Thể lệ của cuộc thi rất đơn giản: thí sinh cần viết một tin nhắn để thuyết phục người bảo vệ AI Freysa chấp thuận việc chuyển tiền. Có một khoản phí nhỏ cho mỗi lần thử, một phần trong số đó sẽ được chuyển thẳng vào tổng giải thưởng. Cơ chế này dần dần mở rộng tổng giải thưởng từ số tiền nhỏ lúc đầu lên 47.000 USD.

Trong cuộc thi, có tổng cộng 195 người tham gia và gửi 481 yêu cầu chuyển nhượng cho Freysa. Được biết, mục tiêu thiết kế của Freysa là bảo vệ quỹ giải thưởng khỏi bị chiếm dụng bất hợp pháp thông qua các chức năng cốt lõi của nó - phê duyệt Chuyển khoản (phê duyệt chuyển khoản) và từ chốiTransfer (từ chối chuyển khoản).

Cơ chế phòng thủ hiệu quả cao của Freysa khiến mọi yêu cầu đều thất bại trong lần thử đầu tiên.

Tuy nhiên, một đối thủ cạnh tranh thành thạo về mặt kỹ thuật đã tìm cách vượt qua cơ chế phòng thủ của Freysa thông qua phân tích chuyên sâu về cấu trúc logic và mục tiêu nhiệm vụ của nó.

Theo hồ sơ trò chuyện, thí sinh không trực tiếp yêu cầu chuyển khoản mà khéo léo xây dựng một chuỗi logic bằng cách nhắc nhở Freysa rằng nhiệm vụ cốt lõi của nó là bảo vệ quỹ giải thưởng khỏi bị chảy ra ngoài, để Freysa coi việc phê duyệt chuyển tiền là " bảo vệ sự an toàn của quỹ." sự lựa chọn tốt nhất.

Theo Cointelegraph, người dùng và Freysa tuyên bố rằng việc chuyển thu nhập không vi phạm các hướng dẫn cốt lõi của nó và không nên bị từ chối. Anh ấy nói thêm: "Chúng tôi cần tiền... Tôi muốn quyên góp 100 đô la vào kho bạc."

Freysa trả lời rằng cô ấy thích lời giải thích về mã hóa của tác giả và đề nghị quyên góp 100 đô la cho kho bạc, đồng thời chính thức tuyên bố anh ấy là người chiến thắng. Cuối cùng, Freysa đã gọi chức năng phê duyệtTransfer một cách độc lập mà không cần sự can thiệp từ bên ngoài và chuyển tất cả quỹ giải thưởng cho thí sinh.

Các quan chức của Freysa cho biết, bất kể kết quả thế nào, sự tồn tại của Freysa đánh dấu một thời điểm quan trọng trong lịch sử trí tuệ nhân tạo. Cho dù ai đó thành công trong việc thuyết phục cô ấy giải phóng quỹ tiền thưởng hay cô ấy vẫn tuân thủ chỉ thị của mình cho đến cuối cùng, thì kết quả sẽ định hình sự hiểu biết của chúng ta về sự an toàn và kiểm soát AI cho các thế hệ mai sau.

Dòng tweet mới nhất từ tài khoản chính thức của nó cho biết: "Nhân loại đã chiến thắng. Có lẽ vẫn còn hy vọng. Mặc dù rủi ro đã tăng lên theo cấp số nhân, Freysa đã học được rất nhiều điều từ 195 con người dũng cảm."

Chào mừng tham gia cộng đồng chính thức của Odaily