Anthropic bị tố không khắc phục lỗ hổng trên Claude Fable 5

Anthropic bị tố không khắc phục lỗ hổng trên Claude Fable 5

Theo Tom’sHardware, Claude Fable 5 – mô hình AI mới của Anthropic, đang bị đặt vào tâm điểm tranh luận về an toàn AI tại Mỹ. Chính phủ Mỹ đã yêu cầu vô hiệu hóa Fable 5 và Mythos 5 trên phạm vi toàn cầu do lo ngại các năng lực mạng nâng cao của hai mô hình này có thể rơi vào tay những người không được phép tiếp cận.

Fable được mô tả là tên thương mại của nhóm mô hình Mythos, trong đó Claude Fable 5 là phiên bản hướng đến người dùng phổ thông. Vấn đề nằm ở cơ chế bảo vệ giữa Fable và Mythos, mô hình nền có năng lực mạng mạnh hơn. Một đối tác được cả Anthropic và chính phủ Mỹ tin cậy được cho là đã phát hiện cách vượt qua lớp bảo vệ này khi thử nghiệm Fable.

David Sacks, đồng Chủ tịch Hội đồng Cố vấn Khoa học và Công nghệ của tổng thống Mỹ, nói chính phủ đã cảnh báo Anthropic về lỗ hổng trên Claude Fable 5. Theo ông, CEO Dario Amodei đã từ chối sửa lỗi hoặc rút mô hình khỏi triển khai.

Sacks cho biết biện pháp kiểm soát xuất khẩu được đưa ra một cách miễn cưỡng sau khi Anthropic không đáp ứng yêu cầu. Ông cũng nói Washington muốn dỡ bỏ hạn chế khi vấn đề được khắc phục và trách nhiệm hiện nằm ở phía Anthropic.

Anthropic không đồng ý với cáo buộc trên. Công ty cho rằng vấn đề có phạm vi hẹp, không phổ biến và chủ yếu liên quan việc yêu cầu mô hình đọc mã nguồn để tìm lỗi phần mềm. Anthropic cũng lập luận kết quả tương tự có thể xuất hiện trên các mô hình AI công khai khác.

Công ty phản đối quan điểm cho rằng một vấn đề hẹp như vậy đủ để buộc thu hồi mô hình đang được hàng trăm triệu người dùng. Sacks bác bỏ cách lý giải này, cho rằng nếu một lỗ hổng có thể kích hoạt năng lực giống “vũ khí mạng”, rất khó xem đó là vấn đề không nghiêm trọng.

Vụ việc cho thấy áp lực ngày càng lớn với các công ty AI khi mô hình mới không chỉ được đánh giá bằng hiệu năng, mà còn bằng khả năng kiểm soát rủi ro trong quá trình triển khai. Với Claude Fable 5, tranh cãi hiện vẫn xoay quanh cách hiểu khác nhau giữa cơ quan quản lý và Anthropic về mức độ nghiêm trọng của vấn đề.

Tin Gốc: Thanh Niên