
Anthropic đang tiến hành hạn chế quyền truy cập vào mô hình AI mới của mình sau khi công ty này phát hiện hàng ngàn lỗ hổng phần mềm trên các hệ thống lớn, làm dấy lên những lo ngại nghiêm trọng về khả năng bị lạm dụng trong các cuộc tấn công mạng.
Theo Anthropic, mô hình AI đa năng mới này đã tìm thấy các lỗ hổng bảo mật nghiêm trọng trên mọi hệ điều hành và trình duyệt web lớn.
“Với tốc độ phát triển của AI, sẽ không mất nhiều thời gian trước khi những khả năng như vậy phổ biến rộng rãi, có khả năng vượt ra ngoài tầm kiểm soát của những người cam kết triển khai chúng một cách an toàn.”
AI đã và đang được tin tặc sử dụng rộng rãi để thực hiện các cuộc tấn công mạng. Theo AllAboutAI, đã có sự gia tăng 72% các cuộc tấn công mạng được hỗ trợ bởi AI hàng năm, với 87% các tổ chức toàn cầu đã trải qua các cuộc tấn công do AI kích hoạt vào năm 2025.
Anthropic bày tỏ lo ngại về những gì sẽ xảy ra nếu các khả năng AI tương tự bị sử dụng bởi những kẻ xấu.
Để chống lại mối đe dọa này, Anthropic đã công bố Dự án Glasswing vào thứ Ba vừa qua, một sáng kiến mới tập hợp hơn 40 công ty hàng đầu, bao gồm Amazon Web Services, Apple, Cisco, Google, JPMorgan, Linux Foundation, Microsoft và Nvidia.
Dự án Glasswing sẽ sử dụng khả năng của Claude Mythos Preview để chủ động tìm lỗi, chia sẻ dữ liệu với các đối tác và đi trước các mối đe dọa bằng cách vá các lỗ hổng nghiêm trọng trước khi những kẻ xấu có thể khai thác chúng.
Các Lỗ Hổng Hàng Thập Kỷ Đang Dần Bị Phát Hiện
Lỗ hổng zero-day là một lỗi phần mềm có thể bị khai thác trước khi bất kỳ ai có khả năng vá lỗi biết về sự tồn tại của nó. Việc tìm kiếm và vá lỗi này theo truyền thống đòi hỏi chuyên môn hiếm có và đắt đỏ từ con người, nhưng AI có thể thay đổi quy mô và tốc độ phát hiện.
Anthropic cho biết các lỗ hổng mà họ tìm thấy “thường rất tinh vi hoặc khó phát hiện”.
Nhiều lỗ hổng trong số đó đã tồn tại 10 hoặc 20 năm, với lỗ hổng cũ nhất được tìm thấy cho đến nay là một lỗi 27 năm tuổi trong OpenBSD — một hệ điều hành nổi tiếng về bảo mật, đã được vá.
AI cũng phát hiện một lỗi 16 năm tuổi trong thư viện xử lý đa phương tiện FFmpeg, một lỗ hổng thực thi mã từ xa 17 năm tuổi trong hệ điều hành mã nguồn mở FreeBSD và vô số lỗ hổng trong nhân Linux.
Liên quan: Cổ phiếu an ninh mạng lao dốc sau khi Anthropic ra mắt Claude Code Security
Mythos Preview cũng xác định một số điểm yếu trong các thư viện mật mã, thuật toán và giao thức phổ biến nhất thế giới, bao gồm TLS, AES-GCM và SSH.
Họ còn cho biết các ứng dụng web “chứa vô số lỗ hổng”, từ cross-site scripting và SQL injection đến các lỗ hổng cụ thể theo từng tên miền như cross-site request forgery, thường được sử dụng trong các cuộc tấn công lừa đảo (phishing).

Anthropic khẳng định 99% các lỗ hổng mà họ tìm thấy vẫn chưa được vá, “vì vậy sẽ là vô trách nhiệm nếu chúng tôi tiết lộ chi tiết về chúng.”
Phần Mềm Sẽ An Toàn Hơn, Nhưng Không Phải Ngày Một Ngày Hai
Anthropic cho biết đây có thể chỉ là khởi đầu của một xu hướng, và “công việc bảo vệ cơ sở hạ tầng mạng toàn cầu có thể mất nhiều năm,” nhưng AI chắc chắn sẽ giúp củng cố phần mềm và hệ thống.
“Về lâu dài, chúng tôi kỳ vọng rằng khả năng phòng thủ sẽ chiếm ưu thế: thế giới sẽ trở nên an toàn hơn, với phần mềm được củng cố tốt hơn — phần lớn nhờ vào mã được viết bởi các mô hình này. Nhưng giai đoạn chuyển tiếp sẽ đầy rẫy hiểm nguy.”
Tạp chí: Không ai biết mật mã lượng tử an toàn có thực sự hoạt động hay không
tienso.org cam kết đưa tin độc lập và minh bạch. Bài viết này được sản xuất theo Chính sách Biên tập của tienso.org và nhằm cung cấp thông tin chính xác, kịp thời. Độc giả được khuyến khích tự mình xác minh thông tin.
