BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

Updated: 21/03/2026 at 20:00

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

Được đề cập trong bài viết
Mới cập nhật

Bitcoin (BTC) đã thể hiện hiệu suất vượt trội so với cổ phiếu Mỹ và vàng kể từ khi căng thẳng leo thang giữa Mỹ, Israel và Iran vào ngày 28/2 — qua đó khẳng định vai trò như một tài sản có khả năng chống chịu trước các cú... ...

Ripple (XRP) đang duy trì trạng thái ổn định quanh mức mở cửa ngày 1,45 USD tại thời điểm ghi nhận vào thứ Bảy. Diễn biến của token chuyển tiền này nhìn chung đồng pha với toàn thị trường tiền điện tử, vốn chịu áp lực giảm kể từ thứ... ...

Tại thời điểm viết bài, Quant (QNT) ghi nhận mức tăng 4,91% trong 24 giờ và tăng tổng cộng 24,14% trong tuần qua — một hiệu suất đáng chú ý đối với một altcoin vốn hóa trung bình, đặc biệt khi đặt cạnh Bitcoin (BTC). Đồng tiền điện tử dẫn... ...

BONK.fun đã chính thức khôi phục hoạt động sau sự cố bị chiếm quyền tên miền xảy ra vào tuần trước. Team xác nhận nguyên nhân đến từ lỗ hổng tại một nhà cung cấp bên thứ ba, khiến người dùng thiệt hại khoảng 30.000 USD. Trong thông báo ngày... ...

BNB Chain đang vươn lên trở thành một trong những hệ sinh thái nổi bật trong làn sóng AI agent đang tăng trưởng mạnh mẽ. Tuy nhiên, đà phát triển này vẫn chưa được phản ánh tương xứng vào diễn biến giá của token gốc của nó. Trong bối cảnh... ...

Shiba Inu (SHIB) tăng gần 6% tại thời điểm viết bài vào thứ Bảy, tiếp nối tín hiệu đảo chiều sau khi xuất hiện nến Doji trong phiên trước. Hoạt động đốt 4,27 triệu token SHIB trong 24 giờ qua góp phần làm dịu áp lực nguồn cung, tạo nền... ...

Bitcoin Cash (BCH) tiếp tục duy trì trên vùng nhu cầu dài hạn quanh mốc 440 USD – một ngưỡng quan trọng đã nhiều lần đóng vai trò hỗ trợ. Trước đó, Coinphoton ghi nhận các chỉ số on-chain phát tín hiệu trái chiều, nhưng bối cảnh hiện tại lại... ...

Bitcoin (BTC) đang dao động quanh ngưỡng 70.000 USD tại thời điểm ghi nhận vào thứ Bảy, giảm gần 3% từ đầu tuần và khép lại chuỗi hai tuần phục hồi liên tiếp. Đà suy yếu xuất hiện khi tâm lý thị trường bị ảnh hưởng bởi lập trường “diều... ...

Dogecoin (DOGE) một lần nữa trở lại tâm điểm chú ý sau khi Elon Musk hồi sinh hình tượng “DogeFather” trên nền tảng X. Bài đăng mô tả ông theo phong cách một nhân vật điện ảnh kinh điển, thay thế chú mèo quen thuộc bằng hình ảnh chó Shiba... ...

Giá Artificial Superintelligence Alliance (FET) đã phục hồi mạnh, duy trì trên mốc 0,230 USD tại thời điểm ghi nhận vào thứ Bảy, sau khi xác lập vùng hỗ trợ quan trọng trong phiên trước đó. Sự cải thiện của dữ liệu on-chain cùng với các tín hiệu tích cực... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode