BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

Updated: 21/03/2026 at 20:00

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

Được đề cập trong bài viết
Mới cập nhật

Liệu câu chuyện về quyền riêng tư có đang lấy lại đà tăng trưởng một lần nữa? Monero [XMR] đã tăng 30,51% kể từ khi thiết lập mức thấp cục bộ tại 313,32 USD vào thứ Sáu, ngày 3 tháng 4. Điều thú vị là ZCash [ZEC] và Dash [DASH],... ...

Bitcoin [BTC] đã giành lại mức 80.000 USD lần đầu tiên kể từ ngày 31 tháng 1 khi quá trình tích lũy của cá voi tăng tốc, với 4.527 BTC trị giá khoảng 362 triệu USD được hấp thụ trong vòng 24 giờ. Sự gia tăng này phản ánh niềm... ...

Sau khi giành lại mốc 80.000 USD, Bitcoin (BTC) đã giao dịch quanh mức 81.000 USD tại thời điểm viết bài, đánh dấu mức cao nhất kể từ cuối tháng 1 và làm thay đổi cấu trúc ngắn hạn. Điều này diễn ra sau một quá trình phục hồi ổn... ...

Zcash đã tiếp tục quá trình hồi phục giá, kéo dài xu hướng tăng trưởng suốt một tuần qua. Kể từ khi rơi xuống dưới mức 320 USD vào một tuần trước, đồng altcoin này đã liên tục đóng cửa ở các mức đỉnh cao hơn, cho thấy nhu cầu... ...

Solana đã tụt lại phía sau trong đợt hồi phục chung của thị trường tiền mã hóa vào ngày 4 tháng 5, ngay cả khi đà phát triển của hệ sinh thái được cải thiện. Theo CoinMarketCap, SOL chỉ tăng 1,90% trong 24 giờ qua. Trong cùng khoảng thời gian... ...

Sau khi duy trì trong một biên độ hẹp suốt những tuần thị trường suy yếu vừa qua, đồng tiền mã hóa DASH cuối cùng đã bùng nổ. Đồng altcoin này đã nhảy vọt lên mức cao nhất trong bốn tháng là 50,98 USD. Tại thời điểm viết bài, token... ...

Sau một đợt sụt giảm kéo dài xuống mức thấp 0,105 USD, ALGO cuối cùng đã tìm thấy sự hỗ trợ và đảo chiều. Đồng altcoin này đã giữ vững mức hỗ trợ 0,11 USD và leo lên 0,118 USD, vượt qua cả các đường trung bình động ngắn hạn... ...

Bitcoin (BTC) đã nhắm đến mốc 79.000 USD vào thời điểm đóng cửa tuần khi thị trường tiền mã hóa tiếp tục chịu ảnh hưởng từ các diễn biến liên quan đến căng thẳng Mỹ-Iran. BTC tiến gần mức đóng cửa tuần cao nhất trong hơn ba tháng Dữ liệu... ...

Strategy , tổ chức nắm giữ Bitcoin đại chúng lớn nhất thế giới, đang tạm nghỉ các hoạt động mua tiền mã hóa khi công ty chuẩn bị cho báo cáo thu nhập quý đầu tiên, dự kiến vào thứ Ba. Vào Chủ nhật, Chủ tịch điều hành Michael Saylor... ...

Khi DOGE giành lại mốc 0,1 USD và duy trì trên mức giá này trong bốn ngày liên tiếp, một số người nắm giữ dài hạn đã thực hiện các chiến lược mới. Một người nắm giữ Dogecoin dài hạn sở hữu ba địa chỉ đã rút 14,06 triệu DOGE... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode