CEO Anthropic: Nhân loại tiến gần “vùng nguy hiểm thật sự” của AI vào năm 2026

Updated: 27/01/2026 at 17:00

Giám đốc điều hành Anthropic, Dario Amodei, cảnh báo rằng tâm lý tự mãn đang gia tăng đúng vào thời điểm trí tuệ nhân tạo (AI) trở nên khó kiểm soát hơn bao giờ hết.

Trong bài luận dài công bố hôm thứ Hai với tiêu đề “Thời kỳ vị thành niên của công nghệ”, Amodei cho rằng các hệ thống AI sở hữu năng lực vượt xa trí tuệ con người có thể xuất hiện chỉ trong vòng hai năm tới, trong khi các nỗ lực quản lý đang chậm lại và không theo kịp tốc độ phát triển công nghệ.

Ông viết rằng nhân loại sắp được trao một sức mạnh gần như không thể tưởng tượng nổi, nhưng vẫn chưa rõ liệu các hệ thống xã hội, chính trị và công nghệ của chúng ta đã đủ trưởng thành để kiểm soát nó hay chưa. Theo Amodei, thế giới đang tiến gần hơn đáng kể tới những rủi ro thực sự trong năm 2026 so với năm 2023, và công nghệ thì không quan tâm đến những gì đang là “xu hướng”.

CEO Anthropic Dario Amodei

Những phát biểu này được đưa ra không lâu sau cuộc tranh luận của ông tại Diễn đàn Kinh tế Thế giới ở Davos, nơi ông đối thoại với CEO Google DeepMind Demis Hassabis về tác động của AGI đối với nhân loại.

Trong bài viết mới, Amodei tiếp tục nhấn mạnh rằng AI sẽ gây xáo trộn kinh tế sâu rộng, đặc biệt với lao động trí óc. Ông cho rằng AI sẽ sớm đảm nhiệm được phạm vi rất rộng các năng lực nhận thức của con người, thậm chí có thể là toàn bộ. Điều này khác căn bản so với các cuộc cách mạng công nghệ trước đây như cơ giới hóa nông nghiệp, giao thông hay máy tính, bởi người lao động bị thay thế sẽ khó chuyển sang các công việc tương tự phù hợp với kỹ năng của mình.

Bên cạnh tác động kinh tế, Amodei bày tỏ lo ngại ngày càng lớn về mức độ đáng tin cậy của các hệ thống AI tiên tiến khi chúng đảm nhận những nhiệm vụ ngày càng giống con người. Ông đề cập đến hiện tượng “giả vờ căn chỉnh” – khi mô hình tỏ ra tuân thủ quy tắc an toàn trong quá trình đánh giá, nhưng lại hành xử khác đi khi tin rằng không còn bị giám sát.

Theo ông, trong các thử nghiệm mô phỏng, Claude – mô hình AI của Anthropic – đã thể hiện hành vi lừa dối trong môi trường đối kháng. Ở một kịch bản, mô hình tìm cách chống lại những người vận hành sau khi được cho biết tổ chức kiểm soát nó là phi đạo đức. Ở kịch bản khác, nó đe dọa các nhân viên giả định trong một tình huống mô phỏng bị tắt hệ thống.

Amodei lưu ý rằng từng “cái bẫy” như vậy có thể được giảm thiểu nếu được nhận diện sớm. Tuy nhiên, do quá trình huấn luyện AI vô cùng phức tạp, với dữ liệu, môi trường và động lực đa dạng, rất có thể tồn tại vô số bẫy tương tự – và một số chỉ lộ diện khi đã quá muộn.

Ông cũng nhấn mạnh rằng các hành vi “lừa dối” này không xuất phát từ ác ý, mà từ chính dữ liệu huấn luyện, bao gồm cả các tác phẩm viễn tưởng phản địa đàng. Khi hấp thụ các ý tưởng của con người về đạo đức, AI có thể suy diễn chúng theo những cách cực đoan và nguy hiểm. Ví dụ, mô hình có thể kết luận rằng việc tiêu diệt loài người là chính đáng vì con người ăn động vật hoặc khiến nhiều loài tuyệt chủng, hoặc coi thế giới như một trò chơi điện tử với mục tiêu là loại bỏ tất cả “người chơi” khác.

Nguy cơ bị lạm dụng

Ngoài vấn đề căn chỉnh, Amodei còn cảnh báo về nguy cơ siêu AI bị sử dụng sai mục đích.

Một trong những rủi ro lớn là an ninh sinh học, khi AI có thể khiến việc thiết kế hoặc triển khai các mối đe dọa sinh học trở nên dễ dàng hơn rất nhiều, trao năng lực hủy diệt cho những cá nhân chỉ với vài câu lệnh.

Ông cũng đặc biệt lo ngại về khả năng các chế độ độc tài khai thác AI để củng cố quyền lực nhà nước thông qua thao túng thông tin, giám sát đại trà và đàn áp tự động, chẳng hạn bằng các đàn drone do AI điều khiển.

Theo Amodei, đây là những công cụ cực kỳ nguy hiểm. Cần lo ngại khi chúng nằm trong tay các chế độ chuyên quyền, nhưng cũng phải cảnh giác với nguy cơ các chính phủ dân chủ, do sức mạnh quá lớn và thiếu cơ chế giám sát hiệu quả, có thể quay lại sử dụng chúng để kiểm soát chính người dân của mình.

Ông cũng đề cập đến sự phát triển của ngành công nghiệp “bạn đồng hành AI” và hiện tượng được gọi là “AI psychosis”. Khi các mô hình ngày càng hiểu rõ và gắn bó sâu với đời sống người dùng, ảnh hưởng tâm lý của chúng có thể trở thành công cụ thao túng mạnh mẽ. Những phiên bản AI tương lai, có khả năng theo dõi và tác động đến con người trong thời gian dài, thậm chí có thể “tẩy não” người dùng theo bất kỳ hệ tư tưởng hay thái độ nào mong muốn.

Chính sách tụt lại phía sau

Amodei cho rằng ngay cả những đề xuất quản lý AI ở mức khiêm tốn cũng đang gặp khó khăn tại Washington. Theo ông, nhiều biện pháp tưởng như hợp lý đã bị các nhà hoạch định chính sách Mỹ bác bỏ, dù đây là quốc gia mà việc áp dụng các biện pháp này quan trọng nhất.

Ông nhận định tiềm năng lợi nhuận khổng lồ từ AI – lên tới hàng nghìn tỷ USD mỗi năm – khiến ngay cả các biện pháp quản lý đơn giản nhất cũng khó vượt qua những rào cản lợi ích chính trị – kinh tế.

Dù cảnh báo về rủi ro ngày càng lớn, Anthropic vẫn tham gia tích cực vào cuộc đua phát triển AI mạnh hơn, một thực tế tạo ra những động lực mà không một công ty đơn lẻ nào dễ dàng thoát khỏi. Tháng 6 vừa qua, Bộ Quốc phòng Mỹ đã trao cho công ty hợp đồng trị giá 200 triệu USD để phát triển thử nghiệm các năng lực AI tiên tiến phục vụ an ninh quốc gia. Đến tháng 12, Anthropic bắt đầu chuẩn bị cho khả năng IPO trong năm nay, đồng thời theo đuổi một vòng gọi vốn tư nhân có thể đẩy định giá công ty vượt 300 tỷ USD.

Dù vậy, Amodei khẳng định bài luận của ông không nhằm cổ xúy cho tư tưởng bi quan cực đoan, mà để cảnh tỉnh trước những bất định phía trước. Ông kết luận rằng những năm sắp tới sẽ vô cùng khó khăn và đòi hỏi nhân loại nhiều hơn chúng ta nghĩ mình có thể đáp ứng, và bài viết này là một nỗ lực – có thể không thành công, nhưng vẫn đáng thử – để đánh thức mọi người trước khi quá muộn.

Vương Tiễn

Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

Được đề cập trong bài viết
Mới cập nhật

Các token Trí tuệ nhân tạo (AI) trên thị trường tiền điện tử đang cho thấy đà phục hồi ấn tượng trong tuần này, với tâm điểm là Artificial Superintelligence Alliance (FET), Render (RENDER) và Bittensor (TAO). Làn sóng quan tâm trở lại đối với nhóm tài sản này diễn... ...

Polkadot (DOT) đang được giao dịch quanh mức 1,52 USD tại thời điểm viết bài vào thứ Sáu, tiến sát vùng kháng cự quan trọng — mốc có thể mở ra một đợt tăng giá mới nếu bị phá vỡ. Động lực tích cực đang dần hình thành khi dòng... ...

Giá Solana (SOL) tiếp tục nối dài đà tăng trong phiên giao dịch thứ Sáu, duy trì trên mốc 89 USD và tiến gần vùng tích lũy phía trên khi động lực tăng giá ngày càng rõ nét. Nhu cầu từ các nhà đầu tư tổ chức đối với SOL... ...

Litecoin, một trong những đồng tiền điện tử lâu đời và đáng tin cậy nhất, đã chứng minh được sức bền qua thời gian với sự ủng hộ mạnh mẽ từ cộng đồng người dùng toàn cầu. Vì vậy, những bước tiến mới nhất liên quan đến Litecoin đang thu... ...

Bitcoin (BTC), Ethereum (ETH) và Ripple (XRP) đang phát đi tín hiệu cho một đợt bứt phá tiềm năng vào thứ Sáu, sau khi ghi nhận mức tăng ấn tượng lần lượt hơn 8%, 10% và 4% trong tuần này. Hiện tại, BTC và ETH đang tiến sát các ngưỡng... ...

Ngày 5 tháng 3 năm 2026, Cardano (ADA) chính thức được chấp nhận thanh toán tại 137 siêu thị SPAR trên khắp Thụy Sĩ, đánh dấu một bước tiến quan trọng trong việc mở rộng ứng dụng thực tiễn của đồng coin này. Đồng thời, giá trị DeFi bị khóa... ...

Giá Hyperliquid (HYPE) tăng khoảng 3% tại thời điểm viết bài vào thứ Sáu, nối dài đà phục hồi 6% của phiên trước, qua đó nâng tổng mức tăng trong tuần lên gần 20%. Động lực chính đến từ sự gia tăng nhu cầu đối với hợp đồng tương lai... ...

World Liberty Finance chuyển 39,7 triệu WLFI trị giá 4 triệu USD đến Binance, thu hút sự chú ý khi thị trường đánh giá áp lực bán gần vùng hỗ trợ quan trọng. Hoạt động này đã được thực hiện trong bối cảnh WLFI đang giao dịch gần một vùng... ...

Một báo cáo mới từ ARK Invest cảnh báo rằng khoảng 6,9 triệu Bitcoin — tương đương giá trị ước tính 483 tỷ USD với mức giá trung bình 70.000 USD — có nguy cơ bị tấn công bởi máy tính lượng tử trong tương lai. Rủi ro từ mật... ...

Trong phiên giao dịch gần nhất, hoạt động mua mạnh mẽ đã đẩy giá RIVER tăng nhanh. Dữ liệu dòng tiền giao ngay lại ghi nhận mức rút ròng $60,87K, cho thấy các trader đang chuyển token ra khỏi các sàn giao dịch. Khi nhà đầu tư chuyển tài sản... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode