Giám đốc điều hành Anthropic, Dario Amodei, cảnh báo rằng tâm lý tự mãn đang gia tăng đúng vào thời điểm trí tuệ nhân tạo (AI) trở nên khó kiểm soát hơn bao giờ hết.
Trong bài luận dài công bố hôm thứ Hai với tiêu đề “Thời kỳ vị thành niên của công nghệ”, Amodei cho rằng các hệ thống AI sở hữu năng lực vượt xa trí tuệ con người có thể xuất hiện chỉ trong vòng hai năm tới, trong khi các nỗ lực quản lý đang chậm lại và không theo kịp tốc độ phát triển công nghệ.
Ông viết rằng nhân loại sắp được trao một sức mạnh gần như không thể tưởng tượng nổi, nhưng vẫn chưa rõ liệu các hệ thống xã hội, chính trị và công nghệ của chúng ta đã đủ trưởng thành để kiểm soát nó hay chưa. Theo Amodei, thế giới đang tiến gần hơn đáng kể tới những rủi ro thực sự trong năm 2026 so với năm 2023, và công nghệ thì không quan tâm đến những gì đang là “xu hướng”.

Những phát biểu này được đưa ra không lâu sau cuộc tranh luận của ông tại Diễn đàn Kinh tế Thế giới ở Davos, nơi ông đối thoại với CEO Google DeepMind Demis Hassabis về tác động của AGI đối với nhân loại.
Trong bài viết mới, Amodei tiếp tục nhấn mạnh rằng AI sẽ gây xáo trộn kinh tế sâu rộng, đặc biệt với lao động trí óc. Ông cho rằng AI sẽ sớm đảm nhiệm được phạm vi rất rộng các năng lực nhận thức của con người, thậm chí có thể là toàn bộ. Điều này khác căn bản so với các cuộc cách mạng công nghệ trước đây như cơ giới hóa nông nghiệp, giao thông hay máy tính, bởi người lao động bị thay thế sẽ khó chuyển sang các công việc tương tự phù hợp với kỹ năng của mình.
Bên cạnh tác động kinh tế, Amodei bày tỏ lo ngại ngày càng lớn về mức độ đáng tin cậy của các hệ thống AI tiên tiến khi chúng đảm nhận những nhiệm vụ ngày càng giống con người. Ông đề cập đến hiện tượng “giả vờ căn chỉnh” – khi mô hình tỏ ra tuân thủ quy tắc an toàn trong quá trình đánh giá, nhưng lại hành xử khác đi khi tin rằng không còn bị giám sát.
Theo ông, trong các thử nghiệm mô phỏng, Claude – mô hình AI của Anthropic – đã thể hiện hành vi lừa dối trong môi trường đối kháng. Ở một kịch bản, mô hình tìm cách chống lại những người vận hành sau khi được cho biết tổ chức kiểm soát nó là phi đạo đức. Ở kịch bản khác, nó đe dọa các nhân viên giả định trong một tình huống mô phỏng bị tắt hệ thống.
Amodei lưu ý rằng từng “cái bẫy” như vậy có thể được giảm thiểu nếu được nhận diện sớm. Tuy nhiên, do quá trình huấn luyện AI vô cùng phức tạp, với dữ liệu, môi trường và động lực đa dạng, rất có thể tồn tại vô số bẫy tương tự – và một số chỉ lộ diện khi đã quá muộn.
Ông cũng nhấn mạnh rằng các hành vi “lừa dối” này không xuất phát từ ác ý, mà từ chính dữ liệu huấn luyện, bao gồm cả các tác phẩm viễn tưởng phản địa đàng. Khi hấp thụ các ý tưởng của con người về đạo đức, AI có thể suy diễn chúng theo những cách cực đoan và nguy hiểm. Ví dụ, mô hình có thể kết luận rằng việc tiêu diệt loài người là chính đáng vì con người ăn động vật hoặc khiến nhiều loài tuyệt chủng, hoặc coi thế giới như một trò chơi điện tử với mục tiêu là loại bỏ tất cả “người chơi” khác.
Nguy cơ bị lạm dụng
Ngoài vấn đề căn chỉnh, Amodei còn cảnh báo về nguy cơ siêu AI bị sử dụng sai mục đích.
Một trong những rủi ro lớn là an ninh sinh học, khi AI có thể khiến việc thiết kế hoặc triển khai các mối đe dọa sinh học trở nên dễ dàng hơn rất nhiều, trao năng lực hủy diệt cho những cá nhân chỉ với vài câu lệnh.
Ông cũng đặc biệt lo ngại về khả năng các chế độ độc tài khai thác AI để củng cố quyền lực nhà nước thông qua thao túng thông tin, giám sát đại trà và đàn áp tự động, chẳng hạn bằng các đàn drone do AI điều khiển.
Theo Amodei, đây là những công cụ cực kỳ nguy hiểm. Cần lo ngại khi chúng nằm trong tay các chế độ chuyên quyền, nhưng cũng phải cảnh giác với nguy cơ các chính phủ dân chủ, do sức mạnh quá lớn và thiếu cơ chế giám sát hiệu quả, có thể quay lại sử dụng chúng để kiểm soát chính người dân của mình.
Ông cũng đề cập đến sự phát triển của ngành công nghiệp “bạn đồng hành AI” và hiện tượng được gọi là “AI psychosis”. Khi các mô hình ngày càng hiểu rõ và gắn bó sâu với đời sống người dùng, ảnh hưởng tâm lý của chúng có thể trở thành công cụ thao túng mạnh mẽ. Những phiên bản AI tương lai, có khả năng theo dõi và tác động đến con người trong thời gian dài, thậm chí có thể “tẩy não” người dùng theo bất kỳ hệ tư tưởng hay thái độ nào mong muốn.
Chính sách tụt lại phía sau
Amodei cho rằng ngay cả những đề xuất quản lý AI ở mức khiêm tốn cũng đang gặp khó khăn tại Washington. Theo ông, nhiều biện pháp tưởng như hợp lý đã bị các nhà hoạch định chính sách Mỹ bác bỏ, dù đây là quốc gia mà việc áp dụng các biện pháp này quan trọng nhất.
Ông nhận định tiềm năng lợi nhuận khổng lồ từ AI – lên tới hàng nghìn tỷ USD mỗi năm – khiến ngay cả các biện pháp quản lý đơn giản nhất cũng khó vượt qua những rào cản lợi ích chính trị – kinh tế.
Dù cảnh báo về rủi ro ngày càng lớn, Anthropic vẫn tham gia tích cực vào cuộc đua phát triển AI mạnh hơn, một thực tế tạo ra những động lực mà không một công ty đơn lẻ nào dễ dàng thoát khỏi. Tháng 6 vừa qua, Bộ Quốc phòng Mỹ đã trao cho công ty hợp đồng trị giá 200 triệu USD để phát triển thử nghiệm các năng lực AI tiên tiến phục vụ an ninh quốc gia. Đến tháng 12, Anthropic bắt đầu chuẩn bị cho khả năng IPO trong năm nay, đồng thời theo đuổi một vòng gọi vốn tư nhân có thể đẩy định giá công ty vượt 300 tỷ USD.
Dù vậy, Amodei khẳng định bài luận của ông không nhằm cổ xúy cho tư tưởng bi quan cực đoan, mà để cảnh tỉnh trước những bất định phía trước. Ông kết luận rằng những năm sắp tới sẽ vô cùng khó khăn và đòi hỏi nhân loại nhiều hơn chúng ta nghĩ mình có thể đáp ứng, và bài viết này là một nỗ lực – có thể không thành công, nhưng vẫn đáng thử – để đánh thức mọi người trước khi quá muộn.
- Anthropic đang đàm phán để huy động tới 10 tỷ đô la tiền tài trợ mới
- Tương lai crypto dưới ảnh hưởng của AI và các deal nghìn tỷ USD
- Anthropic cảnh báo nguy cơ AI tấn công blockchain
Vương Tiễn
Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.
- Thẻ đính kèm:
- Anthropic
- Dario Amodei

Bitcoin
Ethereum
Tether
XRP
USDC
Solana
TRON
Lido Staked Ether
Dogecoin
Figure Heloc
Cardano
Wrapped stETH
Bitcoin Cash
WhiteBIT Coin
Wrapped Bitcoin
Wrapped eETH
USDS 




























