Tại sao Poker vẫn là trở ngại lớn cho trí tuệ nhân tạo?

Updated: 25/04/2018 at 16:00

Chơi poker liên quan đến việc xử lý thông tin không hoàn hảo, điều này làm cho trò chơi trở nên rất phức tạp và giống như nhiều tình huống trong thế giới thực hơn.

Như Kenny Rogers đã từng nói rằng người ta nên “biết khi nào nắm giữ họ, biết khi nào cần đánh ra trong bản “hit” The Gambler” năm 1978 tại Casino Rivers ở Pittsburgh tuần này, một chương trình máy tính được gọi là Libratus cuối cùng có thể chứng minh rằng máy tính có thể làm điều này tốt hơn so với bất kỳ người chơi bài nào.

Libratus đang chơi hàng ngàn trò chơi khác nhau ở Texas với một số người chơi poker chuyên nghiệp. Sau khoảng hơn một nửa cuộc hành trình trong 20 ngày, Libratus đã lãi 800.000 đô la so với các đối thủ của con người. Chiến thắng dành cho Libratus cũng chưa chắc đã được đảm bảo.

Một chiến thắng cho Libratus sẽ là một thành tựu to lớn trong công nghệ trí tuệ nhân tạo. Poker yêu cầu lý luận và trí thông minh, rất khó cho các máy móc bắt chước. Về cơ bản, nó khác với cờ đam, cờ vua hoặc Go, bởi vì đối thủ vẫn là một ẩn số trong khi chơi. Trong các trò chơi “thông tin không hoàn hảo”, sẽ vô cùng phức tạp để tìm ra chiến lược lý tưởng cho mọi cách tiếp cận mà đối thủ của bạn có thể đang dùng. Và với thể lệ không giới hạn ở Texas thì trò chơi càng trở nên đặc biệt khó khăn bởi vì một đối thủ về cơ bản có thể đặt cược bao nhiêu cũng được.

Andrew Ng, nhà khoa học tại Baidu nói:

“Poker là một trong những trò chơi khó khăn nhất cho AI để chiến thắng. Không có con đường tối ưu duy nhất, mà thay vào đó AI phải ngẫu nhiên các hành động của mình để làm cho các đối thủ không chắc chắn liệu nó có đang đánh lừa hay không”.

Libratus được tạo ra bởi Tuomas Sandholm, một giáo sư trong ngành khoa khoa học máy tính tại CMU và là sinh viên tốt nghiệp Noam Brown. Sandholm, một chuyên gia về lý thuyết trò chơi và AI nói rằng thật đáng kinh ngạc khi con người đã có thể chiến thắng máy tính quá lâu. Trong tất cả các trò chơi mà AI đã giải quyết, poker là trò duy nhất mà AI đã không đạt được hiệu suất siêu nhân”.

Các nhà nghiên cứu AI sử dụng lý thuyết trò chơi hoặc toán học để tìm ra chiến lược tốt nhất với những bất ổn khác nhau, được gọi là trạng thái cân bằng. Bởi vì các khả năng rất rộng lớn nên kết quả thường cho ra một số dạng xấp xỉ.

Vincent Conitzer, giáo sư tại Đại học Duke nói:

“Một nước đi là tốt hay không phụ thuộc vào những điều mà bạn không thể quan sát. Điều này khiến cho các diễn biến không thể đoán trước được. Nếu bạn không bao giờ lừa, bạn không phải là người chơi giỏi. Nếu bạn luôn luôn lừa, bạn cũng không phải là người chơi giỏi. Lý thuyết trò chơi cho bạn biết cách ngẫu nhiên hóa cách chơi của bạn theo cách tối ưu”.

Năm ngoái, Sandholm đã phát triển một chương trình chơi bài poker được gọi là Claudico. Chương trình này đã bị đánh bại trong các trận đấu với một số người chơi poker chuyên nghiệp. Ông giải thích rằng Libratus sử dụng một số tiến bộ mới để đạt được mức độ chơi cao như vậy. Điều này bao gồm một kỹ thuật tính toán xấp xỉ điểm cân bằng mới cũng như một số phương pháp mới để phân tích các kết quả có thể xảy ra khi các lá bài được tiết lộ ở các giai đoạn sau của trò chơi. Phân tích kết thúc trò chơi rất khó khăn và được thực hiện trong mỗi trận đấu tại Trung tâm Supercomputing Pittsburgh, một cơ sở được điều hành bởi CMU và Đại học Pittsburgh.

Những tiến bộ trong machine learning và AI đã cho ra một số chương trình chơi game siêu phàm xuất hiện gần đây. Năm ngoái, các nhà nghiên cứu tại DeepMind, một công ty con của Alphabet, đã phát triển một chương trình có khả năng đánh bại một trong những người chơi Go tốt nhất thế giới. Thành tích này rất ngoạn mục bởi vì Go cực kỳ phức tạp và bởi vì thật khó để đánh giá diễn biến trong trò chơi.

Một vài nhóm nghiên cứu khác nhau tập trung vào giải quyết bài poker. Một nhóm nghiên cứu khác, từ Đại học Alberta ở Canada, Đại học Charles và Đại học Kỹ thuật tại Cộng hòa Séc, gần đây đã phát triển một chương trình, gọi là DeepStack. Chương trình này đã đánh bại một số người chơi chuyên nghiệp trong thể lệ không giới hạn của Texas. Tuy nhiên, Sandholm cho biết, những người chơi tham gia vào trận đấu với Libratus mạnh hơn rất nhiều, điều này sẽ mang lại ý nghĩa thống kê lớn hơn cho kết quả.

Sam Ganzfried, người đã tham gia phát triển Claudico và hiện là trợ lý giáo sư tại Đại học Quốc tế Florida ở Miami cho biết:

“Các kỹ thuật được sử dụng để xây dựng một cỗ máy chơi poker thông minh hơn có thể có nhiều ứng dụng trong thế giới thực. Lý thuyết trò chơi đã được áp dụng cho nghiên cứu về các cuộc tấn công gây nhiễu và an ninh mạng, hướng dẫn tự động cho dịch vụ taxi và robot lập kế hoạch”.

Tuy nhiên, ngay cả khi Libratus chiến thắng trong tuần này, điều đó không có nghĩa là con người không còn xứng đáng có chỗ tại bàn chơi bài nữa. Libratus sẽ chưa thể trở thành “siêu nhân” trong phiên bản nhiều người chơi và số tiền cược không giới hạn ở Texas bằng cách sử dụng các kỹ thuật hiện tại.

Theo TapChiBitcoin.vn/technologyreview

Xem thêm:

Được đề cập trong bài viết
Bình luận
Đang tải
Mới cập nhật

Hiện tại, giá Solana đang thể hiện sức mạnh vượt trội, thu hút không chỉ đám đông bán lẻ mà còn cả những tổ chức lớn. Sự gia nhập của các công ty tài chính, quỹ quản lý tài sản và các nhà đầu tư DeFi lớn đang tạo ra... ...

Với 42 tỷ USD “án binh bất động”, nguồn vốn khổng lồ này đang hoạt động như một kho dự trữ tiềm năng, sẵn sàng hấp thụ rủi ro hoặc thổi bùng những cú bứt phá, tùy theo nhịp xoay trục của thị trường. Chỉ trong bốn ngày qua, Tether... ...

Dữ liệu on-chain của Ethereum (ETH) đang phát đi những tín hiệu lạc quan, ngay sau quyết định của Cục Dự trữ Liên bang Mỹ (Fed) hạ lãi suất thêm 0,25 điểm phần trăm vào tối thứ Tư. Ethereum có bước vào xu hướng tăng sau khi Fed hạ 25... ...

Chỉ báo Spot Taker Cumulative Volume Delta (CVD – chênh lệch khối lượng tích lũy của taker giao ngay) 90 ngày của Dogwifhat (WIF) hiện đang nghiêng về phía phe mua, cho thấy nhu cầu thị trường mạnh mẽ tại thời điểm báo chí. Các trader đã liên tục hấp... ...

Bitcoin (BTC) đang dao động quanh mốc 116.600 USD, đối mặt với áp lực bán mạnh tại vùng kháng cự 117.500 USD. Dù vậy, điểm tích cực là phe bò vẫn kiên trì giữ vững ngưỡng hỗ trợ 115.500 USD, ngay sau quyết định hạ lãi suất 0,25% của Fed... ...

Wormhole, một giao thức tương tác hỗ trợ chuyển giao tài sản giữa các blockchain, vừa công bố những cập nhật quan trọng về tokenomics cho token gốc của mình, bao gồm việc thiết lập quỹ dự trữ token và tăng cường lợi suất cho những người tham gia staking.... ...

Ngành công nghiệp blockchain và các cơ quan quản lý đang tiếp tục tranh luận về quyền riêng tư khi Liên minh Châu Âu chuẩn bị triển khai các quy định chống rửa tiền (AML) nghiêm ngặt, dự kiến sẽ cấm các token bảo vệ quyền riêng tư và tài... ...

Vào rạng sáng ngày 18 tháng 9, Bitcoin (BTC) đã trải qua những biến động mạnh sau khi Cục Dự trữ Liên bang Mỹ (Fed) công bố quyết định cắt giảm lãi suất 25 điểm cơ bản, hạ mục tiêu lãi suất quỹ liên bang xuống còn 4% đến 4,25%.... ...

Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) đang tiến hành đơn giản hóa quy trình phê duyệt các sản phẩm ETP tiền điện tử, điều này có thể dẫn đến sự bùng nổ của nhiều sản phẩm mới. Tuy nhiên, một giám đốc điều hành trong ngành... ...

Sky (SKY), trước đây là Maker DAO (MKR), đã ghi nhận mức tăng hơn 5% vào chiều thứ Tư, tiếp nối đà hồi phục từ đường trung bình động hàm mũ (EMA) 200 ngày. Lực cầu gia tăng được củng cố nhờ thời hạn chót nâng cấp MKR sang SKY... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode