Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Updated: 02/08/2024 at 16:09

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Stellar (XLM) tiếp tục chìm trong sắc đỏ khi giá trượt xuống dưới ngưỡng 0,20 USD vào phiên thứ Sáu — mức thấp nhất kể từ giữa tháng 10. Áp lực bán gia tăng trong bối cảnh tâm lý thị trường ngày càng bi quan, thể hiện rõ qua sự... ...

Flying Tulip, nền tảng DeFi mới do “bố già DeFi” Andre Cronje và đội ngũ của ông phát triển, đã huy động thêm vốn thông qua kết hợp các đợt bán token riêng tư và công khai. Trong vòng Series A bán token riêng tư, dự án huy động được... ...

Các meme coin, với Dogecoin (DOGE), Shiba Inu (SHIB) và Pepe (PEPE) giữ vai trò dẫn dắt, tiếp tục lao dốc trong tuần này, nối dài chuỗi suy yếu đã hình thành trước đó. Phân tích kỹ thuật cho thấy bức tranh kém tích cực khi cả DOGE, SHIB và... ...

Hệ thống quản trị của blockchain Optimism vừa phê duyệt một đề xuất quan trọng, theo đó 50% tổng doanh thu từ Superchain sẽ được sử dụng để mua lại token OP của mạng lưới trong vòng 12 tháng tới, bắt đầu từ tháng 2. Đề xuất này được Optimism... ...

Bitcoin (BTC), Ethereum (ETH) và Ripple (XRP) tiếp tục chìm trong nhịp điều chỉnh vào phiên thứ Sáu, với mức sụt giảm trong tuần lần lượt xấp xỉ 6%, 3% và 5%. BTC đang trượt dần về vùng đáy của tháng 11 quanh ngưỡng 80.000 USD, trong khi ETH đánh... ...

Trong khi phần lớn sự chú ý của ngành trong năm qua tập trung vào stablecoin, trái phiếu kho bạc được token hóa và các cổng tiếp cận dành cho tổ chức, đội ngũ đứng sau Velodrome và Aerodrome cho rằng cuộc cạnh tranh quyền lực thực sự của crypto... ...

Giá token ở mức thấp tiếp tục tạo áp lực lên các mạng hạ tầng vật lý phi tập trung (DePIN), nhưng doanh thu toàn ngành đang cho thấy dấu hiệu bền bỉ hơn, theo một báo cáo từ Messari. Phần lớn token DePIN đi ngang hoặc suy giảm trong... ...

Worldcoin (WLD), Chiliz (CHZ) và Hyperliquid (HYPE) đồng loạt lao dốc trong 24 giờ qua, khi Bitcoin (BTC) bất ngờ đánh mất mốc hỗ trợ quan trọng 82.000 USD trong phiên thứ Sáu. Cú trượt mạnh của BTC đã kích hoạt làn sóng “quét” vị thế trị giá khoảng 1,75... ...

XRP bước vào năm 2026 trong trạng thái đi ngang dưới mốc 2 USD khi chưa thể hình thành xu hướng rõ ràng trong tháng giao dịch đầu năm. Dù vậy, dữ liệu nền tảng cho thấy các nhà đầu tư giá trị lớn đang âm thầm tích lũy, bất... ...

Phố Wall ngày càng tranh luận sôi nổi về việc liệu điện toán lượng tử có trở thành mối đe dọa mang tính “tồn vong” đối với Bitcoin hay không. Tuy nhiên, các nhà phân tích tại Benchmark cho rằng lo ngại này đang bị thổi phồng, nhấn mạnh rủi... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode