Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Updated: 02/08/2024 at 16:09

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Solana (SOL) nhích lên trên mốc 90 USD tại thời điểm viết bài vào thứ Hai, sau khi tăng khoảng 13% trong tuần trước. Sức hút của Solana đối với cả nhà đầu tư tổ chức lẫn cá nhân vẫn được duy trì, thể hiện qua dòng tiền tiếp tục... ...

Thị trường tiền điện tử dự kiến sẽ đón nhận nguồn cung token mới trị giá hơn 438 triệu USD trong tuần thứ ba của tháng 3 năm 2025. Nhiều dự án lớn như LayerZero (ZRO), Lombard (BARD) và River (RIVER) sẽ tiến hành các đợt mở khóa token quan... ...

Aave và CoW Swap hôm thứ Bảy đã công bố các báo cáo hậu kiểm riêng biệt liên quan đến giao dịch ngày 12/3, trong đó một người dùng đã hoán đổi hơn 50 triệu USD aEthUSDT nhưng chỉ nhận lại khoảng 36.000 USD aEthAAVE thông qua widget swap do... ...

Bitcoin (BTC), Ethereum (ETH) và Ripple (XRP) đồng loạt phát đi tín hiệu tích cực trong phiên đầu tuần, sau khi ghi nhận mức tăng lần lượt 10%, 12% và 8% trong tuần trước. Bitcoin hiện đang tiến sát một vùng kháng cự kỹ thuật quan trọng, Ethereum đã xác... ...

Các giao thức cho vay DeFi trong lĩnh vực tiền điện tử đã chứng kiến sự sụt giảm mạnh mẽ, với tổng giá trị thị trường giảm khoảng 45 tỷ USD kể từ tháng 10 năm ngoái. Theo dữ liệu từ Artemis, tổng lượng tiền gửi trên các nền tảng... ...

Trong 24 giờ qua, giá RIVER đã trở thành tâm điểm chú ý của giới đầu tư khi ghi nhận mức tăng trưởng đáng kể 11%, vượt xa mức tăng trung bình từ 4% đến 6% của phần lớn thị trường tiền điện tử. Bước ngoặt tại thời điểm quan... ...

Một trong những tín hiệu đáy được tin cậy nhất của Bitcoin dựa trên giả định đơn giản: khi những đồng coin “cũ” bắt đầu di chuyển, điều đó đồng nghĩa với việc một điều gì đó quan trọng đã thay đổi trên thị trường. Các trader và nhà phân... ...

Cardano (ADA) đã ghi nhận một đợt phục hồi giá nhẹ, mang đến tín hiệu tích cực hiếm hoi trong bối cảnh đầy thách thức hiện tại. Tuy nhiên, sự tăng giá này chỉ mang tính tạm thời và chưa thể giải quyết được những vấn đề cấu trúc sâu... ...

Thị trường tiền điện tử tiếp tục nối dài đà phục hồi trong tuần này khi Bitcoin tiến sát ngưỡng 73.000 USD, mở ra kỳ vọng cho một nhịp bứt phá mới. Trong khi đó, Ethereum và XRP cũng lần lượt áp sát các mốc quan trọng 2.200 USD và... ...

Trong 24 giờ qua, giá trị của Bittensor (TAO) đã ghi nhận mức tăng trưởng ấn tượng 19,19%, nhờ vào làn sóng quan tâm đối với hệ sinh thái subnet dựa trên trí tuệ nhân tạo (AI). Đợt tăng giá này diễn ra đồng thời với một cột mốc nổi... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode