Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Updated: 02/08/2024 at 16:09

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Giá vàng tiếp tục tăng nhẹ trong phiên giao dịch ngày thứ Ba, đạt mức 4.305 USD mỗi ounce—chỉ cách ngưỡng cao nhất mọi thời đại hồi tháng 10 (4.381 USD) một khoảng rất gần. Đà tăng của vàng phản ánh xu hướng tìm kiếm tài sản an toàn của... ...

Sui (SUI) tiếp tục đối mặt với áp lực bán mạnh khi đà giảm được kéo dài sang phiên thứ ba liên tiếp. Tại thời điểm ghi nhận vào thứ Ba, giá SUI giảm thêm khoảng 1%, phản ánh xu hướng suy yếu chưa có dấu hiệu chững lại. Token... ...

Công an thành phố Đà Nẵng vừa triệt phá thành công một chuyên án lớn liên quan đến hành vi lừa đảo chiếm đoạt tài sản bằng hình thức kinh doanh đa cấp tiền ảo, với quy mô hoạt động trên phạm vi toàn quốc và số tiền chiếm đoạt... ...

Hoạt động trên mạng lưới Bitcoin đã giảm xuống mức thấp nhất trong vòng 12 tháng khi năm sắp khép lại. Trung bình động 7 ngày của số lượng địa chỉ hoạt động hiện chỉ còn khoảng 660.000. Dù yếu tố mùa vụ thường khiến hoạt động chững lại vào... ...

BNB (trước đây là Binance Coin) đang dao động quanh ngưỡng 855 USD tại thời điểm viết bài vào ngày thứ Ba, sau nhịp điều chỉnh nhẹ trong phiên trước đó. Áp lực giảm giá ngày càng rõ nét khi các dữ liệu on-chain và thị trường phái sinh cho... ...

Bitcoin lao dốc xuống mốc 85.000 USD vào ngày 15/12, nối dài chuỗi giảm giá khi các rủi ro vĩ mô toàn cầu, hoạt động giảm đòn bẩy và thanh khoản hạn chế cùng lúc tác động mạnh. Đợt giảm này đã cuốn phăng hơn 100 tỷ USD khỏi tổng... ...

Chủ tịch SEC Paul Atkins cảnh báo rằng nếu không được kiểm soát bằng các chính sách chính thức, chính phủ liên bang có thể khai thác tiềm năng của lĩnh vực crypto để phục vụ giám sát tài chính trên diện rộng. Tuy nhiên, theo ông, ngành này cũng... ...

Aster (ASTER), Midnight (NIGHT) và Ethena (ENA) đang dẫn đầu nhóm altcoin giảm mạnh nhất trong 24 giờ qua, khi thị trường tiền điện tử bước vào giai đoạn điều chỉnh rõ rệt sau cú trượt giá của Bitcoin (BTC) xuống dưới ngưỡng 86.000 USD. Đà suy yếu của tiền... ...

Mặc dù Bitcoin (BTC) đã phục hồi nhẹ sau cú giảm sâu, ZCash (ZEC) vẫn chưa thể lấy lại những gì đã mất gần đây. Theo báo cáo mới nhất của Coinphoton, ZCash có tiềm năng tăng lên mức $605 nếu phá vỡ thành công khỏi kênh giá giảm. Một... ...

Các sản phẩm đầu tư crypto toàn cầu do những tổ chức quản lý tài sản lớn như BlackRock, Bitwise, Fidelity, Grayscale, ProShares và 21Shares quản lý đã ghi nhận dòng tiền ròng vào đạt 864 triệu USD trong tuần qua, theo dữ liệu từ CoinShares. Đây là tuần thứ... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode