Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Cơ quan quản lý tài chính của Vương quốc Anh đã phê duyệt các quy tắc và hướng dẫn mới cho các quỹ token hóa, nhằm giúp các nhà quản lý tài sản dễ dàng sử dụng blockchain trong khuôn khổ quỹ hiện có thay vì các cấu trúc thử... ...

Bitcoin (BTC) đã tăng vọt lên trên 77.900 USD vào thứ Tư, nhưng bóng nến trên dài cho thấy áp lực bán xuất hiện khi giá tăng. Nhà phân tích on-chain Willy Woo đã cho biết trong một bài đăng trên X rằng “BTC cần đóng cửa trên mức giá... ...

Bitcoin (BTC) đã kéo dài đà sụt giảm trong hai ngày vào thứ Tư sau khi biên bản của Ủy ban Thị trường Mở Liên bang (FOMC) xác nhận quyết định của Fed về việc giữ “phạm vi mục tiêu cho lãi suất quỹ liên bang ở mức 3,5% đến... ...

Bitcoin đã giảm giá sau khi mỗi chủ tịch Cục Dự trữ Liên bang Mỹ (Fed) mới bắt đầu làm việc, dữ liệu cho thấy, trong khi Kevin Warsh đưa ra những tín hiệu trái chiều về chính sách đối với các tài sản rủi ro. Bitcoin (BTC) có thể... ...

Ripple [XRP] đã chứng kiến hơn 1,10 tỷ token được các cá voi tái phân bổ chỉ trong một tuần, báo hiệu một sự thay đổi mạnh mẽ trong hành vi của các chủ sở hữu lớn. Sự chuyển dịch này phản ánh mức giảm đáng kể trong nguồn cung... ...

Căng thẳng địa chính trị giữa Mỹ và Iran đã làm gia tăng biến động, thúc đẩy các nhà giao dịch giảm thiểu rủi ro. Đáng chú ý, dòng vốn đã xoay vòng sang các đồng stablecoin như một động thái phòng thủ. Dòng tiền trên sàn Binance đã phản... ...

Canada đang tiến gần hơn đến việc cấm các khoản quyên góp chính trị được thực hiện bằng tiền điện tử, khi các nhà lập pháp tại Ottawa thắt chặt các quy tắc xung quanh cách thức dòng tiền chảy vào các cuộc bầu cử. Điều đó diễn ra sau... ...

Công ty Strategy của Michael Saylor đã mua 3.273 Bitcoin với giá 255 triệu USD trong khoảng thời gian từ ngày 20 đến 26 tháng 4, nâng tổng số lượng nắm giữ lên 818.334 BTC. Strategy của Michael Saylor, tổ chức sở hữu Bitcoin công khai lớn nhất thế giới,... ...

Ether (ETH) đã tăng hơn 10% trong tháng 4, đạt mức cao nhất là 2.430 USD trong tháng này giữa bối cảnh sự lạc quan của thị trường quay trở lại. Biểu đồ ETH/USD hàng ngày. Nguồn: TradingView Tuy nhiên, trong cùng thời kỳ đó, Ethereum Foundation, một tổ chức... ...

Đợt tăng giá vào tháng 4 của Bitcoin đã bộc lộ sự thiếu đồng nhất rõ rệt giữa hành động giá và hành vi của các quỹ ETF. Giá của đồng tiền mã hóa này đã leo lên mức 79.000 USD vào ngày 22 tháng 4, trong khi dòng vốn... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode