Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Sui (SUI) tiếp tục đối mặt với áp lực bán mạnh khi đà giảm được kéo dài sang phiên thứ ba liên tiếp. Tại thời điểm ghi nhận vào thứ Ba, giá SUI giảm thêm khoảng 1%, phản ánh xu hướng suy yếu chưa có dấu hiệu chững lại. Token... ...

Công an thành phố Đà Nẵng vừa triệt phá thành công một chuyên án lớn liên quan đến hành vi lừa đảo chiếm đoạt tài sản bằng hình thức kinh doanh đa cấp tiền ảo, với quy mô hoạt động trên phạm vi toàn quốc và số tiền chiếm đoạt... ...

Hoạt động trên mạng lưới Bitcoin đã giảm xuống mức thấp nhất trong vòng 12 tháng khi năm sắp khép lại. Trung bình động 7 ngày của số lượng địa chỉ hoạt động hiện chỉ còn khoảng 660.000. Dù yếu tố mùa vụ thường khiến hoạt động chững lại vào... ...

BNB (trước đây là Binance Coin) đang dao động quanh ngưỡng 855 USD tại thời điểm viết bài vào ngày thứ Ba, sau nhịp điều chỉnh nhẹ trong phiên trước đó. Áp lực giảm giá ngày càng rõ nét khi các dữ liệu on-chain và thị trường phái sinh cho... ...

Bitcoin lao dốc xuống mốc 85.000 USD vào ngày 15/12, nối dài chuỗi giảm giá khi các rủi ro vĩ mô toàn cầu, hoạt động giảm đòn bẩy và thanh khoản hạn chế cùng lúc tác động mạnh. Đợt giảm này đã cuốn phăng hơn 100 tỷ USD khỏi tổng... ...

Chủ tịch SEC Paul Atkins cảnh báo rằng nếu không được kiểm soát bằng các chính sách chính thức, chính phủ liên bang có thể khai thác tiềm năng của lĩnh vực crypto để phục vụ giám sát tài chính trên diện rộng. Tuy nhiên, theo ông, ngành này cũng... ...

Aster (ASTER), Midnight (NIGHT) và Ethena (ENA) đang dẫn đầu nhóm altcoin giảm mạnh nhất trong 24 giờ qua, khi thị trường tiền điện tử bước vào giai đoạn điều chỉnh rõ rệt sau cú trượt giá của Bitcoin (BTC) xuống dưới ngưỡng 86.000 USD. Đà suy yếu của tiền... ...

Mặc dù Bitcoin (BTC) đã phục hồi nhẹ sau cú giảm sâu, ZCash (ZEC) vẫn chưa thể lấy lại những gì đã mất gần đây. Theo báo cáo mới nhất của Coinphoton, ZCash có tiềm năng tăng lên mức $605 nếu phá vỡ thành công khỏi kênh giá giảm. Một... ...

Các sản phẩm đầu tư crypto toàn cầu do những tổ chức quản lý tài sản lớn như BlackRock, Bitwise, Fidelity, Grayscale, ProShares và 21Shares quản lý đã ghi nhận dòng tiền ròng vào đạt 864 triệu USD trong tuần qua, theo dữ liệu từ CoinShares. Đây là tuần thứ... ...

Mantle (MNT) đang giữ vững vị thế trên vùng hỗ trợ ngắn hạn quanh mốc 1,23 USD tại thời điểm viết bài ngày thứ Ba, bất chấp bức tranh ảm đạm của thị trường tiền điện tử nói chung. Nếu phe bò tiếp tục gia tăng sức ép và củng... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode