Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Polkadot DAO đã chính thức bày tỏ sự ủng hộ việc giới hạn cứng nguồn cung DOT, đánh dấu một thay đổi lớn trong tokenomics của mạng lưới. Thông qua Trưng cầu dân ý 1710, được thông qua trên lộ trình “Wish For Change” với 81% phiếu thuận, cộng đồng... ...

Các trader Bitcoin đang chuẩn bị đối mặt với biến động khi thị trường crypto tiến gần tới quyết định về lãi suất của Cục Dự trữ Liên bang Mỹ (Fed). Phe bò Bitcoin đang phải vượt qua ngưỡng kháng cự rõ ràng ở mức 117.000 đô la ngay từ... ...

Thị trường crypto đang bước vào một trong những tuần quan trọng nhất của năm, khi mọi ánh mắt đều hướng về quyết định lãi suất của Cục Dự trữ Liên bang Hoa Kỳ (Fed) vào ngày 17/9. Trong bối cảnh đó, giá Bitcoin vẫn giữ nhịp điệu thận trọng,... ...

Thị trường tiền điện tử đã khép lại tuần trước với tâm lý lạc quan khi tổng vốn hóa vượt ngưỡng 4 nghìn tỷ USD một lần nữa, tuy nhiên, động lực đã giảm sút trong suốt cuối tuần. Thị trường chứng khoán Mỹ ghi nhận mức cao kỷ lục... ...

Thị trường crypto khởi động tuần mới trong trạng thái thận trọng, với tổng vốn hóa toàn ngành giảm 2% trong 24 giờ qua. Biến động giá tiếp diễn không chỉ tạo áp lực lên tâm lý chung mà còn thúc đẩy những chiến lược điều chỉnh danh mục đáng... ...

Các tổ chức tài chính, quỹ đầu tư và công ty đại chúng đang tiếp tục mở rộng nắm giữ Bitcoin (BTC), hiện kiểm soát 12,3% tổng cung Bitcoin trên thị trường. Theo nền tảng phân tích Bitcoin Ecoinometrics, tỷ lệ này đã tăng mạnh trong vòng 12 tháng qua.... ...

Gần đây, sự thống trị của Ethereum (ETH) đã có nhiều nỗ lực vượt trội, đặc biệt trong các tháng 7 và 8, khi mùa altcoin bắt đầu. Nhưng với các altcoin đang hạ nhiệt, giá ETH sẽ đi về đâu? Động lực thị trường đã thay đổi khi Solana... ...

Mert Mumtaz, CEO của Helius – nhà cung cấp dịch vụ RPC cho các ứng dụng blockchain – nhận định rằng stablecoin neo theo đô la Mỹ cuối cùng sẽ không còn sự khác biệt về giá trị. Nguyên nhân là các sàn giao dịch xử lý riêng biệt nhiều... ...

Avantis (AVNT) đã tăng mạnh lên mức đỉnh lịch sử mới trong phiên giao dịch sáng sớm tại châu Á hôm nay sau khi được niêm yết trên ba sàn giao dịch lớn. Upbit, Bithumb và Binance đã xác nhận sẽ niêm yết token này, dự kiến giao dịch bắt... ...

Ngày 9/9/2025, Chính phủ đã ban hành Nghị quyết 05/2025/NQ-CP – một văn bản mang tính bước ngoặt, chính thức mở ra giai đoạn thí điểm quản lý và phát triển thị trường tài sản số tại Việt Nam. Đây là lần đầu tiên khung pháp lý rõ ràng được... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode