Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Ủy ban Ngân hàng Thượng viện Mỹ cho biết sẽ không tổ chức phiên đánh dấu (markup hearing) đối với dự luật cấu trúc thị trường crypto cho đến năm sau, dù trước đó kỳ vọng có thể diễn ra vào cuối tuần này. Theo ủy ban, các nghị sĩ... ...

Bitcoin (BTC) giảm xuống dưới mốc 86.000 USD vào đêm qua (15/12), tiếp tục mở rộng tình trạng mất cân bằng thanh khoản khi các nhà đầu tư nhỏ lẻ liên tục mua vào mỗi khi giá điều chỉnh. Tuy nhiên, các nhà đầu tư lớn lại tận dụng nhu... ...

Quyền riêng tư trong lĩnh vực tiền điện tử đang chuyển mình mạnh mẽ, khác biệt rõ nét so với các chu kỳ phát triển trước đây. Nhà đầu tư nổi tiếng Balaji Srinivasan gần đây nhận định rằng tám năm tới sẽ là giai đoạn quyền riêng tư định... ...

Thị trường tiền điện tử chuẩn bị chứng kiến làn sóng phát hành token trị giá khoảng 666,4 triệu USD trong tuần thứ ba của tháng 12 năm 2025. Những dự án nổi bật như LayerZero (ZRO), Arbitrum (ARB) và Sei (SEI) sẽ tiến hành mở khóa nguồn cung token... ...

Dogecoin (DOGE) nhích lên gần 2% tại thời điểm viết bài vào thứ Hai, lấy lại phần nào đà sau khi giảm 3,57% trong phiên trước đó. Dẫu vậy, meme coin này vẫn đứng trước rủi ro đánh mất vùng tích lũy, khi lực cầu từ khối tổ chức suy... ...

Nhiều dữ liệu kinh tế quan trọng của Mỹ trong khoảng thời gian từ ngày 15 tháng 12 đến 19 tháng 12 đang đặt Bitcoin vào một thời điểm bước ngoặt. Các chuyên gia phân tích hiện chia thành hai luồng ý kiến: một bên lo ngại về khả năng... ...

Giá Cardano (ADA) đang dao động ổn định quanh vùng 0,40 USD tại thời điểm viết bài vào thứ Hai, sau khi nỗ lực bứt phá lên trên ranh giới trên của mô hình cái nêm trong tuần trước không thành công. Dù biến động giá ngắn hạn vẫn tương... ...

Năm 2026 chỉ còn chưa đầy ba tuần nữa, và các chuyên gia thị trường đã bắt đầu công bố những dự báo cho lĩnh vực crypto. Một trong những góc nhìn đáng chú ý đến từ Richard Teng, đồng CEO của sàn giao dịch crypto lớn nhất thế giới,... ...

Bittensor (TAO) ghi nhận mức tăng hơn 2% tại thời điểm viết bài vào thứ Hai, qua đó lấy lại một phần đà giảm khoảng 5% trong phiên Chủ nhật trước đó. Động lực phục hồi chủ yếu đến từ sự kiện halving dự kiến diễn ra trong ngày, theo... ...

Sau ba năm phát triển, Firedancer chính thức hoạt động trên mainnet Solana vào tháng 12/2025, sau khi tạo ra hơn 50.000 block trong 100 ngày thử nghiệm với một số ít validator. Cột mốc được tài khoản chính thức của Solana công bố ngày 12/12 không chỉ là một... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode