Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Mới cập nhật

Stablecoin USDC của Circle đang tăng trưởng nhanh hơn USDT của Tether cả về vốn hóa thị trường lẫn hoạt động on-chain, nhờ khung pháp lý minh bạch và sự gia tăng của dòng vốn tổ chức, theo báo cáo mới của các nhà phân tích JPMorgan. Theo nhóm nghiên... ...

Hãy thẳng thắn nhìn nhận: thị trường tiền tiện tử năm 2025 không khác gì việc ngồi nhìn sơn khô (buồn tẻ và không có gì thú vị), nếu như lớp sơn ấy được pha trộn bằng những giấc mơ tan vỡ và nước mắt của các nhà đầu tư... ...

Ba cái tên nổi bật gồm Pump.fun (PUMP), Virtuals Protocol (VIRTUAL) và Ethena (ENA) đang dẫn đầu làn sóng giảm giá khi toàn bộ thị trường tiền điện tử chịu áp lực bán mạnh. Xét về mặt kỹ thuật, các token này hiện đang áp sát những vùng hỗ trợ... ...

Giá EOS đã chứng kiến mức giảm gần 6% trong tuần. Đợt điều chỉnh này diễn ra đồng thời với sự sụt giảm của Bitcoin (BTC) từ ngưỡng kháng cự cục bộ $116.1k. Vào tháng 3 năm 2025, EOS đã được tái cấu trúc và đổi tên thành Vaulta (A).... ...

Một tài khoản từng được sử dụng bởi Sam Bankman-Fried (SBF) – nhà sáng lập và cựu CEO của sàn giao dịch FTX đã phá sản – vào tối thứ Năm đã đăng trên X một liên kết dẫn đến tài liệu dài 14 trang, trong đó lập luận rằng FTX... ...

Công ty phân tích on-chain Glassnode cho biết việc Bitcoin không thể lấy lại mức giá vốn 113.000 USD có thể dẫn đến một đợt điều chỉnh sâu hơn, trong bối cảnh áp lực bán từ nhà đầu tư dài hạn gia tăng và tâm lý thị trường yếu ớt.... ...

Zcash (ZEC) tiếp tục khẳng định triển vọng tăng giá, đang giao dịch quanh mức 360 USD tại thời điểm viết bài vào thứ Sáu. Tiền điện tử tập trung vào quyền riêng tư này đã liên tục đi lên trong vài tuần gần đây, bất chấp biến động thị... ...

Stellar (XLM) đã trải qua một tháng điều chỉnh giảm, mất 14,7% giá trị khi tâm lý thị trường chung suy giảm. Tuy nhiên, trong tuần vừa qua, giá XLM chủ yếu sideways, cho thấy quá trình điều chỉnh có thể đang dần kết thúc. Hiện tại, một số chỉ... ...

Thị trường memecoin tiếp tục chật vật giữa bối cảnh toàn thị trường suy yếu. Pepe (PEPE) giảm 6,9% tại thời điểm viết bài, trong khi khối lượng giao dịch lại tăng vọt 60%. Khi PEPE đang được giao dịch với mức chiết khấu, một ví cá voi mới kích... ...

Whitepaper Bitcoin sẽ bước sang tuổi 17 vào ngày mai, trong bối cảnh các ví của Satoshi Nakamoto đang liên tục sụt giảm giá trị. Chỉ trong vòng một ngày, tổng tài sản của ông đã bốc hơi hơn 5 tỷ đô la. Giá BTC đang đối mặt với áp... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode