Trang chủ >> Trí tuệ nhân tạo (AI) >> Google công bố kỹ thuật huấn luyện AI tối ưu hóa, tăng tốc độ và...

Google công bố kỹ thuật huấn luyện AI tối ưu hóa, tăng tốc độ và hiệu quả

Updated: 06/07/2024 at 18:00

Các nhà nghiên cứu tại DeepMind của Google đã tiết lộ một phương pháp mới để tăng tốc độ huấn luyện AI, giúp giảm đáng kể tài nguyên tính toán và thời gian cần thiết. Phương pháp mới này đối với quy trình tiêu tốn năng lượng có thể làm cho việc phát triển AI nhanh hơn và rẻ hơn, theo một bài báo nghiên cứu gần đây – và điều này có thể là tin tốt cho môi trường.

“Phương pháp của chúng tôi – học tương phản đa phương thức với lựa chọn ví dụ chung (JEST) – vượt qua các mô hình hiện đại nhất với số lượng lần lặp ít hơn lên đến 13 lần và lượng tính toán ít hơn 10 lần,” nghiên cứu cho biết.

Ngành công nghiệp AI được biết đến với mức tiêu thụ năng lượng cao. Các hệ thống AI quy mô lớn như ChatGPT yêu cầu sức mạnh xử lý lớn, điều này đòi hỏi nhiều năng lượng và nước để làm mát các hệ thống này. Ví dụ, lượng nước tiêu thụ của Microsoft đã tăng 34% từ năm 2021 đến 2022 do nhu cầu tính toán AI tăng lên, với ChatGPT bị cáo buộc tiêu thụ gần nửa lít nước cho mỗi 5 đến 50 lần truy vấn.

Cơ quan Năng lượng Quốc tế (IEA) dự đoán rằng tiêu thụ điện của trung tâm dữ liệu sẽ tăng gấp đôi từ năm 2022 đến 2026 – so sánh nhu cầu năng lượng của AI với hồ sơ năng lượng thường bị chỉ trích của ngành khai thác tiền điện tử.

Tuy nhiên, các phương pháp như JEST có thể cung cấp một giải pháp. Bằng cách tối ưu hóa việc chọn dữ liệu cho việc huấn luyện AI, Google cho biết, JEST có thể giảm đáng kể số lượng lần lặp và sức mạnh tính toán cần thiết, điều này có thể giảm tổng mức tiêu thụ năng lượng. Phương pháp này phù hợp với những nỗ lực cải thiện hiệu quả của các công nghệ AI và giảm tác động môi trường của chúng.

Nếu kỹ thuật này chứng minh hiệu quả ở quy mô lớn, những người huấn luyện AI sẽ chỉ cần một phần nhỏ sức mạnh để huấn luyện các mô hình của họ. Điều này có nghĩa là họ có thể tạo ra các công cụ AI mạnh mẽ hơn với cùng tài nguyên hiện có, hoặc tiêu tốn ít tài nguyên hơn để phát triển các mô hình mới.

Cách thức hoạt động của JEST

JEST hoạt động bằng cách chọn các lô dữ liệu bổ sung để tối đa hóa khả năng học của mô hình AI. Không giống như các phương pháp truyền thống chọn từng ví dụ riêng lẻ, thuật toán này xem xét thành phần của toàn bộ tập hợp.

Ví dụ, hãy tưởng tượng bạn đang học nhiều ngôn ngữ. Thay vì học tiếng Hoa, tiếng Hàn và tiếng Nhật riêng rẽ, có lẽ theo thứ tự độ khó, bạn có thể thấy hiệu quả hơn nếu học chúng cùng nhau theo cách mà kiến thức của một ngôn ngữ hỗ trợ việc học ngôn ngữ khác. Vì bạn biết rằng tiếng Hàn và tiếng Nhật có mối quan hệ chặt chẽ với tiếng Hoa, đặc biệt là Nhật Bản vẫn sử dụng rất nhiều Hán tự. Qua đó học cùng lúc 3 thứ tiếng sẽ bổ trợ cho nhau.

Google đã áp dụng cách tiếp cận tương tự và đã thành công.

“Chúng tôi chứng minh rằng việc chọn các lô dữ liệu chung hiệu quả hơn cho việc học so với chọn các ví dụ độc lập,” các nhà nghiên cứu tuyên bố trong bài báo.

Để làm như vậy, các nhà nghiên cứu của Google đã sử dụng “học tương phản đa phương thức,” nơi quá trình JEST xác định các phụ thuộc giữa các điểm dữ liệu. Phương pháp này cải thiện tốc độ và hiệu quả của việc huấn luyện AI trong khi yêu cầu ít sức mạnh tính toán hơn nhiều.

Yếu tố quan trọng của phương pháp này là bắt đầu với các mô hình tham chiếu đã được huấn luyện trước để hướng dẫn quá trình chọn dữ liệu, Google lưu ý. Kỹ thuật này cho phép mô hình tập trung vào các tập dữ liệu chất lượng cao, được quản lý tốt, tối ưu hóa thêm hiệu quả huấn luyện.

“Chất lượng của một lô dữ liệu cũng là một chức năng của thành phần của nó, ngoài chất lượng tổng hợp của các điểm dữ liệu được xem xét độc lập,” bài báo giải thích.

Các thí nghiệm của nghiên cứu đã cho thấy sự cải thiện hiệu suất rõ rệt trên nhiều tiêu chuẩn. Ví dụ, huấn luyện trên tập dữ liệu WebLI thông thường bằng JEST đã cho thấy sự cải thiện đáng kể về tốc độ học và hiệu quả sử dụng tài nguyên.

Các nhà nghiên cứu cũng nhận thấy rằng thuật toán này nhanh chóng phát hiện các lô con có khả năng học cao, tăng tốc quá trình huấn luyện bằng cách tập trung vào các mẩu dữ liệu cụ thể “phù hợp” với nhau. Kỹ thuật này, được gọi là “khởi động chất lượng dữ liệu,” coi trọng chất lượng hơn số lượng và đã chứng minh hiệu quả tốt hơn cho việc huấn luyện AI.

“Một mô hình tham chiếu được huấn luyện trên một tập dữ liệu nhỏ được quản lý tốt có thể hướng dẫn hiệu quả việc quản lý một tập dữ liệu lớn hơn nhiều, cho phép huấn luyện một mô hình vượt trội hơn hẳn về chất lượng so với mô hình tham chiếu trên nhiều nhiệm vụ khác,” bài báo cho biết.

Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

Được đề cập trong bài viết

BÀI TRƯỚC

Bitfinex sẽ hoàn lại tiền cho các nhà đầu tư của dự án khách sạn Hilton El Salvador thất bại

BÀI SAU

Bitcoin ETF giao ngay chứng kiến dòng vốn vào đột biến sau đợt giảm ngày 4 tháng 7

CEO Anthropic: Nhân loại tiến gần “vùng nguy hiểm thật sự” của AI vào năm 2026

27/01/2026
17:00

Token AI lao dốc mạnh sau ‘sự phân kỳ quan trọng’: Bong bóng công nghệ có đang hình thành?

27/12/2025
21:00

Fetch.ai chuẩn bị cho phép AI tự thanh toán thay người dùng từ năm 2026

19/12/2025
13:00

Anthropic cảnh báo nguy cơ AI tấn công blockchain

03/12/2025
07:30

Tương lai crypto dưới ảnh hưởng của AI và các deal nghìn tỷ USD

23/11/2025
18:00

AI không chỉ là cơn sốt: Nó đang kiểm soát toàn bộ thị trường

09/11/2025
06:30

OpenAI xây dựng “cỗ máy bong bóng AI” 300 tỷ USD

22/10/2025
06:00

Nước cờ thế kỷ: Vì sao ván cược AI của Microsoft vào OpenAI là một thiên tài chiến lược

11/10/2025
06:00

Liệu Hoa Kỳ tụt hậu với Trung Quốc trong cuộc đua AI không?

30/09/2025
06:00

OpenAI ra mắt ChatGPT “Pulse” — Liệu có hữu ích cho giao dịch crypto?

27/09/2025
06:00

Từ GPU đến token – Sự lạc quan của Nvidia có thể ảnh hưởng đến lĩnh vực tiền điện tử AI như thế nào

31/08/2025
13:00

Chip AI “Made in China” mới của DeepSeek có thể làm sụp đổ thị trường tiền điện tử Hoa Kỳ

23/08/2025
14:00

Top 10 website tin tức về thị trường Crypto và Bitcoin

26/02/2025
05:00

Airdrop là gì?

24/02/2025
18:15

Bitcoin phục hồi mức giá $100K khi kỳ vọng Fed cắt giảm lãi suất tăng lên

12/12/2024
07:06

Circle và Binance hợp tác mở rộng stablecoin USDC ra toàn cầu

11/12/2024
14:51

Thị trường Altcoin lao dốc 30% là cơ hội “Buy the Dip”

11/12/2024
14:30

Triển vọng Bitcoin của Peter Brandt: Từ $0 đến $1 triệu

11/12/2024
14:00

JPMorgan nâng mục tiêu giá cho các cổ phiếu khai thác Bitcoin

11/12/2024
13:00

OKX Ventures đẩy mạnh hệ sinh thái TON với khoản đầu tư 5 triệu USD

11/12/2024
11:41

Cơ quan quản lý New York phê duyệt stablecoin RLUSD của Ripple

11/12/2024
07:35

Charles Hoskinson hé lộ dự án lớn với Elon Musk, ADA được dự báo chạm mốc $6 vào năm 2025

16/11/2024
15:20

Người điều hành bộ trộn Helix lĩnh án 3 năm tù vì rửa tiền

16/11/2024
14:11

CFTC Hoa Kỳ cấp phép cho các tùy chọn ETF Bitcoin

16/11/2024
12:00

Mới cập nhật

Liệu việc xác định mức đáy 80.000 đô la của BTC là quá sớm?

Tin tức Bitcoin (BTC)
3 giờ trước

Các nhà đầu tư dường như đang gặp khó khăn khi thị trường không ngừng thử thách sự kiên nhẫn của họ. Những tín hiệu lạc quan xuất hiện vào đầu năm 2026, mang lại hy vọng về một đợt tăng giá mạnh mẽ, giờ đây đã biến thành một... ...

Giá Ethereum (ETH) tiếp tục suy yếu khi ra mắt Quỹ The DAO Security Fund

Phân tích kỹ thuật
3 giờ trước

Theo Griff Green — nhà phát triển từng tham gia xây dựng nền tảng — các khoản tiền “trường hợp đặc biệt” vốn được thiết lập để hoàn tiền cho những nạn nhân đặc thù của vụ hack The DAO đang được kích hoạt trở lại, lần này với mục... ...

LayerZero (ZRO) phát tín hiệu bán sớm dù nhu cầu mạng vẫn ổn định

Phân tích kỹ thuật
4 giờ trước

LayerZero (ZRO) đang chịu sức ép rõ rệt từ làn sóng bán tháo lan rộng trên thị trường tiền điện tử, khi giá giảm khoảng 7% tại thời điểm ghi nhận vào ngày thứ Sáu. Dù vậy, giao thức nhắn tin xuyên chuỗi này vẫn cho thấy nền tảng nhu... ...

Stellar (XLM) lao dốc về đáy 3 tháng khi tâm lý né tránh rủi ro bao trùm thị trường

Phân tích kỹ thuật
5 giờ trước

Stellar (XLM) tiếp tục chìm trong sắc đỏ khi giá trượt xuống dưới ngưỡng 0,20 USD vào phiên thứ Sáu — mức thấp nhất kể từ giữa tháng 10. Áp lực bán gia tăng trong bối cảnh tâm lý thị trường ngày càng bi quan, thể hiện rõ qua sự... ...

Flying Tulip của Andre Cronje thu hút hơn 1,36 tỷ USD cam kết cho các đợt bán token

Tin tức Altcoin
6 giờ trước

Flying Tulip, nền tảng DeFi mới do “bố già DeFi” Andre Cronje và đội ngũ của ông phát triển, đã huy động thêm vốn thông qua kết hợp các đợt bán token riêng tư và công khai. Trong vòng Series A bán token riêng tư, dự án huy động được... ...

Meme coin: Dogecoin, Shiba Inu, Pepe giảm xuống dưới mức hỗ trợ quan trọng

Phân tích kỹ thuật
7 giờ trước

Các meme coin, với Dogecoin (DOGE), Shiba Inu (SHIB) và Pepe (PEPE) giữ vai trò dẫn dắt, tiếp tục lao dốc trong tuần này, nối dài chuỗi suy yếu đã hình thành trước đó. Phân tích kỹ thuật cho thấy bức tranh kém tích cực khi cả DOGE, SHIB và... ...

Optimism Foundation thông qua đề xuất mua lại token OP nhằm củng cố giá

Tin tức Altcoin
8 giờ trước

Hệ thống quản trị của blockchain Optimism vừa phê duyệt một đề xuất quan trọng, theo đó 50% tổng doanh thu từ Superchain sẽ được sử dụng để mua lại token OP của mạng lưới trong vòng 12 tháng tới, bắt đầu từ tháng 2. Đề xuất này được Optimism... ...

Dự đoán giá TOP 3 tiền điện tử: BTC, ETH và XRP tiếp tục giảm mạnh khi phe gấu nắm quyền kiểm soát

Phân tích kỹ thuật
9 giờ trước

Bitcoin (BTC), Ethereum (ETH) và Ripple (XRP) tiếp tục chìm trong nhịp điều chỉnh vào phiên thứ Sáu, với mức sụt giảm trong tuần lần lượt xấp xỉ 6%, 3% và 5%. BTC đang trượt dần về vùng đáy của tháng 11 quanh ngưỡng 80.000 USD, trong khi ETH đánh... ...

Aero DEX hướng tới giải quyết tình trạng phân mảnh thanh khoản và lật đổ các ông lớn DEX

DeFi
10 giờ trước

Trong khi phần lớn sự chú ý của ngành trong năm qua tập trung vào stablecoin, trái phiếu kho bạc được token hóa và các cổng tiếp cận dành cho tổ chức, đội ngũ đứng sau Velodrome và Aerodrome cho rằng cuộc cạnh tranh quyền lực thực sự của crypto... ...

Doanh thu các dự án DePIN tăng trưởng bền bỉ dù giá token lao dốc

Tạp chí
11 giờ trước

Giá token ở mức thấp tiếp tục tạo áp lực lên các mạng hạ tầng vật lý phi tập trung (DePIN), nhưng doanh thu toàn ngành đang cho thấy dấu hiệu bền bỉ hơn, theo một báo cáo từ Messari. Phần lớn token DePIN đi ngang hoặc suy giảm trong... ...

Xem thêm bài viết

Được đề cập trong bài viết

Chọn chế độ hiển thị:

Coin phổ biến

Google công bố kỹ thuật huấn luyện AI tối ưu hóa, tăng tốc độ và hiệu quả

Cách thức hoạt động của JEST

Chọn chế độ hiển thị: