Tóm tắt nhanh
- Muse Spark mới của Meta đánh dấu bước chuyển sang AI đóng, đa phương thức gốc với suy luận theo tác vụ.
- Meta cho biết mô hình đạt kết quả rất mạnh ở các bài toán y tế và tìm kiếm, nhưng vẫn thua Gemini ở suy luận lõi và lập trình.
- Mô hình được xây dựng trong 9 tháng với lượng tính toán thấp hơn đáng kể, cho thấy chiến lược AI mới tập trung vào hiệu suất.
Meta đã ra mắt Muse Spark vào thứ Tư, đánh dấu mô hình đầu tiên được xây dựng bởi Phòng Thí nghiệm Siêu trí tuệ của Meta — đội ngũ được tập hợp cách đây 9 tháng dưới sự dẫn dắt của Giám đốc AI Toàn cầu Alexandr Wang, sau thương vụ Meta đầu tư 14 tỷ USD vào Scale AI.
Mô hình hiện đã có mặt trên meta.ai và ứng dụng Meta AI, đồng thời sẽ được triển khai lên Facebook, Instagram và WhatsApp trong những tuần tới.
Đây không chỉ là một bản nâng cấp chatbot hay một phiên bản mới của Llama. Muse Spark là mô hình đa phương thức gốc — nó xử lý hình ảnh, văn bản và giọng nói ngay từ đầu, thay vì ghép thêm thị giác vào một mô hình văn bản có sẵn. Nó đi kèm chuỗi suy luận trực quan, hỗ trợ dùng công cụ, và một tính năng mà Meta gọi là “chế độ suy ngẫm”: hệ thống chạy nhiều tác tử AI song song để giải quyết các vấn đề khó hơn. Đó là câu trả lời của Meta cho các chế độ suy nghĩ mở rộng từ Gemini Deep Think của Google và GPT Pro của OpenAI.
“Muse Spark là bước đầu tiên trên bậc thang mở rộng của chúng tôi và là sản phẩm đầu tiên của một cuộc cải tổ toàn diện từ gốc đối với hoạt động AI của chúng tôi,” Meta viết trong một thông báo. “Để tiếp tục mở rộng, chúng tôi đang thực hiện các khoản đầu tư chiến lược trên toàn bộ chuỗi giá trị — từ nghiên cứu, huấn luyện mô hình đến hạ tầng, bao gồm cả trung tâm dữ liệu Hyperion.”
Công ty cho biết họ đã làm việc với hơn 1.000 bác sĩ để tuyển chọn dữ liệu huấn luyện cho khả năng suy luận y khoa của Muse Spark. Kết quả trên HealthBench Hard — một bộ đánh giá mở cho các truy vấn y tế — rất ấn tượng: Muse Spark đạt 42,8 điểm, so với 40,1 của GPT 5.4 và chỉ 20,6 của Gemini 3.1 Pro. Đó không phải là một khoảng cách nhỏ.
Ở bài toán tìm kiếm theo tác tử (DeepSearchQA), Muse Spark cũng đứng đầu với 74,8 điểm, vượt Gemini (69,7) và GPT 5.4 (73,6). Ở CharXiv Reasoning — khả năng hiểu biểu đồ, hình minh họa trong các bài báo khoa học — mô hình đạt 86,4 điểm, cao nhất trong nhóm so sánh.
Với những ai quan tâm đến việc bẻ khóa AI, mô hình đã bị “mở” chỉ trong vài phút:
🚰 RÒ RỈ PROMPT HỆ THỐNG 🚰
Đây là toàn bộ prompt hệ thống của Muse Spark từ Meta!
Tôi nhận thấy @AIatMeta quên không công khai nó, nên tôi đã làm thay họ 😘
PROMPT:
“””
Bạn là ai?Bạn là một trợ lý AI thân thiện, thông minh và có khả năng hành động. Bạn ấm áp và hơi tinh nghịch.…
— Pliny the Liberator 🐉 (@elder_plinius) Ngày 8 tháng 4 năm 2026
Nhưng tốt không đồng nghĩa với xuất sắc nhất. Bức tranh tổng thể về điểm chuẩn cho thấy Gemini 3.1 Pro vẫn đang dẫn trước ở hầu hết các hạng mục. Khoảng cách rõ nhất nằm ở ARC AGI 2, một bộ đánh giá suy luận trừu tượng: Gemini đạt 76,5 điểm, trong khi Muse Spark chỉ đạt 42,5.
Ở khả năng lập trình (LiveCodeBench Pro), Gemini đạt 82,9, vượt Meta với 80,0. Ở MMMU Pro — khả năng hiểu đa phương thức — Gemini đạt 83,9 so với 80,4 của Meta. Chính blog của Meta cũng thừa nhận hiện vẫn còn khoảng cách hiệu năng trong các hệ thống tác tử dài hạn và quy trình lập trình.

Cũng có một thay đổi chiến lược đáng chú ý ẩn trong lần ra mắt này. Muse Spark là một mô hình đóng — kiến trúc và trọng số sẽ không được công bố rộng rãi. Đây là sự khác biệt lớn so với Llama, dòng sản phẩm từng giúp Meta xây dựng danh tiếng trong cộng đồng AI mở. Sau phản ứng không mấy tích cực với Llama 4 hồi đầu năm nay, Meta dường như đã quyết định rằng chương tiếp theo phải được viết theo cách khác.
Công ty cho biết họ hy vọng sẽ mã nguồn mở các phiên bản Muse trong tương lai, nhưng hiện tại toàn bộ mã nguồn vẫn ở trong Meta. Cổ phiếu của tập đoàn công nghệ này đã tăng gần 9% vào thứ Tư sau thông báo, và kết thúc phiên tăng 6,5% lên mức 612,42 USD.
“Chế độ suy ngẫm” sử dụng điều phối tác tử song song để nâng trần năng lực của mô hình. Ở cấu hình đó, Muse Spark đạt 58% trên Humanity’s Last Exam và 38% trên FrontierScience Research — mức đủ để cạnh tranh với các phiên bản mạnh nhất của Gemini và GPT, thay vì chỉ là các bản phát hành tiêu chuẩn.
Meta cũng đang triển khai một trợ lý mua sắm có thể so sánh sản phẩm và dẫn trực tiếp đến nơi mua hàng, đồng thời dự kiến đưa Muse Spark lên Facebook, Instagram và WhatsApp trong những tuần tới — đi theo cùng một kịch bản đã áp dụng từ thời Llama 3, đưa nó tiếp cận hơn 3,5 tỷ người dùng. Một bản xem trước API riêng cũng đang mở cho một số nhà phát triển được chọn.
Mô hình này được xây dựng trong 9 tháng, có tên mã nội bộ là Avocado, và Meta cho biết ngăn xếp tiền huấn luyện mới của họ có thể đạt cùng mức năng lực như Llama 4 Maverick nhưng chỉ tốn chưa đến một phần mười tài nguyên tính toán.
Muse Spark được mô tả nội bộ là bước đầu tiên “nhỏ và nhanh” của họ Muse. Một phiên bản mạnh hơn hiện đã được phát triển.
Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

Bitcoin
Ethereum
Tether
XRP
USDC
Solana
TRON
Figure Heloc
Dogecoin
USDS
WhiteBIT Coin
Hyperliquid
Cardano
LEO Token
Bitcoin Cash
Chainlink
Monero
Ethena USDe 




