Claude nói kiểu người tiền sử để tiết kiệm chi phí, và hiệu quả thật

Updated: 07/04/2026 at 20:04

Giữa prompt engineering và màn trình diễn nghệ thuật, một nhà phát triển đã đăng lên Reddit một khám phá khiến cộng đồng AI vừa bật cười vừa phải chú ý: hãy dạy Claude giao tiếp như người tiền sử, và hóa đơn token có thể giảm tới 75%.

Bài đăng này xuất hiện trên r/ClaudeAI tuần trước và đến nay đã thu về hơn 400 bình luận cùng 10 nghìn lượt bình chọn — một sự kết hợp hiếm hoi giữa insight kỹ thuật thực sự và hài hước phi lý mà internet thường rất thích.

Cách làm rất đơn giản. Thay vì để Claude mở đầu bằng những câu xã giao, kể lể từng bước nó làm, rồi kết thúc bằng lời đề nghị hỗ trợ thêm, nhà phát triển này ép mô hình dùng những câu ngắn, tối giản. Làm trước, giải thích sau, không dài dòng. Một tác vụ tìm kiếm web vốn tiêu tốn khoảng 180 token đầu ra đã giảm xuống còn khoảng 45 token. Người đăng gốc cho biết mức giảm có thể lên tới 75% ở phần đầu ra, bằng cách khiến mô hình nghe như vừa phát minh ra lửa.

Nói theo kiểu người tiền sử, như một người dùng Reddit đã bình luận: “Tại sao phải mất thời gian nói nhiều khi ít lời cũng đủ?”

Điều kỹ thuật này không tác động tới ngữ cảnh đầu vào: toàn bộ lịch sử hội thoại, các tệp đính kèm và hướng dẫn hệ thống mà mô hình phải đọc lại ở mỗi lượt. Phần đầu vào đó thường lớn hơn rất nhiều so với đầu ra, nhất là trong các phiên lập trình dài. Tính cả đầu vào trong thực tế, mức tiết kiệm thường vào khoảng 25%, chứ không phải 75%. Vẫn đáng kể, chỉ là không “khủng” như con số tiêu đề.

Cũng nên nhớ phải cung cấp cho mô hình những chỉ dẫn bình thường. Đừng bắt nó “nói kiểu người tiền sử” ở mọi tầng, vì như vậy có thể rơi vào tình trạng “đầu vào rác, đầu ra rác”.

Còn một vấn đề khác là suy giảm năng lực. Một số nhà nghiên cứu trong chuỗi thảo luận cho rằng việc ép AI nhập vai thành một nhân vật kém tinh tế hơn có thể làm hại khả năng suy luận — tức là rào cản ngôn ngữ có thể ảnh hưởng ngược tới tư duy. Mối lo này hiện vẫn chưa được kết luận dứt khoát, nhưng đáng cân nhắc khi đánh giá kết quả.

Kỹ năng hay, và nhanh chóng lan truyền

Bất chấp những lưu ý đó, kỹ thuật này gần như lập tức có đời sống thứ hai trên GitHub.

Nhà phát triển Shawnchee đã đóng gói các quy tắc thành một bộ caveman-skill độc lập, tương thích với Claude Code, Cursor, Windsurf, Copilot và hơn 40 công cụ tác nhân khác. Bộ kỹ năng này chắt lọc phương pháp thành 10 quy tắc: không thêm câu đệm, làm trước khi giải thích, không bình luận nội bộ, không mở bài, không kết bài, không thông báo công cụ, chỉ giải thích khi cần, để mã tự nói lên mọi thứ, và coi lỗi là thứ cần sửa chứ không phải thứ để kể lể.

Các bài đo trong kho mã, được xác minh bằng tiktoken, cho thấy mức giảm token đầu ra đạt 68% với tác vụ tìm kiếm web, 50% với chỉnh sửa mã và 72% với các bài hỏi đáp — trung bình giảm 61% token đầu ra trên bốn tác vụ tiêu chuẩn.

Một kho mã song song khác của nhà phát triển Julius Brussee lại chọn cách tiếp cận hơi khác, đóng gói cùng ý tưởng thành một tệp SKILL.md với 562 sao trên GitHub. Đặc tả của nó là: trả lời như một người tiền sử thông minh, lược bỏ mạo từ, câu thừa và xã giao, nhưng giữ nguyên toàn bộ nội dung kỹ thuật. Khối mã không thay đổi. Thông báo lỗi được trích dẫn chính xác. Thuật ngữ kỹ thuật vẫn giữ nguyên. Người tiền sử chỉ nói phần tiếng Anh bao quanh các факт.

Bộ này còn có nhiều chế độ khác nhau để bạn quyết định mức độ cắt gọt, chuyển giữa Normal, Lite và Ultra. Mô hình vẫn làm đúng công việc đó, nhưng đưa ra câu trả lời ngắn hơn rất nhiều, nhờ vậy tiết kiệm đáng kể theo thời gian.

Bối cảnh chi phí rộng hơn khiến câu chuyện bớt mang tính đùa cợt. Anthropic là một trong những mô hình có chi phí trên mỗi token cao nhất. Với các nhà phát triển vận hành quy trình tác nhân qua hàng chục lượt trong một phiên, độ dài dòng của đầu ra không còn là vấn đề phong cách. Nó là một khoản chi. Nếu một tiếng gầm kiểu người tiền sử có thể thay cho bản tóm tắt năm câu về việc mô hình vừa làm gì, số token tiết kiệm được sẽ cộng dồn qua hàng nghìn lần gọi API.

Bộ kỹ năng caveman có thể cài chỉ với một lệnh thông qua skills.sh và hoạt động trên toàn bộ dự án. Dù nó có làm Claude kém hoa mỹ hơn đôi chút hay không, nó đã khiến rất nhiều nhà phát triển bớt khó chịu hơn hẳn.

Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.
Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, CoinPhoton.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

Được đề cập trong bài viết
Mới cập nhật

Hàn Quốc đã ra lệnh cho tất cả các sàn giao dịch tiền mã hóa phải đối chiếu sổ cái nội bộ của họ với số tài sản thực tế nắm giữ mỗi năm phút sau khi một cuộc thanh tra phát hiện ra những điểm yếu trong kiểm soát... ...

Thị trường tiền mã hóa tại Mỹ đã chứng kiến một năm 2025 đầy kỷ lục buồn, khi người dân báo cáo thiệt hại lên tới 11,366 tỷ USD do các vụ lừa đảo liên quan đến tài sản số — tăng 22% so với năm trước, trong bối cảnh... ...

Trưởng bộ phận nghiên cứu của Grayscale Investments, Zach Pandl, nhận định rằng những thách thức từ điện toán lượng tử đối với Bitcoin mang bản chất “xã hội nhiều hơn kỹ thuật”, trong đó rào cản cốt lõi nằm ở khả năng đạt được đồng thuận trong cộng đồng.... ...

Giá Solana (SOL) hiện giao dịch quanh mức 79,90 USD, duy trì ngay phía trên vùng then chốt – nơi một cú phá vỡ xác nhận có thể kích hoạt nhịp điều chỉnh sâu gần 20%. Cấu trúc kỹ thuật gia tăng rủi ro giảm giá Biểu đồ ngày cho... ...

  XRP hiện đang neo quanh mức 1,3 USD, phản ánh sự yếu kém kéo dài sau khi không thể tái chiếm các mức trên 2 USD. Tuy nhiên, áp lực còn sâu hơn mức giá, khi sự mất cân bằng trong định vị tiếp tục được giải tỏa. Trong... ...

Lưu ý: Nội dung bài viết gốc không được cung cấp (hiện đang là ‘undefined’). Do đó, tôi không thể dịch và viết lại bài viết theo yêu cầu. Vui lòng cung cấp nội dung đầy đủ để tôi có thể hoàn thành nhiệm vụ. Kết luận: Không thể thực... ...

Xin lỗi, tôi không thể hoàn thành yêu cầu này vì nội dung bài viết gốc đã bị bỏ trống hoặc không xác định (undefined). Vui lòng cung cấp nội dung để tôi có thể dịch và viết lại theo các quy tắc và định dạng đã cho. Khi nội... ...

Chào bạn,

Với vai trò biên tập viên chuyên nghiệp của CoinPhoton.com, tôi đã sẵn sàng để thực hiện nhiệm vụ dịch và viết lại bài viết theo yêu cầu của bạn. Tuy nhiên, tôi nhận thấy rằng phần ‘NỘI DUNG’ của bài viết bạn cung cấp hiện đang bị trống (hiển... ...

Xin chào,

Tôi nhận thấy rằng phần “NỘI DUNG” của bài viết bạn muốn tôi dịch và viết lại hiện đang trống (undefined). Để có thể hoàn thành nhiệm vụ theo đúng yêu cầu của bạn, tôi cần có nội dung bài viết gốc. Xin vui lòng cung cấp nội dung bài... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode