17 cách để ngừng đạt đến giới hạn Claude

2 giờ 42 phút trước 3

Nội dung bài viết

1. Chỉnh sửa lời nhắc ban đầu, không trả lời
2. Bắt đầu một cuộc trò chuyện mới sau mỗi 15–20 tin nhắn
3. Tải trước tất cả ngữ cảnh
4. Sử dụng Dự án / ngữ cảnh đã lưu
5. Yêu cầu dàn ý trước khi soạn thảo đầy đủ
6. Yêu cầu độ dài và định dạng nghiêm ngặt
7. Gửi nhiều câu hỏi trong một tin nhắn
8. Sử dụng các mô hình nhỏ hơn cho các tác vụ đơn giản
9. Tránh yêu cầu Claude “nhớ lại” các câu trả lời trước đó
10. Bắt đầu các cuộc trò chuyện riêng biệt theo chủ đề
11. Cắt các tệp đã tải lên và dán có chọn lọc
12. Tắt các công cụ bạn không cần
13. Sử dụng lại các đầu ra tóm tắt theo cách thủ công
14. Phân bổ công việc trong ngày
15. Bỏ qua các từ lịch sự
16. Xem bảng điều khiển sử dụng của bạn
17. Sử dụng LLM nhẹ hơn để tinh chỉnh lời nhắc

Ngănn đạt đến giới hạn sử dụng (mã thông báo hoặc tỷ lệ) của Claude chủ yếu là rút ngắn các cuộc trò chuyện, cắt bỏ ngữ cảnh không cần thiết và phân lô công việc thông minh hơn. Dưới đây là 17 cách thực tế bạn có thể áp dụng ngay bây giờ:

1. Chỉnh sửa lời nhắc ban đầu, không trả lời

Thay vì nói “không, ý tôi là…” Trong phần tiếp theo, hãy chỉnh sửa tin nhắn đầu tiên của bạn và gửi lại. Điều này giữ cho ngữ cảnh ngắn hơn và tránh làm phình to lịch sử trò chuyện.

2. Bắt đầu một cuộc trò chuyện mới sau mỗi 15–20 tin nhắn

Sau ~15–20 lượt, lịch sử trở nên nặng nề và mỗi tin nhắn mới tốn nhiều token hơn. Một cuộc trò chuyện mới sẽ đặt lại lịch sử và giảm chi phí mỗi lượt.

3. Tải trước tất cả ngữ cảnh

Cung cấp cho Claude mọi thứ nó cần trong một lời nhắc được viết tốt thay vì nhiều tin nhắn qua lại nhỏ. Chi tiết trước nhiều hơn thường đánh bại các chỉnh sửa lặp đi lặp lại.

4. Sử dụng Dự án / ngữ cảnh đã lưu

Nếu bạn lặp lại cùng một nền (ví dụ: “Tôi là nhà phát triển Python cho dự án X”), hãy đặt nó trong lời nhắc Dự án hoặc hệ thống. Bằng cách đó, bạn không dán lại cùng một ngữ cảnh mỗi lần.

5. Yêu cầu dàn ý trước khi soạn thảo đầy đủ

Đối với các tài liệu hoặc kế hoạch dài, trước tiên hãy yêu cầu dàn ý, sau đó chỉ mở rộng các phần bạn thích. Một bản nháp lớn thường đốt nhiều token hơn một số yêu cầu nhỏ hơn.

6. Yêu cầu độ dài và định dạng nghiêm ngặt

Nói với Claude những điều như “giữ dưới 200 từ”, “sử dụng gạch đầu dòng” hoặc “không có phần giới thiệu chỉ là câu trả lời”. Điều này cắt giảm các câu trả lời dài dòng lãng phí mã thông báo.

7. Gửi nhiều câu hỏi trong một tin nhắn

Thay vì các cuộc trò chuyện riêng biệt cho các nhiệm vụ A, B và C, hãy kết hợp chúng thành một lời nhắc với các câu hỏi được đánh số. Điều này làm giảm số lượt nặng về ngữ cảnh.

8. Sử dụng các mô hình nhỏ hơn cho các tác vụ đơn giản

Nếu bạn đang sử dụng API, hãy sử dụng Haiku hoặc mô hình nhẹ hơn để tóm tắt nhanh, phân loại hoặc chỉnh sửa đơn giản thay vì mô hình lớn nhất.

9. Tránh yêu cầu Claude “nhớ lại” các câu trả lời trước đó

Thay vì “Bạn đã nói gì về X trước đó?”, hãy cuộn lên hoặc sử dụng ghi chú của riêng bạn. Yêu cầu lại đốt cháy một lượt hoàn toàn mới.

10. Bắt đầu các cuộc trò chuyện riêng biệt theo chủ đề

Kết hợp nhiều chủ đề không liên quan trong một cuộc trò chuyện khiến mọi tin nhắn trở nên đắt đỏ hơn. Giữ một chủ đề cho mỗi cuộc trò chuyện và bắt đầu mới khi bạn chuyển đổi.

11. Cắt các tệp đã tải lên và dán có chọn lọc

Không tải lên toàn bộ tệp 500 dòng khi chỉ có một hàm bị hỏng. Dán hoặc chỉ sửa đoạn mã có liên quan để Claude xử lý ít văn bản hơn.

12. Tắt các công cụ bạn không cần

Nếu bạn đang sử dụng gói Claude-Code hoặc Công cụ, hãy tắt các công cụ không cần thiết cho một nhiệm vụ nhất định. Mỗi công cụ bổ sung được sử dụng có thể làm tăng thêm mức tiêu thụ của bạn.

13. Sử dụng lại các đầu ra tóm tắt theo cách thủ công

Tự tóm tắt một cuộc trò chuyện dài trong ghi chú, sau đó chỉ sao chép các phần chính vào cuộc trò chuyện mới. Điều này tránh gửi lại lịch sử đầy đủ và đầu ra dài.

14. Phân bổ công việc trong ngày

Giới hạn sử dụng thường chạy trên cửa sổ cuộn (ví dụ: 5 giờ), không phải đặt lại vào lúc nửa đêm. Việc lan truyền các yêu cầu trong ngày cho phép các phần sử dụng của bạn “giảm bớt” và giữ bạn dưới giới hạn.

15. Bỏ qua các từ lịch sự

Cắt các cụm từ như “Bạn có thể giúp tôi điều gì đó không?” và đi thẳng đến câu hỏi. Claude không quan tâm đến sự lịch sự; lời nhắc ngắn hơn lưu mã thông báo.

16. Xem bảng điều khiển sử dụng của bạn

Sử dụng bảng điều khiển “Sử dụng” hoặc “Giới hạn sử dụng gói” của Claude để xem bạn gần như thế nào với giới hạn phiên hoặc giới hạn hàng tuần của mình. Điều này giúp bạn điều chỉnh lựa chọn mô hình hoặc hành vi trước khi bạn chạm vào giới hạn.

17. Sử dụng LLM nhẹ hơn để tinh chỉnh lời nhắc

Trước tiên, chạy lời nhắc thông qua một mô hình rẻ hơn (như ChatGPT) để đánh bóng cụm từ, sau đó dán phiên bản tinh chỉnh vào Claude. Điều này giúp Claude đắt tiền trở nên sạch sẽ và hiệu quả hơn.

Gói Claude 20 đô la/tháng là đủ.

Nhưng chỉ khi bạn ngừng mắc phải 17 lỗi này:

1: Bạn tải lên các tệp PDF thô. Một trang = 3.000 từ.

Khắc phục: Dán văn bản vào tài liệu Google. Tải xuống ở định dạng .md. Dưới 200 từ.

2: Bạn tạo tệp trong Cowork quá sớm.

Khắc phục: Lập kế hoạch trong Chat trước. Chỉ chuyển sang Cowork khi bạn biết chính xác những gì mình muốn.

3: Bạn viết các lời nhắc dài 500 từ mà lại tải lại.

Khắc phục: Viết 29 từ thay vào đó: “Tôi muốn [nhiệm vụ] để [mục tiêu]. Hãy hỏi tôi các câu hỏi bằng cách sử dụng AskUserQuestion.”

4: Bạn nói “làm lại toàn bộ” để sửa phần 3.
Cách khắc phục: “Chỉ làm lại phần 3. Giữ nguyên mọi thứ khác. Không cần bình luận. Chỉ cần kết quả.”

5: Bạn gửi 3 tin nhắn riêng biệt cho 3 nhiệm vụ.

Cách khắc phục: Một tin nhắn, ba nhiệm vụ. “Tóm tắt nội dung này, liệt kê các điểm chính, đề xuất tiêu đề.”

6: Bạn gõ “Không, ý tôi là…”, ghi đè lên lịch sử.

Cách khắc phục: Nhấp vào ‘Chỉnh sửa’ trên tin nhắn gốc của bạn. Sửa lỗi. Tạo lại. Lịch sử được thay thế, không được thêm vào.

7: Bạn sử dụng mô hình Opus để kiểm tra ngữ pháp.

Cách khắc phục: Sử dụng Sonnet hoặc Haiku cho các nhiệm vụ nhanh. Dành Opus + Tư duy mở rộng cho công việc chuyên sâu.

8: Bạn đổ 50 tập tin vào Cowork “phòng trường hợp cần.”

Cách khắc phục: Chỉ bao gồm những gì nhiệm vụ này cần. Không có thư mục nào cho các nhiệm vụ nhanh như bản nháp email.

9: Bạn không bao giờ bắt đầu lại từ đầu và cứ tiếp tục trò chuyện dài dòng. Khắc phục: Cứ sau 15-20 tin nhắn → tóm tắt, sao chép nội dung ngắn gọn, bắt đầu một phiên mới.

10: Bạn giữ 3 chủ đề trong 1 cuộc trò chuyện. Claude đọc lại tất cả.

Khắc phục: Chủ đề mới = cuộc trò chuyện mới. Luôn luôn như vậy. Ngữ cảnh cũ đồng nghĩa với token cũ.

11: Tệp giới thiệu bản thân của bạn dài 22.000 từ (quá dài).

Khắc phục: Cắt ngắn xuống dưới 2.000 từ. Kết thúc phiên bằng câu hỏi “Viết ghi chú phiên .md.”

Dán tệp .md: https://lnkd.in/gzzhvrY6

12: Bạn để chức năng tìm kiếm và kết nối được bật mặc định.

Khắc phục: Tắt tất cả các chức năng theo mặc định. Bật các tính năng cho từng tác vụ, không phải cho từng tài khoản.

13: Bạn tải cùng một tệp PDF lên 5 cuộc trò chuyện khác nhau.

Khắc phục: Sử dụng Dự án. Tải lên một lần. Mọi cuộc trò chuyện bên trong đều tham chiếu đến tệp đó mà không cần tiêu tốn lại token.

14: Bạn bỏ qua Tùy chọn Cá nhân và lãng phí thời gian thiết lập.

Khắc phục: Cài đặt → Tùy chọn cá nhân. Thiết lập giọng điệu và phong cách của bạn một lần. Nó sẽ được lưu giữ mãi mãi.

15: Bạn viết lại các lời nhắc từ đầu mỗi lần.

Khắc phục: Giữ một thư viện lời nhắc. Cùng cấu trúc, chỉ cần thay đổi biến. Các lời nhắc ổn định sẽ được lưu vào bộ nhớ cache.

16: Bạn chạy thủ công cùng một báo cáo mỗi tuần.

Khắc phục: Sử dụng /schedule. “Mỗi thứ Hai lúc 7 giờ sáng, tạo bản tóm tắt hàng tuần của tôi.” Thức dậy với một tài liệu đã hoàn thành.

17: Bạn sử dụng Claude cho những việc nó không thể làm.

Khắc phục: Hiểu rõ công cụ của bạn. Hình ảnh → Gemini.

Tìm kiếm thời gian thực → Grok.

Ngừng lãng phí token vào những việc không hiệu quả.

—–

how-to-ai.guide.

(1) Post | LinkedIn

(St.)