Claude Code วงเงินระเหยหาย 20 เท่า เจ้าหน้าที่กลับบอกให้ "ใช้อย่างประหยัด"

区块律动BlockBeats

特邀专栏作者

2026-04-03 11:00

บทความนี้มีประมาณ 2564 คำ การอ่านทั้งหมดใช้เวลาประมาณ 4 นาที

บันทึกบั๊กแคช Claude Code ฉบับสมบูรณ์

สรุปโดย AI

ขยาย

ประเด็นหลัก: เครื่องมือ Claude Code ของ Anthropic มีบั๊กแคชที่คงอยู่นาน 28 วัน ทำให้เมื่อผู้ใช้กู้คืนเซสชันไม่สามารถใช้ประโยชน์จากแคชได้อย่างมีประสิทธิภาพ ค่าใช้จ่ายในการเรียก API พุ่งสูงขึ้น 10-20 เท่า แต่การตอบกลับอย่างเป็นทางการไม่ได้ยอมรับการคิดเงินเกินจริง แนะนำให้ผู้ใช้ลดระดับการใช้ฟีเจอร์เพื่อประหยัดวงเงินแทน
องค์ประกอบสำคัญ:
1. ข้อมูลการตรวจสอบอิสระแสดงให้เห็นว่าในช่วงที่มีบั๊ก อัตราการอ่านแคชของ Claude Code อยู่ที่เพียง 4-17% ซึ่งต่ำกว่าระดับปกติที่ 97-99% อย่างมาก ทำให้ทุกครั้งที่กู้คืนเซสชันจะถูกคิดเงินในราคาเต็ม
2. บั๊กนี้ถูกนำเข้ามาในวันที่ 4 มีนาคม และได้รับการแก้ไขในวันที่ 1 เมษายน คาบเกี่ยวกัน 20 เวอร์ชัน ในช่วงนั้นกิจกรรมส่งเสริมการขายได้บดบังปัญหาไว้ชั่วคราว หลังจากกิจกรรมจบลง ปัญหาการสิ้นเปลืองวงเงินของผู้ใช้ก็ปะทุขึ้นพร้อมกัน
3. รายงานจากผู้ใช้แสดงให้เห็นว่าวงเงินรายเดือนของผู้ใช้สมาชิกหมดลงในเวลาอันสั้นอย่างยิ่ง ตัวอย่างเช่น วงเงินแบบเลื่อน 5 ชั่วโมงของผู้ใช้แผน Max 20x หมดลงภายใน 19 นาที
4. วิศวกรของ Anthropic หลังจากการตรวจสอบ ยอมรับว่ามีการจำกัดวงเงินที่เข้มงวดขึ้นในช่วงเวลาที่มีผู้ใช้สูง แต่ปฏิเสธว่าบั๊กทำให้มีการคิดเงินเกินจริง แนะนำเพียงให้ผู้ใช้ลดระดับโมเดล ปิดฟีเจอร์ขั้นสูงเพื่อประหยัดการใช้งาน
5. การตอบกลับอย่างเป็นทางการขัดแย้งกับบันทึกการแก้ไข เวอร์ชันที่แก้ไข v2.1.90 ชัดเจนว่าแก้ไขบั๊กที่ทำให้แคชใช้งานไม่ได้และถูกคิดเงินเต็มราคา แต่ในการสื่อสารอย่างเป็นทางการไม่ได้กล่าวถึงความผิดปกติในการคิดเงินนี้

4-17% นี่คืออัตราการอ่านแคชพรอมต์ของ Claude Code ในช่วงเดือนที่ผ่านมา ระดับปกติคือ 97-99%

ซึ่งหมายความว่า เมื่อคุณกู้คืนเซสชันก่อนหน้า Claude Code ไม่ได้นำบริบทที่ประมวลผลแล้วกลับมาใช้ใหม่ แต่กลับประมวลผลเนื้อหาทั้งหมดตั้งแต่เริ่มต้นทุกครั้ง โดยใช้โควต้าเป็น 10 ถึง 20 เท่าของสถานการณ์ปกติ คุณคิดว่ากำลังสนทนาต่อจากเดิม แต่จริงๆแล้วคุณกำลังเริ่มต้นบทสนทนาใหม่ทั้งหมดทุกครั้ง และต้องจ่ายเต็มราคา

ตัวเลขนี้มาจากการตรวจสอบโดยตรงผ่านพร็อกซีของนักพัฒนาอิสระ ArkNill เขาติดตามและบันทึกทุกคำขอระหว่าง Claude Code และ Anthropic API ผ่านการตั้งค่าพร็อกซีแบบโปร่งใส และพบว่ามีบั๊กแคชไคลเอ็นต์อย่างน้อยสองจุดที่ทำให้เซิร์ฟเวอร์ API ไม่สามารถจับคู่กับคำนำหน้าของบทสนทนาที่แคชไว้ได้ ส่งผลให้ต้องสร้างโทเค็นใหม่ทั้งหมดทุกครั้ง

ภาพด้านบนแสดงการเปรียบเทียบอัตราการอ่านแคชในสามช่วง เวอร์ชัน v2.1.69 ถึง v2.1.89 (ช่วงที่มีบั๊ก) อัตราการอ่านแคชของเวอร์ชัน standalone มีเพียง 4-17% หลังจากที่ v2.1.90 แก้ไขบั๊กสำคัญจุดหนึ่งแล้ว อัตราการอ่านแคชเมื่อเริ่มต้นเย็นกลับมาอยู่ที่ 47-99.7% เมื่อถึง v2.1.91 อัตราการอ่านแคชภายใต้การทำงานที่เสถียรกลับสู่ระดับ 97-99%

สิ่งที่น่าสังเกตในแผนภูมิคือช่วงของ v2.1.90 มีความกว้างมาก (47% ถึง 99.7%) เนื่องจากเมื่อกู้คืนเซสชันใหม่ ยังต้อง "วอร์ม" แคช อัตราการเข้าถึงในรอบแรกๆ จึงต่ำ แต่จะกลับสู่ระดับปกติอย่างรวดเร็ว ในขณะที่ในเวอร์ชันที่มีบั๊ก การวอร์มนี้จะไม่เกิดขึ้นเลย — อัตราการอ่านแคชจะติดอยู่ที่โทเค็น 14,500 ตัวของพรอมต์ระบบ ประวัติบทสนทนาทั้งหมดจะถูกคิดเงินเต็มราคาทุกครั้ง

28 วัน 20 เวอร์ชัน

บั๊กนี้ไม่ใช่ประเภทที่ถูกนำเข้ามาพร้อมกับอัปเดตหนึ่งและถูกแก้ไขในอัปเดตถัดไป จากบันทึกการเผยแพร่ใน npm registry เวอร์ชัน v2.1.69 ที่นำบั๊กเข้ามาถูกปล่อยเมื่อวันที่ 4 มีนาคม และเวอร์ชัน v2.1.90 ที่แก้ไขบั๊กถูกปล่อยเมื่อวันที่ 1 เมษายน มีระยะห่าง 28 วัน และครอบคลุม 20 เวอร์ชัน

ไทม์ไลน์เผยให้เห็นรายละเอียดที่น่าสนใจ หลังจากที่บั๊กถูกนำเข้ามาในวันที่ 4 มีนาคม ผู้ใช้ไม่ได้ร้องเรียนเป็นวงกว้างในทันที จนกระทั่งวันที่ 23 มีนาคม การร้องเรียนจึงเริ่มระเบิดออกมา โดยมีระยะห่างเกือบสามสัปดาห์ สาเหตุคือ ตามการสรุปใน GitHub issue #41930 ระหว่างวันที่ 13 ถึง 28 มีนาคม Anthropic ได้เปิดตัวโปรโมชันเพิ่มโควต้า 2 เท่า (เพิ่มเป็นสองเท่าในช่วงนอกเวลาเร่งด่วน) ซึ่งในทางปฏิบัติช่วยปกปิดผลกระทบของบั๊กไว้ หลังจากโปรโมชันสิ้นสุดลง ผลกระทบของบั๊กแคชกลับสู่เส้นฐานการคิดเงินปกติ ทำให้โควต้าของผู้ใช้ "ระเหย" ไปในพริบตา

การตอบสนองของ Anthropic ไม่ได้รวดเร็วมากนัก วันที่ 26 มีนาคม ซึ่งเป็นสามวันหลังจากที่การร้องเรียนของผู้ใช้ระเบิดออกมา วิศวกร Thariq Shihipar ได้ประกาศผ่านบัญชี X ส่วนตัวว่าได้จำกัดโควต้าในช่วงเวลาเร่งด่วน (วันทำงาน 5am-11am PT) แล้ว วันที่ 30 มีนาคม Anthropic ยอมรับบน Reddit ว่า "ผู้ใช้ถึงขีดจำกัดเร็วกว่าที่คาดไว้มาก" และระบุว่านี่เป็นความสำคัญสูงสุดของทีม จนกระทั่งวันที่ 1 เมษายน สมาชิกทีม Lydia Hallie จึงได้เผยแพร่ข้อสรุปการสอบสวนอย่างเป็นทางการ

ตลอดกระบวนการ Anthropic ไม่ได้เผยแพร่บทความบล็อกใดๆ ไม่ได้ส่งอีเมลแจ้งเตือน และไม่ได้อัปเดตหน้าสถานะ การสื่อสารอย่างเป็นทางการทั้งหมดทำผ่านโพสต์โซเชียลมีเดียส่วนตัวของวิศวกรและความคิดเห็นบน Reddit เพียงไม่กี่แห่งเท่านั้น

คุณจ่ายเท่าไหร่ และใช้ได้นานแค่ไหน?

GitHub issue #41930 รวบรวมรายงานจากผู้ใช้หลายร้อยราย กรณีที่รุนแรงที่สุดคือผู้ใช้สมาชิก Max 20x ($200/เดือน) ซึ่งโควต้าหมุนเวียน 5 ชั่วโมงของเขาหมดลงภายใน 19 นาที ผู้ใช้ Max 5x ($100/เดือน) รายงานว่าโควต้าหมุนเวียน 5 ชั่วโมงหมดภายใน 90 นาที ตามรายงานของ The Letter Two ยังมีผู้ใช้รายหนึ่งอ้างว่าการพูดแค่ "hello" ง่ายๆ ก็ใช้โควต้าเซสชันไป 13% แล้ว ผู้ใช้ระดับ Pro ($20/เดือน) คนหนึ่งพูดบน Discord ว่าโควต้าของเขา "หมดในวันจันทร์ทุกสัปดาห์ และรีเซ็ตใหม่ในวันเสาร์" ใน 30 วัน เขาสามารถใช้งานได้ปกติเพียง 12 วันเท่านั้น

จากการทดสอบมาตรฐานของ ArkNill บนเวอร์ชันที่มีบั๊ก v2.1.89 โควต้า 100% ของแผน Max 20x จะหมดภายในประมาณ 70 นาที เขายังคำนวณต้นทุนโควต้าของการดำเนินการ --resume หนึ่งครั้งสำหรับเซสชันที่มีบริบท 500K โทเค็น ซึ่งอยู่ที่ประมาณ $0.15 เนื่องจากระบบจะเล่นซ้ำบริบททั้งหมดอีกครั้ง

"คุณใช้วิธีผิด"

ข้อสรุปการสอบสวนของ Lydia Hallie ยืนยันสองประเด็น ประเด็นแรกคือโควต้าในช่วงเวลาเร่งด่วนได้ถูกจำกัดลงจริงๆ และประเด็นที่สองคือเซสชันที่มีบริบท 1 ล้านโทเค็นใช้ทรัพยากรมากขึ้น เธอกล่าวว่าทีมได้แก้ไขบั๊กบางส่วน แต่เน้นย้ำว่า "ไม่มีบั๊กใดเลยที่ทำให้มีการเรียกเก็บเงินเพิ่ม"

จากนั้นเธอได้ให้คำแนะนำสี่ข้อเพื่อประหยัดโควต้า:

1. ใช้ Sonnet 4.6 แทน Opus (Opus ใช้ทรัพยากรเร็วกว่าประมาณสองเท่า);

2. เมื่อไม่ต้องการการให้เหตุผลเชิงลึก ให้ลดความเข้มข้นของการให้เหตุผลหรือปิด extended thinking;

3. อย่ากู้คืนเซสชันยาวที่ไม่ได้ใช้งานเกินหนึ่งชั่วโมง ให้เริ่มใหม่;

4. ตั้งค่าตัวแปรสภาพแวดล้อม CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 เพื่อจำกัดขนาดหน้าต่างบริบท

ไม่มีคำพูดใดๆ เกี่ยวกับการรีเซ็ตโควต้าหรือการชดเชย

พิธีกรพอดแคสต์ AI Alex Volkov สรุปการตอบสนองนี้ว่า "คุณใช้วิธีผิด" (You're holding it wrong) โดยชี้ให้เห็นว่า Anthropic เองที่ตั้งค่าบริบท 1 ล้านโทเค็นเป็นค่าเริ่มต้น โปรโมต Opus เป็นโมเดลหลัก และนำเสนอ extended thinking เป็นจุดขาย แต่ตอนนี้กลับแนะนำให้ผู้ใช้ที่จ่ายเงินไม่ให้ใช้ฟีเจอร์เหล่านี้

คำกล่าวที่ว่า "ไม่ได้เรียกเก็บเงินเพิ่ม" ก็ขัดแย้งกับบันทึกการอัปเดตของ Claude Code เอง ในวันก่อนที่ Lydia จะเผยแพร่การตอบสนอง v2.1.90 ได้แก้ไขบั๊กการถดถอยของแคชที่ดำรงอยู่ตั้งแต่ v2.1.69: เมื่อใช้ --resume เพื่อกู้คืนเซสชัน คำขอที่ควรจะเข้าถึงแคชได้กลับทำให้เกิด prompt cache miss เต็มรูปแบบ และถูกคิดเงินเต็มราคา การตอบสนองของ Lydia ไม่ได้กล่าวถึงความผิดปกติในการคิดเงินนี้ที่ได้รับการยืนยันแล้ว

เพื่อเป็นการเปรียบเทียบ OpenAI เองก็เคยมีปัญหาการใช้โควต้าผิดปกติที่คล้ายกันกับ Codex มาก่อน วิธีการของ OpenAI คือการรีเซ็ตโควต้าผู้ใช้ จัดสรรเครดิตคืน และประกาศในเดือนมีนาคมว่าจะยกเลิกขีดจำกัดการใช้งาน Codex ส่วนวิธีการของ Anthropic คือการแนะนำให้ผู้ใช้ดาวน์เกรดโมเดล ปิดฟีเจอร์ จำกัดบริบท และโยนความรับผิดชอบไปที่วิธีการใช้งานของผู้ใช้

Anthropic ขายการสมัครสมาชิกด้วยสโลแกน "โมเดลที่ทรงพลังที่สุด + บริบทที่ใหญ่ที่สุด + ความสามารถในการให้เหตุผลสูงสุด" และเรียกเก็บเงิน $20 ถึง $200 ต่อเดือน บั๊กแคชที่ดำรงอยู่ยาวนาน 28 วัน ทำให้โควต้าของผู้ใช้ที่จ่ายเงิน "ระเหย" ด้วยความเร็ว 10-20 เท่า และการตอบสนองอย่างเป็นทางการคือให้คุณใช้อย่างประหยัด

ยินดีต้อนรับเข้าร่วมชุมชนทางการของ Odaily