Claude Code 주간 사용량 제한

17 hours ago 2

Hacker News 의견
  • 아마 주간 한도에 도달하지는 않을 것 같지만, 한도가 36시간 단위 같은 게 아니라 주간 단위라는 게 불안함
    만약 한도에 걸리면, 그 주 내내 사용할 수 없게 됨
    익숙해진 도구를 이렇게 오래 못 쓰는 건 불편함
    누군가는 내가 Claude에 너무 의존한다고 할 수도 있겠지만, ripgrep 등 다른 툴도 마찬가지임
    며칠 못 쓰는 건 괜찮은데 일주일은 너무 김
    그리고 “5% 미만의 사용자”만 영향을 받는다고 했다는 점도 눈에 띔
    보통 이런 공지들은 1% 미만만 영향이라고 말하는데, Anthropic은 20명 중 1명이 한도를 넘길 거라고 말함

    • ChatGPT Plus 플랜에서 o3 100회/주 한도의 기분이 딱 이 느낌임
      얼마나 썼는지 알 수도 없고, 중요한 리소스라 본능적으로 아끼게 됨
      결국 플랜을 제대로 활용 못 하고 o4-mini 같은 모델로 돌림
      차라리 일일 한도가 나음
      근데 한도 미달로 아껴 쓰게 하는 게 주간 한도의 의도인지도 모름

    • 개발자들이 독점적인 온라인 서비스에 의존하게 되는 현실이 슬픔
      예전엔 모든 걸 FOSS 도구로 할 수 있었고, 특정 회사나 서비스에 월 구독료 내며 종속될 필요가 없었음
      지금 일부는 Monsanto 농부처럼, 매달 돈 내고 툴을 써야만 일하는 방법을 잊어버리고 있음

    • 나는 sonnet으로 Pro 한도에 하루 3번씩 자주 닿음
      Claude code와 claude를 같이 쓰면 30분 만에 끝남
      24/7 멀티 에이전트나 여러 창을 띄우지도 않는데 이렇게 됨
      내가 상위 5% 사용자라고 생각하지도 않지만, 수요일에 한도가 끝나는 건 놀랍지도 않음
      이제야 Claude 챗을 더 활용해보려고 했는데, 며칠 동안 못 믿고 쓸 바엔 의미 없음

    • Anthropic이 20명 중 1명은 한도에 걸린다고 했는데, 계정 공유나 24/7 자동화 사용자가 그렇게 많을 것 같지 않음

    • 만약 한도에 걸리면 그 주 내내 못 쓰는 건 아니라 남은 시간만큼 못 씀
      본인도 아마 잘 안 닿을 거라 했으니, 만약 닿는다면 주의 마지막 36시간쯤일 가능성이 큼
      API 요금을 내고 쓰는 방법도 있음

  • 장기적으로 어떻게 될진 모르겠지만, LLM을 쓸 때마다 제한된 자원이라는 느낌을 받아야 하는 게 별로임
    사람들은 무제한 플랜에 익숙함
    지금 요금 모델은 억지로 쓰는 느낌이라 불편함

    • 무제한이 괜찮은 건 “측정할 수 없을 정도로 저렴한” 모든 서비스에 해당함
      인터넷, 문자 등은 직접적인 비용이 매우 싸서 그럴 수 있지만
      LLM은 아직 한 번 돌릴 때마다 꽤 큰 직접 비용이 듦

    • 월 전체에서 사용이 꾸준하길 기대하는 구조에 동의하지 않음
      나는 보통 한 달 내내 쓰다가 며칠 동안 11시간씩 몰아서 쓸 때도 있는데, 그럴 때 대부분 한도에 막힐 수 있음
      그래서 API를 직접 쓰면 내 지갑 깊이에 맞게 제한되니 더 낫게 느낌
      OpenRouter 같은 걸 이용하면 구독제의 한계도 피할 수 있음
      요즘은 Gemini 2.5 Pro가 Claude보다 코드 작업용으론 더 잘 맞음
      이 외에도 어떤 비용 경쟁력이 있는 옵션들이 있는지 궁금함
      https://docs.anthropic.com/en/api/rate-limits#rate-limits

    • 내 의견은 이런 툴들은 “월 20불” “월 200불” 등으로 제한된 양에 접근하게 하고 한도 계산이 어렵게 만드는 걸 아예 없애야 한다고 생각함
      완전히 사용량 기반으로 전환해야 진짜 사용자 친화적임
      체험용으로 처음 20회 무료 같은 프리 티어를 제공하거나, 일정 사용량만큼 계단식 요금제를 통해 점점 비율을 올리고, 극한 사용자는 실제 원가에 맞춰 요금을 받는 구조로 해야 함
      이러면 낮은 사용량 사용자는 싸게 쓸 수 있고, 시장 점유율도 챙길 수 있음
      OpenRouter보다 더 나은 가격을 내면 사람들은 타사 도구 대신 이 생태계에 남을 것임
      도구가 진짜 좋으면 사용량 기반이어도 사용자는 남게 됨
      문제는 제공자들이 시장 점유율을 위해 사용자를 보조하면서도, 악용 사례나 극단적 사용은 막으려 한다는 점임
      100% 해결책은 완전한 사용량 기반, 입장료 없는 구조임
      근데 이렇게 하면 구독만 하고 적게 쓰는 사람들은 손해 볼 수도 있어서 영업 팀이 반대할 듯
      또 이렇게 하면 사람들은 여기저기 비교하며 옮기기 쉬워져 한 달~두 달 묶이는 느낌도 사라짐

    • 장기적으론 로컬 LLM이 2025년 최고의 클라우드 LLM보다 더 좋아져서, 일상 작업의 99%는 무제한으로 처리하고
      진짜 복잡한 문제에만 클라우드에 접속하는 시대가 올 거라 봄
      LLM이 효율적으로 발전하고, GPU, 메모리, 저장장치 비용도 계속 싸지고 접근성이 높아질 것임
      지금은 아직 과도기라서 좀 불편해 보이는 것뿐임

    • 제한된 자원이어도 내가 얼마나 썼는지 알 수 있다면 괜찮겠음
      진행 상황을 볼 수 없는 게 불편함

  • Max 5x와 Max 20x 차이에 혼란스러움
    내 이메일엔 “대부분 Max 20x 사용자는 Sonnet 4를 주당 240~480시간, Opus 4는 24~40시간 사용할 수 있다”고 적혀 있음
    공식 공지엔 “대부분 Max 5x 사용자는 Sonnet 4 주당 140~280시간, Opus 4는 15~35시간”이라고 되어 있음
    차라리 가격에 비례해서 한도도 2배 이상이면 좋았겠는데, Opus 4는 차이가 5~9시간밖에 안 됨
    최소한 2배는 되어야 하지 않음? 두 배 가격 내는데

    • 이런 식이면 진짜 그렇다면 Max 20x에서 낮은 플랜으로 바로 내릴 거임
      호주에서 한 달에 350불 내고 있음

    • 나는 Opus 한도에 계속 걸려서 20x로 업그레이드했는데, 이제 보니 20x와 5x의 차이가 거의 없음

    • 그래서 MAX 사용을 멈추고 Pro로 다운그레이드해서 o3랑 다른 모델을 API로 사용함
      초기엔 그렇게 많은 시간이 필요 없어서, 프로젝트당 10불 정도면 o3, Gemini, Opus 다 쓸 수 있음
      며칠마다 새로운 모델이 나오는데, 한 공급자에만 묶이고 싶지 않음

    • 실제로는 사용량이 2배라서가 아니라, 트래픽 몰릴 때 우선순위만 높아지는 것

    • 만약 마케팅 자료가 사실과 다르다면, 누군가 실제 데이터로 조사해서 집단 소송 했으면 함

  • 한 달에 200불 내도 충분하지 않다는 건 알겠음
    그럼 한도 걱정 안 하고 쓸 수 있게 충분한 요금제도 만들어줘야 함
    “시간 끝!” 메시지처럼 흐름 깨트리는 건 없음
    차라리 크레딧 방식이면 얼마 썼는지 보고 추가 결제라도 할 수 있는데
    “GPU 식히는 동안 대기”라는 개념은 생산성에 도움 안 됨
    에이전트 여러 개 돌리면 ‘35시간’은 턱없이 부족함
    도구 자체가 이런 방식 지원하게 설계된 것도 이상함

    • 모두에게 충분해서 수익이 날 플랜으로 바꾸려면, 오히려 다들 경쟁사로 빠져나갈 수도 있음
      사용자들이 툴에 의존하도록 만들어 가격을 서서히 올리는 게 오히려 전략적으로 괜찮을 수도 있음

    • “에이전트 여러 개 돌리는 것”은 개인 플랜에선 일반적인 사용 사례가 아니라고 생각함
      항상 이런 경우엔 직접 API로 사용 요금을 지불해야 했음
      고정 요금제에서 이런 걸 허용해준 건 서비스가 너그러운 거였고 애초부터 “더 높은 한도”라고 광고했지 “무제한”은 아니었음

    • API는 한도가 훨씬 자유롭고, 실질적으로 거의 제한이 없음
      Claude는 Aws, gcp에서도 사용 가능해서, 한도와 크레딧도 다르고 각기 다른 요율임

    • 정책을 “좋은 사용자” 기준으로 최적화해야 하지 “나쁜 사용자”를 기준으로 맞추면 안 됨

    • 그냥 API 쓰면 됨

  • 전반적으로 보면, 일부 사용자가 24/7 다수 에이전트를 돌릴 때 시스템을 보호해서
    더 많은 유저가 지속적으로 쓸 수 있게 만드는 긍정적인 변화라고 생각함
    다만, “사용량이 얼마 남았는지” 보여주지 않는 점이 불편함
    몇 퍼센트인진 몰라도, 최소한 중간중간(예: 절반 지났을 때) 알림이라도 있었으면 계획 세우기 쉬울 것임
    이걸 제공하지 않는 게 “우리에게 측정하게 하고 싶지 않은 것 아닐까?”란 생각이 들게 함
    내가 꼼꼼히 측정하고 싶은 게 아니라, 내 위치를 대략 알고 싶을 뿐임

  • Anthropic Reddit 계정에 따르면
    한 사용자가 $200짜리 플랜으로 수만 달러어치 LLM을 사용했음
    회사 측은 고급 사용자들을 위한 별도 솔루션을 개발 중이지만
    이제 새 한도는 더 공평한 경험과 계정 공유·전매 방지 목적임
    그래서 우리가 “좋은 서비스”를 못 가지는 것임

    • 예전에 내가 다닌 스타트업도 무제한 옵션을 제공한 적 있음
      처음에는 아무도 그렇게 많이 못 쓸 거라 생각했지만, 실제로는 창의적으로 서비스 한계를 파는 사용자가 너무 많았음
      계정들이 24/7 서비스에 붙어서 요청 한도 95%까지 계속 요청함
      IP도 다양하게 쓰고, 사람이 쓴 것 같지 않은 패턴까지 나옴
      초기엔 이상치 정도라 받아들였지만, 이런 계정이 기하급수적으로 늘어나면
      실제론 여러 업체가 계정 여러 개를 만들어 로드밸런싱 하는 거였음
      평균 이익·손실 사용자별 그래프를 보면 이런 계정이 엄청난 손실만 남기고 최대치로 리소스를 써서, 결국 정책이 바뀌게 됨
      그런 “고객”을 잃지만 대부분의 일반 사용자는 영향 없음
      오히려 전체 서비스가 쾌적해짐
      이런 경험은 모든 고사용량 스타트업이 겪음

    • 실제로 회사가 적자 상태로 서비스를 파는 것일 수 있음

    • 현재 한도로도 이런 남용을 아이디 막을 수 없나? 이해가 잘 안 됨

    • 어떤 사람이 어제 트위터에서 자랑하고 있었음
      $200 계정으로 $13,200 사용했고, Opus 전용 에이전트 4~5개를 24/7로 서로 재귀 호출하며 돌렸다고 함
      이건 확실히 남용이고 타겟팅 받아야 함
      그런데 대체 inference 제공사가 이걸 어떻게 막아야 할지는 모르겠음
      Cursor는 Anthropc/OpenAI 대비 프리미엄을 더 붙여서 더 힘들어진 상태고
      Anthropic도 비슷한 상황이지만 여기선 프리미엄 옵션이 없음
      만약 20불에 월별로 실제 원가 500불까지만 허용하면, 결국 95% 할인해주는 셈이고, 이런 구조는 절대 못 견딤
      이런 식으로 지원하다 보면 커뮤니티에 “권리 주장” 분위기가 더 커짐
      익숙해진 걸 뺏기는 느낌이지만, 사실 캡/opex만 해도 감당이 안 되고 R&D 비용까지 고려하면 모델 유지 자체도 어려운 구조
      그래서 실질적으로 할 수 있는 건 “계속 가격 구조 바꾸고 유저들이 다음에 더 후하게 보조하는 회사로 떠나는 것”뿐임
      차라리 이런 정책은 애초에 트라이얼이라고 밝히고, 어느 정도 서브시디 나가는지 투명하게 얘기하는 게 나았음
      사람들은 모델을 체험하고 어느 정도는 남지만, 얼마간 이탈하더라도 불만은 줄었을 것임
      진짜로 캡/운영비/개발비 구조에 대해 투명하게 공개하면
      사람들도 “그 정도면 tireless senior engineer 한 명 구하는 수준”이라는 걸 납득할 수 있음

  • 이 이메일에 월별로 “어떤 달에 한도에 도달했는지(Aug 2024, Jan 2025, May 2025 등)” 정보라도 있었으면 훨씬 유익했을 것임
    내가 상위 5%인지 전혀 알 수 없음
    사실 1% 한도 제한은 납득 가지만 SaaS 업계에서 5%면 실 사용자 대부분임

  • 이런 서비스에는 계량 요금제가 필요함
    모든 AI 회사가 같은 문제에 부딪히고 있음
    고정비 구독 요금제가 사용자가 비용 신경 안 쓰길 바라는 구조임
    그런데 극소수 파워 유저는 구독 한도를 극한까지 몰아써서
    Terragon 같은 서비스는 그 사용량을 최적화해주려고 따로 개발됨
    이 때문에 회사는 계속 한도를 낮추고, 사용자는 오히려 비용을 더 신경 쓰게 됨
    Cursor도 한도를 여러 번 조정했고, 이제 Anthropic도 따라가는 중
    결국 상위 10% 극한 사용자를 더 이상 보조하지 않으려는 것
    웹 인터페이스에서 바로 쓸 수 있는 계량형 요금제가 있으면 함

    • API가 존재해서 직접 토큰을 만들고 Claude Code를 별도 요금제 없이 바로 쓸 수 있음

    • 1990년대 공유 호스팅 시절이 떠오름

    • 계량제 웹 플랜을 제공하면, 실제로 inference 지원에 드는 비용이 얼마나 비싼지 공개해야 해서 난감함
      생산성 높은 실사용 수준에서 AI 돌리는 게 현재는 아직 굉장히 비싼 일임

  • “Claude를 24/7 백그라운드로 돌리는 고급 사용 패턴” 때문에 우리가 좋은 서비스를 누리지 못하는 것임

    • AI 서비스들이 광고할 때 “AI가 알아서 일을 돌려준다. 개발자는 커피를 마시거나 잘 때도 일을 해결해준다”라고 강조하는데, 실제로 그 서비스를 합당하게 쓴 개발자도 있음
      이제와서 그런 사용자가 문제라고 탓하는 건 이상함

    • 그 부분 보고 웃음이 남
      마치 ‘선의의 세계 파괴자’가 우주 열사를 한층 촉진시키려는 것 같은 느낌임

    • 이런 문제는 당연히 예상됐다고 생각함
      초기 요금제 결정할 때 이미 충분히 고려됐을 것
      단지 출시를 막는 걸 원치 않아 도입이 늦어진 것 같고, 이젠 현실에 맞춰 시행되는 중임

    • 요금제를 어떻게 책정하든 사용자는 자기 플랜을 100% 활용하려고 함
      나는 Max 구독자임에도 자주 한도에 걸림
      내가 결제한 만큼 돌리는데 한도 적용 자체가 이상함

    • 이게 바로 가격 실험 구조임
      규제가 약하면 언젠간 극단적 활용자들이 등장하고, 회사는 그걸 지속 가능하지 않은 마치 가능한 것처럼 포장했다가, 나중에 보너스를 뺏는 구조임

  • 혹시 엉뚱한 제안일 수 있지만, 적응형 한도는 어떨까 생각해봤음
    옵션 1: 처음엔 짧은 기간 동안 폭발적으로 쓰게 해주고 점진적으로 속도를 늦추고, 쿨다운 이후 다시 폭발이 가능하게 하는 방식
    이러면 유저가 짧게 생산성 극대화하고, 서버도 쉴 수 있음
    옵션 2: 모바일 데이터처럼 쓸 수 있는 요청량은 빠르다가, 이후엔 속도 제한 걸고, 더 필요하면 유료 구매 방식
    이건 수익도 추가로 생기는 모델
    옵션 3: 인프라와 네트워크에서 적응적으로 자원 할당
    GPU가 아닌 작업은 우선순위 낮추거나, 네트워크 요청을 느리게 처리, 또는 k8s 등에서 사용량 따라 서로 다른 서버에 작업을 분배
    그리고 한도 논의 말고, 진짜 비용을 많이 쓰는 요청이 뭔지 추적해서, 비효율적인 코드 경로나 인프라 구조를 손 보면 여유가 생길 수 있음
    작은 코드 최적화로도 시스템에 큰 여유를 줄 수 있다는 점 강조함

Read Entire Article