Claude Code 비용 80% 절감하는 settings.json 설정법과 everything-claude-code 완벽 가이드

목차
- 컨텍스트 로트(Context Rot)란 무엇인가
- everything-claude-code 저장소 소개
- 비용 80% 절감하는 settings.json 3줄 설정
- 컨텍스트 다이어트: /clear vs /compact
- 메모리 학습 시스템: Continuous Learning v2
- AgentShield 보안 스캐너
- 실전 설치 및 시작 가이드
- 핵심 명령어 정리
- 참조 링크
Claude Code를 사용하다 보면 갑자기 AI가 멍청해지는 순간이 찾아옵니다. 같은 실수를 반복하고, 분명히 알려준 규칙을 잊어버리며, 시키지도 않은 파일을 건드리기도 합니다. 이것은 버그가 아니라 컨텍스트 로트(Context Rot)라는 구조적 현상입니다. GitHub 스타 14만 개를 돌파한 everything-claude-code 저장소는 이 문제에 대한 체계적인 해결책을 제시합니다.
컨텍스트 로트(Context Rot)란 무엇인가
컨텍스트 로트는 Claude Code에게 장시간 작업을 시킬 때 출력 품질이 서서히 무너지는 현상을 말합니다. 크래시나 에러가 발생하는 것이 아니라 조용히 품질이 떨어지기 때문에 발견하기 어렵습니다. 원인은 크게 네 가지입니다.
- 어텐션 희석(Attention Dilution): 문맥이 길어질수록 중간에 있는 정보를 모델이 정확하게 떠올리지 못합니다. 컨텍스트 윈도우 내 토큰 수가 증가하면 정보 회수 정확도가 감소합니다.
- 명령 충돌(Instruction Conflict): 누적된 지시문이 서로 모순되면서 어느 쪽을 따라야 할지 혼란이 생깁니다.
- 토큰 예산 압박(Token Budget Pressure): 부풀어 오른 CLAUDE.md 등 시작 파일이 실제 작업에 쓸 토큰을 잡아먹습니다.
- 관련성 미스매치(Relevance Mismatch): 현재 작업과 무관한 정보까지 모두 로드되어 모델의 집중력이 분산됩니다.
이를 자동차에 비유하면, 20만 토큰이라는 연료 탱크에 출발할 때부터 트렁크에 짐을 가득 실은 것과 같습니다. 운전은 가능하지만 연비도 떨어지고 핸들도 무거워집니다. 전문가들은 CLAUDE.md 한 파일이 2,000~3,000 토큰(한글 기준 약 100단어)을 넘으면 점검이 필요하다고 권장합니다.
everything-claude-code 저장소 소개
이 저장소는 Anthropic 해커톤 우승자 Affaan Mustafa가 10개월 이상 매일 다듬은 Claude Code 설정을 오픈소스로 공개한 프로젝트입니다. 2026년 2월 Cerebral Valley x Anthropic 해커톤에서 100팀 이상이 참가한 대회에서 1등을 차지한 개발자가 만들었으며, 단순한 설정 모음이 아닌 에이전트 하니스 퍼포먼스 최적화 시스템입니다.
| 구성 요소 | 수량 | 설명 |
|---|---|---|
| 전문 에이전트 | 38개 | planner, architect, tdd-guide, security-reviewer 등 |
| 스킬 | 156개 | 필요할 때만 로드되는 모듈형 기능 |
| 슬래시 명령어 | 72개 | 레거시 호환 포함 |
| 룰 | 34개 | 항상 적용되는 규칙 |
| MCP 서버 설정 | 14개 | GitHub, Supabase, Context7 등 |
| 자동화 테스트 | 1,282개 | 커버리지 98% |
특히 주목할 점은 Claude Code뿐만 아니라 Cursor, Codex, OpenCode, Antigravity, Gemini까지 동일한 설정으로 동작한다는 것입니다. 루트의 agents.md 파일 하나만 두면 여섯 개 도구가 모두 이를 인식합니다.
비용 80% 절감하는 settings.json 3줄 설정
홈 디렉토리의 ~/.claude/settings.json 파일에 다음 세 가지를 추가하면 즉시 비용을 절감할 수 있습니다.
{
"model": "sonnet",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
"CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
}
}각 설정의 효과
| 설정 | 기본값 | 변경값 | 절감 효과 |
|---|---|---|---|
model: sonnet | opus | sonnet | 약 60% 비용 절감. 코딩 작업의 80%는 Sonnet으로 충분 |
MAX_THINKING_TOKENS | 31,999 | 10,000 | 약 70% 숨은 비용 절감. 대부분 작업에서 3만 토큰 사고 불필요 |
CLAUDE_CODE_SUBAGENT_MODEL | sonnet/opus | haiku | 약 80% 절감. 보조 에이전트에 비싼 모델 불필요 |
세 가지를 모두 적용하면 기본 설정 대비 누적 80% 이상 비용 절감이 가능합니다. 깊은 아키텍처 분석이나 복잡한 디버깅이 필요할 때는 /model opus 명령으로 일시적으로 전환하면 됩니다.
추가로 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE를 50으로 설정하면 기본값(95%)보다 일찍 자동 압축이 실행되어 Claude가 작업할 여유 공간을 확보합니다.
컨텍스트 다이어트: /clear vs /compact
설정만 바꾸는 것으로는 부족합니다. 작업 습관도 함께 개선해야 합니다.
| 명령어 | 용도 | 사용 시점 |
|---|---|---|
/clear | 컨텍스트 완전 초기화 | 전혀 다른 작업으로 전환할 때. 무료이며 즉시 실행 |
/compact | 컨텍스트 요약 압축 | 리서치→구현, 디버깅→다음 기능 등 마일스톤 사이 |
/compact를 실행하지 마세요. 변수명, 파일 경로, 부분 상태를 모두 잃어버립니다. everything-claude-code의 strategy-compact 스킬은 적절한 시점에 자동으로 압축을 제안합니다.MCP 서버 함정
MCP 서버를 너무 많이 활성화하면 각 서버의 도구 설명이 토큰을 소비하여 20만 토큰 컨텍스트 윈도우가 7만 토큰까지 줄어들 수 있습니다. 프로젝트당 MCP는 10개 이하, 활성 도구는 80개 이하로 유지하는 것이 권장됩니다.
메모리 학습 시스템: Continuous Learning v2
14만 명이 이 저장소를 즐겨찾기한 핵심 이유가 바로 지속 학습 시스템입니다. 이 시스템의 작동 방식은 다음과 같습니다.
- 관찰: 도구 호출 전후에 훅(Hook)이 자동 발동되어 작업 패턴을 100% 관찰합니다. v1의 스킬 기반 관찰(50~80% 신뢰도)에서 크게 개선되었습니다.
- 인스팅트 생성: 반복되는 패턴을 감지하여 인스팅트(Instinct)라는 원자적 학습 단위로 저장합니다. 각 인스팅트에는 0.3~0.9의 신뢰도 점수가 부여됩니다.
- 스킬 승격: 관련 인스팅트 3개 이상이 모이면
/evolve명령으로 재사용 가능한 스킬 모듈로 자동 승격됩니다. - 팀 공유:
/instinct-export와/instinct-import로 학습 결과를 팀원간에 공유할 수 있습니다.
프로젝트별 스코프도 지원하여 React 프로젝트의 패턴은 React 프로젝트에서만, Python 컨벤션은 Python 프로젝트에서만 적용됩니다. 입력 검증 같은 범용 패턴은 글로벌로 공유됩니다.
실무 관점에서 보면, 팀의 코딩 컨벤션을 한 번 학습시키면 Claude가 영구적으로 기억하고, 새로운 팀원이 합류해도 동일한 노하우를 전달받을 수 있다는 의미입니다.
AgentShield 보안 스캐너
같은 개발자가 만든 AgentShield는 Claude Code 설정 전체를 스캔하는 보안 도구입니다.
npx ecc-agentshield scan설치 없이 이 한 줄로 바로 실행할 수 있으며, 다음 5가지 카테고리를 검사합니다.
- 시크릿 감지: API 키, 비밀번호 등 14개 패턴으로 노출 여부 확인
- 권한 감사: 과도하게 열린 권한 설정 탐지
- 훅 인젝션 분석: 후크 설정의 취약점 확인
- MCP 서버 리스크 프로파일링: 위험한 MCP 서버 연동 점검
- 에이전트 설정 검토: 에이전트 정의의 보안 이슈 분석
--opus 플래그를 추가하면 Claude Opus 4.6 기반 에이전트 3개가 레드팀(공격), 블루팀(방어), 오디터(종합 평가) 역할로 나뉘어 적대적 검증을 수행합니다. 1,282개의 테스트와 102개의 보안 룰로 구동되며, AI 에이전트 보안이 중요해지는 시대에 필수적인 도구입니다.
실전 설치 및 시작 가이드
한 번에 모든 기능을 설치하지 말고, 단계적으로 접근하는 것이 좋습니다.
1단계: settings.json 설정 (즉시 적용)
~/.claude/settings.json에 위에서 소개한 3줄을 추가합니다. 이것만으로도 다음 달 청구서가 크게 줄어듭니다.
2단계: 플러그인 설치
/plugin marketplace add https://github.com/affaan-m/everything-claude-code
/plugin install ecc@ecc3단계: 룰 별도 설치
git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
./install.sh --profile full핵심 명령어 정리
| 명령어 | 용도 |
|---|---|
/clear | 컨텍스트 완전 초기화 (작업 전환 시) |
/compact | 컨텍스트 요약 압축 (마일스톤 사이) |
/cost | 토큰 비용 실시간 모니터링 |
/model opus | 복잡한 작업 시 일시적으로 Opus 전환 |
/evolve | 인스팅트 3개 이상을 스킬로 승격 |
/instinct-export | 학습 결과를 팀원에게 공유 |
/security-scan | AgentShield 보안 스캔 실행 |
참조 링크
- 원본 영상: Claude Code 비용 80% 절감하는 settings.json 3줄과 14만명이 쓰는 everything-claude-code 설정법헤이제임스 - AI 쉽게 배우기 YouTube 채널
- everything-claude-code GitHub 저장소Affaan Mustafa의 Claude Code 에이전트 하니스 퍼포먼스 최적화 시스템
- Token Optimization 공식 문서비용 절감을 위한 토큰 최적화 상세 가이드
- AgentShield GitHub 저장소AI 에이전트 보안 스캐너 — CLI, GitHub Action, ECC 플러그인 지원
- Claude Code 컨텍스트 최적화 가이드인포그랩 기술 블로그 — 컨텍스트 관리 전략 상세 설명
- Claude Code 공식 비용 관리 문서Anthropic 공식 — 효과적인 비용 관리 가이드
