Claude Code 토큰 사용량 90% 절감하는 3가지 실전 기법 (qmd, 3-에이전트)
完整文本记录
클로드 코드 쓰시는 분들 혹시 한
시간도 안 됐는데 사용량 제한에 걸려
본 적 있으신가요? 열심히 코딩하다가
갑자기 잠깐만 기다려 달라는 메시지가
뜨면 진짜 멘붕이 오죠. 그런데이
문제에 대부분 클로드 코드가 쓸데없이
토큰을 낭비하고 있어서 그렇습니다.
실제로 중간 규모 프로젝트에서 토큰의
80에서 90%가 코드를 읽고
탐색하는데만 소비됩니다. 정작 코드를
작성하는 데는 10%밖에 안 쓰이는
거예요. 오늘이 토큰 낭비를
획기적으로 줄이는 세 가지 실전
기법을 알려 드리겠습니다.이 방법들을
적용하면 같은 구동료로 두 배에서 세
배 더 많은 작업을 할 수 있습니다.
특히 최근 엔스로픽에서 클로드 코드
사용량 제한 문제를 공식적으로
조사하고 있다고 발표했는데이 상황에서
토큰을 효율적으로 쓰는 방법을 아는
것과 모르는 것은 하늘과 땅
차이입니다. 영상을 끝까지 보시고
좋아요와 댓글 구독해 주시면 클로드
코드 토큰약 핵심 가이드 PDF를
받으실 수 있는 링크를
말씀드리겠습니다. 첫 번째 기법은
기본 설정만 제대로 해도 토큰
30에서 40%를 아낄 수 있다는
겁니다. 가장 먼저 해야 할 건
클로드 이그노 파일을 만드는 겁니다.
이게 뭐냐면 클로드 코드가 읽지
말아야 할 파일 목록을 적어 두는
거예요. 기시근노어 아시죠? 기시
추적하지 않을 파일을 정하는 것처럼
클로드어는 클로드가 무시할 파일을
정합니다. 프로젝트 폴더에 노드
모듈즈, 빌드 산출물, 로그 파일
같은게 잔뜩 있잖아요. 클로드가 이런
파일까지 전부 읽으면 토큰이 순식간에
녹아 버립니다. 넥스트 JS
프로젝트에서 점 넥스트 폴더 하나만
제외해도 컨텍스트 크기가 확
줄어듭니다. 만드는 방법도 간단해요.
프로젝트 최상위 폴더에 점클로드
이그노어라는 파일을 하나 만들고
무시할 폴더명을 한 줄씩 적으면
됩니다. 노드 모듈즈 슬/시 점넥스트
슬/시디스트 슬/시 이런 식으로요.
이거 한번 만들어 놓으면 그 뒤로는
신경 쓸 필요가 없습니다. 두 번째로
중요한 건 클로드 MD 파일을
간결하게 유지하는 겁니다. 클로드
MD는 프로젝트의 설계도 같은
파일인데 여기에 규칙을 계속 추가하다
보면 500줄 1천000줄까지
불어나는 경우가 있어요. 문제는이
파일이 매 대화마다 통째로 읽힌다는
겁니다. 200줄 이내로 핵심만
유지하고 나머지 상세 규칙은 별도
파일로 분리해서 필요할 때만 읽게
하세요. 이것만으로도 매 대화마다
5에서 10%의 토큰을 절약할 수
있습니다. 티끌모화 태산이라고 이런
작은 최적화가 쌓이면 효과가
어마어마합니다. 그리고 세션 관리도
중요합니다. 클로드 코드로 30분
이상 작업하다 보면 대화가 길어지면서
컨텍스트가 비대해집니다. 이때 슬래시
콤팩트 명령어를 쓰면 지금까지의
대화를 요약해서 토큰을 확 줄여
줍니다. 같은 작업을 계속할 때는
콤팩트를 완전히 새로운 작업으로
넘어갈 때는 슬래시 클리어로 깨끗하게
시작하세요. 그리고 MCP 서버도
필요한 것만 연결해 두세요. 연결된
MCP 서버마다 매시지에 도구 정의가
추가되거든요. 안 쓰는 서버 세 개만
끊어도 체감이 됩니다. 정리하면 첫
번째 기법의 핵심은 클로드가 있는 양
자체를 줄이는 겁니다. 불필요한
파일은 아예 못 읽게 맞고 지침선은
짧게 유지하고 대화가 길어지면
요약하고 마치 책상 위에 필요한
서류만 올려 놓고 나머지는 서랍에
넣어 두는 것과 같습니다. 이렇게
하면 클로드가 딴짓하는 시간이 확
줄어들어요. 두 번째 기법은 코드
베이스 사전 인덱싱입니다. 이게 진짜
게임 체인저예요. 클로드 코드에게
인증 관련 코드가 어디 있냐고
물어보면 뭘 하는지 아시나요? 먼저
글로브로 전체 파일 목록을 읽습니다.
토큰 소비. 그다음 그랩으로 키워드를
검색합니다. 또 토큰 소비 그리고
후보 파일어계를 통째로 익습니다. 또
토큰 소비.이 이 과정에서 2,700
토큰을 쓰는데 실제로 의미 있는
단계는 마지막 코드 읽기뿐입니다.
나머지는 전부 탐색에 낭비되는
거예요. 이걸 매번 질문할 때마다
반복한다고 생각해 보세요. 열 번
질문하면 탐색에만 27,000 토큰이
날아갑니다. 클로드 코드가 돈 먹는
하마라는 소리가 괜히 나온게
아닙니다. 사전 인덱싱 도구를 쓰면이
탐색 과정을 통째로 건너뛸 수
있습니다. 대표적인 도구가 QMD라는
건데 프로젝트의 모든 파일을 미리
세내 놓고 클로드가 검색 엔진처럼
바로 원하는 코드를 찾을 수 있게 해
줍니다. 마치 도서관에서 책을 일일이
뒤지는 대신 검색 카탈로그를 사용하는
것과 같은 원리입니다. 실제 사례를
보면 효과가 놀랍습니다. 인증 로직을
찾을 때 기존에 2,700 토큰이
들던게 250 토큰으로
줄어들었습니다. 91% 절감이에요.
결제 버그를 수정할 때는 3,950
토큰에서 400 토큰으로 90%
줄었고요. 데이터베이스 스키마를
파악할 때는 6,000 토큰에서
400 토큰으로 무려 93%가
절감됐습니다. 평균적으로 92%의
토큰을 아낄 수 있다는 겁니다.
설정도 간단합니다. QMD를 설치하고
프로젝트를 인덱싱한 다음 클로드
코드에 MCP 서버로 연결하면
끝입니다. 5분이면 됩니다. 그리고
클로드 MD의 파일을 읽기 전에 항상
QMD로 먼저 검색하라는 규칙을 한
줄 추가해 주세요.이 한 줄이 마법을
부립니다. 클로드가 파일을 무작기로
뒤지는 대신 정확한 위치를 바로
찾아가거든요. 프로젝트가 커질수록
효과가 극대화되고 20개 이상의
프로젝트를 동시에 관리하는 것도
가능해집니다. 세 번째 기법은 3
에이전트 팀 구조입니다. 이건 최근
레딧에서 엄청나게 화제가 된 방법인데
발상의 전환이 기가 막힙니다. 보통
클로드 코드를 쓸 때 하나의
에이전트에게 설계부터 코딩, 검토까지
전부 맡기잖아요. 문제는 이렇게 하면
에이전트가 방향을 잃고 삽질하는
시간이 엄청나다는 겁니다. 요청하지도
않은 기능을 추가한다거나 전체 코드
베이스를 불필요하게 다 읽는다거나
작업 중간에 딴 길로 세는 경우가
비비지하죠. 클로드한테 로그인 기능
하나 만들어 달라고 했는데 갑자기
데이터베이스 스키마를 전부 읽고
테스트 코드까지 알아서 작성하고
심지어 CCSS 스타일까지 바꿔 놓은
경험 다들 있으시죠? 어이가 없는데
이게 전부 토큰 낭비입니다. 3
에이전트 팀은이 문제를 해결하기 위해
역할을 세스로 분리합니다. 첫째,
아키텍트, 전체 시스템을 이해하고
작업 계획을 세우는 역할입니다. 뭘
만들지, 어떤 순서로 만들지, 어떤
파일을 수정할지, 상세한 브리프를
작성합니다. 둘째, 빌더. 아키텍트가
작성한 브리프만 정확하게 구현합니다.
브리프에 없는 건 절대 하지
않습니다. 이게 핵심이에요. 셋째,
리뷰어. 빌더가 완성한 코드를
검증합니다. 품질이 부족하면
구체적으로 뭐가 문제인지 짚어서
돌려보냅니다. 워크플로우는 아키텍트가
계획하고 빌더가 구현하고 리뷰어가
검토하고 다시 아키텍트가 최종
확인하는 순서입니다. 각 단계마다
명확한 인수인계 문서가 전달되고 어떤
단계도 건너뛸 수 없습니다.이 구조의
핵심 장점은 각 에이전트가 자기
역할에만 집중하니까 불필요한 토큰
낭비가 원천적으로 차단된다는 겁니다.
빌더는 전체 코드 베이스를 읽을 필요
없이 아키텍트가 지정한 파일만
수정하면 되고 리뷰어는 변경된 부분만
확인하면 됩니다.이 방법을 만든
러셀은 20년 경력의 시니어
엔지니어인데 실제 사스 프로덕션
환경에서 검증한 결과라고 합니다.
설정 방법도 어렵지 않습니다. 기터의
쓰맨 팀이라는 오픈 소스 프로젝트가
있는데 여기서 템플릿을 받아서
프로젝트에 넣으면 됩니다. 각
에이전트의 역할과 규칙이 미리
정의되어 있어서 클로드 코드의
아키텍트로 시작해 달라고 말하면 바로
팀 구조가 작동합니다. 처음에는 좀
번거롭게 느껴질 수 있는데 프로젝트가
커질수록이 구조 없이는 못 돌아갈
정도로 효과가 큽니다. 백문이
불열견이니까 한번 직접 해 보시길
강력 추천합니다. 추가로 토큰을
아끼는 다섯 가지 규칙도 클로드
앤디에 넣어 두면 좋습니다. 첫째,
이미 읽은 파일은 다시 확인하지