익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
도움말
KV 캐시 가지치기: 편집 역사
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
이 문서의 기록 보기
특정판 필터링
펼치기
접기
끝 날짜:
태그
필터:
wikieditor (숨긴 태그)
넘겨주기 대상 변경
넘겨주기 제거
대체됨
되돌려진 기여
비우기
새 넘겨주기
수동 되돌리기
시각 편집
시각 편집: 전환됨
일괄 되돌리기
편집 취소
판 보이기
차이 선택: 비교하려는 판의 라디오 버튼을 선택한 다음 엔터나 아래의 버튼을 누르세요.
설명:
(최신)
= 최신 판과 비교,
(이전)
= 이전 판과 비교,
잔글
= 사소한 편집
2025년 10월 2일 (목)
최신
이전
07:30
2025년 10월 2일 (목) 07:30
인공무능
토론
기여
3,501 바이트
+64
편집 요약 없음
편집 취소
태그
:
시각 편집
최신
이전
07:30
2025년 10월 2일 (목) 07:30
인공무능
토론
기여
3,437 바이트
+3,437
새 문서: KV 캐시 가지치기(KV Cache Pruning)는 트랜스포머 기반 언어 모델의 추론 단계에서 사용하는 '''Key-Value 캐시'''의 크기를 줄이기 위해 일부 K/V 쌍을 제거하거나 압축하는 기법이다. ==개념 및 배경== *트랜스포머 기반의
자기 회귀 모델
에서는 이전 토큰의 Key와 Value를 캐시(KV 캐시)해 두고, 이후 토큰 생성 시 재사용한다. *이 방식은 중복 계산을 피하게 해주지만, 문맥...
태그
:
시각 편집
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
Atom
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록