엔비디아 GPU 아키텍처: 두 판 사이의 차이
IT 위키
(새 문서: '''엔비디아 GPU 아키텍처'''는 엔비디아(NVIDIA)가 개발해 온 주요 GPU 마이크로아키텍처의 발전 과정을 다룬 문서이다. ==개요== 엔비디아는 그래픽 처리, 병렬 연산, 인공지능 가속 등 다양한 목적을 위해 GPU(Graphics Processing Unit) 아키텍처를 지속적으로 발전시켜 왔다. 각 세대의 아키텍처는 그래픽 파이프라인, 메모리 기술, 전력 효율, 연산 단위(CUDA Core, Tensor Core, RT Cor...) |
(차이 없음)
|
2025년 10월 24일 (금) 06:59 기준 최신판
엔비디아 GPU 아키텍처는 엔비디아(NVIDIA)가 개발해 온 주요 GPU 마이크로아키텍처의 발전 과정을 다룬 문서이다.
개요[편집 | 원본 편집]
엔비디아는 그래픽 처리, 병렬 연산, 인공지능 가속 등 다양한 목적을 위해 GPU(Graphics Processing Unit) 아키텍처를 지속적으로 발전시켜 왔다. 각 세대의 아키텍처는 그래픽 파이프라인, 메모리 기술, 전력 효율, 연산 단위(CUDA Core, Tensor Core, RT Core) 등에서 차별화된다. 본 문서에서는 2010년대 이후 주요 아키텍처의 기술적 특징과 변화 과정을 상세히 다룬다.
주요 아키텍처 연표[편집 | 원본 편집]
| 아키텍처 | 발표 시기 | 주요 특징 | 대표 모델 |
|---|---|---|---|
| Kepler | 2012년경 | CUDA Compute Capability 3.x, 에너지 효율 강화 | GeForce GTX 680 등 |
| Maxwell | 2014년경 | 전력 효율 향상, 다중 디스플레이 지원 강화 | GeForce GTX 750 Ti, GTX 900 시리즈 |
| Pascal | 2016년경 | 16 nm 공정, HBM2 메모리 지원, VR 및 고해상도 그래픽 강화 | GeForce GTX 10 시리즈 (예: GTX 1080 Ti) |
| Volta | 2017년경 | Tensor Core 최초 탑재, AI 연산 가속화 | Tesla V100 |
| Turing | 2018 ~ 2019년 | 실시간 레이 트레이싱(RT Core)과 AI 가속(Tensor Core) 통합 | GeForce RTX 20 시리즈 |
| Ampere | 2020년경 | 2세대 RT Core, 3세대 Tensor Core, 높은 연산 효율 | GeForce RTX 30 시리즈 |
| Ada Lovelace | 2022년경 | 고성능·고효율, 실시간 렌더링 및 AI 처리 강화 | GeForce RTX 40 시리즈 |
| Hopper | 2022년경 | 데이터센터·AI 학습 특화, NVLink/NVSwitch 확장성 강화 | NVIDIA H100 |
| Blackwell | 2024년경 | 차세대 AI 슈퍼칩, 2000억 트랜지스터, 초고속 인터커넥트 지원 | NVIDIA GB200 등 |
아키텍처별 주요 특징[편집 | 원본 편집]
Kepler (2012)[편집 | 원본 편집]
- CUDA Compute Capability 3.x 기반으로 GPU 병렬 처리 효율을 개선하였다.
- SMX(Streaming Multiprocessor eXtended) 구조로 전력 효율 향상.
- 동적 병렬 처리(Dynamic Parallelism) 기능 도입으로 GPU 내에서 커널 호출이 가능해졌다.
- NVENC 하드웨어 인코더 탑재로 영상 처리 가속 지원.
- 대표 모델: GeForce GTX 680, Tesla K20, Quadro K6000.
Maxwell (2014)[편집 | 원본 편집]
- SM(Streaming Multiprocessor) 구조를 단순화하여 효율 향상.
- GPU Boost 2.0 기술을 통한 전력·클럭 최적화.
- 새로운 캐시 아키텍처로 렌더링 성능 향상.
- 전력 대비 성능비가 이전 세대 대비 약 2배 향상.
- 대표 모델: GeForce GTX 980, GTX 750 Ti, Tesla M40.
Pascal (2016)[편집 | 원본 편집]
- 16 nm FinFET 공정으로 제조되어 클럭 속도와 전력 효율을 동시에 개선.
- HBM2 및 GDDR5X 메모리 지원으로 메모리 대역폭이 향상되었다.
- NVLink 기술 최초 적용으로 GPU 간 통신 성능 강화.
- FP16(하프 정밀도) 연산 및 HPC 최적화.
- 대표 모델: GeForce GTX 1080 Ti, Tesla P100, Quadro P6000.
Volta (2017)[편집 | 원본 편집]
- 엔비디아 최초로 Tensor Core를 탑재하여 AI 연산 성능이 대폭 향상되었다.
- CUDA Core와 Tensor Core의 병렬 구조로 AI + 그래픽 연산 병행 가능.
- NVLink 2.0 지원, 메모리 대역폭 최대 900 GB/s.
- FP16 연산 성능 강화로 딥러닝 가속기 시장을 선도.
- 대표 모델: Tesla V100, Quadro GV100.
Turing (2018~2019)[편집 | 원본 편집]
- RT Core(Ray Tracing)와 Tensor Core를 통합하여 실시간 레이 트레이싱 구현.
- DLSS(Deep Learning Super Sampling) 기술 지원으로 AI 기반 업스케일링 가능.
- GDDR6 메모리 도입, 렌더링 효율을 높이는 Variable Rate Shading(VRS) 지원.
- 실시간 그래픽 + AI 가속의 융합 세대.
- 대표 모델: GeForce RTX 2080 Ti, Quadro RTX 8000, Tesla T4.
Ampere (2020)[편집 | 원본 편집]
- 2세대 RT Core, 3세대 Tensor Core 탑재.
- FP16, BFLOAT16, Tensor Float32(TF32) 등 다양한 연산 정밀도 지원.
- PCIe 4.0, NVLink 3.0 지원으로 데이터 전송 속도 향상.
- 전력 효율 및 성능 모두 개선되어 데이터센터, AI, 게이밍 분야에 폭넓게 활용.
- 대표 모델: GeForce RTX 3080, RTX 3090, NVIDIA A100.
Ada Lovelace (2022)[편집 | 원본 편집]
- 4세대 Tensor Core, 3세대 RT Core 탑재.
- DLSS 3 기술 도입으로 프레임 생성(Frame Generation) 기능 제공.
- 5nm 공정 기반으로 전력당 성능비가 Ampere 대비 크게 향상.
- 실시간 렌더링, 생성형 AI 처리, 고해상도 그래픽에 최적화됨.
- 대표 모델: GeForce RTX 4090, NVIDIA L4, L40.
Hopper (2022)[편집 | 원본 편집]
- 데이터센터 및 HPC용 아키텍처.
- Transformer Engine 탑재로 대규모 언어 모델(LLM) 학습에 최적화.
- NVLink 4.0 및 NVSwitch 지원, GPU 간 초고속 연결 가능.
- FP8 연산 지원으로 AI 연산 효율 극대화.
- 대표 모델: NVIDIA H100.
Blackwell (2024)[편집 | 원본 편집]
- 차세대 데이터센터·AI 슈퍼컴퓨팅용 아키텍처.
- 약 2000억 트랜지스터, 3D 패키징 기술 적용.
- 칩-투-칩 대역폭 최대 10TB/s의 초고속 인터커넥트 제공.
- FP8 및 FP4 연산 지원으로 AI 학습·추론 모두 고효율화.
- Grace CPU와 통합된 GB200 슈퍼칩 형태로 출시.
- 대표 모델: NVIDIA GB200, GB100.
아키텍처 발전의 방향[편집 | 원본 편집]
- GPU 아키텍처는 단순 그래픽 렌더링을 넘어 범용 병렬 컴퓨팅 플랫폼으로 진화하였다.
- Tensor Core, RT Core 등 전용 연산 유닛의 추가로 AI, 시뮬레이션, 영상 처리 등 다양한 응용이 가능해졌다.
- 전력 효율, 연산 밀도, 메모리 대역폭 향상이 아키텍처 세대 진화의 핵심 목표로 이어지고 있다.
같이 보기[편집 | 원본 편집]
참고 문헌[편집 | 원본 편집]
- NVIDIA Technologies and GPU Architectures
- NVIDIA, Turing Graphics Architecture Overview
- Wikipedia, Pascal (microarchitecture)
- Wikipedia, Volta (microarchitecture)
- Wikipedia, Ampere (microarchitecture)
- NVIDIA, Blackwell GPU Architecture
- Wolf Advanced Technology, NVIDIA GPU Architecture Overview