엔비디아 GPU 아키텍처 및 모델
이 문서는 엔비디아가 지금까지 출시해온 주요 GPU 아키텍처와 그에 해당하는 대표 모델들을 정리한 문서이다.
아래 두 문서로 세분화된다. 본 문서는 아래 두 문서에 대한 요약본이나 최신화 및 구체성 측면에선 부족할 수 있다.
개요[편집 | 원본 편집]
엔비디아(NVIDIA)는 그래픽 카드, 데이터센터용 가속기, 인공지능용 가속기 등을 위해 여러 세대의 GPU 마이크로아키텍처를 개발해 왔다. 이 문서에서는 주요 아키텍처와 그 특징, 그리고 대표 모델들을 연표 형태로 정리한다.
주요 아키텍처 연표[편집 | 원본 편집]
| 아키텍처 | 발표 시기 | 주요 특징 | 대표 모델 |
|---|---|---|---|
| Kepler | 2012경 | CUDA Compute Capability 3.x, 에너지 효율 강화 | GeForce GTX 680 등 [1] |
| Maxwell | 2014경 | 더욱 향상된 전력 효율, 다중 디스플레이 대응 강화 | GeForce GTX 750 Ti, GTX 900 시리즈 |
| Pascal | 2016경 | 16 nm/14 nm 공정, HBM2 메모리 지원, VR/고해상도 대응 강화 [2] | GeForce GTX 10 시리즈 (예: GTX 1080 Ti) |
| Volta | 2017경 | Tensor Core 최초 탑재, AI 연산 가속화 [3] | Tesla V100 등 |
| Turing | 2018-19경 | 실시간 레이 트레이싱(RT Core)과 AI 가속(Tensor Core) 통합 [4] | GeForce RTX 20 시리즈 |
| Ampere | 2020경 | 2세대 RT Core, 3세대 Tensor Core, 대폭 성능 향상 [5] | GeForce RTX 30 시리즈 |
| Ada Lovelace | 2022경 | 더욱 고효율/고성능, 실시간 렌더링 및 AI 대응 강화 [6] | GeForce RTX 40 시리즈 등 |
| Hopper | 2022경 | 데이터센터/AI 특화, 대형 모델 학습 대응 [7] | NVIDIA A100 이후 세대 서버용 GPU |
| Blackwell | 2024경 | 차세대 대형 AI 슈퍼칩 설계, 200 B 트랜지스터급, 대역폭 10 TB/s 칩-투-칩 인터커넥트 포함 [8] | 다음 세대 데이터센터 GPU |
아키텍처별 특징 요약[편집 | 원본 편집]
Kepler~Pascal[편집 | 원본 편집]
이 초기 세대들은 주로 그래픽 및 게이밍 시장을 위한 설계이며, 각각 전력 효율, 공정 미세화, 메모리 대역폭 개선 등을 통해 세대별 향상을 이뤘다.
Volta[편집 | 원본 편집]
처음으로 Tensor Core가 탑재되어 딥러닝 연산 가속이 가능해졌으며, 데이터센터 및 연구용 GPU로 중요한 전환점이었다.
Turing[편집 | 원본 편집]
그래픽과 AI 기능을 통합한 세대이다. 실시간 레이 트레이싱(RT Core)과 AI 가속(Tensor Core)을 통해 게이밍 및 콘텐츠 제작 환경에서 큰 변화를 가져왔다.
Ampere[편집 | 원본 편집]
성능과 효율 모두 대폭 향상된 세대다. 데스크톱/노트북용 그래픽카드뿐 아니라 데이터센터용 가속기에서도 사용되었다.
Ada Lovelace[편집 | 원본 편집]
최신 소비자용 그래픽카드 세대로, 고해상도·고주사율 게이밍, AI 렌더링, 실시간 영상처리 등 최신 워크로드에 대응하도록 설계되었다.
Hopper, Blackwell 등 데이터센터 특화 아키텍처[편집 | 원본 편집]
이들은 그래픽보다는 대형 인공지능 모델 학습, HPC(고성능 컴퓨팅), 클라우드 인프라 대응에 초점이 맞춰져 있으며, 일반 소비자용 GPU와는 설계 목적이 다르다.
모델별 예시 정리[편집 | 원본 편집]
| 아키텍처 | 소비자용/데스크톱 모델 예시 | 데이터센터/서버용 모델 예시 |
|---|---|---|
| Pascal | GeForce GTX 1080 Ti | Tesla P4 |
| Turing | GeForce RTX 2080 Ti | Quadro RTX 8000 |
| Ampere | GeForce RTX 3080 | NVIDIA A100 |
| Ada Lovelace | GeForce RTX 4090 | (서버용으로는 L4, L40 등) |
| Hopper | (소비자용은 드물음) | NVIDIA H100 |
| Blackwell | (예정/차세대) | 서버용 차세대 가속기 예정 |
왜 아키텍처가 중요한가?[편집 | 원본 편집]
GPU 아키텍처는 단순히 세대 숫자가 아닌, 내부 구조(코어 구성, 메모리 구조, 레이 트레이싱/AI 가속 기능 등)와 성능 효율을 결정짓는 핵심 요소이다. 따라서 새로운 아키텍처가 등장할 때마다 성능 향상 뿐 아니라 전력 효율, 기능 지원, 확장성 등이 크게 바뀌었다.
같이 보기[편집 | 원본 편집]
참고 문헌[편집 | 원본 편집]
각주[편집 | 원본 편집]
- ↑ https://nvidia.custhelp.com/app/answers/detail/a_id/5204/~/list-of-kepler-series-geforce-desktop-gpus
- ↑ https://en.wikipedia.org/wiki/Pascal_(microarchitecture)
- ↑ https://en.wikipedia.org/wiki/Volta_(microarchitecture)
- ↑ https://www.nvidia.com/en-us/geforce/turing/
- ↑ https://en.wikipedia.org/wiki/GeForce_RTX_30_series
- ↑ https://www.nvidia.com/en-us/technologies/
- ↑ https://www.nvidia.com/en-us/technologies/
- ↑ https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/