인공무능의 사용자 기여
IT 위키
2025년 11월 20일 (목)
- 05:332025년 11월 20일 (목) 05:33 차이 역사 +4,903 새글 구글 TPU 새 문서: '''TPU'''(Tensor Processing Unit)는 Google이 딥러닝 워크로드를 가속하기 위해 설계한 맞춤형 ASIC(Application-Specific Integrated Circuit) 계열의 하드웨어 가속기이다. 내부 Google 서비스(Gmail, Search, Translate 등)와 Google Cloud Platform(GCP)의 AI/ML 워크로드를 위해 개발되었으며, 행렬 연산 및 대규모 딥러닝 연산을 최적화한 아키텍처를 가진다. ==개요== TPU는 딥러닝에서 핵심이 되는... 최신 태그: 시각 편집
- 05:302025년 11월 20일 (목) 05:30 차이 역사 +5,501 새글 AI 가속기 새 문서: '''AI 가속기'''(AI Accelerator)는 인공지능(Artificial Intelligence), 특히 딥러닝(Deep Learning)의 연산을 빠르고 효율적으로 수행하기 위해 설계된 특수 목적 하드웨어이다. 딥러닝 모델의 핵심 연산(행렬 곱, convolution, attention 등)을 가속하기 위해 범용 CPU나 GPU보다 더 높은 성능 또는 전력 효율을 제공한다. AI 가속기는 데이터센터, 클라우드, 엣지 장치(스마트폰·IoT), 로봇, 자... 최신 태그: 시각 편집
- 05:262025년 11월 20일 (목) 05:26 차이 역사 +4,292 새글 DRAM 새 문서: '''DRAM'''(Dynamic Random-Access Memory, 동적 랜덤 접근 메모리)은 컴퓨터 및 전자 기기에서 주기억장치(main memory)로 널리 사용되는 반도체 메모리 기술이다. DRAM은 메모리 셀에 저장된 전하가 시간이 지나면 자연 방전되기 때문에, 일정 간격으로 재충전(refresh)해야 한다. 이러한 특성 때문에 "동적(dynamic)"이라는 이름이 붙었다. ==개요== DRAM은 CPU, GPU, 모바일 기기, 서버, AI 가... 최신 태그: 시각 편집
- 05:132025년 11월 20일 (목) 05:13 차이 역사 +4,517 새글 CuBLAS 새 문서: '''cuBLAS'''는 NVIDIA가 제공하는 고성능 GPU 가속 선형대수(Liner Algebra) 라이브러리로, BLAS(Basic Linear Algebra Subprograms) 표준을 GPU에서 빠르게 실행할 수 있도록 구현한 라이브러리이다. 행렬-벡터 곱, 행렬-행렬 곱(GEMM), 벡터 연산 등 딥러닝과 과학 계산의 핵심 연산을 효율적으로 처리하기 위해 최고의 성능을 제공한다. ==개요== cuBLAS는 CPU에서 실행되는 BLAS를 GPU로 이식한... 최신 태그: 시각 편집
- 05:082025년 11월 20일 (목) 05:08 차이 역사 +4,411 새글 CuDNN 새 문서: '''cuDNN'''(CUDA Deep Neural Network Library)은 NVIDIA가 제공하는 고성능 GPU 가속 딥러닝 라이브러리로, 합성곱 신경망(Convolutional Neural Networks), 순환 신경망(RNN), 정규화, 활성화 함수 등 딥러닝에서 자주 사용되는 연산을 최적화된 GPU 커널로 제공한다. TensorFlow, PyTorch, JAX 등 대부분의 주요 딥러닝 프레임워크는 cuDNN을 자동으로 사용하여 GPU에서의 학습 및 추론 성능을 크게 향... 최신 태그: 시각 편집
- 05:052025년 11월 20일 (목) 05:05 차이 역사 +30 새글 PyTorch 파이토치 문서로 넘겨주기 최신 태그: 새 넘겨주기 시각 편집
- 05:042025년 11월 20일 (목) 05:04 차이 역사 +4,860 새글 파이토치 새 문서: '''PyTorch'''는 Meta(구 Facebook) AI Research(FAIR)에서 개발한 딥러닝 프레임워크로, 동적 계산 그래프(dynamic computation graph)와 파이썬 친화적 인터페이스를 기반으로 한 고성능 머신 러닝/딥러닝 라이브러리이다. 자연어 처리, 컴퓨터 비전, 대규모 모델 연구 등 다양한 분야에서 사실상 표준적으로 사용되는 프레임워크 중 하나이다. ==개요== PyTorch는 파이썬 문법과 자연스럽... 최신 태그: 시각 편집
- 04:512025년 11월 20일 (목) 04:51 차이 역사 +4,290 새글 Triton (인공지능) 새 문서: '''Triton'''은 Python 기반으로 GPU 커널을 작성할 수 있게 해주는 오픈소스 언어 및 컴파일러로, 고성능 CUDA 수준의 연산을 훨씬 간단한 코드로 구현할 수 있도록 설계되었다. 원래 Harvard 및 OpenAI에서 개발되었으며, 현재는 PyTorch의 컴파일 스택에 통합되어 딥러닝 연산 최적화를 위해 널리 사용되고 있다. ==개요== Triton은 연구자와 개발자가 복잡하고 오류가 발생하기 쉬... 최신 태그: 시각 편집
- 01:572025년 11월 20일 (목) 01:57 차이 역사 +4,136 새글 딥 러닝 프레임워크 새 문서: '''딥 러닝 프레임워크(Deep Learning Frameworks)'''는 인공 신경망 모델을 정의하고 학습하며 배포하기 위한 소프트웨어 도구와 라이브러리의 집합이다. 이러한 프레임워크는 자동 미분(autograd), 텐서 연산, GPU 가속, 모델 구조화, 데이터 파이프라인 구성 등 복잡한 과정을 추상화하여 연구자와 개발자가 효율적으로 딥러닝 모델을 개발할 수 있도록 돕는다. 딥러닝 프레임... 최신 태그: 시각 편집
2025년 11월 13일 (목)
- 08:512025년 11월 13일 (목) 08:51 차이 역사 +3,739 새글 MoDNN 새 문서: MoDNN(Mobile Distributed Deep Neural Network, 2017년)은 여러 모바일 디바이스의 연산 자원을 결합하여 하나의 딥러닝 모델을 분산 추론하도록 설계된 기법이다. 단일 스마트폰이나 IoT 기기에서 처리하기 어려운 신경망 연산을 여러 노드가 협력하여 나누어 수행함으로써 추론 속도를 향상시키는 것을 목표로 한다. ==개요== MoDNN은 모바일 디바이스들이 서로 연결된 환경에서,... 최신 태그: 시각 편집
- 08:152025년 11월 13일 (목) 08:15 차이 역사 +3,581 새글 ADCNN 새 문서: ADCNN(Adaptive Distributed Convolutional Neural Network, 2020년)은 여러 엣지(edge) 디바이스에 신경망의 연산을 적응적으로 분산시켜 추론 지연(latency)과 통신량을 줄이기 위한 딥러닝 분산추론(distributed inference) 기법이다. ==개요== ADCNN은 딥러닝 추론을 위해 하나의 중앙 서버나 클라우드에 모든 연산을 맡기는 대신, 여러 엣지 디바이스 클러스터에 연산을 적절히 분할해서 배치함... 최신 태그: 시각 편집
- 08:092025년 11월 13일 (목) 08:09 차이 역사 +3,667 새글 DDNN (신경망, 2017년) 새 문서: DDNN(Distributed Deep Neural Network, 2017년)은 단일 기기에서 실행되는 신경망을 클라우드, 엣지, 디바이스 계층에 분산하여 협력적으로 추론을 수행하는 구조로, 입력 데이터의 특성에 따라 로컬 또는 클라우드에서 단계적으로 계산을 수행함으로써 지연(latency)과 통신 비용을 줄이는 것을 목표로 한다. ==개요== DDNN은 분산 환경에서 신경망 일부를 로컬 디바이스에 배치하... 최신 태그: 시각 편집
- 07:482025년 11월 13일 (목) 07:48 차이 역사 +3,268 새글 브랜치넷 새 문서: BranchyNet(브랜치넷)은 신경망의 중간 계층에 여러 개의 조기 종료 지점(exit branch)을 추가하여, 입력 데이터의 난이도에 따라 계산량을 동적으로 조절하는 신경망 구조이다. 이를 통해 쉬운 입력은 빠르게 처리하고, 어려운 입력만 전체 모델을 통과시키는 방식으로 추론 속도를 크게 향상시킨다. ==개요== BranchyNet은 입력 샘플의 난이도가 서로 다르다는 점에 착안하여... 최신 태그: 시각 편집
- 06:302025년 11월 13일 (목) 06:30 차이 역사 +4,637 새글 GPipe 새 문서: 섬네일|Bubble을 줄이는 것을 목표로 한다. GPipe(지파이프, 영어: GPipe)는 대규모 신경망 모델을 여러 장치에 나누어 학습시키기 위해 제안된 파이프라인 병렬(pipeline parallelism) 기법으로, 마이크로배치를 활용해 파이프라인의 유휴 시간(bubble)을 줄이고 장치 활용률을 높이는 것을 목표로 한다. ==개요== GPipe는 모델을 여러 스테이지(stage)로 분... 최신 태그: 시각 편집
- 06:302025년 11월 13일 (목) 06:30 차이 역사 +121 새글 파일:GPipe 병렬 학습.png 편집 요약 없음 최신
- 06:252025년 11월 13일 (목) 06:25 차이 역사 +4,165 새글 파이프드림 새 문서: 섬네일|파이프드림 사용 전의 학습 순서 섬네일|파이프드림 사용 시 학습 파이프드림(PipeDream)은 대규모 신경망 모델을 여러 장치에 나누어 학습하는 파이프라인 병렬(pipeline parallelism) 방식의 비효율성을 개선하기 위해 제안된 분산 학습 기법이다. 특히 순전파와 역전파의 파이프라인 스케... 최신 태그: 시각 편집
- 06:252025년 11월 13일 (목) 06:25 차이 역사 +52 새글 파일:파이프드림 사용 시 학습 과정.png 편집 요약 없음 최신
- 06:242025년 11월 13일 (목) 06:24 차이 역사 +60 새글 파일:멀티 코어 학습 순서.png 편집 요약 없음 최신
- 06:042025년 11월 13일 (목) 06:04 차이 역사 +70 신경망 분산 학습 편집 요약 없음 최신 태그: 시각 편집
- 06:022025년 11월 13일 (목) 06:02 차이 역사 +8,032 새글 신경망 분산 학습 새 문서: 신경망 분산 학습(영어: distributed training of neural networks)은 인공신경망 모델을 여러 컴퓨팅 노드(예: GPU, 서버)에 분산시켜 동시에 학습함으로써 학습 속도를 높이고 더 큰 모델과 데이터셋을 다루기 위한 기술이다. ==개요== 신경망 분산 학습은 단일 장치의 메모리와 연산 능력으로 처리하기 어려운 대규모 데이터셋과 딥러닝 모델을 효율적으로 학습하기 위해 등장하... 태그: 시각 편집
- 05:522025년 11월 13일 (목) 05:52 차이 역사 +3,998 새글 링 올 리듀스 새 문서: 링 올 리듀스(Ring All-Reduce)는 분산 딥러닝 및 고성능 컴퓨팅(HPC) 환경에서 다수의 노드(주로 GPU) 간에 데이터를 효율적으로 집계하고 공유하기 위해 사용되는 올 리듀스(All-Reduce) 알고리즘의 한 형태이다. ==개요== 링 올 리듀스는 모든 노드를 링(Ring) 형태로 연결하여, 각 노드가 자신의 텐서를 여러 조각(chunk)으로 분할한 뒤 인접한 노드와 데이터를 교환하며 기울기(g... 최신 태그: 시각 편집
- 05:512025년 11월 13일 (목) 05:51 차이 역사 +98 새글 파일:링 올 리듀스 동작 순서 4.png 편집 요약 없음 최신
- 05:502025년 11월 13일 (목) 05:50 차이 역사 +98 새글 파일:링 올 리듀스 동작 순서 3.png 편집 요약 없음 최신
- 05:492025년 11월 13일 (목) 05:49 차이 역사 +98 새글 파일:링 올 리듀스 동작 순서 2.png 편집 요약 없음 최신
- 05:482025년 11월 13일 (목) 05:48 차이 역사 +98 새글 파일:링 올 리듀스 동작 순서 1.png 편집 요약 없음 최신
- 05:452025년 11월 13일 (목) 05:45 차이 역사 0 파라미터 서버 편집 요약 없음 최신 태그: 시각 편집
- 05:442025년 11월 13일 (목) 05:44 차이 역사 +4,273 새글 올 리듀스 새 문서: 섬네일|올 리듀스 방식 작동 구조 올 리듀스(All-Reduce)는 분산 딥러닝 및 고성능 컴퓨팅(HPC) 환경에서 여러 노드(예: GPU)가 계산한 데이터를 집계하고, 그 결과를 모든 노드에 다시 배포하는 집합 통신 연산이다. ==개요== 올 리듀스는 각 노드가 독립적으로 계산한 기울기(gradient) 또는 텐서 값을 서로 공유하고 합산 또는 평균한 뒤, 그 결과를 모든... 최신 태그: 시각 편집
- 05:432025년 11월 13일 (목) 05:43 차이 역사 +98 새글 파일:올 리듀스.png 편집 요약 없음 최신
- 05:382025년 11월 13일 (목) 05:38 차이 역사 +3,469 새글 파라미터 서버 새 문서: 섬네일|파라미터 서버(싱글과 멀티 서버 방식) 파라미터 서버(Parameter Server)는 대규모 분산 머신러닝에서 모델 파라미터(가중치)를 관리하고 동기화하기 위해 사용되는 분산 시스템 구조이다. ==개요== 파라미터 서버 아키텍처는 여러 개의 워커(worker) 노드가 각자 데이터 샘플을 사용해 기울기(gradient)를 계산하고, 중앙 또는 분산된 서버(serv... 태그: 시각 편집
- 05:362025년 11월 13일 (목) 05:36 차이 역사 +77 새글 파일:파라미터 서버.png 편집 요약 없음 최신
- 05:132025년 11월 13일 (목) 05:13 차이 역사 +1,158 Medusa (인공지능) 편집 요약 없음 최신 태그: 시각 편집
- 05:112025년 11월 13일 (목) 05:11 차이 역사 +32 추측 디코딩 편집 요약 없음 최신 태그: 시각 편집
- 05:102025년 11월 13일 (목) 05:10 차이 역사 +66 Medusa (인공지능) 편집 요약 없음 태그: 시각 편집
- 05:092025년 11월 13일 (목) 05:09 차이 역사 +147 새글 파일:Medusa Framework.png 편집 요약 없음 최신
- 05:062025년 11월 13일 (목) 05:06 차이 역사 +2,922 새글 Medusa (인공지능) 새 문서: Medusa(영어: Medusa)는 대형 언어모델(LLM) 기반 생성 모델의 추론 속도를 가속화하기 위해 제안된 프레임워크이다. ==개요== Medusa는 기존 언어모델이 토큰을 순차적으로 하나씩 생성하는 방식의 병목을 해결하기 위해 고안된 방식이다. 기존 방식에서는 출력할 토큰 K개에 대해 모델이 K번의 연산을 실행해야 하지만, Medusa는 여러 개의 디코딩 헤드를 추가해 후속 토큰을... 태그: 시각 편집
2025년 11월 6일 (목)
- 09:392025년 11월 6일 (목) 09:39 차이 역사 −95 추측 디코딩 편집 요약 없음 태그: 시각 편집
- 09:382025년 11월 6일 (목) 09:38 차이 역사 +4,677 새글 추측 디코딩 새 문서: 섬네일|추측적(예측적) 디코딩 방법 추측 디코딩(영어: Speculative Decoding)은 거대 언어 모델(LLM)의 자동회귀 디코딩 과정에서 지연(latency)과 처리량(throughput)을 개선하기 위해 고안된 방법으로, 작은 초안 모델이 여러 개의 미래 토큰을 제안하고, 이후 고성능 대상 모델이 이를 병렬로 검증하는 방식이다. ==개요== 기존의 자동회귀 디코딩 방식... 태그: 시각 편집
- 09:372025년 11월 6일 (목) 09:37 차이 역사 +56 새글 파일:추측적 디코딩.png 편집 요약 없음 최신
2025년 10월 30일 (목)
- 07:532025년 10월 30일 (목) 07:53 차이 역사 +17 희소 데이터 편집 요약 없음 최신 태그: 시각 편집
- 07:532025년 10월 30일 (목) 07:53 차이 역사 +1,477 희소 데이터 편집 요약 없음
- 07:352025년 10월 30일 (목) 07:35 차이 역사 0 딥 러닝 옵티마이저 편집 요약 없음 최신 태그: 시각 편집
- 07:322025년 10월 30일 (목) 07:32 차이 역사 +3,585 새글 가중치 감쇠 새 문서: 가중치 감소(Weight Decay)는 머신러닝 및 딥러닝에서 과적합(overfitting)을 방지하기 위한 정규화(regularization) 기법이다. 학습 과정에서 모델의 가중치(weight)가 지나치게 커지는 것을 억제하여, 일반화(generalization) 능력을 향상시키는 역할을 한다. ==개요== 가중치 감소는 손실 함수(loss function)에 '''가중치의 크기(weight magnitudes)''' 에 대한 '''페널티(penalty)''' 를 추가함으로... 최신
- 07:322025년 10월 30일 (목) 07:32 차이 역사 −3,551 가중치 감소 가중치 감쇠 문서로 넘겨주기 최신 태그: 새 넘겨주기
- 07:322025년 10월 30일 (목) 07:32 차이 역사 +3,487 새글 L2 정규화 새 문서: '''L2 정규화'''(L2 Regularization)는 머신러닝과 딥러닝에서 모델의 복잡도를 억제하고 과적합(overfitting)을 방지하기 위해 손실 함수에 가중치의 제곱합을 추가하는 정규화 기법이다. 일반적으로 가'''중치 감쇠(weight decay)''' 또는 '''릿지 정규화(Ridge Regularization)''' 라고도 불린다. ==개념== L2 정규화는 모델의 파라미터(가중치)가 지나치게 커지지 않도록 제약을 부여한... 최신 태그: 시각 편집
- 07:302025년 10월 30일 (목) 07:30 차이 역사 +35 가중치 감소 편집 요약 없음 태그: 시각 편집
- 07:282025년 10월 30일 (목) 07:28 차이 역사 +3,221 새글 AdaGrad 옵티마이저 새 문서: '''AdaGrad'''(Adaptive Gradient Algorithm)은 각 파라미터마다 학습률(learning rate)을 다르게 적용하여, 파라미터별로 변화량을 자동 조정하는 적응형(Adaptive) 옵티마이저 알고리즘이다. 2011년 John Duchi, Elad Hazan, Yoram Singer가 제안했으며, 희소(sparse) 데이터나 자연어 처리와 같은 영역에서 특히 효과적이다. ==개념== 기존 경사 하강법(Gradient Descent)은 모든 파라미터에 동일한 학... 최신 태그: 시각 편집
- 07:262025년 10월 30일 (목) 07:26 차이 역사 +2,900 새글 RMSProp 새 문서: '''RMSProp'''(Root Mean Square Propagation)은 신경망 학습 시 기울기(gradient)의 크기를 제곱평균제곱근(Root Mean Square)으로 정규화하여, 학습률(learning rate)을 파라미터별로 자동 조정하는 적응형(Adaptive) 옵티마이저 알고리즘이다. 2012년 Geoffrey Hinton이 제안했으며, 딥러닝의 대표적인 적응형 경사 하강법 중 하나로 꼽힌다. ==개념== RMSProp은 AdaGrad의 변형 알고리즘으로, AdaGrad... 최신 태그: 시각 편집
- 07:192025년 10월 30일 (목) 07:19 차이 역사 −1 딥 러닝 옵티마이저 편집 요약 없음 태그: 시각 편집
- 07:142025년 10월 30일 (목) 07:14 차이 역사 +156 옵티마이저 데이터베이스 옵티마이저에 대한 넘겨주기를 제거함 최신 태그: 넘겨주기 제거 시각 편집
- 07:112025년 10월 30일 (목) 07:11 차이 역사 +4,242 새글 딥 러닝 옵티마이저 새 문서: '''딥 러닝 옵티마이저(Deep Learning Optimizer)'''는 딥러닝 모델의 학습 과정에서 손실 함수(loss function)를 최소화하기 위해 신경망의 가중치 및 편향 등의 파라미터를 반복적으로 갱신하는 알고리즘이다. 이러한 최적화 알고리즘은 고차원, 비선형, 대규모 파라미터 공간을 가진 신경망에서 효율적이고 안정적으로 학습이 이루어지도록 하는 핵심 구성 요소이다. ==개념... 태그: 시각 편집