모든 공개 기록
IT 위키
IT 위키에서 사용할 수 있는 모든 기록이 표시됩니다. 기록 종류나 사용자 이름(대소문자 구별) 또는 영향을 받는 문서(대소문자 구별)를 선택하여 범위를 좁혀서 살펴볼 수 있습니다.
(최신 | 오래됨) (다음 50개 | 이전 50개) (20 | 50 | 100 | 250 | 500) 보기- 2025년 10월 26일 (일) 13:20 인공무능 토론 기여님이 텐서 압축 문서를 만들었습니다 (새 문서: 텐서 압축(Tensor Compression)은 고차원 배열(텐서)을 저장·처리할 때 메모리 사용량과 계산 복잡도를 줄이기 위해 희소성(sparsity) 또는 저차(rank) 구조를 이용하여 데이터를 압축하는 기법이다. ==개념== 고차원 텐서란 3차원 이상(예: 3‑way, 4‑way…) 배열을 의미하며, 텐서 압축은 이러한 배열에서 대부분이 0이거나 중요도가 낮은 원소를 효율적으로 표현하는 방식이다....) 태그: 시각 편집
- 2025년 10월 26일 (일) 13:18 인공무능 토론 기여님이 CSC (압축) 문서를 만들었습니다 (새 문서: CSC(Compressed Sparse Column, 압축된 희소 열 형식)은 희소 행렬을 저장할 때 열 중심(column‑oriented)으로 비제로(non‑zero) 원소를 압축하는 방식이다. ==개념== CSC 방식은 비제로 원소들을 열 단위로 순서대로 저장하며, 각 열의 시작 위치를 나타내는 포인터 배열을 함께 유지한다. 구체적으로 세 개의 배열을 사용한다: * ‘data’ — 비제로 원소들의 값 배열 * ‘indices...) 태그: 시각 편집
- 2025년 10월 25일 (토) 12:15 인공무능 토론 기여님이 프루닝 문서를 만들었습니다 (새 문서: 프루닝은 컴퓨터 과학 측면에선 계산 효율 및 성능 개선등을 위해 상대적으로 불필요한 경로나 수치를 잘라내는 것을 의미한다. 아래 중 하나의 문서를 선택할 수 있다. * 의사결정 나무의 프루닝 * 신경망 가지치기) 태그: 시각 편집
- 2025년 10월 25일 (토) 11:33 인공무능 토론 기여님이 깊이별 합성곱 문서를 만들었습니다 (새 문서: 깊이별 합성곱(Depthwise Convolution)은 합성곱 신경망(CNN)에서 연산 효율성을 높이기 위해 제안된 구조로, 표준 합성곱(Standard Convolution)을 채널 단위로 분리하여 수행하는 방식이다. 이 방식은 MobileNet 등 경량 신경망의 핵심 구성 요소로 사용되며, 모델의 파라미터 수와 연산량을 크게 줄인다. ==개요== 일반적인 합성곱 연산은 입력의 모든 채널에 대해 동일한 필터를 적...) 태그: 시각 편집
- 2025년 10월 25일 (토) 11:17 인공무능 토론 기여님이 ShiftNet 문서를 만들었습니다 (새 문서: ShiftNet은 2018년에 제안된 초경량 합성곱 신경망(CNN) 구조로, 합성곱 연산(convolution) 자체를 제거하고 단순한 픽셀 이동(shift) 연산으로 공간 정보를 처리하는 혁신적인 접근 방식을 제시하였다. ==개요== ShiftNet은 전통적인 합성곱 계층의 연산량과 파라미터 수를 극단적으로 줄이기 위해 설계되었다. 기존의 표준 합성곱이나 깊이별 합성곱(depthwise convolution)조차도 상...) 태그: 시각 편집
- 2025년 10월 25일 (토) 11:15 인공무능 토론 기여님이 ConvNeXt 문서를 만들었습니다 (새 문서: ConvNeXt(Convolutional Network for the 2020s)는 2022년에 제안된 현대적 합성곱 신경망(CNN) 구조로, 비전 트랜스포머(Vision Transformer)의 설계 철학을 결합하여 기존 CNN의 성능과 효율성을 극대화한 모델이다. ==개요== ConvNeXt는 기존 ResNet 구조를 기반으로 하지만, 트랜스포머의 설계 원칙을 도입하여 단순한 CNN 구조로도 최신 비전 모델과 경쟁 가능한 성능을 달성하였다. 주요 목...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:38 인공무능 토론 기여님이 EfficientNet 문서를 만들었습니다 (새 문서: EfficientNet(영어: EfficientNet)은 컨볼루션 신경망(CNN) 아키텍처의 효율적인 확장을 위한 모델 계열로, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks” 논문에서 제안되었다. ==개요== EfficientNet은 네트워크의 깊이(depth), 폭(width), 입력 해상도(resolution)를 균형 있게 확장하는 '''복합 계수(compound coefficient)''' 기반 스케일링 기법을 도입하였다. 기존 모델들은 깊이...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:34 인공무능 토론 기여님이 DenseNet 문서를 만들었습니다 (새 문서: DenseNet(영어: Dense Convolutional Network, 덴스넷)은 층(layer) 간의 연결을 극대화하여 특징 재사용(feature reuse)과 기울기 흐름(gradient flow)을 개선한 컨볼루션 신경망(CNN) 구조이다. ==개요== DenseNet은 각 층이 이전 모든 층의 출력(feature map)을 입력으로 받아들이고, 자신의 출력을 이후 모든 층이 다시 입력으로 전달하는 구조를 가진다. 즉, 하나의 Dense Block 내부에서 l번째 층...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:32 인공무능 토론 기여님이 SqueezeNet 문서를 만들었습니다 (새 문서: SqueezeNet(영어: SqueezeNet)은 모바일 및 임베디드 환경에서 매우 적은 파라미터 수로도 높은 정확도를 달성하도록 설계된 경량 컨볼루션 신경망(CNN) 구조이다. ==개요== SqueezeNet은 2016년 발표된 모델로, AlexNet과 비슷한 수준의 이미지 분류 성능을 유지하면서도 파라미터 수를 약 50배 줄이는 것을 목표로 설계되었다. 모델 크기가 매우 작아(최소 0.5MB 수준) 모바일 및 임...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:29 인공무능 토론 기여님이 ShuffleNet 문서를 만들었습니다 (새 문서: ShuffleNet(영어: ShuffleNet)은 모바일 및 임베디드 디바이스 환경에서 매우 제한된 연산 자원 하에서도 고성능 이미지 인식이 가능하도록 설계된 경량 컨볼루션 신경망(CNN) 아키텍처이다. ==개요== ShuffleNet은 연산량이 극히 적은 환경(수십 MFLOPs 수준)에서도 동작하도록 설계되었다. 핵심은 두 가지 연산 기법인 포인트와이즈 그룹 컨볼루션(pointwise group convolution)과 채널...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:23 인공무능 토론 기여님이 MobileNet 문서를 만들었습니다 (새 문서: MobileNet(영어: MobileNet)은 모바일 및 임베디드 디바이스 환경에서 낮은 지연(latency)과 적은 연산량으로 이미지 인식, 객체 검출 등의 컴퓨터 비전 과제를 수행하도록 설계된 경량 컨볼루션 신경망(CNN) 아키텍처 계열이다. ==개요== MobileNet은 일반적인 컨볼루션 연산을 깊이별 분리된 컨볼루션(depthwise separable convolution) 방식으로 대체하여 연산량과 파라미터 수를 크게 줄...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:19 인공무능 토론 기여님이 Wide ResNet 문서를 만들었습니다 (새 문서: Wide ResNet(영어: Wide Residual Network, 축약 WRN)은 ResNet 구조의 “깊이(Depth)”를 늘리는 대신 “폭(Width)”을 확장하여 성능을 향상시킨 변형 아키텍처로, 세르게이 자고루이코(Sergey Zagoruyko)와 니코스 코모다키스(Nikos Komodakis)가 2016년에 제안하였다. ==개요== Wide ResNet은 기존 ResNet이 층을 깊게 쌓을수록 학습 효율이 떨어지고, 특징 재사용(feature reuse)이 감소하는 문제를 해...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:11 인공무능 토론 기여님이 AlexNet 문서를 만들었습니다 (새 문서: AlexNet(영어: AlexNet)은 2012년 ImageNet 대회(ILSVRC 2012)에서 우승하며 딥러닝 기반 이미지 인식의 시대를 연 컨볼루션 신경망(CNN) 모델이다. 토론토 대학교의 알렉스 크리제브스키(Alex Krizhevsky), 일야 서츠케버(Ilya Sutskever), 제프리 힌턴(Geoffrey Hinton)에 의해 개발되었다. ==개요== AlexNet은 대규모 이미지 데이터셋(ImageNet)을 학습하여 객체 분류 문제를 해결한 모델로, 당시 기...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:09 인공무능 토론 기여님이 LeNet 문서를 만들었습니다 (새 문서: LeNet(영어: LeNet)은 손글씨 숫자 인식 등 문서 이미지 인식을 위해 설계된 초기 컨볼루션 신경망(CNN) 계열 모델로, 특히 1998년에 제안된 LeNet-5가 가장 널리 알려져 있다. ==개요== LeNet은 컨볼루션과 서브샘플링(당시 평균 풀링)을 반복해 공간 정보를 보존하며 특징을 추출하고, 마지막에 완전연결층으로 분류를 수행하는 구조를 갖는다. 원래 목적은 우편번호나 수표의...) 태그: 시각 편집
- 2025년 10월 25일 (토) 05:08 인공무능 토론 기여님이 르넷 문서를 만들었습니다 (LeNet 문서로 넘겨주기) 태그: 새 넘겨주기
- 2025년 10월 25일 (토) 01:36 인공무능 토론 기여님이 파일:배치 정규화 전후 분포.png 문서를 만들었습니다
- 2025년 10월 25일 (토) 01:36 인공무능 토론 기여님이 파일:배치 정규화 전후 분포.png 파일을 올렸습니다
- 2025년 10월 25일 (토) 01:21 인공무능 토론 기여님이 파일:배치 정규화 전후.png 문서를 삭제했습니다 (중복된 파일)
- 2025년 10월 25일 (토) 01:20 인공무능 토론 기여님이 파일:배치 정규화 전후.png 문서를 만들었습니다
- 2025년 10월 25일 (토) 01:20 인공무능 토론 기여님이 파일:배치 정규화 전후.png 파일을 올렸습니다
- 2025년 10월 24일 (금) 11:47 인공무능 토론 기여님이 전문가 조합 (인공지능) 문서를 만들었습니다 (새 문서: 섬네일|혼합 전문가 모델 예시 Mixture of Experts(줄여서 MoE)는 여러 개의 전문가 모델(expert model)과 게이트(gating) 또는 라우터(router) 메커니즘을 결합하여 입력에 따라 적절한 전문가를 선택하거나 가중합하여 출력을 내는 기계학습 기법이다. 주로 딥러닝에서 모델의 효율적 확장과 성능 향상을 위해 사용된다. ==개요== Mixture of Experts는...)
- 2025년 10월 24일 (금) 07:08 인공무능 토론 기여님이 엔비디아 GPU 모델 문서를 만들었습니다 (새 문서: '''엔비디아 GPU 모델'''은 NVIDIA가 출시한 주요 GPU 제품들을 모델 중심으로 정리한 문서이다. 본 문서는 각 모델의 아키텍처, 특징, 성능, 출시 당시의 소비자 가격 등을 포함한다. ==개요== 엔비디아의 GPU 라인업은 크게 소비자용(GeForce), 전문가용(Quadro/RTX PRO), 데이터센터용(Tesla, A100 등)으로 나뉜다. 모델명에 따라 성능과 용도가 명확히 구분되며, 각 세대의 아키텍처...) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:59 인공무능 토론 기여님이 엔비디아 GPU 아키텍처 문서를 만들었습니다 (새 문서: '''엔비디아 GPU 아키텍처'''는 엔비디아(NVIDIA)가 개발해 온 주요 GPU 마이크로아키텍처의 발전 과정을 다룬 문서이다. ==개요== 엔비디아는 그래픽 처리, 병렬 연산, 인공지능 가속 등 다양한 목적을 위해 GPU(Graphics Processing Unit) 아키텍처를 지속적으로 발전시켜 왔다. 각 세대의 아키텍처는 그래픽 파이프라인, 메모리 기술, 전력 효율, 연산 단위(CUDA Core, Tensor Core, RT Cor...) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:57 인공무능 토론 기여님이 Google Colab 런타임 문서를 만들었습니다 (새 문서: '''Colab 런타임'''은 구글이 제공하는 클라우드 기반 노트북 환경인 '''Google Colaboratory(줄여서 Colab)'''에서 코드가 실제로 실행되는 가상 머신(VM) 환경이다. <ref>https://cloud.google.com/colab/docs/runtimes?hl=ko</ref> ==기본 개념== Colab 노트북(.ipynb 형식)은 브라우저에서 실행되지만, 실제로는 원격의 가상 머신에서 파이썬 코드가 동작한다. 이 실행 환경이 바로 ‘런타임’이다....) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:53 인공무능 토론 기여님이 엔비디아 GPU 아키텍처 및 모델 문서를 만들었습니다 (새 문서: 이 문서는 엔비디아가 지금까지 출시해온 주요 GPU 아키텍처와 그에 해당하는 대표 모델들을 정리한 문서이다. 아래 두 문서로 세분화된다. 본 문서는 아래 두 문서에 대한 요약본이나 최신화 및 구체성 측면에선 부족할 수 있다. * 엔비디아 GPU 아키텍처 * 엔비디아 GPU 모델 ==개요== 엔비디아(NVIDIA)는 그래픽 카드, 데이터센터용 가속기, 인공지능용 가속기 등...) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:49 인공무능 토론 기여님이 엔비디아 L4 문서를 만들었습니다 (새 문서: '''NVIDIA L4'''(엔비디아 L4 Tensor Core GPU)은 엔비디아가 데이터센터, 클라우드 및 엣지(edge) 환경을 위해 설계한 에너지 효율 중심의 범용 가속기이다. ==개요== NVIDIA L4는 2023년경 출시된 Ada Lovelace 아키텍처 기반 GPU로, 영상 처리, AI 추론(inference), 가상 워크스테이션 및 그래픽 처리까지 폭넓은 워크로드에 대응할 수 있도록 설계되었다. 저전력(약 72 W) 설계 및 단일 슬롯/...) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:47 인공무능 토론 기여님이 엔비디아 A100 문서를 만들었습니다 (새 문서: '''NVIDIA A100'''(엔비디아 A100 Tensor Core GPU)은 엔비디아가 데이터센터 및 고성능 컴퓨팅(HPC) 및 인공지능(AI) 워크로드를 위해 설계한 최상위급 GPU 가속기이다. ==개요== NVIDIA A100은 2020년에 발표된 Ampere 아키텍처 기반의 데이터센터용 가속기로, 대형 모델 학습(training), 딥러닝 추론(inference), HPC 애플리케이션을 염두에 두고 설계되었다. 특히 대용량 메모리(HBM2/HBM2e), 고대...) 태그: 시각 편집
- 2025년 10월 24일 (금) 06:46 인공무능 토론 기여님이 엔비디아 T4 문서를 만들었습니다 (새 문서: '''NVIDIA Tesla T4'''(엔비디아 T4, 코드명: Tesla T4)는 엔비디아가 데이터센터 및 클라우드 환경을 위해 설계한 저전력 고효율 GPU(그래픽 처리 장치)로, 딥러닝 추론(inference), 머신러닝, 가상화, 영상 처리 등에 사용된다. ==개요== NVIDIA T4는 2018년에 발표된 엔비디아의 Turing 아키텍처 기반 GPU로, 높은 연산 성능과 에너지 효율을 동시에 달성하기 위해 설계되었다. 특히 클라...) 태그: 시각 편집
- 2025년 10월 23일 (목) 07:56 인공무능 토론 기여님이 DuQuant 문서를 만들었습니다 (새 문서: '''DuQuant (Distributing Outliers via Dual Transformation)'''은 대형 언어 모델(LLM: Large Language Model)의 활성화 및 가중치 양자화 과정에서 특히 문제되는 아웃라이어(outlier) 값을 효과적으로 분산시켜 저비트 양자화 시 성능 손실을 최소화하는 회전(rotation) 및 순열(permutation) 기반 포스트 트레이닝 양자화(Post-Training Quantization, PTQ) 기법이다. ==개요== DuQuant는 활성화 내에 존재하는...) 태그: 시각 편집
- 2025년 10월 23일 (목) 07:53 인공무능 토론 기여님이 QuaRot 문서를 만들었습니다 (새 문서: '''QuaRot (Quantization via Rotations)'''은 대형 언어 모델(LLM: Large Language Model)의 모든 가중치(weights), 활성화(activations), KV 캐시(KV cache)를 4비트 수준으로 양자화하면서도 성능 저하를 최소화하도록 설계된 회전 기반 포스트 트레이닝 양자화(Post-Training Quantization, PTQ) 기법이다. ==배경 및 필요성== *전통적인 양자화 기법들은 가중치는 낮은 비트로 줄일 수 있어도, 모델의 활성...) 태그: 시각 편집
- 2025년 10월 23일 (목) 04:54 인공무능 토론 기여님이 Wanda 문서를 만들었습니다 (Wanda 가지치기 문서로 넘겨주기) 태그: 새 넘겨주기 시각 편집
- 2025년 10월 23일 (목) 04:52 인공무능 토론 기여님이 저랭크 분해 문서를 만들었습니다 (새 문서: 저랭크 분해(低階分解, 영어: Low-Rank Decomposition)는 행렬이나 텐서 등의 데이터를 더 낮은 차원의 구성 요소로 표현하여 계산 효율을 높이고 데이터의 잠재 구조를 추출하는 기법이다. 이는 복잡한 고차원 데이터를 단순화하면서도 본질적인 정보는 유지하려는 수학적 방법이다. ==개요== 행렬 A ∈ ℝ^{m×n}이 있을 때, 그 랭크(rank)가 r(< m,n)인 근사 행렬 Ă를 찾아 A ≈...) 태그: 시각 편집
- 2025년 10월 23일 (목) 04:50 인공무능 토론 기여님이 대형 언어 모델 효율화 문서를 만들었습니다 (새 문서: 본 문서는 대형 언어 모델(Large Language Model, LLM)의 저장 공간 및 연산 효율을 개선하기 위한 대표적 기법들을 정리한 것이다. 주요 방향은 '''양자화(Quantization)''', '''가지치기(Pruning)''', '''지식 증류(Knowledge Distillation)'''이며, LoRA, SmoothQuant, MoE 등 최신 기법들도 포함된다. ==양자화 (Quantization)== 모델의 가중치(weight)와 활성값(activation)을 부동소수(FP32) 대신 정수(INT8, INT...) 태그: 시각 편집
- 2025년 10월 23일 (목) 04:15 인공무능 토론 기여님이 SmoothQuant 문서를 만들었습니다 (새 문서: SmoothQuant(스무스퀀트, 영어: SmoothQuant)은 대규모 언어모델(LLM, Large Language Model)을 대상으로 한 사후(Post-Training) 양자화 기법으로, 정확도 손실을 최소화하면서 모델의 추론 속도와 메모리 효율을 향상시키는 방법이다. 이 기법은 2022년 구글 리서치(Google Research)와 MIT 공동 연구진이 발표한 논문 「SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models」에...) 태그: 시각 편집
- 2025년 10월 23일 (목) 04:11 인공무능 토론 기여님이 ONNX 문서를 만들었습니다 (새 문서: ONNX(Open Neural Network Exchange)은 다양한 머신러닝·딥러닝 프레임워크에서 학습된 모델을 프레임워크 간에 변환하고 배포할 수 있도록 설계된 오픈 표준 저장 포맷 및 중간 표현(IR, Intermediate Representation)이다. ==정의 및 개요== ONNX는 학습된 신경망 모델의 구조(그래프 형태), 연산자(operator) 정의, 가중치(weights), 메타데이터(metadata) 등을 하나의 파일로 기술하여, 다양한...) 태그: 시각 편집
- 2025년 10월 23일 (목) 04:04 인공무능 토론 기여님이 신경망 저장 포맷 문서를 만들었습니다 (새 문서: 신경망 저장 포맷(Neural Network Storage Format)은 인공신경망이 학습된 모델의 구조(architecture), 가중치(weights), 옵티마이저 상태(optimizer state) 등을 디스크에 저장하고 나중에 불러와 재사용하거나 배포할 수 있도록 설계된 파일 형식 또는 규격이다. ==개요== 신경망 모델을 저장하고 불러오는 과정은 머신러닝·딥러닝 워크플로우에서 매우 중요한 부분으로, 학습이 완료된...) 태그: 시각 편집
- 2025년 10월 23일 (목) 03:38 인공무능 토론 기여님이 Massive Activation 문서를 만들었습니다 (과도한 활성값 문서로 넘겨주기) 태그: 새 넘겨주기 시각 편집
- 2025년 10월 17일 (금) 03:18 인공무능 토론 기여님이 깁스 분포 문서를 만들었습니다 (새 문서: '''깁스 분포'''(Gibbs distribution, Gibbs measure)는 통계역학, 확률 이론, 기계 학습 등에서 많이 쓰이는 확률 분포로, 상태의 에너지(또는 비용)에 따라 확률을 배정하는 지수 형태 확률 분포이다. ==정의== 깁스 분포는 상태 공간 \(\mathcal{X}\) 위에서 정의되고, 각 상태 \(x \in \mathcal{X}\)에 대응하는 에너지 함수 \(E(x)\)가 있을 때 다음과 같은 꼴을 가진다: \[ P(x) = \frac{1}{Z} \exp\...) 태그: 시각 편집
- 2025년 10월 17일 (금) 03:17 인공무능 토론 기여님이 Softargmax 문서를 만들었습니다 (새 문서: '''softargmax'''(soft arg‑max, 또는 soft‑argmax)는 비정형적인 arg max의 미분 가능(연속) 근사 버전이다. ==정의 및 개념== softargmax는 입력 벡터 \( \mathbf{z} = (z_1, z_2, \dots, z_K) \in \mathbb{R}^K \)에 대해, 각 성분에 확률 형태로 점유율을 부여하는 함수다. 보통 softmax 함수가 “softargmax”라고 불리기도 한다. <ref>“Softmax function”, Wikipedia</ref> 표준 softmax 정의는 \[ \sigma(\mathbf{z})_k...) 태그: 시각 편집
- 2025년 10월 17일 (금) 03:06 인공무능 토론 기여님이 Argmin 문서를 만들었습니다 (새 문서: '''argmin'''(argument of the minimum, 줄여서 “arg min” 또는 “argmin”)는 함수가 최소값을 갖는 지점(입력 변수의 값)을 나타내는 연산자이다. ==정의== 함수 \(f: X \to \mathbb{R}\)와 그 정의역의 부분집합 \(S \subseteq X\)가 주어졌을 때, \[ \arg\min_{x \in S} f(x) = \{\, x \in S \mid \forall\, s \in S,\; f(x) \le f(s) \} \] 로 정의된다. 즉, \(S\) 내에서 \(f(x)\)가 최소값을 갖는 모든 \(x\)의 집합이다...) 태그: 시각 편집
- 2025년 10월 17일 (금) 03:03 인공무능 토론 기여님이 Argmax 문서를 만들었습니다 (새 문서: '''argmax'''(argument of the maximum, 줄여서 “arg max” 또는 “argmax”)는 함수가 최댓값을 갖는 지점(변수의 값)을 가리키는 연산자이다. ==정의== \(\arg\max\)는 주어진 함수 \(f: X \to \mathbb{R}\)와 부분집합 \(S \subseteq X\)에 대해, \[ \arg\max_{x \in S} f(x) = \{x \in S \mid f(x) \ge f(s) \text{ for all } s \in S\} \] 로 정의된다. 즉, 정의역 \(S\) 내에서 함수 \(f\)의 값이 최대가 되는 모든 \(x\)의...) 태그: 시각 편집
- 2025년 10월 16일 (목) 08:44 인공무능 토론 기여님이 과도한 활성값 문서를 만들었습니다 (새 문서: 과도한 활성값(Massive Activation)은 신경망 내부의 일부 활성(activation)이 다른 활성들에 비해 매우 큰 값을 가지는 현상을 가리킨다. 특히 대형 언어 모델(LLM)에서 이러한 현상이 반복적으로 관찰되며, 단순한 이상치(outlier)를 넘어 모델 동작의 중요한 요소로 역할하는 것으로 보고된다. ==정의 및 개념== 과도한 활성값은 전체 활성 공간 중 극히 일부의 차원(dimension)에서...) 태그: 시각 편집
- 2025년 10월 15일 (수) 01:08 인공무능 토론 기여님이 행렬의 랭크 문서를 만들었습니다 (새 문서: 행렬의 랭크(영어: rank of a matrix)는 행렬에서 선형 독립한 행 또는 열벡터의 최대 개수를 나타내는 수로, 벡터 공간의 차원과 선형 변환의 구조를 분석하는 데 중요한 개념이다. ==정의== 행렬 A의 랭크는 다음과 같이 정의된다: *행 랭크(row rank): 행렬 A의 행벡터들 중 선형 독립한 최대 개수 *열 랭크(column rank): 행렬 A의 열벡터들 중 선형 독립한 최대 개수 모든 행렬에...) 태그: 시각 편집
- 2025년 10월 15일 (수) 01:04 인공무능 토론 기여님이 가우스 소거법 문서를 만들었습니다 (새 문서: 가우스 소거법(독일어: Gaußsches Eliminationsverfahren, 영어: Gaussian elimination)은 연립방정식 해법, 행렬의 기저 및 랭크 계산 등에 사용되는 선형대수학의 기초적인 알고리즘으로, 행 연산을 통해 행렬을 계단형으로 바꾸는 절차이다. ==정의== 가우스 소거법은 행렬에 다음과 같은 기본 행 연산을 반복 적용하여 계단형(row echelon form) 또는 기약 계단형(reduced row echelon form, RRE...) 태그: 시각 편집
- 2025년 10월 15일 (수) 01:01 인공무능 토론 기여님이 선형 독립 문서를 만들었습니다 (새 문서: 선형 독립(線型獨立, 영어: linear independence)은 벡터 공간에서 여러 벡터가 서로 선형 결합으로 표현되지 않는 관계를 의미하며, 기저와 차원 정의의 핵심 개념이다. ==정의== 벡터 공간 V의 벡터 집합 \(\{v_1, v_2, ..., v_n\}\)이 다음 조건을 만족할 때 이 집합은 '''선형 독립'''이라 한다: *임의의 스칼라 \(a_1, a_2, ..., a_n\)에 대해 **\(a_1 v_1 + a_2 v_2 + ... + a_n v_n = 0\) 이 성립하면...)
- 2025년 10월 15일 (수) 01:00 인공무능 토론 기여님이 벡터의 차원 문서를 만들었습니다 (새 문서: 벡터의 차원(次元, 영어: dimension of a vector space)은 벡터 공간을 구성하는 데 필요한 최소한의 선형 독립 벡터의 수를 의미하며, 해당 공간의 구조를 수치적으로 나타내는 중요한 개념이다. ==정의== 벡터 공간 V의 차원은 V의 기저를 이루는 벡터들의 개수로 정의된다. *벡터 공간 V의 차원은 기호로 \(\dim V\) 또는 \(\operatorname{dim}(V)\)로 나타낸다. *기저는 여러 개 존재할...) 태그: 시각 편집
- 2025년 10월 15일 (수) 00:57 인공무능 토론 기여님이 벡터의 기저 문서를 만들었습니다 (새 문서: 벡터의 기저(基底, 영어: basis of a vector space)는 벡터 공간을 구성하는 최소한의 벡터 집합으로, 모든 벡터를 유일하게 선형 결합으로 표현할 수 있게 하는 벡터들의 집합이다. ==정의== 벡터 공간 V에서 벡터 집합 \(\{v_1, v_2, ..., v_n\}\)이 다음 두 조건을 만족할 때, 이 집합을 V의 '''기저'''라 한다: *생성 조건: 집합 \(\{v_1, ..., v_n\}\)의 선형 결합으로 V의 모든 벡터를 표현...) 태그: 시각 편집
- 2025년 10월 15일 (수) 00:50 인공무능 토론 기여님이 선형독립 문서를 만들었습니다 (새 문서: 선형 독립(線型獨立, 영어: linear independence)은 벡터 공간에서 여러 벡터가 서로 선형 결합으로 표현되지 않는 관계를 의미하며, 기저와 차원 정의의 핵심 개념이다. ==정의== 벡터 공간 V의 벡터 집합 \(\{v_1, v_2, ..., v_n\}\)이 다음 조건을 만족할 때 이 집합은 '''선형 독립'''이라 한다: *임의의 스칼라 \(a_1, a_2, ..., a_n\)에 대해 **\(a_1 v_1 + a_2 v_2 + ... + a_n v_n = 0\) 이 성립하면...) 태그: 시각 편집
- 2025년 10월 14일 (화) 06:16 인공무능 토론 기여님이 OLS 회귀분석 문서를 만들었습니다 (새 문서: '''OLS 회귀분석'''(Ordinary Least Squares 회귀분석)은 관측된 자료에 가장 잘 맞는 직선(혹은 초평면)을 찾기 위해, 잔차의 제곱합을 최소화하는 회귀계수를 추정하는 방법이다. * 최소제곱법이라고도 한다. (ex. 최소제곱법 회귀분석) ==개념 및 목적== OLS는 독립 변수(설명 변수)와 종속 변수(반응 변수) 사이의 선형 관계를 모델링하고, 이 관계를 설명하는 계수들을 추정...) 태그: 시각 편집
- 2025년 10월 9일 (목) 14:01 인공무능 토론 기여님이 PyTorch named parameters 메서드 문서를 만들었습니다 (새 문서: named_parameters()는 PyTorch에서 제공하는 메서드로, 신경망 모델의 모든 학습 가능한 파라미터(parameter)에 대해 해당 파라미터의 이름(name)과 파라미터 객체(torch.nn.Parameter)를 함께 반환한다. 이 메서드는 torch.nn.Module을 상속받은 모든 모델에서 사용 가능하며, 레이어별 파라미터에 이름을 기준으로 접근하거나 필터링할 수 있도록 도와준다. ==개요== PyTorch의 모든 모델은 t...)