익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
CIFAR 데이터셋
편집하기
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
'''CIFAR 데이터셋'''은 이미지 인식 및 머신러닝 연구에서 널리 사용되는 소형 컬러 이미지 데이터셋이다. 대표적으로 '''CIFAR-10'''과 '''CIFAR-100'''이 존재하며, 각기 다른 분류 수준을 제공한다. ==개요== CIFAR는 "Canadian Institute for Advanced Research"의 약자로, 원래는 MIT의 Tiny Images 프로젝트에서 파생된 데이터셋이다. 이 데이터셋들은 32×32 픽셀 크기의 컬러 이미지로 구성되어 있으며, 각 이미지에는 사전에 정의된 클래스 레이블이 부여되어 있다. 모델 개발과 벤치마킹에 널리 사용된다. ==CIFAR-10== *클래스 수: 10개 **비행기, 자동차, 새, 고양이, 사슴, 개, 개구리, 말, 배, 트럭 *데이터 크기: 총 60,000장 **훈련 이미지 50,000장, 테스트 이미지 10,000장 *이미지 크기: 32×32 RGB *용도: 경량 이미지 분류, 기본 CNN 구조 실험, 데이터 증강 연구 등 ==CIFAR-100== *클래스 수: 100개 (20개의 상위 클래스, 100개의 하위 클래스) *데이터 크기: 총 60,000장 **클래스당 600장 (500장 훈련, 100장 테스트) *이미지 크기: 32×32 RGB *용도: 정밀 분류, 계층적 분류 실험, 다중 레이블 학습 등 ==특징== *모든 이미지는 정사각형이며, 크기가 작고 균일하다 *클래스 간 이미지 수가 균등하게 분포되어 있다 *복잡하지 않은 구조로 인해 저사양 환경에서도 실험 가능 *이미지에 배경이 포함되어 있고, 일부는 클래스 간 시각적 구분이 어렵다 ==장단점== ===장점=== *경량화된 데이터: 학습 속도가 빠르고 실험 반복에 적합하다 *표준화된 구조: 다양한 모델 간 성능 비교가 용이하다 *커뮤니티 확산: 다양한 라이브러리와 튜토리얼에서 지원 ===단점=== *낮은 해상도: 복잡한 패턴이나 세밀한 특징 인식에는 한계가 있다 *일반화 한계: 실제 환경의 고해상도 이미지와 차이가 있어 모델 성능이 과대평가될 수 있다 *중복 이미지 존재: 훈련 및 테스트 이미지 간 유사 이미지가 존재함이 보고된 바 있다 ==활용 예시== *기본적인 CNN 실험 (예: LeNet, AlexNet, VGG 등) *전이 학습 테스트 및 fine-tuning *데이터 증강 기법 비교 *반지도학습, 자가 지도 학습 실험 *벤치마크 비교 논문에서 성능 비교 기준선 ==PyTorch 사용 예시== <syntaxhighlight lang="python"> import torchvision import torchvision.transforms as transforms from torch.utils.data import DataLoader # 훈련 및 테스트용 데이터 전처리 transform_train = transforms.Compose([ transforms.RandomCrop(32, padding=4), transforms.RandomHorizontalFlip(), transforms.ToTensor(), ]) transform_test = transforms.Compose([ transforms.ToTensor(), ]) # CIFAR-10 데이터셋 로딩 trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform_train) trainloader = DataLoader(trainset, batch_size=128, shuffle=True) testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform_test) testloader = DataLoader(testset, batch_size=100, shuffle=False) </syntaxhighlight> ==같이 보기== *[[ImageNet]] *[[MNIST]] *[[Tiny Images]] *[[전이 학습]] *[[데이터 증강]] ==참고 문헌== ==각주== [[분류:인공지능]] [[분류:데이터]]
요약:
IT 위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
IT 위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록