모든 공개 기록
IT 위키
IT 위키에서 사용할 수 있는 모든 기록이 표시됩니다. 기록 종류나 사용자 이름(대소문자 구별) 또는 영향을 받는 문서(대소문자 구별)를 선택하여 범위를 좁혀서 살펴볼 수 있습니다.
(최신 | 오래됨) (다음 50개 | 이전 50개) (20 | 50 | 100 | 250 | 500) 보기- 2025년 4월 15일 (화) 12:23 AlanTuring 토론 기여님이 맥스 힙 문서를 만들었습니다 (새 문서: 맥스 힙(Max Heap)은 완전 이진 트리(Complete Binary Tree)의 한 형태로, 모든 부모 노드의 값이 그 자식 노드들의 값보다 '''크거나 같은''' 구조를 갖는 힙 자료구조이다. 우선순위 큐(priority queue) 구현이나 정렬 알고리즘(힙 정렬) 등에 사용된다. == 개념 == * 완전 이진 트리 형태 유지 * 각 노드의 값 ≥ 자식 노드의 값 * '''루트 노드에는 항상 최댓값이 위치''' == 특징 == *...)
- 2025년 4월 15일 (화) 10:53 AlanTuring 토론 기여님이 트립 (이진 탐색 트리) 문서를 만들었습니다 (새 문서: 트립 이진 탐색 트리(Treap Binary Search Tree)는 이진 탐색 트리(BST)의 정렬 규칙과 힙(Heap)의 우선순위 규칙을 동시에 만족하는 확률적 자료구조이다. 삽입 시 각 노드에 난수 형태의 우선순위를 부여함으로써, 별도의 재균형 알고리즘 없이도 평균적으로 균형 잡힌 트리를 구성할 수 있다. ==개요== 트립(Treap)은 '''Tree'''와 '''Heap'''의 합성어로, 각 노드가 다음 두 가지 속성...)
- 2025년 4월 15일 (화) 10:32 AlanTuring 토론 기여님이 무작위 이진 탐색 트리 문서를 만들었습니다 (새 문서: 무작위 BST(randomized binary search tree)는 명시적인 균형 조건 없이 무작위성을 활용하여 평균적으로 균형 잡힌 이진 탐색 트리를 구성하는 자료구조이다. Treap 외에도 다양한 구조가 있으며, 이들은 각기 다른 방식으로 무작위성을 도입하여 O(log n) 평균 시간복잡도를 유지한다. ==주요 종류== *Treaps **노드에 무작위 우선순위를 부여하여 힙 + BST 구조 유지 **삽입, 삭제 연...)
- 2025년 4월 15일 (화) 08:34 이재용 토론 기여님이 파일:경제적 주문 비용 그래프.png 문서를 만들었습니다
- 2025년 4월 15일 (화) 08:34 이재용 토론 기여님이 파일:경제적 주문 비용 그래프.png 파일을 올렸습니다
- 2025년 4월 15일 (화) 08:29 이재용 토론 기여님이 JIT 문서를 만들었습니다 (저스트 인 타임 문서로 넘겨주기) 태그: 새 넘겨주기 시각 편집
- 2025년 4월 15일 (화) 08:29 이재용 토론 기여님이 EOQ 문서를 만들었습니다 (경제적 주문량 문서로 넘겨주기) 태그: 새 넘겨주기 시각 편집
- 2025년 4월 15일 (화) 08:22 이재용 토론 기여님이 재주문 시점 문서를 만들었습니다 (새 문서: 재주문 시점(Reorder Point, ROP)은 재고 수준이 일정 기준 이하로 떨어졌을 때 '''새로운 주문을 발주해야 하는 시점'''을 의미한다. 재고가 소진되기 전에 보충이 이뤄질 수 있도록 설정된 기준점으로, 재고 부족(품절)을 방지하고 안정적인 공급을 유지하는 핵심 요소다. ==개념== *리드타임(발주부터 입고까지 걸리는 시간) 동안 소비될 수량을 기준으로 설정 *수요가 일...) 태그: 시각 편집
- 2025년 4월 15일 (화) 08:22 이재용 토론 기여님이 파일:재주문 시점 재고 그래프.png 문서를 만들었습니다
- 2025년 4월 15일 (화) 08:22 이재용 토론 기여님이 파일:재주문 시점 재고 그래프.png 파일을 올렸습니다
- 2025년 4월 15일 (화) 08:13 이재용 토론 기여님이 경제적 주문량 문서를 만들었습니다 (새 문서: 경제적 주문량(Economic Order Quantity, EOQ)은 총 재고 비용을 최소화하기 위한 '''주문량의 최적 크기'''를 계산하는 재고 관리 기법이다. 주문 비용과 보관 비용 간의 균형점을 찾아, 연간 재고 운영비용을 최소화하는 데 목적이 있다. ==개념== *주문량이 적으면 자주 주문해야 하므로 '''주문 비용 증가''' *주문량이 많으면 보유 재고가 커져 '''보관 비용 증가''' *EOQ는 이 둘...) 태그: 시각 편집
- 2025년 4월 15일 (화) 07:59 이재용 토론 기여님이 재고 비용 문서를 만들었습니다 (새 문서: 재고 비용(Inventory Cost)은 기업이 재고를 보유하고 운영하는 과정에서 발생하는 '''직접적 또는 간접적인 모든 비용'''을 의미한다. 재고 수준을 최적화하기 위해서는 이들 비용을 명확히 파악하고 균형을 맞추는 것이 중요하다. ==분류== 재고 비용은 일반적으로 다음의 세 가지 또는 네 가지로 구분된다: ===1. 주문 비용 (Ordering Cost)=== *재고를 보충하기 위해 주문할 때...) 태그: 시각 편집
- 2025년 4월 15일 (화) 07:40 이재용 토론 기여님이 ABC 분석 문서를 만들었습니다 (새 문서: ABC 분석은 재고 항목이나 고객, 제품 등을 '''중요도나 기여도에 따라 A, B, C 세 그룹으로 분류하여 효율적으로 관리하는 기법'''이다. 일반적으로 파레토 법칙(80/20 법칙)을 기반으로 하며, 관리 자원을 핵심 항목에 집중하기 위한 전략으로 활용된다. ==개념== *A 항목: 전체 가치의 약 70~80%를 차지하는 상위 10~20%의 항목 *B 항목: 전체 가치의 약 15~25%를 차지하는 중간 30~...) 태그: 시각 편집
- 2025년 4월 15일 (화) 07:14 이재용 토론 기여님이 재고 관리 문서를 만들었습니다 (새 문서: 재고 관리는 기업이 보유한 원자재, 반제품, 완제품 등의 재고를 '''적절한 수준에서 유지하며, 수요에 맞게 공급을 조절하는 활동'''이다. 과잉 재고나 재고 부족을 방지하고, 생산과 판매의 흐름을 효율적으로 유지하기 위해 핵심적인 역할을 한다. ==개념== *재고(inventory): 판매를 위해 보유 중인 모든 물품 **원자재, 부품, 반제품, 완제품 등이 포함됨 *재고 관리는...) 태그: 시각 편집
- 2025년 4월 15일 (화) 00:15 권영세 토론 기여님이 연판장 돌리기 문서를 만들었습니다 (새 문서: 연판장 돌리기란 특정한 목적을 위해 여러 사람의 '''동의, 서명, 또는 지지'''를 받기 위해 문서를 순서대로 돌리는 행위를 말한다. 주로 정치적, 사회적 요구나 항의, 청원, 후원, 응원 등의 표현 수단으로 사용되며, 종이 문서 또는 온라인 서명 형태로 이뤄질 수 있다. ==개념== *하나의 문서를 사람들이 차례로 읽고, 자신의 이름, 소속, 서명 등을 남기는 방식 *문자...) 태그: 시각 편집
- 2025년 4월 12일 (토) 13:15 이재명 토론 기여님이 샤프 비율 문서를 만들었습니다 (새 문서: 샤프 비율(Sharpe Ratio)은 투자 자산의 성과를 위험 대비 수익의 관점에서 평가하는 지표로, '''추가적인 위험을 감수함으로써 얻은 초과 수익률을 변동성으로 나눈 값'''이다. 금융 자산, 포트폴리오, 펀드 성과 비교 등에서 널리 사용된다. ==개념== *윌리엄 샤프(William F. Sharpe)에 의해 제안됨 *위험 조정 수익률(risk-adjusted return)을 평가 *수익률이 높더라도 변동성이 크면...) 태그: 시각 편집
- 2025년 4월 12일 (토) 12:02 이재명 토론 기여님이 무역 가중 달러 인덱스 문서를 만들었습니다 (새 문서: 무역 가중 달러 인덱스(Trade-Weighted U.S. Dollar Index)는 미국 달러의 가치를 '''미국과 교역량이 많은 여러 국가의 통화에 대해 가중 평균하여 측정한 지표'''이다. 달러 인덱스(DXY)가 6개 주요 통화에만 기반하는 반면, 이 지수는 실제 무역 비중을 반영하므로 '''보다 현실적인 달러의 강도'''를 보여준다. ==개념== *미 연방준비제도(Federal Reserve)가 발표하는 공식 지표 *...) 태그: 시각 편집
- 2025년 4월 12일 (토) 12:02 이재명 토론 기여님이 달러 인덱스 문서를 만들었습니다 (새 문서: 달러 인덱스(U.S. Dollar Index, DXY)는 미국 달러의 가치를 '''주요 6개 통화 바스켓에 대해 상대적으로 측정한 지표'''이다. 달러가 글로벌 외환시장에서 강세인지 약세인지를 판단할 수 있는 대표적인 벤치마크로, 외환 트레이딩, 거시경제 분석, 금리 정책 판단 등에 활용된다. ==개념== *달러 인덱스는 미국 달러(USD)가 유로, 엔, 파운드, 캐나다 달러, 스웨덴 크로나, 스위...) 태그: 시각 편집
- 2025년 4월 12일 (토) 11:49 이재명 토론 기여님이 이자율 평형 문서를 만들었습니다 (새 문서: 이자율 평형(Interest Rate Parity, IRP)은 두 국가 간의 통화 가치와 이자율의 관계를 설명하는 국제금융 이론으로, '''무위험 차익 거래(arbitrage)가 불가능한 상태에서 환율과 금리가 결정되는 균형 조건'''이다. 외환시장과 채권시장의 상호작용을 설명하며, 현물환율과 선물환율, 금리 사이의 수학적 관계를 제시한다. ==개념== *이자율 평형은 외환시장에서 자본이 자유롭...) 태그: 시각 편집
- 2025년 4월 12일 (토) 11:43 이재명 토론 기여님이 수익률 곡선 문서를 만들었습니다 (새 문서: 수익률 곡선(yield curve)은 동일한 신용 등급을 가진 채권의 '''만기별 이자율(수익률)의 변화를 시각적으로 나타낸 곡선'''이다. 일반적으로는 국채(특히 무위험 채권)를 기준으로 작성되며, 금리 만기 구조를 시각적으로 표현한 도구이다. 섬네일|수익률 곡선 예시 ==개념== *x축: 채권의 '''만기(Maturity)''' *y축: 해당 만기 채권의 '''수익...) 태그: 시각 편집
- 2025년 4월 12일 (토) 11:41 이재명 토론 기여님이 금리 만기 구조 문서를 만들었습니다 (새 문서: 금리 만기 구조(term structure of interest rates)는 동일한 신용 등급을 가진 채권의 '''만기에 따른 금리의 변화 관계'''를 나타내는 개념이다. 일반적으로 만기가 길수록 금리가 높아지는 경향이 있지만, 시장 상황에 따라 다양한 형태의 구조가 관측된다. ==개념== 섬네일|형태 유형별 수익률 곡선 *만기 구조는 특정 시점에서 다양한 '''만기(leng...) 태그: 시각 편집
- 2025년 4월 12일 (토) 11:41 이재명 토론 기여님이 파일:수익률 곡선 예제.png 문서를 만들었습니다
- 2025년 4월 12일 (토) 11:41 이재명 토론 기여님이 파일:수익률 곡선 예제.png 파일을 올렸습니다
- 2025년 4월 12일 (토) 11:39 이재명 토론 기여 계정이 생성되었습니다
- 2025년 4월 10일 (목) 12:40 SOLO 토론 기여님이 SQL UNION 연산자 문서를 만들었습니다 (새 문서: SQL의 UNION 연산자는 두 개 이상의 SELECT 문 결과를 결합하여 하나의 결과 집합으로 반환할 때 사용된다. 이때 각 SELECT 문은 같은 수의 컬럼을 반환해야 하며, 각 컬럼의 데이터 타입이 호환되어야 한다. ==기본 문법== <syntaxhighlight lang="sql"> SELECT 컬럼1, 컬럼2, ... FROM 테이블1 [WHERE 조건] UNION SELECT 컬럼1, 컬럼2, ... FROM 테이블2 [WHERE 조건]; </syntaxhighlight> *기본적으로 중복된...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:39 SOLO 토론 기여님이 SQL DELETE 구문 문서를 만들었습니다 (새 문서: SQL의 DELETE 구문은 테이블에서 특정 조건에 해당하는 데이터를 삭제할 때 사용하는 명령어이다. 전체 행을 제거하거나 WHERE 절을 통해 특정 행만 선택적으로 삭제할 수 있다. ==기본 문법== <syntaxhighlight lang="sql"> DELETE FROM 테이블명 [WHERE 조건]; </syntaxhighlight> *WHERE 절을 생략하면 테이블의 '''모든 행'''이 삭제되며, 테이블 구조는 남는다. ==예시 테이블== employees 테이블...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:38 SOLO 토론 기여님이 SQL UPDATE 구문 문서를 만들었습니다 (새 문서: SQL의 UPDATE 구문은 기존 테이블의 데이터를 수정할 때 사용하는 명령어이다. 특정 조건에 맞는 행(row)을 찾아 그 안의 컬럼 값을 새 값으로 변경할 수 있다. ==기본 문법== <syntaxhighlight lang="sql"> UPDATE 테이블명 SET 컬럼1 = 값1, 컬럼2 = 값2, ... [WHERE 조건]; </syntaxhighlight> *WHERE 절이 없으면 테이블의 모든 행이 업데이트됨에 주의해야 한다. ==예시 테이블== employees 테이블이...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:37 SOLO 토론 기여님이 SQL INSERT 구문 문서를 만들었습니다 (새 문서: SQL의 INSERT 구문은 테이블에 새로운 데이터를 추가(삽입)할 때 사용하는 명령어이다. 새로운 행(row)을 하나 또는 여러 개 삽입할 수 있으며, 명시적으로 컬럼을 지정하거나 테이블 구조에 따라 자동 매핑할 수 있다. ==기본 문법== <syntaxhighlight lang="sql"> INSERT INTO 테이블명 (컬럼1, 컬럼2, ...) VALUES (값1, 값2, ...); </syntaxhighlight> *컬럼 목록 생략 시 테이블의 모든 컬럼 순서...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:36 SOLO 토론 기여님이 SQL SELECT 구문 문서를 만들었습니다 (새 문서: SQL의 SELECT 구문은 데이터베이스에서 원하는 데이터를 조회할 때 사용하는 기본적인 명령어이다. 테이블에서 특정 컬럼 또는 조건에 맞는 행(row)을 선택하여 결과 집합을 반환한다. ==기본 문법== <syntaxhighlight lang="sql"> SELECT [컬럼명1], [컬럼명2], ... FROM [테이블명] [WHERE 조건] [GROUP BY 컬럼] [HAVING 조건] [ORDER BY 컬럼 ASC|DESC] [LIMIT 개수]; </syntaxhighlight> ==주요 구성 요소== *S...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:28 SOLO 토론 기여님이 비동기 전송 모드 문서를 만들었습니다 (새 문서: 비동기 전송 모드(Asynchronous Transfer Mode, ATM)는 고정된 길이의 셀(cell) 단위로 데이터를 전송하는 고속 패킷 전환 기술이다. 통신 품질 보장(QoS)이 필요한 음성, 영상, 데이터 트래픽을 동시에 처리할 수 있도록 설계되었으며, 주로 광대역 네트워크(B-ISDN)에서 사용되었다. ==개요== ATM은 각 전송 단위를 '''53바이트 셀'''로 고정하여 전송하며, 이 셀은 5바이트 헤더와 48바...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:23 SOLO 토론 기여님이 패키지 다이어그램 문서를 만들었습니다 (새 문서: 패키지 다이어그램(Package Diagram)은 UML(Unified Modeling Language)에서 시스템을 구성하는 클래스나 하위 패키지들을 논리적으로 그룹화한 구조를 표현하는 다이어그램이다. 시스템의 의존 관계와 모듈화를 시각화하는 데 유용하며, 주로 소프트웨어의 아키텍처 설계 초기 단계에서 사용된다. ==개요== 섬네일|패키지 다이어그램 예시 패...) 태그: 시각 편집
- 2025년 4월 10일 (목) 12:23 SOLO 토론 기여님이 파일:패키지 다이어그램 예시.png 문서를 만들었습니다
- 2025년 4월 10일 (목) 12:23 SOLO 토론 기여님이 파일:패키지 다이어그램 예시.png 파일을 올렸습니다
- 2025년 4월 10일 (목) 12:17 SOLO 토론 기여님이 데이터베이스 세타 조인 문서를 만들었습니다 (새 문서: 세타 조인(θ-조인, Theta Join)은 관계형 데이터베이스에서 두 테이블을 조인할 때, 단순한 동등 조건뿐만 아니라 '''비교 연산자(=, ≠, <, ≤, >, ≥)'''를 포함한 일반적인 조건식을 사용할 수 있는 조인 방식이다. 세타(θ)는 임의의 조건을 나타내는 기호이다. ==개요== 세타 조인은 다음과 같은 형식의 조건으로 이루어진다. *R ⋈<sub>θ</sub> S **여기서 θ는 비교 연산자(예:...) 태그: 시각 편집
- 2025년 4월 10일 (목) 07:55 AlanTuring 토론 기여님이 FKS 해싱 문서를 만들었습니다 (새 문서: FKS 해싱(FKS Hashing)은 정적인 키 집합에 대해 O(1) 시간의 탐색을 보장하는 두 단계 해싱(two-level hashing) 기법이다. 이 방법은 Fredman, Komlós, Szemerédi 세 명의 연구자가 제안하였으며, 완전 해싱(perfect hashing)의 대표적 구현으로 널리 알려져 있다. * 최적 정적 해싱(Optimal Static Hashing)이라고도 불린다. ==개요== FKS 해싱은 다음과 같은 조건에서 동작하도록 설계된다: *키 집...) 태그: 시각 편집
- 2025년 4월 10일 (목) 07:48 AlanTuring 토론 기여님이 유니버설 해싱 문서를 만들었습니다 (새 문서: 유니버설 해싱(Universal Hashing)은 해시 함수의 집합 중에서 하나를 무작위로 선택하여 사용하는 해싱 기법으로, '''모든 키 쌍이 충돌할 확률이 최소화되도록 보장하는 해시 방식'''이다. 해시 함수가 고정되지 않고 무작위로 선택되기 때문에, 입력에 의존적인 공격이나 최악의 성능을 회피할 수 있다는 장점이 있다. ==개념== *일반적인 해시 테이블은 해시 함수가 고정...) 태그: 시각 편집
- 2025년 4월 10일 (목) 06:21 AlanTuring 토론 기여님이 트립 이진 탐색 트리 문서를 만들었습니다 (새 문서: 트립 이진 탐색 트리(Treap Binary Search Tree)는 이진 탐색 트리(BST)의 정렬 규칙과 힙(Heap)의 우선순위 규칙을 동시에 만족하는 확률적 자료구조이다. 삽입 시 각 노드에 난수 형태의 우선순위를 부여함으로써, 별도의 재균형 알고리즘 없이도 평균적으로 균형 잡힌 트리를 구성할 수 있다. ==개요== 트립(Treap)은 '''Tree'''와 '''Heap'''의 합성어로, 각 노드가 다음 두 가지 속성...) 태그: 시각 편집
- 2025년 4월 10일 (목) 06:17 AlanTuring 토론 기여님이 외부 이진 탐색 트리 문서를 만들었습니다 (새 문서: 외부 이진 탐색 트리(external binary search tree)는 모든 키(key)를 '''리프 노드(외부 노드)'''에 저장하는 이진 탐색 트리 구조이다. 내부 노드에는 실제 키 대신 탐색을 위한 비교 정보만 저장되며, 키와 연관된 실제 데이터는 리프 노드에 위치한다. ==개념== *외부 노드만 실제 키를 저장하고, 내부 노드는 탐색 경로를 위한 정보만 갖는다 *삽입, 삭제, 탐색 과정에서 비교는...)
- 2025년 4월 9일 (수) 09:57 빅데이터분석기사 토론 기여님이 아파치 스파크 ParamGridBuilder 문서를 만들었습니다 (새 문서: ParamGridBuilder는 Apache Spark MLlib에서 하이퍼파라미터 튜닝을 위한 도구로, 여러 파라미터 조합을 생성해 CrossValidator나 TrainValidationSplit과 함께 사용된다. 이를 통해 모델의 하이퍼파라미터를 체계적으로 탐색하고 최적의 조합을 찾을 수 있다. ==개요== ParamGridBuilder는 ML 파이프라인 내 Estimator 객체의 파라미터를 대상으로 여러 후보 값을 설정하고, 가능한 모든 조합을 만...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:45 빅데이터분석기사 토론 기여님이 로그 정규 분포 문서를 만들었습니다 (새 문서: 섬네일|로그 정규 분포와 일반 정규 분포 로그 정규 분포(로그 正規 分布, 영어: log-normal distribution)는 확률 변수의 로그가 정규 분포를 따르는 확률 분포이다. 즉, 확률 변수 X가 로그 정규 분포를 따른다는 것은 ln(X)가 정규 분포를 따른다는 것을 의미한다. 로그 정규 분포는 정수 값만을 가지는 데이터나, 0보다 큰 양수 데이터에 적합...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:44 빅데이터분석기사 토론 기여님이 파일:로그 정규 분포 비교.png 문서를 만들었습니다
- 2025년 4월 9일 (수) 09:44 빅데이터분석기사 토론 기여님이 파일:로그 정규 분포 비교.png 파일을 올렸습니다
- 2025년 4월 9일 (수) 09:38 빅데이터분석기사 토론 기여님이 결정 계수 문서를 만들었습니다 (새 문서: 결정 계수(決定係數, Coefficient of Determination)는 회귀 분석에서 예측된 결과가 실제 데이터를 얼마나 잘 설명하는지를 나타내는 지표로, 일반적으로 R² (R 제곱값)로 표기된다. 값의 범위는 0에서 1 사이이며, 1에 가까울수록 모델이 데이터를 잘 설명하고 있음을 의미한다. ==정의== 결정 계수는 총 변동 중에서 회귀 모형이 설명할 수 있는 변동의 비율이다. R² = 1 − (RSS...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:34 빅데이터분석기사 토론 기여님이 평균 제곱근 오차 문서를 만들었습니다 (새 문서: 평균 제곱근 오차(RMSE, Root Mean Squared Error)는 회귀 분석에서 예측값과 실제값 간의 차이를 측정하는 대표적인 평가 지표이다. 오차(Residual)의 제곱 평균에 루트를 씌운 값으로, 단위가 원래 데이터와 동일하여 해석이 직관적이다. ==정의== 평균 제곱근 오차는 다음 수식으로 정의된다. RMSE = sqrt( (1/n) * Σ (y<sub>i</sub> - ŷ<sub>i</sub>)² ) 여기서, *<big>y<sub>i</sub>: 실제값</big>...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:30 빅데이터분석기사 토론 기여님이 아파치 스파크 RFormula 문서를 만들었습니다 (새 문서: RFormula는 Apache Spark MLlib에서 제공하는 피처 엔지니어링 도구로, R 언어의 공식(formula) 문법을 사용하여 특성과 레이블을 자동으로 정의하고 전처리 과정을 단순화하는 기능을 제공한다. 이 기능은 범주형 변수 인코딩, 수치형 변수 선택, 다항식 식별 등을 간결한 구문으로 수행할 수 있어, 모델링 파이프라인 구성 시 유용하다. ==개요== RFormula는 `"label ~ features"` 형식...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:28 빅데이터분석기사 토론 기여님이 아파치 스파크 StringIndexer 문서를 만들었습니다 (새 문서: StringIndexer는 Apache Spark MLlib에서 제공하는 범주형 문자열 데이터를 수치형 인덱스로 변환하는 변환기(Transformer)이다. 머신 러닝 알고리즘은 일반적으로 숫자형 입력을 필요로 하므로, 문자열로 표현된 범주형 변수를 정수형 인덱스로 매핑하는 데 사용된다. ==개요== StringIndexer는 입력 열(input column)에 포함된 고유한 문자열 레이블을 빈도 또는 알파벳 순에 따라 정수...) 태그: 시각 편집
- 2025년 4월 9일 (수) 09:20 빅데이터분석기사 토론 기여님이 원 핫 인코딩 문서를 만들었습니다 (새 문서: 원 핫 인코딩(One-hot encoding)은 범주형(categorical) 데이터를 머신 러닝 알고리즘에서 사용할 수 있도록 수치형 데이터로 변환하는 기법 중 하나이다. 각 범주를 이진 벡터의 고유한 위치에 1로 표시하고, 나머지는 0으로 처리하여 범주 간의 순서 또는 크기 의미를 제거한다. ==개요== 범주형 데이터는 대부분 문자열로 표현되며, 모델 학습에 직접 사용할 수 없다. 이를 해...) 태그: 시각 편집
- 2025년 4월 9일 (수) 08:29 빅데이터분석기사 토론 기여님이 아파치 스파크 머신 러닝 파이프라인 문서를 만들었습니다 (새 문서: 아파치 스파크 머신 러닝 파이프라인(Spark ML Pipeline)은 Apache Spark의 머신 러닝 라이브러리인 MLlib에서 제공하는 고수준 API로, 데이터 전처리부터 모델 학습, 평가, 예측에 이르기까지 전체 머신 러닝 흐름을 구조화된 방식으로 구성할 수 있도록 지원한다. 파이프라인은 대규모 분산 처리 환경에서 확장성과 재현성을 높이기 위해 설계되었다. ==개요== 스파크 머신 러...) 태그: 시각 편집
- 2025년 4월 9일 (수) 08:27 빅데이터분석기사 토론 기여님이 머신 러닝 파이프라인 문서를 만들었습니다 (새 문서: 머신 러닝 파이프라인(Machine Learning Pipeline)은 데이터 전처리부터 모델 학습, 예측, 평가, 배포까지 일련의 과정을 체계적으로 구성한 자동화 흐름이다. 파이프라인을 통해 반복 가능한 작업을 재사용 가능하고 일관성 있게 수행할 수 있으며, 실험 및 배포 환경에서 생산성을 크게 높인다. ==개요== 머신 러닝 파이프라인은 전체 모델링 과정에서 필요한 여러 단계를...) 태그: 시각 편집
- 2025년 4월 8일 (화) 09:23 이재용 토론 기여님이 파레토 분석 문서를 만들었습니다 (새 문서: 파레토 분석(Pareto analysis)은 품질 관리, 경영, 통계 등에서 사용되는 문제 해결 기법 중 하나로, 문제의 원인이나 요소를 중요도 순으로 정렬하여 소수의 주요 원인이 대부분의 결과를 초래한다는 '''파레토 법칙(80:20 법칙)'''에 기반한다. 이를 통해 자원과 노력을 집중해야 할 핵심 요소를 식별할 수 있다. ==개요== 파레토 분석은 전체 문제 중 가장 큰 영향을 주는 원...) 태그: 시각 편집: 전환됨