개인정보 비식별: 두 판 사이의 차이

IT위키
편집 요약 없음
잔글 (문자열 찾아 바꾸기 - "분류:데이터/통계학" 문자열을 "분류:데이터 과학" 문자열로)
 
(사용자 5명의 중간 판 10개는 보이지 않습니다)
1번째 줄: 1번째 줄:
[[분류:개인정보보호]][[분류:데이터베이스]][[분류:데이터 분석]][[분류:보안]]
[[분류:개인정보보호]][[분류:데이터베이스]][[분류:데이터 과학]][[분류:보안]]
;개인정보에 대해 통계적으로 식별자를 제거하여 정보 주체를 알아볼 수 없도록 익명화하는 과정


== 단계 ==
== 단계 ==
5번째 줄: 6번째 줄:


== 기법 ==
== 기법 ==
* 가명 처리
=== 비식별 처리 기법 ===
* 총계 처리
* [[가명 처리]]
* 데이터 삭제
* [[총계 처리]]
* 데이터 범주화
* [[데이터 삭제]]
* 데이터 마스킹
* [[데이터 범주화]]
* [[데이터 마스킹]]


== 평가 지표 ==
=== 비식별 암호 기술 ===
==== 동형 암호 ====
;Homomorphic Encryption
* 평문에 대한 연산 결과와 암호문에 대한 연산 결과가 같은 값
* 암호화된 개인정보를 풀어보지 않고도 통계분석이 가능
 
==== 형태 보존 암호 ====
;Format-Preserving Encryption
* 블록암호에 기반하여 특정한 형태의 평문의 값을 동일한 형태의 값으로 변환
 
==== 순서 보존 암호 ====
;Order-Preserving Encryption
* 암호화 과정에서 평문의 순서 정보를 보존
* 암호화를 통한 데이터 프라이버시 보호와 데이터 활용성을 보장
 
=== 기타 ===
* [[차분 프라이버시]]
 
 
== 적정성 평가 ==
=== 평가 지표 ===
{| class="wikitable"
{| class="wikitable"
|-
|-
! 지표 !! 의미 !! 적용
! 지표 !! 의미 !! 적용
|-
|-
| k-익명성 || 특정인임 추론 가능 여부 검토 || 동일 값 레코드 k개 이상
| [[k-익명성]] || 특정인임 추론 가능 여부 검토 || 동일 값 레코드 k개 이상
|-
|-
| l-다양성 || 민감정보의 다양성을 낮춤 || L개 이상의 다양성을 가지도록 하여 추론 방지
| [[l-다양성]] || 민감정보의 다양성을 낮춤 || L개 이상의 다양성을 가지도록 하여 추론 방지
|-
|-
| t-근접성 || 민감한 정보의 분포를 낮춤 || 전체 데이터 분포, 민감 정보 분포 차이를 t 이하로 설정
| [[t-근접성]] || 민감한 정보의 분포를 낮춤 || 전체 데이터 분포, 민감 정보 분포 차이를 t 이하로 설정
|}
|}


== 비식별 암호 기술 ==
=== 비식별 조치 단계 ===
=== 동형 암호 ===
;국내 가이드라인 기준
;Homomorphic Encryption
{| class="wikitable"
* 평문에 대한 연산 결과와 암호문에 대한 연산 결과가 같은 값
! 절차
* 암호화된 개인정보를 풀어보지 않고도 통계분석이 가능
! 설명
|-
| 사전 검토
| 개인정보에 해당하는지 검토
|-
| 비식별 조치
| 정보집합물에서 개인 식별요소 제거
|-
| 적정성 평가
| 다른 정보와의 쉽게 결합 여부 평가
|-
| 사후관리
| 재식별 방지를 위한 방안 마련 및 수행
|}


=== 형태 보존 암호 ===
=== 적정성 평가 단계 ===
;Format-Preserving Encryption
;국내 가이드라인 기준
* 블록암호에 기반하여 특정한 형태의 평문의 값을 동일한 형태의 값으로 변환
{| class="wikitable"
! 절차
! 설명
|-
| 기초자료 작성
| 데이터 명세, 비식별 현황 등
|-
| 평가단 구성
| 외부 전문가, 내부 책임자로 평가단 구성
|-
| 평가 수행
| 기초자료와 k-익명성 모델 등 활용
|-
| 추가 비식별 조치
| 평가 결과가 부적격인 경우 추가 조치 수행
|-
| 데이터 활용
| 평가 결과가 적정한 경우 데이터 활용
|}


=== 순서 보존 암호 ===
== [[개인정보 재식별]] ==
;Order-Preserving Encryption
* 재식별 기준: 개인화, 연결 가능성, 추론 가능성
* 암호화 과정에서 평문의 순서 정보를 보존
* 재식별 공격: 검사 공격, 기자 공격, 마케터 공격 등
* 암호화를 통한 데이터 프라이버시 보호와 데이터 활용성을 보장


== 표준 ==
== 같이 보기 ==
* [[ISO/IEC 20889]]
* [[ISO/IEC 20889]]
* [[개인정보 비식별 조치 가이드라인]]

2020년 5월 6일 (수) 23:28 기준 최신판

개인정보에 대해 통계적으로 식별자를 제거하여 정보 주체를 알아볼 수 없도록 익명화하는 과정

단계[편집 | 원본 편집]

  • 개인정보 -> 가명정보 -> 익명정보

기법[편집 | 원본 편집]

비식별 처리 기법[편집 | 원본 편집]

비식별 암호 기술[편집 | 원본 편집]

동형 암호[편집 | 원본 편집]

Homomorphic Encryption
  • 평문에 대한 연산 결과와 암호문에 대한 연산 결과가 같은 값
  • 암호화된 개인정보를 풀어보지 않고도 통계분석이 가능

형태 보존 암호[편집 | 원본 편집]

Format-Preserving Encryption
  • 블록암호에 기반하여 특정한 형태의 평문의 값을 동일한 형태의 값으로 변환

순서 보존 암호[편집 | 원본 편집]

Order-Preserving Encryption
  • 암호화 과정에서 평문의 순서 정보를 보존
  • 암호화를 통한 데이터 프라이버시 보호와 데이터 활용성을 보장

기타[편집 | 원본 편집]


적정성 평가[편집 | 원본 편집]

평가 지표[편집 | 원본 편집]

지표 의미 적용
k-익명성 특정인임 추론 가능 여부 검토 동일 값 레코드 k개 이상
l-다양성 민감정보의 다양성을 낮춤 L개 이상의 다양성을 가지도록 하여 추론 방지
t-근접성 민감한 정보의 분포를 낮춤 전체 데이터 분포, 민감 정보 분포 차이를 t 이하로 설정

비식별 조치 단계[편집 | 원본 편집]

국내 가이드라인 기준
절차 설명
사전 검토 개인정보에 해당하는지 검토
비식별 조치 정보집합물에서 개인 식별요소 제거
적정성 평가 다른 정보와의 쉽게 결합 여부 평가
사후관리 재식별 방지를 위한 방안 마련 및 수행

적정성 평가 단계[편집 | 원본 편집]

국내 가이드라인 기준
절차 설명
기초자료 작성 데이터 명세, 비식별 현황 등
평가단 구성 외부 전문가, 내부 책임자로 평가단 구성
평가 수행 기초자료와 k-익명성 모델 등 활용
추가 비식별 조치 평가 결과가 부적격인 경우 추가 조치 수행
데이터 활용 평가 결과가 적정한 경우 데이터 활용

개인정보 재식별[편집 | 원본 편집]

  • 재식별 기준: 개인화, 연결 가능성, 추론 가능성
  • 재식별 공격: 검사 공격, 기자 공격, 마케터 공격 등

같이 보기[편집 | 원본 편집]