T-다양성: Difference between revisions

From IT Wiki
(새 문서: 분류:개인정보 보호분류:데이터 분석 ;t-closeness ;l-다양성의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델 == l-다양성의...)
 
No edit summary
Line 1: Line 1:
[[분류:개인정보 보호]][[분류:데이터 분석]]
[[분류:개인정보 보호]][[분류:데이터 분석]]
;t-closeness
;[[l-다양성]]의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델
== l-다양성의 취약점 ==
; 쏠림 공격 (skewness attack)
* 정보가 특정한 값에 쏠려 있을 경우 ℓ-다양성 모델이 프라이버시를 보호하지 못함
* '''쏠림 공격의 예''': 특정 대상이 속한 데이터의 99%가 '위암'이라면 공격 대상이 99%의 확률로 위암
; 유사성 공격 (similarity attack)
* 비식별 조치된 레코드의 정보가 서로 비슷하다면 ℓ-다양성 모델을 통해 비식별 된다 할지라도 프라이버시가 노출될 수 있음
== 예시 ==
* l-다양성 모델에 의해 비식별된 데이터
{| class="wikitable"
! rowspan="2" | 구분
! colspan="2" | 속성자
! colspan="2" | 민감한 정보
! rowspan="2" | 비고
|-
| 지역 코드
| 연령
| 급여(백만원)
| 질병
|-
| 1
| 476**
| 2*
| 30
| 위궤양
| rowspan="3" | 모두가 ‘위’와 관련한
유사 질병으로 취약
|-
| 2
| 476**
| 2*
| 40
| 급성 위염
|-
| 3
| 476**
| 2*
| 50
| 만성 위염
|-
| 4
| 4790*
| ≥ 40
| 60
| 급성 위염
| rowspan="3" | 다양한 질병이
혼재되어 안전
|-
| 5
| 4790*
| ≥ 40
| 110
| 감기
|-
| 6
| 4790*
| ≥ 40
| 80
| 기관지염
|-
| 7
| 476**
| 3*
| 70
| 기관지염
| rowspan="3" | 다양한 질병이
혼재되어 안전
|-
| 8
| 476**
| 3*
| 90
| 폐렴
|-
| 9
| 476**
| 3*
| 100
| 만성 위염
|}
* 레코드 1,2,3이 속한 동질 집합의 병명이 서로 다르지만 의미가 서로 유사함(위궤양, 급성 위염, 만성 위염)
* 공격자는 공격 대상의 질병이 ‘위’에 관련된 것이라는 사실을 알아낼 수 있음
* 또 다른 민감한 정보인 급여에 대해서도 공격 대상이 다른 사람에 비해 상대적으로 낮은 급여 값을 가짐을 쉽게 알아낼 수 있음(30 ~ 50백만원)
* t-근접성 적용
{| class="wikitable"
! rowspan="2" | 구분
! colspan="2" | 속성자
! colspan="2" | 민감한 정보
! rowspan="2" | 비고
|-
| 지역 코드
| 연령
| 급여(백만원)
| 질병
|-
| 1
| 4767*
| ≤ 40
| 30
| 위궤양
| rowspan="3" | 급여와 질병의
다양한 분포로 안전
|-
| 3
| 4767*
| ≤ 40
| 50
| 만성 위염
|-
| 8
| 4767*
| ≤ 40
| 90
| 폐렴
|-
| 4
| 4790*
| ≥ 40
| 60
| 급성 위염
| rowspan="3" | 급여와 질병의
다양한 분포로 안전
|-
| 5
| 4790*
| ≥ 40
| 110
| 감기
|-
| 6
| 4790*
| ≥ 40
| 80
| 기관지염
|-
| 2
| 4760*
| 3*
| 40
| 급성 위염
| rowspan="3" | 급여와 질병의
다양한 분포로 안전
|-
| 7
| 4760*
| 3*
| 70
| 기관지염
|-
| 9
| 4760*
| 3*
| 100
| 만성 위염
|}
== [[분류:개인정보 보호]][[분류:데이터 분석]]
;t-closeness
;t-closeness
;[[l-다양성]]의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델
;[[l-다양성]]의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델

Revision as of 23:50, 22 January 2020

t-closeness
l-다양성의 취약점(쏠림 공격, 유사성 공격)을 보완하기 위해 모델

l-다양성의 취약점

쏠림 공격 (skewness attack)
  • 정보가 특정한 값에 쏠려 있을 경우 ℓ-다양성 모델이 프라이버시를 보호하지 못함
  • 쏠림 공격의 예: 특정 대상이 속한 데이터의 99%가 '위암'이라면 공격 대상이 99%의 확률로 위암
유사성 공격 (similarity attack)
  • 비식별 조치된 레코드의 정보가 서로 비슷하다면 ℓ-다양성 모델을 통해 비식별 된다 할지라도 프라이버시가 노출될 수 있음

예시

  • l-다양성 모델에 의해 비식별된 데이터
구분 속성자 민감한 정보 비고
지역 코드 연령 급여(백만원) 질병
1 476** 2* 30 위궤양 모두가 ‘위’와 관련한

유사 질병으로 취약

2 476** 2* 40 급성 위염
3 476** 2* 50 만성 위염
4 4790* ≥ 40 60 급성 위염 다양한 질병이

혼재되어 안전

5 4790* ≥ 40 110 감기
6 4790* ≥ 40 80 기관지염
7 476** 3* 70 기관지염 다양한 질병이

혼재되어 안전

8 476** 3* 90 폐렴
9 476** 3* 100 만성 위염
  • 레코드 1,2,3이 속한 동질 집합의 병명이 서로 다르지만 의미가 서로 유사함(위궤양, 급성 위염, 만성 위염)
  • 공격자는 공격 대상의 질병이 ‘위’에 관련된 것이라는 사실을 알아낼 수 있음
  • 또 다른 민감한 정보인 급여에 대해서도 공격 대상이 다른 사람에 비해 상대적으로 낮은 급여 값을 가짐을 쉽게 알아낼 수 있음(30 ~ 50백만원)
  • t-근접성 적용
구분 속성자 민감한 정보 비고
지역 코드 연령 급여(백만원) 질병
1 4767* ≤ 40 30 위궤양 급여와 질병의

다양한 분포로 안전

3 4767* ≤ 40 50 만성 위염
8 4767* ≤ 40 90 폐렴
4 4790* ≥ 40 60 급성 위염 급여와 질병의

다양한 분포로 안전

5 4790* ≥ 40 110 감기
6 4790* ≥ 40 80 기관지염
2 4760* 3* 40 급성 위염 급여와 질병의

다양한 분포로 안전

7 4760* 3* 70 기관지염
9 4760* 3* 100 만성 위염

같이 보기