April 3, 2017Open Access

소셜 네트워크를 통한 웹 브라우징 데이터 비식별화

Key Points

Key points are not available for this paper at this time.

Abstract

온라인 추적기와 네트워크 적대자들이 그들에게 readily(쉽게) 제공되는 웹 브라우징 데이터를 비식별화할 수 있을까? 우리는 이론적으로, 시뮬레이션을 통해, 그리고 실제 사용자 데이터를 실험함으로써 비식별화된 웹 브라우징 기록이 공개적으로 이용 가능한 데이터만으로 소셜 미디어 프로필과 연결될 수 있음을 보여준다. 우리의 접근 방법은 간단한 관찰에 기반한다: 각 개인은 독특한 소셜 네트워크를 가지고 있으며, 그러므로 자신의 피드에 나타나는 링크 세트는 고유하다. 사용자가 랜덤 사용자보다 자신의 피드에서 링크를 방문할 확률이 높다고 가정할 때, 브라우징 기록은 정체성의 단서를 포함한다. 우리는 이러한 직관을 웹 브라우징 행동 모델을 지정하여 형식화한 다음, 사용자의 소셜 프로필의 최대 우도 추정치를 도출한다. 우리는 이 전략을 시뮬레이션된 브라우징 기록에서 평가하고, 트위터에서 유래한 30개의 링크가 있는 기록을 가지고 있을 때, 해당하는 트위터 프로필을 50% 이상의 확률로 추론할 수 있음을 보여준다. 이 접근 방식의 실제 효과를 평가하기 위해 우리는 거의 400명을 모집하여 그들의 웹 브라우징 기록을 기부받았고, 그 중 70% 이상을 올바르게 식별할 수 있었다. 우리는 또한 여러 온라인 추적기가 높은 정확도로 이 공격을 수행할 수 있도록 충분히 많은 웹사이트에 임베드되어 있음을 보여준다. 우리의 이론적 기여는 모든 유형의 거래 데이터에 적용되며, 노이즈 관측에 강력하게 저항하며, 이전의 다양한 비식별화 공격을 일반화한다. 마지막으로, 우리의 공격은 3억 개 이상의 후보 중에서 올바른 트위터 프로필을 찾으려고 시도하므로, 현재까지 시연된 비식별화 중 가장 대규모이다.

소셜 네트워크를 통한 웹 브라우징 데이터 비식별화

Key Points

Abstract

Cite This Study