Key points are not available for this paper at this time.
N개의 레코드 풀에서 교체 없이 n개의 레코드를 선택하기 위한 빠른 알고리즘을 소개합니다. 여기서 N의 값은 사전에 알 수 없습니다. 본 논문의 주요 결과는 알고리즘 Z의 설계 및 분석입니다. 이 알고리즘은 상수 공간을 사용하여 한 번의 패스로 샘플링을 수행하며, O(n(1 + log(N/n)))의 기대 시간 내에 수행되며, 이는 상수 계수를 제외하면 최적입니다. 여러 가지 최적화가 연구되어 알고리즘의 단순한 버전의 속도를 현저하게 개선합니다. 이러한 수정을 통합한 효율적인 파스칼 유사 구현을 제공하며 일반 사용에 적합합니다. 이론적 및 경험적 결과는 알고리즘 Z가 현재 방법들보다 상당한 차이로 우수함을 보여줍니다.
제프리 스콧 비터(Jeffrey Scott Vitter, 금요일)는 이 질문을 연구했습니다.