참조 기반 격자 전이 임베딩 분석(RefLaTEA)은 소규모 실험 데이터셋을 대규모 환경 또는 관찰 데이터 구조 내에서 문맥화하도록 설계된 차원 축소 및 해석 프레임워크입니다. 이 방법은 배경 데이터셋에서 균일 다양체 근사 및 사상(UMAP)을 기반으로 참조 임베딩('격자')을 구축합니다. 이 격자에 관심 있는 추가 데이터셋을 전이 임베딩을 통해 투영함으로써, 연구자는 실험 반응이 자연 변동 범위 내에 있는지 여부를 평가할 수 있습니다. RefLaTEA는 필드 데이터가 크고 노이즈가 많으면서 실험 데이터가 깨끗하지만 희소한 환경 및 오믹스 연구에 특히 적합합니다. RefLaTEA는 UMAP 매개변수(이웃 크기, 최소 거리)의 중간 정도 변화에도 견고하며, 반응이 미묘할 때에도 해석 가능함을 보여줍니다. 핵심 RefLaTEA 파이프라인은 선택적으로 클러스터링(예: 노이즈를 포함하는 계층적 밀도 기반 공간 클러스터링), 특성 중요도 분석(예: 랜덤 포레스트 사용), 인과 추론(예: 베이지안 네트워크 사용)을 포함하도록 확장할 수 있습니다. 이러한 후속 단계는 기본 임베딩에 필요하지 않으나 연구자에게 기계적 통찰을 제공합니다. 전반적으로 RefLaTEA는 관찰 데이터와 실험 데이터 간의 격차를 연결하여 탐색적 분석과 가설 생성을 위한 견고하고 유연한 프레임워크를 제공합니다. 참조 기반 UMAP 임베딩 프레임워크를 제공하여 소규모 실험 데이터셋을 대규모 관찰 데이터 내에 문맥화합니다. 배경 데이터와 상대적으로 데이터셋을 문맥화하여 미묘한 반응에 대한 견고한 해석을 가능하게 합니다. 전이 임베딩과 클러스터링, 특성 추출, 인과 추론을 통합한 확장 가능한 분석 파이프라인을 제공합니다.
Shima 등(Sun,)이 이 질문을 연구했습니다.