Key points are not available for this paper at this time.
초록 유전체 언어 모델(gLM)의 출현은 비암호화 게놈에서 기능적 활동에 의해 생성된 레이블 없이 다양한 cis-규제 패턴을 학습하는 비지도 접근 방식을 제공합니다. 이전 평가에서는 사전 학습된 gLM을 활용하여 비교적 단순한 기준 데이터 셋 및 기준 모델을 사용하더라도 다양한 규제 유전체학 작업에서 예측 성능을 향상시킬 수 있음을 보여주었습니다. 이러한 연구에서 gLM은 각 하위 작업에 따라 가중치를 미세 조정한 후 테스트되었기 때문에, gLM 표현이 cis-규제 생물학에 대한 기초 이해를 포함하고 있는지 여부는 여전히 열린 질문입니다. 여기에서는 DNA 및 RNA 조절을 포함하는 세포 유형 특이적인 기능 유전체학 데이터를 예측하고 해석하는 사전 학습된 gLM의 표현력을 평가합니다. 우리의 연구 결과는 사전 학습된 gLM의 표현을 탐색하는 것이 원-핫 인코딩 시퀀스를 사용하는 기존 기계 학습 방법에 비해 실질적인 이점을 제공하지 않음을 시사합니다. 이 연구는 현재 gLM과의 주요 격차를 강조하며 비암호화 게놈에 대한 기존 사전 훈련 전략에 대한 잠재적인 문제를 제기합니다.
Tang et al. (Mon,)는 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: