Key points are not available for this paper at this time.
우리는 질문을 제기합니다: 최근의 대규모 언어 및 이미지 생성 모델이 시각적 개념을 얼마나 혼합할 수 있을까요? 임의의 객체가 주어지면, 우리는 관련 객체를 식별하고 두 개념의 혼합에 대한 단일 문장 설명을 언어 모델을 사용하여 생성합니다. 이후 텍스트 기반 이미지 생성 모델을 사용하여 혼합의 시각적 묘사를 생성합니다. 정량적 및 정성적 평가를 통해 개념 혼합에 대한 고전적 방법에 비해 언어 모델의 우수성과 최근의 대규모 이미지 생성 모델이 이전 모델에 비해 시각적 묘사에서의 우수성을 입증합니다.
Ge et al. (Sun,)은 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: