June 27, 2021Open Access

대규모 언어 및 비전 모델을 통한 시각적 개념 혼합

Key Points

Key points are not available for this paper at this time.

Abstract

우리는 질문을 제기합니다: 최근의 대규모 언어 및 이미지 생성 모델이 시각적 개념을 얼마나 혼합할 수 있을까요? 임의의 객체가 주어지면, 우리는 관련 객체를 식별하고 두 개념의 혼합에 대한 단일 문장 설명을 언어 모델을 사용하여 생성합니다. 이후 텍스트 기반 이미지 생성 모델을 사용하여 혼합의 시각적 묘사를 생성합니다. 정량적 및 정성적 평가를 통해 개념 혼합에 대한 고전적 방법에 비해 언어 모델의 우수성과 최근의 대규모 이미지 생성 모델이 이전 모델에 비해 시각적 묘사에서의 우수성을 입증합니다.

AI에게 질문

Bookmark

View Full Paper

Cite This Study

Ge et al. (Sun,)은 이 질문을 연구했습니다.

synapsesocial.com/papers/6a17b7e8aeefdf6d9c12e489 https://doi.org/https://doi.org/10.48550/arxiv.2106.14127

Also Consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

AI에게 질문

Bookmark

View Full Paper